我正在尝试生成一个html帖子到一个有一个选项列表的页面。有一个下拉列表,用户在其中选择一个项目,然后单击一个生成按钮。根据所选的选项,它将返回各种结果。我对HTML前后做了一个比较,可以看出以下差异:
以前

<option value="Option1">Option 1</option>
<option value="Option2">Option 2</option>
<option value="Option3">Option 3</option>


<option value="Option1">Option 1</option>
<option selected="selected" value="Option2">Option 2</option>
<option value="Option3">Option 3</option>

我无法找出生成jsoup文档的语法。到目前为止,我有这个,但它只是不断返回原始的html,没有结果:
doc = Jsoup.connect("MYurl...")
.timeout(5000)
.userAgent("Mozilla/5.0 (Windows; U; WindowsNT 5.1; en-US; rv1.8.1.6) Gecko/20070725 Firefox/2.0.0.6")
.cookie("auth", "token")
.data("selected", "Option2")
.post();

最佳答案

必须使用数据通过字段的name属性设置字段值。
使用时:

.data("selected", "Option2")

与在请求页上具有此元素相同(请注意form):
<select name="selected">
    <option value="Option1">Option 1</option>
    <option selected="selected" value="Option2">Option 2</option>
    <option value="Option3">Option 3</option>
</select>

所以,你试图name="selected"的方式是正确的。问题可能是名为POST的参数(字段)在selected中不存在(您正在尝试模拟),因此发送它与不发送任何内容是一样的。
评论后编辑:
在解析之前,我真正需要做的是在web页面元素上执行一个点击,根据我的理解,这不能用jsoup完成。
你是对的。jsoup不支持这一点-单击可能会产生一些副作用,如javascript事件等。处理它们是件大事。
不过,对于您的特定情况,jsoup更改dom的功能可能很有用。检查下面的示例。在它中,我们通过显式地将其form属性设置为selected,来“选择”一个选项(并从每个其他选项中删除它)。
import org.jsoup.Jsoup;
import org.jsoup.nodes.*;
import org.jsoup.select.*;

public class JSoupChangeDom {
    public static void main(String[] args) {
        Document doc = Jsoup.parse(""+
        " <html><body>                                            " +
        " <div>example</div>                                      " +
        " <form>                                                  " +
        "    <select name='mySelect'>                             " +
        "       <option value='Option1'>Option 1</option>         " +
        "       <option value='Option2'>Option 2</option>         " +
        "       <option value='Option3'>Option 3</option>         " +
        "    </select>                                            " +
        " <form>                                                  " +
        " </body></html>                                          ");
        Element mySelect =
                      doc.getElementsByAttributeValue("name", "mySelect").get(0);
        String optionValueToBeSelected = "Option2";
        Elements options = mySelect.getElementsByTag("option");
        for (Element option : options) {
            if (option.attr("value").equals(optionValueToBeSelected)) {
                option.attr("selected", "selected");
            } else {
                option.removeAttr("selected");
            }
        }
        System.out.println(doc);
    }
}

输出:
<html>
    <head></head>
    <body>
        <div>example</div>
        <form>
            <select name="mySelect">
                <option value="Option1">Option 1</option>
                <option value="Option2" selected="selected">Option 2</option>
                <option value="Option3">Option 3</option>
            </select>
        </form>
    </body>
</html>

09-10 12:25
查看更多