我正在尝试生成一个html帖子到一个有一个选项列表的页面。有一个下拉列表,用户在其中选择一个项目,然后单击一个生成按钮。根据所选的选项,它将返回各种结果。我对HTML前后做了一个比较,可以看出以下差异:
以前
<option value="Option1">Option 1</option>
<option value="Option2">Option 2</option>
<option value="Option3">Option 3</option>
后
<option value="Option1">Option 1</option>
<option selected="selected" value="Option2">Option 2</option>
<option value="Option3">Option 3</option>
我无法找出生成jsoup文档的语法。到目前为止,我有这个,但它只是不断返回原始的html,没有结果:
doc = Jsoup.connect("MYurl...")
.timeout(5000)
.userAgent("Mozilla/5.0 (Windows; U; WindowsNT 5.1; en-US; rv1.8.1.6) Gecko/20070725 Firefox/2.0.0.6")
.cookie("auth", "token")
.data("selected", "Option2")
.post();
最佳答案
必须使用数据通过字段的name
属性设置字段值。
使用时:
.data("selected", "Option2")
与在请求页上具有此元素相同(请注意
form
):<select name="selected">
<option value="Option1">Option 1</option>
<option selected="selected" value="Option2">Option 2</option>
<option value="Option3">Option 3</option>
</select>
所以,你试图
name="selected"
的方式是正确的。问题可能是名为POST
的参数(字段)在selected
中不存在(您正在尝试模拟),因此发送它与不发送任何内容是一样的。评论后编辑:
在解析之前,我真正需要做的是在web页面元素上执行一个点击,根据我的理解,这不能用jsoup完成。
你是对的。jsoup不支持这一点-单击可能会产生一些副作用,如javascript事件等。处理它们是件大事。
不过,对于您的特定情况,jsoup更改dom的功能可能很有用。检查下面的示例。在它中,我们通过显式地将其
form
属性设置为selected
,来“选择”一个选项(并从每个其他选项中删除它)。import org.jsoup.Jsoup;
import org.jsoup.nodes.*;
import org.jsoup.select.*;
public class JSoupChangeDom {
public static void main(String[] args) {
Document doc = Jsoup.parse(""+
" <html><body> " +
" <div>example</div> " +
" <form> " +
" <select name='mySelect'> " +
" <option value='Option1'>Option 1</option> " +
" <option value='Option2'>Option 2</option> " +
" <option value='Option3'>Option 3</option> " +
" </select> " +
" <form> " +
" </body></html> ");
Element mySelect =
doc.getElementsByAttributeValue("name", "mySelect").get(0);
String optionValueToBeSelected = "Option2";
Elements options = mySelect.getElementsByTag("option");
for (Element option : options) {
if (option.attr("value").equals(optionValueToBeSelected)) {
option.attr("selected", "selected");
} else {
option.removeAttr("selected");
}
}
System.out.println(doc);
}
}
输出:
<html>
<head></head>
<body>
<div>example</div>
<form>
<select name="mySelect">
<option value="Option1">Option 1</option>
<option value="Option2" selected="selected">Option 2</option>
<option value="Option3">Option 3</option>
</select>
</form>
</body>
</html>