我需要为一个项目审查法国法院的案件,但我不知道如何使用Java来导航法院的搜索引擎。

Here's the search page我需要操纵。我想开始抓取结果页面,但仅靠URL无法从Java进入该页面。我需要某种方式让Java命令服务器根据我的日期参数(2003年1月1日-2003年6月30日)执行搜索,然后我可以通过简单地操纵要连接的URL来运行节目。

有什么建议么?

最佳答案

首先,请确保该网站的服务条款允许这样做。

我会httpclient发布以发送数据并获取结果。请参阅页面上的表单,找出需要模拟哪些变量并通过httpclient提交它们。您应该获得想要的结果。此外,该页面还包含许多JavaScript,因此您需要弄清楚它在做什么,也许它从不提交表单,而是通过ajax调用来更新页面,但是也许可以获得相同的结果。

您始终可以安装“ fiddler”之类的内容,并观察页面正在发送的HTTP流量,然后使用httpclient进行模拟。

10-07 19:07
查看更多