我需要通过MATLAB阅读网站的内容,但是问题是当我将网站加载为:
URL = java.net.URL(UrlNew);
urlConnection = URL.openConnection();
urlConnection.connect();
str = regexprep(fileread(filename),'\s*',' ');
该网站将我重定向到一个页面,我必须先按“我同意”按钮,然后转到请求的页面。
如何在MATLAB中处理这种情况。我需要以某种方式单击MATLAB中的“同意”按钮才能访问原始网页。
谢谢
最佳答案
首先,您需要在原始页面上找到表单的action
属性的值。您可以执行以下操作:检查页面的源代码,查找包含“同意”按钮的表单标签,或者手动单击该按钮,然后查看Chrome开发者工具或Firefox中的Firebug的“网络活动”标签。
找到该内容后,找出如何用Java发送POST请求并通过将POST请求发送到表单的操作URL来模拟按钮的单击。如果之后从套接字收集输出,则该输出应对应于所需的页面。