我有一个奇怪的问题,这周我一直在那里。
在我的站点的脚注中,我使用Java脚本使用随机链接

 <a class="default.php">Some Default Text</a>

而javascript是
 <script>
 (function(){
  var myLinks = [
{href: 'example.php?title=hello', text: 'example1'},
{href: 'example.php?title=hello2', text: 'example2'}
];
onload = function(){
var link, pageLinkClass = 'myLink', pageLinks = document.getElementsByTagName('a');
pageLinkClass = new RegExp('\\b' + pageLinkClass + '\\b');
for(var i = 0; i < pageLinks.length; ++i){
if(pageLinkClass.test(pageLinks[i].className)){
link = myLinks[Math.floor(Math.random() * myLinks.length)]
pageLinks[i].href = link.href;
pageLinks[i].firstChild.nodeValue = link.text;
pageLinks[i].target = '_self';
}
}
};
})();// JavaScript Document
</script>

(这是一个例子)
但是当我爬网生成站点地图时,它只读取example.php链接?标题=
而不是后面的部分。
提前谢谢

最佳答案

爬网程序无法/不解释javascript。很多机器人和爬虫程序只会读取原始的html。google bot可以在一定程度上解释js,但我仍然不会依赖它。最好的办法是生成链接服务器端。

08-08 05:11