我有一个奇怪的问题,这周我一直在那里。
在我的站点的脚注中,我使用Java脚本使用随机链接
<a class="default.php">Some Default Text</a>
而javascript是
<script>
(function(){
var myLinks = [
{href: 'example.php?title=hello', text: 'example1'},
{href: 'example.php?title=hello2', text: 'example2'}
];
onload = function(){
var link, pageLinkClass = 'myLink', pageLinks = document.getElementsByTagName('a');
pageLinkClass = new RegExp('\\b' + pageLinkClass + '\\b');
for(var i = 0; i < pageLinks.length; ++i){
if(pageLinkClass.test(pageLinks[i].className)){
link = myLinks[Math.floor(Math.random() * myLinks.length)]
pageLinks[i].href = link.href;
pageLinks[i].firstChild.nodeValue = link.text;
pageLinks[i].target = '_self';
}
}
};
})();// JavaScript Document
</script>
(这是一个例子)
但是当我爬网生成站点地图时,它只读取example.php链接?标题=
而不是后面的部分。
提前谢谢
最佳答案
爬网程序无法/不解释javascript。很多机器人和爬虫程序只会读取原始的html。google bot可以在一定程度上解释js,但我仍然不会依赖它。最好的办法是生成链接服务器端。