我想建立一个自定义的研究词表,因此我刮特殊的网站。
我想:
将命令行中的Lynx与以下命令一起使用:
lynx -dump -listonly "example.com" | grep -E -o "http://example.com.*|http://www.example.com.*" | sort | uniq > output.txt
我不想写5000 x这个命令。我想对网站使用一个.txt文件,该文件将由lynx命令读取,所有“输出”都应该放在一个文件中。
你能帮我解决这个问题吗?我是Linux/Ubuntu的新手,对编程一无所知。对不起,我的语言是德语。
最佳答案
你的意思是
cat yourdomains.txt | while read domain
do
lynx -dump -listonly "$domain" | \
grep -E -o "http://${domain}.*|http://www.${domain}.*"
done | sort | uniq > output.txt
?
关于linux - Lynx的自动化,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/37610797/