我想建立一个自定义的研究词表,因此我刮特殊的网站。
我想:
将命令行中的Lynx与以下命令一起使用:

lynx -dump -listonly "example.com" | grep -E -o "http://example.com.*|http://www.example.com.*" | sort | uniq > output.txt

我不想写5000 x这个命令。我想对网站使用一个.txt文件,该文件将由lynx命令读取,所有“输出”都应该放在一个文件中。
你能帮我解决这个问题吗?我是Linux/Ubuntu的新手,对编程一无所知。对不起,我的语言是德语。

最佳答案

你的意思是

cat yourdomains.txt | while read domain
do
    lynx -dump -listonly "$domain" | \
       grep -E -o "http://${domain}.*|http://www.${domain}.*"
done | sort | uniq > output.txt

?

关于linux - Lynx的自动化,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/37610797/

10-13 05:52