Linux下载工具Curl也是Linux下不错的命令行下载工具,小巧、高速,唯一的缺点是不支持多线程下载。以下是他的安装和功能。

安装

$ tar zxvf curl-7.14.0.tar.gz
$ cd curl-7.14.0/
$ ./configure
$ make
$ make test
$ make install

参数详情

参数:描述
-M/--manual显示全手动
-n/--netrc从netrc文件中读取用户名和密码
--netrc-optional使用 .netrc 或者 URL来覆盖-n
--ntlm使用 HTTP NTLM 身份验证
-N/--no-buffer禁用缓冲输出
-o/--output把输出写到该文件中
-O/--remote-name把输出写到该文件中,保留远程文件的文件名
-p/--proxytunnel使用HTTP代理
--proxy-anyauth选择任一代理身份验证方法
--proxy-basic在代理上使用基本身份验证
--proxy-digest在代理上使用数字身份验证
--proxy-ntlm在代理上使用ntlm身份验证
-P/--ftp-port
使用端口地址,而不是使用PASV
-Q/--quote文件传输前,发送命令到服务器
-r/--range检索来自HTTP/1.1或FTP服务器字节范围
--range-file读取(SSL)的随机文件
-R/--remote-time在本地生成文件时,保留远程文件时间
--retry传输出现问题时,重试的次数
--retry-delay传输出现问题时,设置重试间隔时间
--retry-max-time传输出现问题时,设置最大重试时间
-s/--silent静音模式。不输出任何东西
-S/--show-error显示错误
--socks4<host[:port]>用socks4代理给定主机和端口
--socks5<host[:port]>用socks5代理给定主机和端口
-t/--telnet-option<opt=val>Telnet选项设置
--trace对指定文件进行debug
--trace-ascii Like跟踪但没有hex输出
--retry-delay传输出现问题时,设置重试间隔时间
--trace-time跟踪/详细输出时,添加时间戳
-T/--upload-file上传文件
--urlSpet URL to work with
-u/--user<user[:password]>设置服务器的用户和密码
-U/--proxy-user<user[:password]>设置代理用户名和密码
-V/--version显示版本信息
-w/--write-out [format]什么输出完成后
-x/--proxy<host[:port]>在给定的端口上使用HTTP代理
-X/--request指定什么命令
-y/--speed-time放弃限速所要的时间。默认为30
-Y/--speed-limit停止传输速度的限制,速度时间秒
-z/--time-cond传送时间设置

常用curl实例

抓取页面内容到一个文件中

$ curl -o home.html  http://www.sina.com.cn 

用-O(大写的),后面的url要具体到某个文件,不然抓不下来。我们还可以用正则来抓取东西

$ curl -O http://www.it415.com/czxt/linux/25002_3.html 

模拟表单信息,模拟登录,保存cookie信息

$ curl -c ./cookie_c.txt -F log=aaaa -F pwd=****** http://blog.51yip.com/wp-login.php 

模拟表单信息,模拟登录,保存头信息

$ curl -D ./cookie_D.txt -F log=aaaa -F pwd=****** http://blog.51yip.com/wp-login.php #-c(小写)产生的cookie和-D里面的cookie是不一样的

使用cookie文件

$ curl -b ./cookie_c.txt  http://blog.51yip.com/wp-admin 

断点续传,-C(大写的)

$ curl -C -O http://www.sina.com.cn 

传送数据,最好用登录页面测试,因为你传值过去后,curl回抓数据,你可以看到你传值有没有成功

$ curl -d log=aaaa  http://blog.51yip.com/wp-login.php 

显示抓取错误

$ curl -f http://www.sina.com.cn/asdf #curl: (22) The requested URL returned error: 404

伪造来源地址,有的网站会判断,请求来源地址

$  curl -e http://localhost http://www.sina.com.cn 

当我们经常用curl去搞人家东西的时候,人家会把你的IP给屏蔽掉的,这个时候,我们可以用代理

$ curl -x 10.10.90.83:80-o home.html http://www.sina.com.cn 

比较大的东西,我们可以分段下载

$  curl -r 0-100-o img.part1 http://i2.f.itc.cn/thumb/180/bj/6018/b_60178154.jpg 

不显示下载进度信息

$  curl -s -o aaa.jpg  

显示下载进度条

$  curl -# -O  http://www.it415.com/czxt/linux/25002_3.html  

通过ftp下载文件

$  curl -u 用户名:密码-O http://blog.51yip.com/demo/curtain/bbstudy_files/style.css 

通过ftp上传

$  curl -T xukai.php ftp://xukai:[email protected]:21/www/focus/enhouse/
05-19 01:50