在 Linux 中 curl 是一个利用 URL 规则在命令行下工作的文件传输工具,可以说是一款很强大的 http 命令行工具。它支持文件的上传和下载,是综合传输工具,但按传统,习惯称 url 为下载工具。
作为一款强力工具,curl 支持包括 HTTP、HTTPS、FTP 等众多协议,还支持 GET、POST、cookies、认证、从指定偏移处下载部分文件、用户代理字符串、限速、文件大小、进度条等特征,还可以做网页处理流程和数据检索自动化。
在进行 web 后台程序开发测试过程中,常常会需要发送 url 进行测试,使用 curl 可以方便地模拟出符合需求的 url 命令。
概述curl(cURL)是一个用于传输数据的命令行工具,其诞生于20多年前,最早版本是在1998年。
curl支持以多种方式检索和发送数据,并输出到标准输出,可以无缝衔接标准unix管道使用。在绝大多数的*nix操作系统上都默认安装。curl支持各种协议,包括 HTTP/HTTPS、FTP和SCP。
Linux Curl命令详解语法
url [option] [url]参数
参数描述说明
使用 curl 命令,加上参数 option 给指定的 url 发送请求。
Curl命令参数 参数描述我们在使用 Linux 的 curl 命令,访问网站时,可以通过 A 参数来指定我们访问该网站使用的指定的浏览器或者指定的浏览器的指定版本。
Curl模仿浏览器详解语法
url -A info url参数
参数描述说明
我们使用 A 参数设置浏览器信息,来模拟浏览器访问网站。
模仿浏览器使用 curl 命令,可以指定浏览器信息,来访问网站,具体命令如下:
url -A "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.0)"我们使用了 A 参数模仿了使用 IE8.0 去访问了网站。
Curl伪造refer命令我们在使用 Linux 的 curl 命令时,可以使用 e 参数,来伪造 refer 信息,以防止某些网站的防盗链功能屏蔽我们的访问。
很多服务器会检查 http 访问的 referer 从而来控制访问。比如:你是先访问首页,然后再访问首页中的邮箱页面,这里访问邮箱的 referer 地址就是访问首页成功后的页面地址,如果服务器发现对邮箱页面访问的 referer 地址不是首页的地址,就断定那是个盗链了。
Curl伪造refer详解语法
url -e referUrl url参数
参数描述说明
我们使用 e 参数模仿请求的 url。
伪造refer使用 curl 命令,可以伪造访问的 url 信息,来访问网站,具体命令如下:
url -e "" %20go%20helloworld.png运行后,终端输出如下:
Curl下载文件或网页详解语法
curl -o fileName url参数
参数描述说明
我们使用 o 参数将 url 的信息保存到本地 fileName 文件中。
语法
curl -O url参数
参数描述说明
我们使用 O 参数将 url 的信息保存到本地文件中,文件名与服务器上的文件同名。
Curl下载进度条命令我们使用 Linux 的 curl 命令,在下载文件时,还可以显示下载的进度条信息。
Curl下载进度条详解语法
curl -# -O url参数
参数描述我们在使用 Linux 的 curl 命令,在下载文件时,还可以支持断点续传功能,即,我们下载文件过程中断线了,可以继续下载。
Curl断点续传详解语法
url -C offset -O url参数
参数描述使用 curl 命令,下载文件时,还可以支持断点续传,具体命令如下:
url -C 0 -O %20go%20helloworld.png Curl上传文件命令我们使用 Linux 的 curl 命令,不仅仅可以支持下载文件,还可以支持上传文件,我们通过参数 T 实现上传文件功能。
Curl上传文件详解语法
url -T uploadFile -u username:password uploadUrl参数
参数描述我们使用 Linux 的 curl 命令,不仅仅可以支持下载文件,还可以支持上传文件,我们通过参数 T 实现上传文件功能。
Curl获取错误命令我们在使用 Linux 的 curl 命令时,可以使用 f 参数,显示获取的错误信息。
Curl获取错误详解语法
url -f url参数
参数描述使用 curl 命令,可以获取错误信息,具体命令如下:
url -f Curl GET请求命令我们在使用 Linux 的 curl 命令时,可以实现 GET请求的功能,即可以模拟 HTTP 的 GET 请求。
Curl GET请求详解语法
url "url?param1=val1¶m2=val2"参数
参数描述说明
在发送 GET 请求时,请求参数放在 url 后面,因为有特殊字符 &,所以我们需要使用双引号进行包裹,或者,我们直接使用转义字符也可以,即 curl "url?param1=val1\¶m2=val2"
Curl GET请求命令总结我们在使用 Linux 的 curl 命令时,可以实现 GET请求的功能,即可以模拟 HTTP 的 GET 请求。
Curl POST请求命令我们在使用 Linux 的 curl 命令时,可以实现 POST 请求的功能,即可以模拟 HTTP 的 POST 请求。
Curl POST请求详解语法
curl [-H] [HEAD] -X POST -d '{"key1": "val1", "key2":val2}' url参数
参数描述说明
在发送 POST 请求时,我们可以使用 H 参数,指定发送的请求头信息,使用 X 参数,说明我们发送的是 POST 请求。
使用 d 参数,设置我们请求的参数信息。
Curl POST请求详解语法
url -H "Content-Type: application/json" -X POST -d '{"key1": "val1", "key2":val2}' url说明
我们使用了 H 参数,设置了请求的参数是 Json 类型。
Curl POST请求命令总结我们在使用 Linux 的 curl 命令时,可以实现 POST 请求的功能,即可以模拟 HTTP 的 POST 请求。
Curl设置代理proxy命令我们在使用 Linux 的 curl 命令,访问网站时,还可以使用 x 参数,来指定访问网站时使用的具体代理地址和端口。
Curl设置代理proxy详解语法
url -x proxyAddr:proxyPort url参数
参数描述说明
我们使用 x 参数设置代理信息。
设置代理proxy信息使用 curl 命令,访问网站时,可以设置代理信息,具体命令如下:
url -x 220.181.38.150 Curl设置代理详解 Web代理服务器Web代理服务器充当客户端和目标服务器之间的中介。客户端首先访问代理,然后代理执行它并将结果返回给客户端。
有些Web站点是有限制的,我们无法直接通过当前IP直接访问目标站点;还有一些站点对访问请求是有一定限制,而我们在请求数据时候为了请求速度也需要突破IP限制。通过使用代理服务,我们就可以突破上述限制。
curl代理设置为演示需要,本文中示例中使用的代理将设置为本地机器上,使用端口5000。默认情况下,代理语句中唯一需要的部分是主机,默认端口80。我们将通过HTTP将数据传输到它,我们将明确指定完整性。为了方便,我们请求服务为httpbin。 Httpbin是一个开源的标准http服务显示,在请求/ip接口时候可以查看请求IP地址。
方法一:命令行参数使用代理的第一个也是最简单的选项是使用命令行参数。Curl代理参数为-x(或者--proxy)。基本格式为:
-x, --proxy [protocol://]host[:port]
因此,要使用代理访问,可以使用:
curl -x 220.181.38.150
其中,代理服务器的协议头,默认为http可以省略掉:
curl -x 127.0.0.1:5000 httpbin/ip
身份验证
此外,如果HTTP代理服务器也需要身份验证,可以使用 -U标志来指定它。
curl -U user:password --proxy 127.0.0.1:5000 httpbin/ip
某些代理服务器可能需要不同的身份验证方案。可以通过--proxy-anyauth指定curl以确定身份验证方案
curl -U user:password --proxy 127.0.0.1:5000 httpbin/ip --proxy-anyauth
如果认证密码中包含特殊字符,需要对其添加加上双引号("")。
curl -U "user:p@assword" --proxy 127.0.0.1:5000 httpbin/ip
上面命令中直接用密码容易被泄露并且会被记录在history日志中,在命令行中通过只提供用户名,然后可以交互式的,根据curl提示输入密码。
curl -U user --proxy 127.0.0.1:5000 httpbin/ip
> Enter proxy password for user 'user':
方法二:使用环境变量可以使用环境变量配置实现curl使用代理服务器。curl允许通过设置变量为它支持的每个协议使用环境变量[scheme]_proxy。如果设置了这些,那么当使用对应协议时,curl将默认引入。对http和https协议:
export http_proxy="127.0.0.1:5000"
export https_proxy="127.0.0.1:5000"
同样可以添加认证参数:
export http_proxy=":password@127.0.0.1:5000"
export https_proxy=":password@127.0.0.1:5000"
然后所有,curl http和https请求就会自动使用代理。
与以这种方式设置的所有环境变量一样,这些只是临时变量,shell会话结束或重新启动系统时删除。但是,为了使其在所有会话中可用,可以将其附加到profile文件中,或者对于个人可以在.bashrc 或 .zshrc文件添加,实现持久化的代理设置。
方法三:使用别名配置代理的另一种更持久的方法是shell别名,如果总是需要以这种方式定期连接,这很有用。通过别名可以cur将调用替换为使用代理的版本,这其实和上面的方法二同理。
alias curl="curl -x 127.0.0.1:5000"
方法四:使用.curlrc 配置其实curl也支持个性化的配置参数配置,配置文件默认情况下在个人目录 ~/.curlrc(Windows上为 _curlrc),也可以指定其他文件路径。
在.curlrc配置文件中添加代理支持的方法为:
proxy = ":5000"
实例:使用curl 提取网页的标题最后举个更复杂的,我们使用unix管道将结合grep正则提取站点标题。
curl curl –silent baidu |grep -Eo '<title>(.*)</title>'
--silent参数可以去掉curl输出进度信息,对响应的内容用grep正则表达式中捕获标题。