现在的位置: 首页 > 综合 > 正文

libcurl使用教程

2013年10月17日 ⁄ 综合 ⁄ 共 15242字 ⁄ 字号 评论关闭

各位亲 有时间可以去看看我的  “金骏家居淘宝店” http://jinjun1688.taobao.com/shop/view_shop.htm?tracelog=twddp 买时说明在我的博客看到有优惠哦
还有意外礼品赠送  真正的程序员淘宝店

原文地址:http://curl.haxx.se/libcurl/c/libcurl-tutorial.html

    译者:JGood(http://blog.csdn.net/JGood )

    译者注:这是一篇介绍如何使用libcurl的入门教程。文档不是逐字逐句按原文翻译,而是根据笔者对libcurl的理解,参考原文写成。文中用到的一些例子,可能不是出自原文,而是笔者在学习过程中,写的一些示例程序(笔者使用的libcurl版本是:7.19.6)。出现在这里主要是为了更好的说明libcurl的某些api函数的使用。许多例子都参考libcurl提供的example代码。原文example中的提供的示例程序完全使用C语言,而这里笔者提供的例子使用C++语言。因为能力有限,对于libcurl的某些理解和使用可能有误,欢迎批评指正。

 

目标

    本文档介绍了在应用程序开发过程中,如何正确使用libcurl的基本方式和指导原则。文档使用C语言来调用libcurl的接口,当然也适用于其他与C语言接近的语言。

    文档主要针对使用libcurl来进行开发的人员。文档所掼的应用程序泛指你写的源代码,这些代码使用了libcurl进行数据传输。

    更多关于libcurl的功能和接口信息,可以在相关的主页上查阅。

编译源码

    有很多种不同的方式来编译C语言代码。这里使用UNIX平台下的编译方式。即使你使用的是其他的操作系统,你仍然可以通过阅读本文档来获取许多有用的信息。

编译

    你的编译器必须知道libcurl头文件的位置。所以在编译的时候,你要设置头文件的包含路径。可以使用curl-config工具来获取这方面的信息:

    $ curl-config –cflags

链接

    编译完源码(这时的源代码不是指libcurl的源代码,你是你自己写的程序代码)之后,你还必须把目标文件链接成单个可执行文件。你要链接libcurl库,以及libcurl所依赖的其他库,例如OpenSLL库。当然可能还需要一些其他的操作系统库。最后你还要设置一些编译选项,当然可以使用curl-config工具简化操作:

    $curl-config –libs

是否使用SSL

    定制编译libcurl。与其他库不同的是,libcurl可以定制编译,根据实际需要是否支持某些特性,如是否支持SSL传输,像HTTPS和FTPS。如果决定需要支持SSL,必须在编译时正确的设置。可以使用’curl-config’来判断libcurl库是否支持SSL:

    $ curl-config –feature

autoconf宏

    当你编写配置脚本来检测libcurl及其相应设置时,你可以使用预定义宏。文档docs/libcurl/libcurl.m4告诉你如何使用这些宏。

跨平台的可移植的代码

    libcurl的开发人员花费很大的努力,使libcurl尽可能在大多数平台上正常运行。

全局初始化

    应用程序在使用libcurl之前,必须先初始化libcurl。libcurl只需初始化一次。可以使用以下语句进行初始化:

curl_global_init();

    curl_global_init()接收一个参数,告诉libcurl如何初始化。参数CURL_GLOBAL_ALL 会使libcurl初始化所有的子模块和一些默认的选项,通常这是一个比较好的默认参数值。还有两个可选值:

CURL_GLOBAL_WIN32

    只能应用于Windows平台。它告诉libcurl初始化winsock库。如果winsock库没有正确地初始化,应用程序就不能使用socket。在应用程序中,只要初始化一次即可。

CURL_GLOBAL_SSL

    如果libcurl在编译时被设定支持SSL,那么该参数用于初始化相应的SSL库。同样,在应用程序中,只要初始化一次即可。

    libcurl有默认的保护机制,如果在调用curl_easy_perform时它检测到还没有通过curl_global_init进行初始化,libcurl会根据当前的运行时环境,自动调用全局初始化函数。但必须清楚的是,让系统自已初始化不是一个好的选择。

    当应用程序不再使用libcurl的时候,应该调用curl_global_cleanup来释放相关的资源。

    在程序中,应当避免多次调用curl_global_init和curl_global_cleanup。它们只能被调用一次。

libcurl提供的功能

    在运行时根据libcurl支持的特性来进行开发,通常比编译时更好。可以通过调用curl_version_info函数返回的结构体来获取运行时的具体信息,从而确定当前环境下libcurl支持的一些特性。下面是笔者在visual studio2008中调用相关函数获取libcurl版本信息的截图: 
pic1  

使用easy interface

    首先介绍libcurl中被称为easy interface的api函数,所有这些函数都是有相同的前缀:curl_easy 。

    当前版本的libcurl也提供了multi interface,关于这些接口的详细使用,在下面的章节中会有介绍。在使用multi interface之前,你首先应该理解如何使用easy interface。

    要使用easy interface,首先必须创建一个easy handle,easy handle用于执行每次操作。基本上,每个线程都应该有自己的easy handle用于数据通信(如果需要的话)。千万不要在多线程之间共享同一个easy handle。下面的函数用于获取一个easy handle :

CURL *easy_handle = curl_easy_init();

    在easy handle上可以设置属性和操作(action)。easy handle就像一个逻辑连接,用于接下来要进行的数据传输。

    使用curl_easy_setopt函数可以设置easy handle的属性和操作,这些属性和操作控制libcurl如何与远程主机进行数据通信。一旦在easy handle中设置了相应的属性和操作,它们将一直作用该easy handle。也就是说,重复使用easy hanle向远程主机发出请求,先前设置的属性仍然生效。

    easy handle的许多属性使用字符串(以/0结尾的字节数组)来设置。通过curl_easy_setopt函数设置字符串属性时,libcurl内部会自动拷贝这些字符串,所以在设置完相关属性之后,字符串可以直接被释放掉(如果需要的话)。

    easy handle最基本、最常用的属性是URL。你应当通过CURLOPT_URL属性提供适当的URL:

curl_easy_setopt(easy_handle, CURLOPT_URL, "http://blog.csdn.net/JGood ");

    假设你要获取URL所表示的远程主机上的资源。你需要写一段程序用来完成数据传输,你可能希望直接保存接收到的数据而不是简单的在输出窗口中打印它们。所以,你必须首先写一个回调函数用来保存接收到的数据。回调函数的原型如下:

size_t write_data(void *buffer, size_t size, size_t nmemb, void *userp);

    可以使用下面的语句来注册回调函数,回调函数将会在接收到数据的时候被调用:

curl_easy_setopt(easy_handle, CURLOPT_WRITEFUNCTION, write_data);

    可以给回调函数提供一个自定义参数,libcurl不处理该参数,只是简单的传递:

curl_easy_setopt(easy_handle, CURLOPT_WRITEDATA, &internal_struct);

    如果你没有通过CURLOPT_WRITEFUNCTION属性给easy handle设置回调函数,libcurl会提供一个默认的回调函数,它只是简单的将接收到的数据打印到标准输出。你也可以通过CURLOPT_WRITEDATA属性给默认回调函数传递一个已经打开的文件指针,用于将数据输出到文件里。

    下面是一些平台相关的注意点。在一些平台上,libcurl不能直接操作由应用程序打开的文件。所以,如果使用默认的回调函数,同时通过CURLOPT_WRITEDATA属性给easy handle传递一个文件指针,应用程序可能会执行失败。如果你希望自己的程序能跑在任何系统上,你必须避免出现这种情况。

    如果以win32动态连接库的形式来使用libcurl,在设置CURLOPT_WRITEDATA属性时,你必须同时 使用CURLOPT_WRITEFUNCTION来注册回调函数。否则程序会执行失败(笔者尝试只传递一个打开的文件指针而不显式设置回调函数,程序并没有崩溃。可能是我使用的方式不正确。)。

    当然,libcurl还支持许多其他的属性,在接下来的篇幅里,你将会逐步地接触到它们。调用下面的函数,将执行真正的数据通信:

success = curl_easy_perform(easy_handle);

    curl_easy_perfrom将连接到远程主机,执行必要的命令,并接收数据。当接收到数据时,先前设置的回调函数将被调用。libcurl可能一次只接收到1字节的数据,也可能接收到好几K的数据,libcurl会尽可能多、及时的将数据传递给回调函数。回调函数返回接收的数据长度。如果回调函数返回的数据长度与传递给它的长度不一致(即返回长度 != size * nmemb),libcurl将会终止操作,并返回一个错误代码。

    当数据传递结束的时候,curl_easy_perform将返回一个代码表示操作成功或失败。如果需要获取更多有关通信细节的信息,你可以设置CURLOPT_ERRORBUFFER属性,让libcurl缓存许多可读的错误信息。

    easy handle在完成一次数据通信之后可以被重用。这里非常建议你重用一个已经存在的easy handle。如果在完成数据传输之后,你创建另一个easy handle来执行其他的数据通信,libcurl在内部会尝试着重用上一次创建的连接。

    对于有些协议,下载文件可能包括许多复杂的子过程:日志记录、设置传输模式、选择当前文件夹,最后下载文件数据。使用libcurl,你不需要关心这一切,你只需简单地提供一个URL,libcurl会给你做剩余所有的工作。

    下面的这个例子演示了如何获取网页源码,将其保存到本地文件,并同时将获取的源码输出到控制台上。

/**  *	@brief libcurl接收到数据时的回调函数  *  *	将接收到的数据保存到本地文件中,同时显示在控制台上。  *
 *	@param [in] buffer 接收到的数据所在缓冲区
 *	@param [in] size 数据长度
 *	@param [in] nmemb 数据片数量
 *	@param [in/out] 用户自定义指针
 *	@return 获取的数据长度
 */ 
size_t process_data(void *buffer, size_t size, size_t nmemb, void *user_p) { 	FILE *fp = (FILE *)user_p; 	size_t return_size = fwrite(buffer, size, nmemb, fp); 	cout << (char *)buffer << endl;
	return return_size; }
 
 int main(int argc, char **argv) { 	// 初始化libcurl 	CURLcode return_code; 	return_code = curl_global_init(CURL_GLOBAL_WIN32); 	if (CURLE_OK != return_code) 	{ 		cerr << "init libcurl failed." << endl; 		return -1; 	}

 	// 获取easy handle 	CURL *easy_handle = curl_easy_init();
	if (NULL == easy_handle)
	{
		cerr << "get a easy handle failed." << endl;
                  curl_global_cleanup(); 
		return -1;
	}
 	FILE *fp = fopen("data.html", "ab+");	//  	// 设置easy handle属性 	curl_easy_setopt(easy_handle, CURLOPT_URL, http://blog.csdn.net/JGood);
	curl_easy_setopt(easy_handle, CURLOPT_WRITEFUNCTION, &process_data);
	curl_easy_setopt(easy_handle, CURLOPT_WRITEDATA, fp);

 	// 执行数据请求 	curl_easy_perform(easy_handle);	
 	// 释放资源 
	fclose(fp);
	curl_easy_cleanup(easy_handle);
	curl_global_cleanup();

 	return 0;
}

 

多线程问题

    首先一个基本原则就是:绝对不应该在线程之间共享同一个libcurl handle,不管是easy handle还是multi handle(将在下文中介绍)。一个线程每次只能使用一个handle。

    libcurl是线程安全的,但有两点例外:信号(signals)和SSL/TLS handler。 信号用于超时失效名字解析(timing out name resolves)。libcurl依赖其他的库来支持SSL/STL,所以用多线程的方式访问HTTPS或FTPS的URL时,应该满足这些库对多线程操作的一些要求。详细可以参考:

    OpenSSL: http://www.openssl.org/docs/crypto/threads.html#DESCRIPTION

    GnuTLS: http://www.gnu.org/software/gnutls/manual/html_node/Multi_002dthreaded-applications.html

    NSS: 宣称是多线程安全的。

什么时候libcurl无法正常工作

    传输失败总是有原因的。你可能错误的设置了一些libcurl的属性或者没有正确的理解某些属性的含义,或者是远程主机返回一些无法被正确解析的内容。

    这里有一个黄金法则来处理这些问题:将CURLOPT_VERBOSE属性设置为1,libcurl会输出通信过程中的一些细节。如果使用的是http协议,请求头/响应头也会被输出。将CURLOPT_HEADER设为1,这些头信息将出现在消息的内容中。

    当然不可否认的是,libcurl还存在bug。当你在使用libcurl的过程中发现bug时,希望能够提交给我们,好让我们能够修复这些bug。你在提交bug时,请同时提供详细的信息:通过CURLOPT_VERBOSE属性跟踪到的协议信息、libcurl版本、libcurl的客户代码、操作系统名称、版本、编译器名称、版本等等。

    如果你对相关的协议了解越多,在使用libcurl时,就越不容易犯错。

上传数据到远程站点

    libcurl提供协议无关的方式进行数据传输。所以上传一个文件到FTP服务器,跟向HTTP服务器提交一个PUT请求的操作方式是类似的:

1. 创建easy handle或者重用先前创建的easy handle。

2. 设置CURLOPT_URL属性。

3. 编写回调函数。在执行上传的时候,libcurl通过回调函数读取要上传的数据。(如果要从远程服务器下载数据,可以通过回调来保存接收到的数据。)回调函数的原型如下:

size_t function(char *bufptr, size_t size, size_t nitems, void *userp); 

    bufptr指针表示缓冲区,用于保存要上传的数据,size * nitems是缓冲区数据的长度,userp是一个用户自定义指针,libcurl不对该指针作任何操作,它只是简单的传递该指针。可以使用该指针在应用程序与libcurl之间传递信息。

4. 注册回调函数,设置自定义指针。语法如下:

// 注册回调函数 curl_easy_setopt(easy_handle, CURLOPT_READFUNCTION, read_function);  // 设置自定义指针 curl_easy_setopt(easy_handle, CURLOPT_READDATA, &filedata); 

5. 告诉libcurl,执行的是上传操作。

curl_easy_setopt(easy_handle, CURLOPT_UPLOAD, 1L); 

    有些协议在没有预先知道上传文件大小的情况下,可能无法正确判断上传是否结束,所以最好预先使用CURLOPT_INFILESIZE_LARGE属性:告诉它要上传文件的大小:

/* in this example, file_size must be an curl_off_t variable */ curl_easy_setopt(easy_handle, CURLOPT_INFILESIZE_LARGE, file_size);

6. 调用curl_easy_perform。

    接下来,libcurl将会完成剩下的所有工作。在上传文件过程中,libcurl会不断调用先前设置的回调函数,用于将要上传的数据读入到缓冲区,并执行上传。

    下面的例子演示如何将文件上传到FTP服务器。笔者使用的是IIS自带的FTP服务,同时在FTP上设置了可写权限。

/**
 *	@brief 读取数据的回调。
 */ size_t read_data(void *buffer, size_t size, size_t nmemb, void *user_p) { 	return fread(buffer, size, nmemb, (FILE *)user_p); } 
 int main(int argc, char **argv) { 	// 初始化libcurl 	CURLcode code;
	code = curl_global_init(CURL_GLOBAL_WIN32); 	if (code != CURLE_OK) 	{ 		cerr << "init libcurl failed." << endl; 		return -1; 	} 
 	FILE *fp = fopen("a.html", "rb"); 	if (NULL == fp) 	{
		cout << "can't open file." << endl; 		curl_global_cleanup(); 		return -1; 	}

 	// 获取文件大小 	fseek(fp, 0, 2);
	int file_size = ftell(fp); 	rewind(fp); 
 	// 获取easy handle 
	CURL *easy_handle = NULL; 	easy_handle = curl_easy_init(); 	if (NULL == easy_handle) 	{ 		cerr << "get a easy handle failed." << endl; 		fclose(fp); 		curl_global_cleanup(); 		return -1;
	}

 	// 设置eash handle属性 	curl_easy_setopt(easy_handle, CURLOPT_URL, ftp://127.0.0.1/upload.html); 	curl_easy_setopt(easy_handle, CURLOPT_UPLOAD, 1L); 	curl_easy_setopt(easy_handle, CURLOPT_READFUNCTION, &read_data); 	curl_easy_setopt(easy_handle, CURLOPT_READDATA, fp); 	curl_easy_setopt(easy_handle, CURLOPT_INFILESIZE_LARGE, file_size); 
 	// 执行上传操作 	code = curl_easy_perform(easy_handle); 	if (code == CURLE_OK) 	{ 		cout << "upload successfully." << endl; 	}

 	// 释放资源 	fclose(fp);
	curl_easy_cleanup(easy_handle);
	curl_global_cleanup();

 	return 0; }

 

关于密码

    客户端向服务器发送请求时,许多协议都要求提供用户名与密码。libcurl提供了多种方式来设置它们。

    一些协议支持在URL中直接指定用户名和密码,类似于: protocol://user:password@example.com/path/。libcurl能正确的识别这种URL中的用户名与密码并执行相应的操作。如果你提供的用户名和密码中有特殊字符,首先应该对其进行URL编码。

    也可以通过CURLOPT_USERPWD属性来设置用户名与密码。参数是格式如 “user:password ”的字符串:

curl_easy_setopt(easy_handle, CURLOPT_USERPWD, "user_name:password"); 

    (下面这几段文字我理解地模模糊糊)有时候在访问代理服务器的时候,可能时时要求提供用户名和密码进行用户身份验证。这种情况下,libcurl提供了另一个属性CURLOPT_PROXYUSERPWD:

curl_easy_setopt(easy_handle, CURLOPT_PROXYUSERPWD, "user_name:password"); 

    在UNIX平台下,访问FTP的用户名和密码可能会被保存在$HOME/.netrc文件中。libcurl支持直接从这个文件中获取用户名与密码:

curl_easy_setopt(easy_handle, CURLOPT_NETRC, 1L); 

    在使用SSL时,可能需要提供一个私钥用于数据安全传输,通过CURLOPT_KEYPASSWD来设置私钥:

curl_easy_setopt(easy_handle, CURLOPT_KEYPASSWD, "keypassword"); 

 

HTTP验证

    上一章介绍了如何在libcurl中,对需要身份验证的URL设置用户名与密码。在使用HTTP协议时,客户端有很多种方式向服务器提供验证信息。默认的HTTP验证方法是"Basic”,它将用户名与密码以明文的方式、经Base64编码后保存在HTTP请求头中,发往服务器。当然这不太安全。

    当前版本的libcurl支持的验证方法有:basic, Digest, NTLM, Negotiate, GSS-Negotiate and SPNEGO。(译者感叹:搞Web这么多年,尽然不知道这些Http的验证方式,实在惭愧。)可以通过CURLOPT_HTTPAUTH属性来设置具体的验证方式:

curl_easy_setopt(easy_handle, CURLOPT_HTTPAUTH, CURLAUTH_DIGEST);

    向代理服务器发送验证信息时,可以通过CURLOPT_PROXYAUTH设置验证方式:

curl_easy_setopt(easy_handle, CURLOPT_PROXYAUTH, CURLAUTH_NTLM); 

    也可以同时设置多种验证方式(通过按位与), 使用‘CURLAUTH_ANY‘将允许libcurl可以选择任何它所支持的验证方式。通过CURLOPT_HTTPAUTH或CURLOPT_PROXYAUTH属性设置的多种验证方式,libcurl会在运行时选择一种它认为是最好的方式与服务器通信:

curl_easy_setopt(easy_handle, CURLOPT_HTTPAUTH,  CURLAUTH_DIGEST|CURLAUTH_BASIC); 
// curl_easy_setopt(easy_handle, CURLOPT_HTTPAUTH,  CURLAUTH_ANY); 

 

HTTP Post

    这一章介绍如何使用libcurl以Post方式向HTTP服务器提交数据。

    方法一,也是最简单的方式,就像html中使用<form>标签提交数据一样,只需向libcurl提供一个包含数据的字符串即可。下面是笔者学习过程中的一个demo程序:

int main(int argc, char **argv) { 	code = curl_global_init(CURL_GLOBAL_WIN32); 	CURL *easy_handle = curl_easy_init(); 
 	curl_easy_setopt(easy_handle, CURLOPT_URL, http://localhost:2210/Default.aspx); 	// 单个域post 	curl_easy_setopt(easy_handle, CURLOPT_POSTFIELDS, "name=jgood&address=hangzhou");
	code = curl_easy_perform(easy_handle);
 	curl_easy_cleanup(easy_handle);
	curl_global_cleanup();

 	return 0; }

    在asp.net Web服务器上跟踪调试,得到客户程序提交上来的数据,下面是截图:pic1

    上面的代码够简单吧~_~ 有时候,我们需要提交一些二进制数据到HTTP服务器,使用方法一就不行了,因为方法一中实际提交的是一个字符串,字符串遇到/0就表示结束了。所以在上传二进制数据的时候,必须明确的告诉libcurl要提交的数据的长度。在上传二进制数据的时候,还应该设置提交的Content-Type头信息。下面的示例代码:

int main(int argc, char **argv) { 	curl_global_init(CURL_GLOBAL_WIN32);
	CURL *easy_handle = curl_easy_init();

 	// 上传二进制数据 	char data[] = { 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0 }; 	curl_slist *http_headers = NULL; 	http_headers = curl_slist_append(http_headers, "Content-Type: text/xml");
 	curl_easy_setopt(easy_handle, CURLOPT_HTTPHEADER, http_headers);
	curl_easy_setopt(easy_handle, CURLOPT_URL, http://localhost:2210/Default.aspx); 	curl_easy_setopt(easy_handle, CURLOPT_POSTFIELDS, data); 	curl_easy_setopt(easy_handle, CURLOPT_POSTFIELDSIZE, sizeof(data)); 
 	curl_easy_perform(easy_handle); 
 	curl_slist_free_all(http_headers); 	curl_easy_cleanup(easy_handle); 	curl_global_cleanup();

 	return 0; }

    在asp.net Web服务器上跟踪调试,得到客户程序提交上来的二进制数据,下面是截图:pic1

     上面介绍的两种方式,可以完成大部分的HTTP POST操作。但上面的两种方式都不支持multi-part formposts。Multi-part formposts被认为是提交二进制数据(或大量数据)的更好方法,可以在RFC1867, RFC2388中找到他们的定义。何为Multi-part?其实,就我理解,就是在Post提交的时候,有不同的数据单元,每个单元有自己的名称与内容,内容可以是文本的,也可以是二进制的。同时,每个数据单元都可以有自己的消息头,MIME类型,这些数据单元组成一个链表,提交到HTTP服务器。libcurl提供了方便的api用于支持multi-part
formposts。使用curl_formadd函数,可以添加不同的数据数据单元,然后提交到服务器。下面是一个multi-part formposts的例子(更详细的使用,请参考:http://curl.haxx.se/libcurl/c/curl_formadd.html ):

int main() {

               curl_global_init(CURL_GLOBAL_WIN32); 
               CURL *easy_handle = curl_easy_init();

	// 使用multi-parts form post 	curl_easy_setopt(easy_handle, CURLOPT_URL, http://localhost:2210/Default.aspx);
	curl_httppost *post = NULL;
	curl_httppost *last = NULL;	
 	// 文本数据 	curl_formadd(&post, &last, CURLFORM_COPYNAME, "name", CURLFORM_COPYCONTENTS, "JGood", CURLFORM_END);
	curl_formadd(&post, &last, CURLFORM_COPYNAME, "address", CURLFORM_COPYCONTENTS, "HangZhou", CURLFORM_END);
 	// 文本文件中的数据 	curl_formadd(&post, &last, CURLFORM_COPYNAME, "file", CURLFORM_FILECONTENT, "ReadMe.txt", CURLFORM_END); 	curl_easy_setopt(easy_handle, CURLOPT_HTTPPOST, post); 	curl_easy_perform(easy_handle);
 	curl_formfree(post); 	curl_easy_cleanup(easy_handle); 	curl_global_cleanup(); 
 	return 0; }

     最后要说明的是,所有在easy handle上设置的属性都是”sticky”的,什么意思?就是说在easy handle上设置的属性都将被保存,即使执行完curl_easy_perform之后,这些属性值仍然存在。通过将CURLOPT_HTTPGET设为1可以使easy handle回到最原始的状态:

curl_easy_setopt(easy_handle, CURLOPT_HTTPGET, 1L); 

 

显示进度

    libcurl支持通信过程中的进度控制。通过将CURLOPT_NOPROCESS设置为0开启进度支持。该选项默认值为1。对大多数应用程序,我们需要提供一个进度显示回调。libcurl会不定期的将当前传输的进度通过回调函数告诉你的程序。回调函数的原型如下:

int progress_callback(void *clientp, double dltotal, double dlnow, double ultotal, double ulnow);

    通过CURLOPT_PROGRESSFUNCTION注册该回调函数。参数clientp是一个用户自定义指针,应用程序通过CURLOPT_PROCESSDATA属性将该自定义指定传递给libcurl。libcurl对该参数不作任何处理,只是简单将其传递给回调函数。

在C++中使用libcurl

    在C++中使用libcurl跟在C语言中没有任何区别,只有一个地方要注意:回调函数不能是类的非静态成员函数。例如:

class AClass {       static size_t write_data(void *ptr, size_t size, size_t nmemb, void *ourpointer)       {         /* do what you want with the data */      }  } 

 

代理

    什么是代理?Merrian-Webster的解释是:一个通过验证的用户扮演另一个用户。今天,代理已经被广泛的使用。许多公司提供网络代理服务器,允许员工的网络客户端访问、下载文件。代理服务器处理这些用户的请求。

    libcurl支持SOCKS和HTTP代理。使用代理,libcurl会把用户输入的URL提交给代理服务器,而不是直接根据URL去访问远程资源。

    当前版本的libcurl并不支持SOCKS代理的所有功能。

    对于HTTP代理来说,即使请求的URL不是一个合法的HTTP URL(比方你提供了一个ftp的url),它仍然会先被提交到HTTP代理。

代理选项

    CURLOPT_PROXY属性用于设置libcurl使用的代理服务器地址:

curl_easy_setopt(easy_handle, CURLOPT_PROXY, "proxy-host.com:8080"); 

    可以把主机名与端口号分开设置:

curl_easy_setopt(easy_handle, CURLOPT_PROXY, "proxy-host.com");  curl_easy_setopt(easy_handle, CURLOPT_PROXYPORT, "8080");  // 端口号是用字符串还是整数?? 

    有些代理服务器要求用户通过验证之后才允许接受其请求,此时应该先提供验证信息:

curl_easy_setopt(easy_handle, CURLOPT_PROXYUSERPWD, "user:password"); 

    还要告诉libcurl使用的代理类型(如果没有提供,libcurl会认为是HTTP代理):

curl_easy_setopt(easy_handle, CURLOPT_PROXYTYPE, CURLPROXY_SOCKS4); 
 
环境变量

     对于有些协议,libcurl会自动检测并使用一些环境变量,并根据这些环境变量来确定要使用的代理服务器。这些环境变量的名称格式一般是"[protocol]_proxy"(注意小写)。例如输入一个HTTP的URL,那么名称为"http_proxy"的环境变量就会被检测是否存在,如果存在,libcurl会使用该环境变量指定的代理。相同的规则也适用于FTP。

    这些环境变量的值的格式必须是这样的:"[protocol://][user:password@]machine[:port]"。libcurl会忽略掉[protocol://],如果没有提供端口号,libcurl使用该协议的默认端口。 

    有两个比较特殊的环境变量:'all_proxy'与'no_proxy'。如果一个URL所对应的协议,它的环境变量没有设置,那么'all_proxy'指定的代理将被使用。'no_proxy'则指定了一个不应被使用的代理主机的列表。例如:no_proxy的值是'192.168.1.10',即使存在http_proxy,它的值也是'192.168.1.10','192.168.1.10'也不会被作为代理。no_proxy=”*”表示不允许使用任何代理。

    显式地将CURLOPT_PROXY属性设置为空,可以禁止libcurl检查并使用环境变量来使用代理。

SSL和代理

    SSL为点到点通信提供安全保障。它包含一些强壮的加密措施和其他安全检测,这使得上面讲到的代理方式不适用于SSL。除非代理服务器提供专用通道,对进出该代理服务器的数据不作任何检测或禁止。通过HTTP代理服务器打开SSL连接,意味着代理服务器要直接连接到目标主机的指定端口。因为代理服务器对在专用通道上传输的数据的类型毫无所知,所以它往往会使某些机制失效,如缓存机制。许多组织只允许在443端口上创建这种类型的数据通道。

代理通道(Tunneling Through Proxy)

    正如上面讲到的,要使SSL工作必须在代理服务器创建专用数据通道,通常专用通道只被限制应用于HTTPS。通过HTTP代理在应用程序与目标之间创建一个专用数据通道,应该预防在该专有通道上执行非HTTP的操作,如进行FTP上传或执行FTP命令。代理服务器管理员应该禁止非法的操作。

    通过CURLOPT_HTTPPROXYTUNNEL属性来告诉libcurl使用代理通道:

curl_easy_setopt(easy_handle, CURLOPT_HTTPPROXYTUNNEL, 1L); 

     有时候你想通过代理通道执行平常的HTTP操作,而实际上却可能使你不经过代理服务器而直接与远程主机进行交互。libcurl不会代替这种新引入的行为。

自动配置代理

    许多浏览器支持自动配置代理,例如NetScape。libcurl并不支持这些。

持久化的好处

抱歉!评论已关闭.