现在的位置: 首页 > web前端 > 正文

cookiejar的用法

2020年07月21日 web前端 ⁄ 共 1125字 ⁄ 字号 评论关闭

  我们在使用爬虫的时候,经常会用到cookie进行模拟登陆和访问。在使用urllib库做爬虫,我们需要借助http.cookiejar库中的CookieJar来实现。


  cookiejar怎么样


  CookieJar类有一些子类,分别是FileCookieJar,MozillaCookieJar,LWPCookieJar。


  CookieJar:管理HTTPcookie值、存储HTTP请求生成的cookie、向传出的HTTP请求添加cookie的对象。整个cookie都存储在内存中,对CookieJar实例进行垃圾回收后cookie也将丢失。


  FileCookieJar(filename,delayload=None,policy=None):从CookieJar派生而来,用来创建FileCookieJar实例,检索cookie信息并将cookie存储到文件中。filename是存储cookie的文件名。delayload为True时支持延迟访问访问文件,即只有在需要时才读取文件或在文件中存储数据。


  MozillaCookieJar(filename,delayload=None,policy=None):从FileCookieJar派生而来,创建与Mozilla浏览器cookies.txt兼容的FileCookieJar实例。


  LWPCookieJar(filename,delayload=None,policy=None):从FileCookieJar派生而来,创建与libwww-perl标准的Set-Cookie3文件格式兼容的FileCookieJar实例。


  其实大多数情况下,我们只用CookieJar(),如果需要和本地文件交互,就用MozillaCookjar()或LWPCookieJar()。


  当然,如果我们对cookie有定制的需要,那么我们也要借助HTTPCookieProcess处理器来处理。具体看下面代码。


  使用CookieJar获取cookie值


  代码如下:


  if__name__=='__main__':


  url='http://www.baidu.com/'


  headers={


  'User-Agent':'Mozilla/5.0(WindowsNT10.0;WOW64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/53.0.2785.104Safari/537.36Core/1.53.3427.400QQBrowser/9.6.12513.400'


  }


  总之,cookiejar给大家简单的介绍了一些,希望大家多看看。


  

抱歉!评论已关闭.