本文共 895 字,大约阅读时间需要 2 分钟。
由于google浏览器cookie值无法格式化复制
考虑使用火狐浏览器进行cookie获取,但是火狐复制下来的cookie为原生cookie,无法直接使用
如上所示,无法直接使用,考虑通过python进行分割
cookie = 'cna=xaYUEGbE2X0CAd7f2Qhq4DAA; thw=cn;nk=%5Cu65E0%5Cu58F0%5Cu6EF4%5Cu5BF9%5Cu767D; l_g=Ug%3D%3D; cookie17=UonZBGCaYSPQhQ%3D%3D; l=AiIimIoKS0HVED4ao4GprqAT8qKEcyaN; isg=AkxMGzVSdzRypWPIho7m3FdsHapqgvAvBpI7WaYNWPeaMew7zpXAv0KDp47z'cookieDict = {}cookies = cookie.split("; ")for co in cookies: co = co.strip() p = co.split('=') value = co.replace(p[0]+'=', '').replace('"', '') cookieDict[p[0]]=value
输出结果:
{
"thw": "cn;nk=%5Cu65E0%5Cu58F0%5Cu6EF4%5Cu5BF9%5Cu767D", "cookie17": "UonZBGCaYSPQhQ%3D%3D", "l": "AiIimIoKS0HVED4ao4GprqAT8qKEcyaN", "l_g": "Ug%3D%3D", "cna": "xaYUEGbE2X0CAd7f2Qhq4DAA", "isg": "AkxMGzVSdzRypWPIho7m3FdsHapqgvAvBpI7WaYNWPeaMew7zpXAv0KDp47z" }而后使用python requests库添加cookie参数即可实现爬虫
r = requests.get("http://www.tianya.cn/",cookies=cookieDict)
参考链接:
转载地址:http://baio.baihongyu.com/