错题集(已解决):爬虫中碰到请求头header里有冒号‘:‘在key前面,直接调用requests报错valueError: Invalid header name b‘:authority‘

  • Post author:
  • Post category:其他


不说闲话直接入题:

碰到如下这样有冒号’:‘在前面的请求标头,如果直接在requests的headers参数里写冒号的话会报错

在这里插入图片描述

具体报错如下ValueError: Invalid header name b’:<你的header中带有冒号的key名>’:

原因是http2.0的应用(

相关解释

),在requests这个包中没有得到兼容,因此需要导入一个小帮手,在这里感谢

这位大佬的文章

解决方案(使用hyper包):

from hyper.contrib import HTTP20Adapter  # 帮助解析http2.0的帮手
import requests

url = 'https://XXXXXXXXXX'
hdr = {
    ':authority': 'api.xxxxxxxxxx.com', 
    ':method': 'POST',
    ':path': '/xxxx/result/list',
    ':scheme': 'https',
    'accept': 'application/json, text/plain, */*',
}  # 这里根据我们的目标网页填写相应的header,冒号直接原样保留
dts = {...}  # 这里根据我们的页面需要和请求类型发送data

sessions = requests.session()			# 实例化一个可以定制的requests.session类
sessions.mount(url, HTTP20Adapter())	# 指定对http2.0中':'header的解码
res = sessions.post(url, headers=hdr, data=dts)  # 接下来与原有requests的使用方式一致,不再报错

成功

在这里插入图片描述



版权声明:本文为qq_39360343原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。