备案控制台

开发者社区彭世瑜的博客文章正文

Python爬虫：将headers请求头字符串转为字典

2022-09-01 341

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Python爬虫：将headers请求头字符串转为字典

原生请求头字符串

raw_headers = """Host: open.tool.hexun.com
Pragma: no-cache
Cache-Control: no-cache
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36
Accept: */*
Referer: http://stock.hexun.com/gsxw/
Accept-Encoding: gzip, deflate
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8"""

将字符串转为字典

split(sep=None, maxsplit=None)

headers = dict([line.split(": ",1) for line in raw_headers.split("\n")])

输出测试

print(headers)
"""
{
    'Accept-Language': ' zh-CN,zh;q=0.9,en;q=0.8', 
    'Accept-Encoding': ' gzip, deflate', 
    'Accept': ' */*', 
    'User-Agent': ' Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36', 
    'Host': ' open.tool.hexun.com', 
    'Referer': ' http://stock.hexun.com/gsxw/',
    'Pragma': ' no-cache', 
    'Cache-Control': ' no-cache'
}
"""

封装为函数

def get_headers(header_raw):
    """
    通过原生请求头获取请求头字典
    :param header_raw: {str} 浏览器请求头
    :return: {dict} headers
    """
   return dict(line.split(": ", 1) for line in header_raw.split("\n") if line != '')
def get_cookies(cookie_raw):
    """
    通过原生cookie获取cookie字段
    :param cookie_raw: {str} 浏览器原始cookie
    :return: {dict} cookies
    """
    return dict(line.split("=", 1) for line in cookie_raw.split("; "))

如果需要临时转换一下，可以使用小工具 coder

文章标签：

Python

数据采集

关键词：

Python爬虫

Python字典

Python字符串

爬虫python

Python字符串字典

码农技术君

目录

相关文章

小白学大数据

|

8月前

|

数据采集测试技术 C++

无headers爬虫 vs 带headers爬虫：Python性能对比

无headers爬虫 vs 带headers爬虫：Python性能对比

小白学大数据

301 5 5

土木林森

|

数据采集存储 JSON

Python网络爬虫：Scrapy框架的实战应用与技巧分享

【10月更文挑战第27天】本文介绍了Python网络爬虫Scrapy框架的实战应用与技巧。首先讲解了如何创建Scrapy项目、定义爬虫、处理JSON响应、设置User-Agent和代理，以及存储爬取的数据。通过具体示例，帮助读者掌握Scrapy的核心功能和使用方法，提升数据采集效率。

土木林森

562 6 6

winx_19970108018

|

8月前

|

数据采集存储监控

Python 原生爬虫教程：网络爬虫的基本概念和认知

网络爬虫是一种自动抓取互联网信息的程序，广泛应用于搜索引擎、数据采集、新闻聚合和价格监控等领域。其工作流程包括 URL 调度、HTTP 请求、页面下载、解析、数据存储及新 URL 发现。Python 因其丰富的库（如 requests、BeautifulSoup、Scrapy）和简洁语法成为爬虫开发的首选语言。然而，在使用爬虫时需注意法律与道德问题，例如遵守 robots.txt 规则、控制请求频率以及合法使用数据，以确保爬虫技术健康有序发展。

winx_19970108018

1214 31 32

小白学大数据

|

7月前

|

数据采集存储 NoSQL

分布式爬虫去重：Python + Redis实现高效URL去重

分布式爬虫去重：Python + Redis实现高效URL去重

小白学大数据

390 4 5

python编程狮

|

机器学习/深度学习数据采集数据可视化

基于爬虫和机器学习的招聘数据分析与可视化系统，python django框架，前端bootstrap，机器学习有八种带有可视化大屏和后台

本文介绍了一个基于Python Django框架和Bootstrap前端技术，集成了机器学习算法和数据可视化的招聘数据分析与可视化系统，该系统通过爬虫技术获取职位信息，并使用多种机器学习模型进行薪资预测、职位匹配和趋势分析，提供了一个直观的可视化大屏和后台管理系统，以优化招聘策略并提升决策质量。

python编程狮

866 4 5

小白学大数据

|

8月前

|

数据采集 XML 存储

Headers池技术在Python爬虫反反爬中的应用

Headers池技术在Python爬虫反反爬中的应用

小白学大数据

372 0 0

请看我回答~

|

数据采集存储搜索推荐

打造个性化网页爬虫：从零开始的Python教程

【8月更文挑战第31天】在数字信息的海洋中，网页爬虫是一艘能够自动搜集网络数据的神奇船只。本文将引导你启航，用Python语言建造属于你自己的网页爬虫。我们将一起探索如何从无到有，一步步构建一个能够抓取、解析并存储网页数据的基础爬虫。文章不仅分享代码，更带你理解背后的逻辑，让你能在遇到问题时自行找到解决方案。无论你是编程新手还是有一定基础的开发者，这篇文章都会为你打开一扇通往数据世界的新窗。

请看我回答~

185 0 0

beloved000

|

数据采集存储数据挖掘

深入探索 Python 爬虫：高级技术与实战应用

本文介绍了Python爬虫的高级技术，涵盖并发处理、反爬虫策略（如验证码识别与模拟登录）及数据存储与处理方法。通过asyncio库实现异步爬虫，提升效率；利用tesseract和requests库应对反爬措施；借助SQLAlchemy和pandas进行数据存储与分析。实战部分展示了如何爬取电商网站的商品信息及新闻网站的文章内容。提醒读者在实际应用中需遵守法律法规。

beloved000

474 66 66

土木林森

|

数据采集前端开发中间件

Python网络爬虫：Scrapy框架的实战应用与技巧分享

【10月更文挑战第26天】Python是一种强大的编程语言，在数据抓取和网络爬虫领域应用广泛。Scrapy作为高效灵活的爬虫框架，为开发者提供了强大的工具集。本文通过实战案例，详细解析Scrapy框架的应用与技巧，并附上示例代码。文章介绍了Scrapy的基本概念、创建项目、编写简单爬虫、高级特性和技巧等内容。

土木林森

572 4 4

小白学大数据

|

数据采集 Web App开发 JavaScript

爬虫策略规避：Python爬虫的浏览器自动化

爬虫策略规避：Python爬虫的浏览器自动化

小白学大数据

450 1 1

热门文章

最新文章

Prompt 工程实战：如何让 AI 生成高质量的 aiohttp 异步爬虫代码

Python爬虫知识点梳理

python爬虫之微打赏（scrapy版）

星星充电充电桩数据爬虫

python爬虫之图片下载APP1.0

网络爬虫（1）：概述

Python爬虫验证码识别——手机验证码的自动化处理

Python爬虫技术从去哪儿网获取旅游数据，对攻略进行可视化分析，提供全面的旅游攻略和个性化的出行建议

Python网络爬虫 - 3. 异常处理

阿里云爬虫风险管理产品商业化，为云端流量保驾护航

基于python大数据的台风灾害分析及预测系统

基于Python大数据的热门游戏推荐系统

基于python大数据的青少年网络使用情况分析及预测系统

2026版基于python大数据的电影分析可视化系统

基于Python大数据的的电商用户行为分析系统

基于python大数据技术的医疗数据分析与研究

基于python大数据深度学习的酒店评论文本情感分析系统

Python SQLAlchemy模块：从入门到实战的数据库操作指南

基于python大数据的的海洋气象数据可视化平台

基于Python大数据的主流汽车价格分析可视化系统

相关课程

更多

Python爬虫实战

Python开发基础入门

Python常用数据科学库

Python网络爬虫实战

Python完全自学手册图文教程

Python基础快速入门实战教程

相关电子书

更多

From Python Scikit-Learn to Sc

Data Pre-Processing in Python:

双剑合璧-Python和大数据计算平台的结合

推荐镜像

更多

python-release

下一篇

安全设备篇——WAF