备案控制台

开发者社区问答正文

python爬取糗事百科，该如何正确保存到本地文件夹?报错

我的程序已经可以爬取网络内容,但不太清楚怎么保存到当地文件夹,用网上方法试着做,但是有报错

import urllib
import urllib.request
import requests ##导入requests
from bs4 import BeautifulSoup ##导入bs4中的BeautifulSoup
import os


for i in range(35):
    page=i
    headers = {'User-Agent':"Mozilla/5.0 (Windows NT 6.1; WOW64)"}
    all_url = 'http://www.qiushibaike.com/hot/page/'+str(page)  ##开始的URL地址
    start_html = requests.get(all_url,headers=headers)
    Soup = BeautifulSoup(start_html.text, 'lxml')
    all_a = Soup.find('div', class_='col1').find_all(class_='content')
    for j in all_a:
        title = j.get_text() #取出a标签的文本
        path = str(title).strip()
        
        os.makedirs(os.path.join("C:\\Users\\DOU XIAOFEI\\Desktop\\wintercode\\funstory", path))
        os.chdir("C:\\Users\\DOU XIAOFEI\\Desktop\\wintercode\\funstory\\"+path) ##切换到上面创建的文件夹
        name = all_url[-9:-4]
        allurl = request.get(all_url,headers=headers)
        f = open(name + '.html', 'ab')
        f.write(allurl.content)
        f.close()

展开

收起

爱吃鱼的程序员 2020-06-08 20:07:56 587 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

爱吃鱼的程序员

https://developer.aliyun.com/profile/5yerqm5bn5yqg?spm=a2c6h.12873639.0.0.6eae304abcjaIB

报错发出来去掉路径中的空格试试i

2020-06-08 20:08:14

赞同展开评论

问答分类：

Python Windows

问答标签：

Python报错 Python文件夹 Python爬取 Python糗事百科 Python本地文件

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

使用阿里云官方python SDK获取实例订阅消息，如何接收HEX数据？如何转储本地文件？

171

1

0

python 爬取过程中如何保持多个会话？

211

1

0

爬虫去重有哪些解决方案以及python scrapy爬取超时怎么处理？

137

1

0

函数计算这个文件夹地址是云函数Python运行时依赖包的地址吗？

72

1

0

函数计算python的函数入口可以指定文件夹名称吗？

108

3

0

已经安装了Python3.5，并确认环境变量已经配置了路劲，且将3.8修改为无效文件夹了

295

2

0

datawork里面写python脚本，最后输出excel到本地，写的本地文件路径，但是最后没写成功

256

1

0

机器学习PAI-Designer算法组件自定义Python脚本组件不能保存提示文件上传失败

333

1

0

求助，运行环境 Python 3.9 报错，有什么处理思路... { "errorMessa

1771

1

0

麻烦看下这个问题，客户的版本是2.9.7，运行python报错odps找不到，这个版本不是自动获取实

836

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

12月冬日咖啡礼｜大模型解决方案邀你来体验

相关文章

Python装饰器：让代码更简洁优雅

Python 3.8 隐藏神器：海象运算符的实战技巧

Python 3.10新特性：更优雅的模式匹配

Python上下文管理器：告别繁琐的资源清理

还有其他疑问?