Scrapy使用MailSender发送邮件

简介: Scrapy使用MailSender发送邮件

1、配置邮箱账号 163为例

settings.py

# 邮箱配置
MAIL_HOST = "smtp.163.com"
MAIL_FROM = "xxx@163.com"
MAIL_USER = "xxx@163.com"
MAIL_PASS = "xxx"   # 授权码
MAIL_PORT = 25

2、发送邮件的代码

# -*- coding: utf-8 -*-


import scrapy
from scrapy import cmdline
from scrapy.mail import MailSender


class SendEmailSpider(scrapy.Spider):
name = 'send_email'

start_urls = ['https://www.baidu.com/';]

def parse(self, response):
# 方式一:读取配置文件中的配置
# debug参数为True 不会发送邮件,仅仅打印日志
mailer = MailSender(
smtphost=self.settings["MAIL_HOST"],
mailfrom=self.settings["MAIL_FROM"],
smtpuser=self.settings["MAIL_USER"],
smtppass=self.settings["MAIL_PASS"],
smtpport=self.settings["MAIL_PORT"]
)

# 方式二:直接传入settings 对象
mailer = MailSender.from_settings(self.settings)

# 发送邮件
return mailer.send(
to=["xxx@qq.com"],
subject="这是邮件标题",
body="这是邮件内容"
)


if name == '__main__':
cmdline.execute("scrapy crawl send_email".split())

问题

1、问题一

以上代码如果不加return, 可以正常发送邮件

mailer.send(
to=["xxx@qq.com"],
subject="这是邮件标题",
body="这是邮件内容"
)

不过会报错

builtins.AttributeError: 'NoneType' object has no attribute 'bio_read'

2、问题二

如果按照文档的写法直接不传参数实例化MailSender

mailer = MailSender()

会报错

Unable to send mail: To=['xxx@qq.com'] Cc=[] Subject="这是邮件标题" Attachs=0- 
Connection was refused by other side: 61: Connection refused.

原因是MailSender的实例化参数是固定的默认值,并没有读取settings.py文件中设定的值,坑~~

构造函数源码如下

class MailSender(object):

def __init__(self, smtphost='localhost', mailfrom='scrapy@localhost',
smtpuser=None, smtppass=None, smtpport=25,
smtptls=False, smtpssl=False, debug=False):
self.smtphost = smtphost
self.smtpport = smtpport
self.smtpuser = _to_bytes_or_none(smtpuser)
self.smtppass = _to_bytes_or_none(smtppass)
self.smtptls = smtptls
self.smtpssl = smtpssl
self.mailfrom = mailfrom
self.debug = debug

如果采用此方式实例化MailSender 需要采用方式一手动读取配置

吐槽:搞不懂scrapy作者为啥要设置完全没有用的默认值, 也不报错,坑了一波人


3、问题三

如果按照文档的写法

mailer = MailSender.from_settings(settings)

直接就会报错,都没有定义

NameError: name 'settings' is not defined

我的第一感觉是把项目的settings.py 导入传进去

import settings

mailer = MailSender.from_settings(settings)

然后又报错了

TypeError: 'module' object is not subscriptable

查看文档参数说明才知道要传一个settings 对象

settings (scrapy.settings.Settings object)

所以需要按照方式二的形式,才能正确获取setting对象

吐槽:动态语言的函数定义并没有严格要求参数类型,没有把具体的参数类型写清楚,不看文档完全不知道传什么参数


参考

  1. https://scrapy-chs.readthedocs.io/zh_CN/0.24/topics/email.html
            </div>
目录
相关文章
|
网络协议 安全 Android开发
软件丨李跳跳们现在该如何跳呢?
前段时间,李跳跳等软件被某大厂发了律师函,之后,好些个跳广告软件都相继发布公众号说明,停止维护软件,并且下架了相关软件,那我们还能跳吗?该怎么跳呢?
1472 0
软件丨李跳跳们现在该如何跳呢?
|
新零售 前端开发 JavaScript
盒马跨端设计系统 ReX Design For OS
6 个月前,在 D2 前端技术论上我们向社区分享了《盒马中后台跨端方案》,详细介绍了我们在基于盒马实体零售数字化业务场景中,面向盒马营运数字化系统构建的跨端设计系统——ReX Design For OS。6 个月来,在开发资源极度紧张的状态下,我们持续建设和打磨,今天我们很高兴的告诉大家我们已经将项目的主要代码开源到了 Github,并发布了 beta 版本。
盒马跨端设计系统 ReX Design For OS
|
10月前
|
搜索推荐 数据可视化 数据挖掘
点晴OA系统:用户体验至上,操作简单易上手
在数字化转型的浪潮中,企业选择办公自动化(OA)系统时,除了关注功能强大与否,更看重系统的用户体验。一个操作复杂、学习成本高的系统,不仅会降低员工的工作效率,还可能影响企业的整体运营。点晴OA系统以“用户体验至上”为核心理念,致力于打造操作简单、易上手的办公平台,帮助企业快速实现高效办公。
205 1
挣的钱都用来买HTTP代理了?一招解决!2023年最新版HTTP代理对比12.9
来说说动态短效代理按量计费,多家厂商的价格是怎么样的吧!
挣的钱都用来买HTTP代理了?一招解决!2023年最新版HTTP代理对比12.9
|
SQL 监控 关系型数据库
利用event为zabbix数据表定期添加和删除分区
利用event为zabbix数据表定期添加和删除分区
104 0
|
缓存 NoSQL Java
3条原则,16个小点,帮你写出一个优秀的对外接口!
3条原则,16个小点,帮你写出一个优秀的对外接口!
3条原则,16个小点,帮你写出一个优秀的对外接口!
Typora、Markdown中的公式,颜色汇总(二)
由于写博客经常使用一些数学公式以及基础的 Markdown语法,网上一些博客虽然写的是大全汇总,但也总是有一些是我找不到的,一直去进行查找也是很麻烦的,本文是针对我个人的使用公式习惯进行一个汇总,也基本涵盖了大部分的使用技巧,同时本文也包含一些初等的 HTML 的知识,建议收藏本文,在需要的时候翻出来看
762 0
Typora、Markdown中的公式,颜色汇总(二)
|
数据采集 城市大脑 运维
战略地图|“云上数字政府”与背后的科技
“云上数字政府”是当前整合数字技术和服务,加快治理能力现代化的一种最佳实践形态。在政府政务服务、社会治理、城市区域服务、非常态应急治理等方面,“云上”与“数字”科技的结合将进一步为数字政府建设提速。
1334 0
战略地图|“云上数字政府”与背后的科技
|
缓存 安全 Java
Android进程保活-自“裁”或者耍流氓,呸!
Android进程保活-自“裁”或者耍流氓,呸!
632 0
Android进程保活-自“裁”或者耍流氓,呸!
|
测试技术 API 容器
云效测评之测试提效
业务发展过程中都会不可避免的面临服务增长,应用负责度增加,可持续测试的难度不断增加。对于测试团队而言,一方面要应对不断膨胀的测试用例,维护成本越来越高,开发效率开始降低。
973 0
云效测评之测试提效