大众对618大促销的热情为何越来越淡了

简介: 大众对618大促销的热情为何越来越淡了

618购物大促销已经过了,但是今年大家的热情相比此前热情大战购物节减少了很多,今年不少消费者选择了“冷静”,没有抢购、没有冲刺,有的减少了下单的客单价,有的减少了购买数量。很多网页反馈说对购物节似乎不那么在意这种促销活动了,羊毛薅不动了,已经没有几年前参与大促时的满满兴致。
大家都知道618更多是京东的主场,淘宝防守为主以进攻双11主场,拼多多则继续百亿补贴抢占中小品牌的低价市场。今年很多商家发现很多的老用户热情逐渐退场,消费欲望被分流。对于老用户而言,对购物节大促的疲惫感似乎与日俱增。
虽然大家对促销的热情减少了不少,但是还有很多人参与了618购物节,所以今天准备分析一波购物节大家都喜欢买什么?本文以某东为例,用Python爬取618活动的畅销商品数据,并进行数据清洗,最后以可视化的方式从不同角度去了解畅销商品中,名列前茅的商品是哪些?销售数据如何?用户好评如何?等等
完整的步骤如下
1、爬取某东畅销商品数据
2、清洗数据并并进行简单分析
3、将数据进行可视化展示
数据的获取只最重要的一步,在爬取数据之前,先对某东进行了分析,目标的反爬措施一如既往的严格,各种反爬措施都使用上,特别是对基本的IP的防空更是加强了,一般的代理已经没法使用了,这里必须使用高质量,高匿的代理,经过一波测试分析,目前只有亿牛云的代理在成功率上有很好的效果。这里我们可以通过使用代理 IP、修改请求头部信息、降低请求频率或使用其他语言库,如 aiohttp、 Scrapy、Selenium 等,来进行复杂的反爬处理。比如这里我们可以使用aiohttp、爬虫代理加强版IP和随机User-Agent实现数据采集。
```import urllib.parse
import asyncio
import aiohttp
import lxml.html
import random

URL_TEMPLATE = 'https://search.jd.com/search?keyword=%E6%89%8B%E6%9C%BA/{}'
HEADERS_LIST = [
'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36',
'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 Edge/16.16299',
'Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; AS; rv:11.0) like Gecko',

# 添加更多 User-Agent

]

代理服务器( www.16yun.cn)

proxyHost = "t.16yun.cn"
proxyPort = "31111"

代理验证信息

proxyUser = "16yun"
proxyPass = "16ip"

PROXIES = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {
"host" : proxyHost,
"port" : proxyPort,
"user" : proxyUser,
"pass" : proxyPass,
}

async def query(content):
async with aiohttp.ClientSession(headers=get_random_headers()) as session:
url = URL_TEMPLATE.format(urllib.parse.quote(content))
async with session.get(url, proxy=PROXIES) as response:
html = lxml.html.fromstring(await response.read())
sen_list = html.xpath('//div[contains(@class,"lemma-summary") or contains(@class,"lemmaWgt-lemmaSummary")]//text()')
sen_list_after_filter = [item.strip('\n') for item in sen_list]
return '\n'.join(sen_list_after_filter).encode('utf-8')

async def main():
async for content in get_input():
result = await query(content)
print("查询结果:\n%s" % result.decode('utf-8'))

async def get_input():
while True:
yield input('查询词语:')

def get_random_headers():
return {'User-Agent': random.choice(HEADERS_LIST)}

if name == 'main':
asyncio.run(main())

```

相关文章
124Echarts - 关系图(Graph Dynamic)
124Echarts - 关系图(Graph Dynamic)
144 0
|
11月前
|
JSON API 数据格式
1688 满足跨境业务需求而提供的一组 API 接口
1688跨境属性接口系列是1688开放平台为满足跨境业务需求提供的API接口,核心接口1688.item_get用于查询商品的跨境属性,帮助开发者和商家获取关键信息,更好地开展跨境贸易。公共参数包括key、secret等,支持多种返回格式,默认json。Python示例代码展示了如何调用该接口获取海关编码、税率等信息。使用步骤包括注册、构建请求、发送请求和处理响应。
|
JSON 小程序 JavaScript
微信小程序制作 购物商城首页 【内包含源码】
这篇文章提供了一个微信小程序购物商城首页的实现方法和源码,包括页面布局、数据结构、核心代码以及如何配置tabBar和搜索框组件。
微信小程序制作 购物商城首页 【内包含源码】
|
监控 数据可视化 项目管理
如何利用工作计划管理软件提升项目管理透明度?高效工具推荐与使用指南
在快速发展的商业环境中,项目管理工具已成为团队协作和工作计划管理的必备利器。本文推荐2024年5款最受欢迎的工作计划管理软件:板栗看板、Wrike、TeamGantt、Smartsheet和Podio。这些工具各具特色,能有效提升项目经理的工作效率,管理复杂的项目流程。无论是简洁高效的板栗看板,还是强调跨部门协作的Wrike,或是高度定制化的Podio,都能满足不同团队的需求。选择合适的工具,需综合考虑团队规模、项目复杂度等因素。
如何利用工作计划管理软件提升项目管理透明度?高效工具推荐与使用指南
|
Java 容器 Spring
IOC控制反转&&DI依赖注入的方法论
控制反转(IoC)是面向对象编程中用于减少代码耦合的设计原则。传统编程中,对象通过`new`关键字创建,控制权在应用手中。而在Spring框架下,对象由IoC容器管理并创建,通过依赖注入(DI)机制,自动将所需资源注入对象中,从而实现对象间的解耦。DI有两种实现方式:构造方法注入和属性setter方法注入。通过IoC和DI,程序更易于维护和测试。
319 0
|
算法 5G UED
无线信号干扰的成因
【8月更文挑战第24天】
2074 0
|
Linux 编译器 C语言
Linux中的pkg-config:简化库依赖管理的利器
**pkg-config**是Linux下管理库依赖的工具,它通过读取库的`.pc`文件提供编译和链接参数。使用`pkg-config --cflags --libs <library>`获取编译和链接选项,例如`gcc -o test test.c $(pkg-config --cflags --libs glib-2.0)`。能进行版本检查、参数提取、依赖管理和路径搜索。列出所有包用`pkg-config --list-all`。最佳实践包括确保库正确安装、检查版本、配置`PKG_CONFIG_PATH`及使用构建工具。
|
JavaScript Java 测试技术
课堂考勤微信小程序+springboot+vue.js附带文章和源代码设计说明文档ppt
课堂考勤微信小程序+springboot+vue.js附带文章和源代码设计说明文档ppt
165 0
|
并行计算 PyTorch 算法框架/工具
YOLOv5入门实践(1)——手把手带你环境配置搭建
YOLOv5入门实践(1)——手把手带你环境配置搭建
7766 1
YOLOv5入门实践(1)——手把手带你环境配置搭建