用Python对微博热搜做舆情分析~

简介: 大家好,我是志斌~今天志斌看微博热搜的时候,发现这样一条热搜。

大家好,我是志斌~


今天志斌看微博热搜的时候,发现这样一条热搜。


49.png



我寻思,这要真的改了,真的炸锅!所以志斌爬取了这条微博下的数据,进行了一个简单的舆情分析!


需要源码的同学,加志斌微信获取哈~


01数据采集


志斌在之前的两篇文章中,详细的介绍了如何获取微博评论,有兴趣的读者可以看看这两篇文章。这里志斌直接展示核心代码了,代码如下:

for page in range(1,10000):
  if page == 1 :
      params = (
          ('id', '4654152979845247'),
          ('mid', '4654152979845247'),
          ('max_id_type', '0'),
      )
  #s = requests.Session()
  response = requests.get('https://m.weibo.cn/comments/hotflow', headers=headers, params=params)
  a = response.json()['data']['max_id']
  b = response.json()['data']['max_id_type']
  for i in response.json()['data']['data']:
      pinglunshijian = i['created_at']
      neirong = re.sub(r'<[^>]*>', '', i['text'])
      id = i['user']['id']
      yonghumingcheng = i['user']['screen_name']
      with open(r'71.txt', 'a', encoding='utf-8') as f:
          f.write(f'{neirong}\n')
  params = (
      ('id', '4654152979845247'),
      ('mid', '4654152979845247'),
      ('max_id', str(a)),
      ('max_id_type', str(b)),
       )
  print(f'爬取第{page}页数据......')
  time.sleep(random.randint(1,3))


02可视化分析


我们来对这些数据进行可视化分析。本次绘图使用的是Excel和Tableau两款软件。


01 点赞数top10用户


50.png


我们发现椭圆圆子这个用户所发表的评论点赞数最多,有9.5w+,下面让我们看看它的评论是什么,竟然让用户这么喜欢。


51.png



这是一句纯吐槽的话,点赞数这么多,可能是因为发的时间早,或者是引起了老师们的共鸣。


02 评论日期分布


52.png


从图中我们可以清晰的看出,7.6号发表评论的人数最多,可能跟今天上热搜有关系的原因,毕竟上了热搜,曝光度就高了!


03 评论时间分布


53.png



对6号评论发布时间进行分析,我们发现19点发表的评论数量最多,我当时看到这条热搜的时候,基本也是这个时间,看来热搜对一个消息的影响还是很大的。


04 词云图


54.png


通过词云图可以看出,人们围绕这寒暑假这个词讨论的非常热烈,学生和取消、行业等词也被大量提及,我翻了翻评论,发现大部分人都是不想取消的。当然志斌也觉得不要取消。


03小结


1. 通过分析我们可以看出,热搜对每条微博的影响是巨大的。

2. 大家都不太愿意取消寒暑假。

3. 本文仅供学习参考,不做它用。

4. 需要源码的同学,加志斌微信获取哈~

相关文章
|
3月前
|
数据采集 存储 自然语言处理
基于Python的微博热点李佳琦忒网友话题的评论采集和情感分析的方法,利用情感分析技术对评论进行情感倾向性判断
本文介绍了一种基于Python的方法,用于采集微博热点话题下的评论数据,并运用情感分析技术对这些评论进行情感倾向性判断,进而通过统计分析和可视化技术展示网友对特定话题的情感态度,对品牌或个人形象管理、用户需求发现、舆情监测和危机管理等方面具有重要价值。
基于Python的微博热点李佳琦忒网友话题的评论采集和情感分析的方法,利用情感分析技术对评论进行情感倾向性判断
|
3月前
|
机器学习/深度学习 数据采集 算法
【python】python基于微博互动数据的用户类型预测(随机森林与支持向量机的比较分析)(源码+数据集+课程论文)【独一无二】
【python】python基于微博互动数据的用户类型预测(随机森林与支持向量机的比较分析)(源码+数据集+课程论文)【独一无二】
|
4月前
|
自然语言处理 算法 安全
Python实现贝叶斯算法疫情微博评论情感分析
Python实现贝叶斯算法疫情微博评论情感分析
Python实现贝叶斯算法疫情微博评论情感分析
|
5月前
|
数据采集 存储 API
用Python打造你的微博热搜追踪器
在当今信息爆炸的时代,获取最新、最热门的信息成为了许多人的日常需求。微博热搜榜作为反映社会热点和公众关注焦点的重要窗口,其信息价值不言而喻。本文将介绍一个实用的Python爬虫程序,它能够自动爬取微博热搜榜的信息,并通过邮件的形式将这些信息发送给用户,帮助用户及时了解社会动态,把握热点趋势。
|
6月前
|
监控 数据可视化 NoSQL
Python基于Flask的高校舆情分析,舆情监控可视化系统
Python基于Flask的高校舆情分析,舆情监控可视化系统
137 0
|
6月前
|
数据采集 存储 数据可视化
微博数据可视化分析:利用Python构建信息图表展示话题热度
微博数据可视化分析:利用Python构建信息图表展示话题热度
|
6月前
|
Python 自然语言处理 Java
Python每日一练(20230403) 随机正整数、微博热门话题、恢复二叉搜索树
Python每日一练(20230403) 随机正整数、微博热门话题、恢复二叉搜索树
50 0
Python每日一练(20230403) 随机正整数、微博热门话题、恢复二叉搜索树
|
数据可视化 JavaScript 前端开发
基于Python的微博大数据舆情分析,舆论情感分析可视化系统
基于Python的微博大数据舆情分析,舆论情感分析可视化系统
|
9天前
|
设计模式 开发者 Python
Python编程中的设计模式:工厂方法模式###
本文深入浅出地探讨了Python编程中的一种重要设计模式——工厂方法模式。通过具体案例和代码示例,我们将了解工厂方法模式的定义、应用场景、实现步骤以及其优势与潜在缺点。无论你是Python新手还是有经验的开发者,都能从本文中获得关于如何在实际项目中有效应用工厂方法模式的启发。 ###
|
2天前
|
存储 人工智能 数据挖掘
从零起步,揭秘Python编程如何带你从新手村迈向高手殿堂
【10月更文挑战第32天】Python,诞生于1991年的高级编程语言,以其简洁明了的语法成为众多程序员的入门首选。从基础的变量类型、控制流到列表、字典等数据结构,再到函数定义与调用及面向对象编程,Python提供了丰富的功能和强大的库支持,适用于Web开发、数据分析、人工智能等多个领域。学习Python不仅是掌握一门语言,更是加入一个充满活力的技术社区,开启探索未知世界的旅程。
11 5