情感分析 上|学习笔记

简介: 快速学习情感分析 上

开发者学堂课程【高校精品课-华东师范大学 - Python 数据科学基础与实践情感分析 上】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/1067/detail/15524


情感分析 上

 

内容介绍

一、情感分析的定义

二、情感分析构成

三、情感分析详情

 

左图跟文本分类一样

image.png情感分析有多种定义,但都大同小异本章情感分析的定义为。

 

一、情感分析的定义

情感分析是对文本进行上下文挖掘,识别和提取文本中的主观信息(积极、消极和中性),中性一般不考虑

文本分析的目的,帮助企业了解其品牌、产品或服务的用户情感。

情感分析又可以称为:观点挖掘、倾向性分析、意见抽取、意见挖掘、情感挖掘、主观分析;Sentiment analysis/Opinion mining

是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程

 

二、情感分析构成

-观点持有者 发表观点、情感,分析不同用户的情感,

-评价对象

-评价观点

-评价文本,大多数时只考虑评价文本,只考虑文本是积极与否,一般比较简单。详细一点,应该是区分不同的观点持有者。哪些用户什么观点,然后,再进一步,要在文本里分析出,评价对象,评价观点。里面有评价对象和评价观点,评价对象和评价词,主观力度强。

在大作业里,不一定是叫情感分析,可以是观点挖掘,在民生的文本里挖掘观点,观点可以是,表达的是地方的交通特别堵,或医疗药费特别贵,在民生里挖掘力度细

 

三、情感分析详情

image.png1,情感粒度

二元分类的粒度是把情感分成正面负面,积极消极,感兴趣,不感兴趣等等二元分类

三元分类,比如增加一个中性

多元分类,如七情六欲。七情,喜怒忧思悲恐惊。在文本里分析多情绪、多标签的情感。或者以一星到五星打分进行多标签的多元分类。

情感分析的粒度指情感本身的粒度情感

2,文本粒度

篇章级,粗---篇章的情感。句子级,细---句子的情感。方面级aspect,到某一特征 某一评价对象情感。

现在情感分析的发展趋势,已经是到细粒度。通过情感分析。例如,雅戈尔的衬衫比七匹狼好,为什么雅戈尔的衬衫比七匹狼好,实际上这在商业里面是没有意义,只是知道好坏。进一步希望知道什么呢?知道雅戈尔的衬衫到底在哪几个方面好,面料,做工还是价格等等。所以方面级可以再进一步分成粗粒度和细粒度。主要就是看分析的对象,文本级别是粗粒度和细粒度。

3,分析方法

情感分析的方法跟文本分类放在一起讲,所以现在,目前用的最成熟的还是分类的基础,此外还有,基于情感词典的方法,指是分类技术,基于词表的方法看看情感词表里,在文本里面中的词是不是情感词表这样一个概念情感分析

开始流行起来以后---机器学习的方法

深度学习在大的范畴里面也是机器学习,但其特征自动提取,主要是特征的自动提取特征。不要人工干预情感分析的方法

4,研究方向

目前情感分析的研究方向,有情感分类,还有可以打分的情感评分,就是结合情感分类,然后进行强度打分。可以做专门做评价对象抽取。评价词抽取。

注意:之前往往是把情感分析的观点。观念放在一起Sentiment analysis/Opinion mining放一起。所以,要在里面抽取的评价对象和评价词。

课程是永远是要结束,探索是无尽的,所以在大作业里,看那个组能不能做得到,里面做的民生关注做得更细,能够真的是挖掘到文本里面的用户的关注,所以,评价对象,评价词的抽取。另外还可以做一些概括性的,也就是之前的评价对象,评价词也许抽出来了,当然抽出来以后,也不知道那两个是不是一对一对的。因为,如果用命名实体识别,这样一个条件随机场,用命名实体识别的方法只出来一个独立词,可以后面通过规则,在一段话里面看两个对象之间的关系,结合具法分析吧,能不能判断是一对,就是讲的观点概括,评价对象,评价值正确的,然后在做各种统计分析。然后还可以做一些虚假评论的设备设备如一些水军

5,应用领域

前面的文本分类有了很多应用领域,情感分析也有很多应用领域,现在商业领域里面用的最多的应用领域就是消费者口碑分析。然后是事件的走向预测。接下来是舆情监控,用户兴趣挖掘,后面会展开介绍。当然还有很多应用领域。民生关注,就是这样的应用领域

相关文章
|
架构师 测试技术 网络性能优化
dpdk课程学习之练习笔记七(vpp环境搭建及plugin demo测试)
dpdk课程学习之练习笔记七(vpp环境搭建及plugin demo测试)
1017 0
|
前端开发 应用服务中间件 nginx
Nginx配置详解Docker部署Nginx使用Nginx部署vue前端项目
Nginx配置详解Docker部署Nginx使用Nginx部署vue前端项目
1482 0
|
11月前
|
存储 算法 搜索推荐
【潜意识Java】期末考试可能考的高质量大题及答案解析
Java 期末考试大题整理:设计一个学生信息管理系统,涵盖面向对象编程、集合类、文件操作、异常处理和多线程等知识点。系统功能包括添加、查询、删除、显示所有学生信息、按成绩排序及文件存储。通过本题,考生可以巩固 Java 基础知识并掌握综合应用技能。代码解析详细,适合复习备考。
200 4
|
数据安全/隐私保护
jupyterlab远程服务器配置
jupyterlab远程服务器配置
440 0
|
10月前
|
算法 机器人 Python
使用Selenium和ChromeDriver模拟用户操作:从表单填写到数据提交
简介:工程师小王和产品经理莉莉面临无人机市场调研投票数据获取难题,传统方法屡遭封禁。小王通过构建“隐身特工”装备——代理IP、随机UserAgent及有效Cookie,结合Python与Selenium技术,成功绕过问卷星的防刷票系统,实现自动化投票。最终,他们获得了看似真人投票的数据,展示了技术攻防的艺术。这段故事不仅是一场技术较量,更是对算法规则游戏的深刻思考。
231 2
使用Selenium和ChromeDriver模拟用户操作:从表单填写到数据提交
|
数据可视化 SDN Python
复动力系统 | 混沌 | Lozi 映射吸引子的可视化与交互式探索
该文介绍了一篇关于Lozi映射吸引子可视化和交互式探索的文章。Lozi映射是混沌理论中的一个模型,展示非线性动力系统的复杂性。通过Python和matplotlib,作者实现了Lozi映射的可视化,并添加交互功能,允许用户缩放以详细观察混沌吸引子。文中还给出了Lozi映射的数学定义,并提供了Python代码示例,演示如何绘制和动态调整吸引子的显示。
|
SQL 安全 数据处理
揭秘数据脱敏神器:Flink SQL的神秘力量,守护你的数据宝藏!
【8月更文挑战第9天】在大数据时代,Apache Flink以其强大的流处理能力脱颖而出,而Flink SQL则为数据处理带来了灵活性。本文介绍如何运用Flink SQL实现数据脱敏——一项关键的隐私保护技术。通过内置函数与表达式,在SQL查询中加入脱敏逻辑,可有效处理敏感信息,如个人身份与财务数据,以符合GDPR等数据保护法规。示例展示了如何对信用卡号进行脱敏,采用`CASE`语句检查并替换敏感数据。此外,Flink SQL支持自定义函数,适用于更复杂的脱敏需求。掌握此技能对于保障数据安全至关重要。
283 5
|
Android开发 开发者 Kotlin
Android 多进程情况下判断应用是否处于前台或者后台
本文介绍在多进程环境下判断Android应用前后台状态的方法。通过`ActivityManager`和服务信息`RunningAppProcessInfo`可有效检测应用状态,优化资源使用。提供Kotlin代码示例,帮助开发者轻松集成。
1056 8
|
机器学习/深度学习 缓存 自然语言处理
入门生成式语言模型(Generative Language Models)
入门生成式语言模型涉及理解基本概念、学习NLP基础知识、掌握相关工具和框架、训练与评估模型、实践项目和案例,以及持续学习。关键步骤包括预训练、微调(如SFT、LoRA、Prefix Tuning)、模型选择(如LLaMA、ChatGLM、Bloom等)和优化部署(量化、剪枝)。训练策略包括Pretrain、SFT、LoRA等,模型如Qwen、GPT-3、OPT等,评估数据集有SuperGLUE、CLUEbenchmark等。此外,有专门的加速和分布式框架如DeepSpeed、Megatron、FairScale等,以及部署工具vLLM、TensorRT-LLM。
711 2
|
移动开发 编解码
数学建模常用模型05 :模糊综合评价法
数学建模常用模型05 :模糊综合评价法
28840 3