pLSA 原理中|学习笔记

简介: 快速学习 pLSA 原理中

开发者学堂课程【高校精品课-华东师范大学 - Python 数据科学基础与实践pLSA 原理中】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/1067/detail/15530


pLSA 原理中

 

提问:单个文档概率,假设隐变量Z未知,单个文档概率隐变量z未知 p(d|θd,T)是怎么回事?

image.gif

image.gif就是如果p(d,Z|θd,T)已知的话我们要把这个Z从表达式2里消掉,一个办法就是我们把所有可能的Z穷举变, 加起来。比如Z是每个词的topic θd属于哪个topic。它可以属于top 1,也可以属于topic K,有很多种可能性,尤其是考虑的所有词之后,这个可能性非常多,所以说Z它有很多种选择。

理论上我们可以把所有的可能穷举一遍,然后把文档概率Z已知的这个概率加起来。打个比方:就好像要算明天下雨,明天下雨并且打雷的概率。这里有两种概率:明天下雨,并且打雷的概率以及明天明天下雨但是不打雷的概率。明天下雨的概率等于p(d,Z|θd,T)和(d|θd,T)的和值,咱们把所有可能的Z都加起来之后这个Z就消失了,就代表我们已经把所有情况都考虑到了。它是一个主题,然后这个主题里Wi的概率是 

image.gif如图1所示,我把这个联乘里头的这些东西我用,然后再取个对数f(θ,Z)表示,f(θ,Z)可以分解成。按Z1加上一直加到Zs,长度用S表示。表达式(1)它并不是一个恒总成立的一个式子,它只是一个前提。即假设这个Z的分布可以分解,f(θ,Z)的分布可以按表达式(2)来分解,p(Z)f(Z)的求和对所有的Z求都可以按照表达式(3)的式子来求。

乘积变成求和就要取个log,。可以使用log+jensen不等式公式。这这个式子比较复杂,就是咱们。把它分成左右两块,分别来看,如图二所示:

image.gif图2

公式解读:

左边这个绿框这一块是算文档的概率(d|θd,T)。(d|θd,T)等式的右边,Q(Z)和分母的Q(Z)相互抵消,就相当于p(d,Z|θ)对对所有的Z求和。

为什么左边大于等于右边呢?因为先求和再去log大于等于先去log再求和。

image.gif总结:jensen不等式先求和再去log大于等于先去log再求和,

不等式成立成立的条件是利用凸函数的特性,表达式如图3所示,

对数函数是个凹函数,对数函数的曲线如图3所示,凹函数取个符号就变成图函数了。

所以说是log先去求和再log大于等于先logo再求和。ai是我们指定的一个分布,他是可恢复的。

相关文章
|
3天前
|
数据采集 人工智能 安全
|
12天前
|
云安全 监控 安全
|
4天前
|
自然语言处理 API
万相 Wan2.6 全新升级发布!人人都能当导演的时代来了
通义万相2.6全新升级,支持文生图、图生视频、文生视频,打造电影级创作体验。智能分镜、角色扮演、音画同步,让创意一键成片,大众也能轻松制作高质量短视频。
1052 151
|
4天前
|
编解码 人工智能 机器人
通义万相2.6,模型使用指南
智能分镜 | 多镜头叙事 | 支持15秒视频生成 | 高品质声音生成 | 多人稳定对话
|
17天前
|
机器学习/深度学习 人工智能 自然语言处理
Z-Image:冲击体验上限的下一代图像生成模型
通义实验室推出全新文生图模型Z-Image,以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成,支持16GB显存设备,中英双语理解与文字渲染尤为出色,真实感和美学表现媲美国际顶尖模型,被誉为“最值得关注的开源生图模型之一”。
1736 9
|
9天前
|
人工智能 自然语言处理 API
一句话生成拓扑图!AI+Draw.io 封神开源组合,工具让你的效率爆炸
一句话生成拓扑图!next-ai-draw-io 结合 AI 与 Draw.io,通过自然语言秒出架构图,支持私有部署、免费大模型接口,彻底解放生产力,绘图效率直接爆炸。
683 152
|
11天前
|
人工智能 安全 前端开发
AgentScope Java v1.0 发布,让 Java 开发者轻松构建企业级 Agentic 应用
AgentScope 重磅发布 Java 版本,拥抱企业开发主流技术栈。
648 12
|
6天前
|
SQL 自然语言处理 调度
Agent Skills 的一次工程实践
**本文采用 Agent Skills 实现整体智能体**,开发框架采用 AgentScope,模型使用 **qwen3-max**。Agent Skills 是 Anthropic 新推出的一种有别于mcp server的一种开发方式,用于为 AI **引入可共享的专业技能**。经验封装到**可发现、可复用的能力单元**中,每个技能以文件夹形式存在,包含特定任务的指导性说明(SKILL.md 文件)、脚本代码和资源等 。大模型可以根据需要动态加载这些技能,从而扩展自身的功能。目前不少国内外的一些框架也开始支持此种的开发方式,详细介绍如下。
409 4