开发者学堂课程【人工智能必备基础:概率论与数理统计:贝叶斯拼写纠错实例】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/545/detail/7415
贝叶斯拼写纠错实例
一、拼写纠正实例
问题是我们看到用户输入了一个不在字典中的单词
我们需要去猜测:“这个家伙到底真正想输入的单词是什么呢?”
P(我们猜测他想输入的单词| 他实际输入的单词)
用户实际输入的单词记为 D( D 代表 Data,即观测数据)
猜测1: P(h1 | D)
猜测2: P(h2 | D)
猜测3: P(h3 | D)。。。
统一为: P(h | D)
P(h | D)=P(h)*P(D | h)/P(D)
用户实际输入的单词记为 D( D 代表 Data,即观测数据)
对于不同的具体猜测 h1 h2 h3..,P(D) 都是一样的
所以在比较 P(h1 |D) 和 P(h2 | D) 的时候我们可以忽略这个常数
对于给定观测数据,一个猜测是好是坏
取决于“这个猜测本身独立的可能性大小(先验概率,Prior) ”和“这个猜测生成我们观测到的数据的可能性大小。
贝叶斯方法计算: P(h)*P(D|h),P(h) 是特定猜测的先验概率
比如用户输入 tlp,那到底是 top 还是 tip?
这个时候,当最大似然不能作出决定性的判断时,
先验概率就可以插手进来给出指示--
“既然你无法决定,那么我告诉你,一般来说 top 出现的程度要高许多,所以更可能他想打的是 top"
