- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
naivebayes朴素贝叶斯 文本分类.ppt
朴素贝叶斯算法简介 在分类(classification)问题中,常常需要把一个事物分到某个类别。一个事物具有很多属性,把它的众多属性看做一个向量,即x=(x1,x2,x3,…,xn),用x这个向量来代表这个事物。 有类别集合 y=(y1,y2,y3,....yn) 分别计算 p(y1|x) p(y2|x) p(y3|x).... p(yn|x), 如果p(yk|x) =max { p(y1|x) p(y2|x) p(y3|x).... p(yn|x) }, x就属于yk类。 如何计算 p(yk|x) 方法:运用贝叶斯公式 p(yk|x)=p(x|yK)*p(yk)/p(x) 在之前已介绍x=(x1,x2,x3,…,xn),朴素贝叶斯假设 x1,x2,x3,…,xn 是相互独立的(朴素贝叶斯存在的bug) 则有 p( x | yk ) = p( x1,x2,x3,…,xn|yk ) = p( x1 | yk ) *p( x2 | yk ) ..... *p( xn | yk ) (1) (1)式中等式最右边部分的各项是可以通过统计得到的, p(yk)和p(x)也是已知的,这样我们就可以算出p(yk|x) 现在开始进入本文的主旨部分:如何将贝叶斯分类器应用到语义消歧文本分类上来。 1 在文本分类中,假设我们有一个文档d 和一个固定的 类集合C={c1,c2,…,cj} 2 我们把一堆打了标签的文档集合d,c作为训练样本,比如 hello world , computer就是说文本 “hello world” 的类型标签是computer 3 通过训练样本来得到一个映射函数,可以把文本x映射到类型ck中 计算映射函数的多项式模型 设某文档d=(t1,t2,…,tk),tk是该文档中出现过的单词 ,允许重复 先验概率P(c)= 类c下单词总数/整个训练样本的单词总数 类条件概率P(tk|c)=(类c下单词tk在各个文档中出现过的次数之和+1)/ (类c下单词总数+|V|) V是训练样本的单词表(即抽取单词,单词出现多次,只算一个) |V|则表示训练样本包含多少种单词。 演示文本分类 本程序通过事先从文档输入训练集,产生一个条件概率矩阵,来指导之后的文本分类。在分类结果完成后,用户可以选择分类是否正确,如果分类正确,新输入的结果会作为新的训练加入训练集(昨晚才写完,可能有bug) 这体现了方法论中经验主义的的特点,在不断的分类中 分类器会不断学习,成长。 降低原材料成本 本文反映结束! 谢谢大家观看! 同步糖化发酵工艺 ,能耗下降30% naive贝叶斯文本分类 朴素贝叶斯具有容易实现,运行速度快的特点,被广泛使用 实例 5
您可能关注的文档
最近下载
- 中学地理学科课程标准与教材研究教学大纲.pdf VIP
- 中建X局各类建筑工程技术经济指标.docx VIP
- 我们的手上有多少细菌?.doc VIP
- 第一单元 观察物体 大单元教学设计2025数学人教版三年级上册(新教材).pdf
- 年东北财经大学国际商学院(校本部) 联招联考项目招生指南.pdf VIP
- 驾驶员安全生产操作规程 - 生产安全.docx VIP
- 公务员(国考)之行政职业能力测验题库附答案(基础题)收藏.docx VIP
- 全册部编版六年级上册全册道德与法治教学课件.pptx
- 第二章-空气流动压力及阻力.pptx VIP
- 2025年全国农产品质量安全检测技能竞赛理论知识考试题库(含答案.docx VIP
文档评论(0)