基于朴素贝叶斯分类器校园信息智能算法.docVIP

基于朴素贝叶斯分类器校园信息智能算法.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于朴素贝叶斯分类器校园信息智能算法

基于朴素贝叶斯分类器校园信息智能算法   摘 要:本文?Y合对原始朴素贝叶斯分类器原理的分析,论述智能助理软件的设计过程中,所需推荐算法与其之间存在的差异性。并针对在校园收集和整合信息的特点和所需推荐方式,对原始朴素贝叶斯文本分类器算法加以修改。将得到的校园信息智能推荐算法实现在智能助理软件中。经测试,算法具有较好的准确性。   关键词:朴素贝叶斯分类器;校园信息提示;智能推荐算法   中图分类号:TP181 文献标识码:A   1 引言(Introduction)   随着知识社会的到来及“互联网+”行动计划的制定,互联网上的海量数据逐渐被有效地收集和整合。国内的一些互联网企业在针对用户的个性化服务上进行了探索,如豆瓣网提供了推荐书籍、音乐等服务,百度旅游在假期提供推荐旅游路线,自动匹配低价机票和酒店等服务。这些创新取得了很好的效果,大大提高了企业的竞争力。目前的智能个人助理软件都没有针对特定群体进行优化,而是面向所有用户进行开发。这样的软件涉及的信息过于分散,缺乏解决实际问题的能力。此外,由于朴素贝叶斯方法在预测和分类中被广泛应用,如在预测项目交付率[1]、互联网流量分类[2]、云检测和估计算法[3]等。因此本文提出了针对校园实时信息进行推荐的基于朴素贝叶斯方法的智能推荐算法研究。   2 朴素贝叶斯分类器(Naive Bayes classifier)   2.1 朴素贝叶斯分类器概述   贝叶斯学习方法中的朴素贝叶斯学习器,常被称为朴素贝叶斯分类器。在某些领域其性能可与神经网络和决策树学习能力相当[4]。分类问题一直是机器学习、模式分类和数据挖掘的核心问题[5]。   贝叶斯方法的新实例分类目标是在给定描述实例的属性值下,得到最可能的目标值vmap。朴素贝叶斯分类器所使用的方法:   其中,VNB表示朴素贝叶斯分类器输出的目标值。   2.2 朴素贝叶斯分类器分析   假设给定了如下表1所示的训练样本数据,学习的目标是根据给定天气的结果判断是否打网球。   样本数据集提供了14个训练样本,使用此表的数据,并以朴素贝叶斯分类器来分类下面的新实例:(Outlook=sunny,Temperature=cool,Humidity=high,Wind=strong)对于新实例预测目PlayTennis的目标值(Yes或No),由上面的公式可以得到:   其他数据同理代入后得到:   故应分类到no中。   3 校园信息智能推荐算法(Campus recommendation   algorithm)   3.1 算法说明   与上述例子有所区别,在校园信息智能推荐算法中,所面对情况中的新实例的属性值范围不是仅限于数据库中记录,而是所有可能的输入值。在新实例中可能存在记录中没有涉及到的属性值。算法需要根据新实例与数据记录的匹配程度推测新实例的目标值,将其所对应关键字返回,将新实例记录于数据库中,以此来达到对新实例学习的目的。   给定了如表2所示的训练样本数据,学习的目标是以当前的时间节点为条件,根据用户历史查询记录,推测客户当前可能最需要获取的信息,即返回通过算法计算得出的概率值最大的记录所对应的关键字(时间仅以上下午进行分类)。   3.2 算法的过程   如图1程序框图所示,通过二层循环依次计算每条记录与其他记录匹配程度的概率值并保存概率最高的一组记录。最后,将保存的记录关键字返回。算法包含二层循环,时间复杂度为O(n2)。   3.3 算法测试   算法测试所采用的数据库为MySQL,通过Android客户端在特定时间进行相应内容的查询,由Java Web端的Servlet将数据记录在服务器中,即生成如图2所示的数据表。   当数据库完成对基础数据的收集后,用户再通过客户端要求推荐信息时,算法会根据以上信息进行计算,分析数据表记录。将得出关键字返回,查询相应关键字,得到所需信息,结果和表2计算结果一致,如图3所示。   4 结论(Conclusion)   本文阐述了原始朴素贝叶斯分类器的基本原理,给出了对其进行变换后的形式化定义。在此基础上,进一步对基于此理论的校园信息智能推荐算法进行描述,给出了算法的过程、时间复杂度,并将算法实际应用于基于JavaWeb服务器的项目中,得到测试结果。测试结果与计算结果一致,达到了预期目的,能够返回所期望数据。   参考文献(References)   [1] Stewart,B.Predicting Project Delivery Rates Using the Naive-Bayes Classifier[J].Journal of Software Maintenance and Evolution Research

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档