基于SVM的用户输入推荐模型研究.docVIP

下载本文档

7
0
约7.01千字
约 10页
2017-03-24 发布于北京
举报
版权申诉

基于SVM的用户输入推荐模型研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于SVM的用户输入推荐模型研究.doc

基于SVM的用户输入推荐模型研究摘要：在现代计算机接口中用户输入任务是非常普遍的：我们经常需要在一个给定的输入框中输入一些字符串。虽然当前用户会采用一些简捷策略来帮助用户端，但这往往是不够的。该文描述了一个可以预测用户输入行为的新颖模型，即基于SVM的用户输入推荐模型，该模型提出的依据是用户输入行为虽然各不相同，但在动作序列中通常伴随着一些可识别的潜在模式。该文引入用户输入推荐模型的动机在于发现这些隐含的用户输入模式并利用这些模式来做输入预测。我们的模型理念包括两大核心部分：用于发现用户输入模式的模式挖掘和用于预测输入值的预测分类。关键词：用户输入任务；可发现模式；模式挖掘；预测分类中图分类号：TP311 文献标识码：A 文章编号：1009-3044（2015）05-0203-03 1 引言用户的输入内容是千变万化的，很难发现隐藏在其中的用户输入模式。例如，当用户打开一个文档时，无法预测到他将要输入的内容。尽管如此，在许多情况下，还是存在一些有迹可循的用户输入的模式和规律，尤其是对于用户界面的单行输入框。现有的一些方法仅能在某种特殊情况下使用，局限性很大，不能适应一般情况。目前，相关的研究有很多[1-6】。但是这些技术都存在一些问题，比如：内容分析受限、有效上下文选择和推荐范围过窄等问题，因此，为了满足用户自动化输入要求，本文提出了基于SVM的用户输入推荐模型。 2 基于SVM的用户输入推荐模型在用户操作界面上，用户的操作行为可以看作是一个个动作组成的序列。每一个动作包含若干参数，当用户在界面的输入框内输入内容时，利用相关的信息来预测用户的输入值，这些相关信息包括的内容有当前参数和历史数据。基于以上的思路，本文提出了基于SVM的用户输入推荐模型，如图1所示。由上图所示，该模型主要包括两部分，预测分类和模式挖掘。预测分类器是依据用户输入的实例的当前上下文信息来预测输出与某模式对应的模式标签。模式挖掘器的主要的功能是找出潜在的动作序列模式，从而可以对样例输入模式起到筛选作用。实例在经预测分类后器处理后进入模式挖掘器，模式挖掘器则会依据用户输入的历史记录挖掘出用户的输入模式，并且向用户给出预测推荐值。在特定的用户输入界面下，为了规范化模式挖掘算法，引入了文献[7] 以提供模式挖掘的相关定义。模式挖掘的相关算法如时间序列模式挖掘[8]、频繁模式挖掘[9]、聚类模式挖掘[10]的研究文献以及各算法应用的研究文献[11-13]都表明模式挖掘技术的研究也是数据挖掘领域内的热点。 3 预测分类算法根据用户输入推荐模型可以看出，新实例首先进入预测分类器，根据实例的特征信息输出模式标签，模式标签对应于模式，模式挖掘器根据模式类型生成预测推荐值，该预测分类算法流程如图2所示。支持向量机（Support Vector Machine， SVM）[14]是一种传统的机器学习方法[15]。它将输入的样本特征向量集合变换到高维空间，在高维空间中构造最优分类超平面来使样本进行分离。SVM算法的分类函数在形式上类似神经网络，输出是中间节点的线性组合，每个中间节点对应一个支持向量，向量之间只进行点积运算。SVM用于分类的表达式为：如果采用核函数，就可以避免在高维特征空间进行复杂的运算。该过程可以这样描述：首先将输入向量x通过映射：Rn- H映射到高维Hibert空间H中。该函数K满足，显然不同的核函数决定了不同的决策曲面（即支持不同的向量机）。核函数的形式是多种多样的，例如以下几种常用的核函数：多项式核函数：径向基核函数：神经网络核函数：实际上，SVM的核心思想是利用核函数将输入样本空间映射到高维特征空间，在这个空间中求一个最优分类面f（x） wT?x+b 0，根据f（x）构造新的符号函数g（x），根据g（x）的取值将数据点即样本进行分类。简言之，SVM算法的原理就是给分类对象找到合适的核函数以构造最优分类决策平面，达到对输入样本进行分类的目的。由于SVM分类器是一个两类分类器，只能实现两类划分，在解决多类划分的问题时则需要作进一步处理。通常通过组合多个SVM分类器来实现多类划分问题。对于本课题的用户输入推荐模型中用户动作序列模式可以构造一对多型分类器，构造N个两类分类器，通过比较分类器的输出来判定分类结果。 SVM决策树是将SVM分类算法和二叉决策树[16]结合起来构成的分类算法。针对本文用户输入推荐模型中的动作序列， [A1（P11，P12…P1j…P1k），A2（P21，P22…P2j…P2k）……Ai（Pi1，Pi2…Pij…Pik）……AN（PN1，PN2…PNj…PNk）] （其中，Ai是动作序列中的一个动作，Pij是动作中的一个参数）设计SVM决策树[15] 算法。该算法的基本思想是：先将所有的动作合成两大类，再将每一