基于cart决策树算法的专利价值评估指标体系-doi10.6043j.docVIP

下载本文档

63
0
约1.62万字
约 11页
2017-02-11 发布于天津
举报
版权申诉

基于cart决策树算法的专利价值评估指标体系-doi10.6043j.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于cart决策树算法的专利价值评估指标体系-doi10.6043j

doi: 10.6043/j.issn.0438-0479.201608004 基于分类回归决策树算法的专利价值评估指标体系邱一卉* 张驰雨（厦门理工学院经济与管理学院，福建厦门 361024）摘要：科学、准确的专利价值评估将有效地促进专利的产业化、商业化，是提升国家、企业综合实力的重要关键点。针对我国专利数据来源众多、指标关系复杂等特点，现有专利价值评估过程依赖人为主观，缺乏客观、合理评估方法等问题，提出了一种基于分类回归决策树（lassification and regression tree, CART）能提高评估建模效率在评估可解释性的基础上关键词：专利价值评估指标体系；属性选择；决策树算法中图分类号：TP181 文献标志码: A 近年来，我国的专利总量快速增长。2015年，我国全年科研经费支出达14220亿元，比上年增长9.2%，全年受理专利申请279.9万件，为171.8万件授予专利权[1]。。60%的研究时间40%的研究经费[1~3]。因此，专利价值评估。专利评估涉及诸多的影响专利价值的有利于我们。[4]和Hou[5]分别提出了影响专利价值评估的主要因素，也出现了CHI专利价值评估指标体系[6]和佐治亚太平洋（Georgia Pacific）评估体系7]等相关指标体系。杨丹丹、李清海、赵蕴华等[8~14]提出了影响专利价值评估的关键指标，并构建了专利价值评估指标体系。国家知识产权局于2012年出版了《专利价值分析指标体系操作手册》[15]，该体系主要包括技术价值因素、法律价值因素及经济价值因素3个一级指标及一系列二级指标，为专利价值评估提供指导性的先验信息。综上，国内外学者对专利价值评估指标体系研究取得了不少成果，在实际应用邻域仍未形成统一的评估模型及标准。我国专利数据库也存在不完善、未标准化等问题使得很多国外的研究成果不适用于我国的专利价值评估，导致以往的专利价值评估过程中过于依赖人为评价、主观性太强，缺乏公正、合理和易操作的评估方法。在这一背景下，利用跨领域的新方法专利价值评估数据具有来源众多、指标关系复杂、类别不平衡等特点，为进一步提高评估性能，对专利价值评估数据进行属性选择、建立一个简约的专利价值评估指标体系十分必要。机器学习领域的属性选择分为三种模式：第一种模式是过滤器（Filter）方法，独立的对数据属性进行选择处理，与后续模型无关；第二种模式是包裹式（Wrapper）方法，直接把最终将使用的模型性能作为特征子集的评价准则；第三种模式是嵌入式(Embedding)方法，将属性选择过程与模型训练过程融为一体。一般而言，由于包裹式属性选择方法直接针对模型进行优化，因此从最终模型性能来看，包裹式特征选择比过滤式特征选择更好。Fisher’s ratio、F-score[16]和Chi-Square[17]属性选择方法都是过滤器式的方法。这些方法无法检测属性之间的关系，所选取的属性之间可能存在严重冗余，提高过拟合风险。而KP-SVM[18]（Kernel-Penalized Support Vector Machine）和Boosting-SVM[19]（Boosting Support Vector Machine）则是嵌入式的属性选择方法，嵌入式的属性选择方法效率较高，它们在构造分类器的同时选择相关的属性。基于随机森林[20]的属性选择方法也是一种嵌入式属性选择方法，在建立随机森林的同时可以得到变量重要性的排序列表，根据该列表进行属性选择。但是这类方法依赖于特定的数据类型，在专利价值评估的数据上运用效果不佳。针对以上属性选择方法在专利价值评估指标体系应用中出现的问题。本文提取出一种基于CART决策树算法的属性选择方法，用于构建专利价值评估的指标体系。实验结果表明相较于基于随机森林的属性选择方法，该方法具有更大的优势，能够有效地降低指标体系的规模。相较于上述属性选择方法能快速地属性进行选择，得到的重要性程度排序并适用于多种数据类型成本法21]和市场法22]相比提出的 1.1 CART决策树算法为提高专利评估的效率，本文利用在机器学习领域应用最为广泛的CART决策树算法进行属性选择。决策树是一种由结点和有向边组成的层次结构，树中包含三种结点：根结点、内部结点、终结点。决策树仅有一个根结点，是全体训练数据集合。树中的每个内部结点是一个分裂问题，它将到达该结点处的样本按某个特定属性分块。每个终结点是带有分类标签的数据集合。从决策树的根结点到叶结点的一条路径形成一个判别规则。 CART决策树算法是Breiman[23]于1984年提出的，该算法可以处理处理高度倾斜或多态的数值型数据，也可以处理顺序或无序的类属型数据[24]。CART算法使用基尼系数（Gini Index）作为