浅谈专利分类、行业分类与商品分类的统一模型.pdfVIP

  • 277
  • 0
  • 约2.09万字
  • 约 8页
  • 2018-02-04 发布于湖北
  • 举报

浅谈专利分类、行业分类与商品分类的统一模型.pdf

中介服务 IP Agents 浅谈专利分类、行业分类与商品分类 的统一模型 杨 栋 邱晓宁 梁素平 成慧明 曹 鹏 张建强 严 薇 田 晶 摘 要:提出一种专利分类、行业分类与商品分类的统一模型,便于专利数据与行业经济数据、商品分类数据 的关联研究。该统一模型的关键在于多种分类体系之间的映射方法。首先,映射方法将复杂的任务拆分为简单任务 的组合。其次,利用了名称、说明、生产商、分类号等多种分类数据。最后,改进了一种投票算法以处理数据映射 歧义。该统一模型使得经济活动数据的大数据处理更加容易,使得在三种视角下的综合分析成为可能。 关键词:专利分类 国民经济行业分类 海关商品分类 一、引言 人工判定方法即组织领域专家对专利分类的某条 经济活动的分析视角可以包括创新视角 (专利)、 目与行业分类的某条目对应关系进行判定。人工判定 行业视角 (企业)和贸易视角 (商品)等[1] 。 方法准确性高,但耗费大量人力物力,并往往只能对 专利体现了经济活动的创新视角。专利分类提供 部分领域进行对应。 了有效的专利数据组织方式和检索方式。常见的专 映射方法即利用分类属性 (如专利申请人、企业 利分类体系如国际专利分类 (IPC )、联合专利分类 名称等)在两个分类表中查找映射关系 (如专利申请 (CPC )等。 人等于企业名称)。映射方法速度较快,但可进行映射 企业体现了经济活动的行业视角。行业分类提供 的相关属性有限,预处理也需要较多人工参与。 了有效的产业活动的分类方式。常见的行业分类体系 语义分析方法利用大规模训练语料自动分析两个 如国际标准产业分类 (ISIC )、我国的 《国民经济行业 定义之间的相似性,并判断其是否属于整体与部分的 分类 (GB/T 4754-2011)》(以下简称NIC )等。 关系,从而实现不同分类体系的不同定义之间的映射。 商品体现了经济活动的贸易视角。商品分类提供 语义分析方法的不足在于:语义分析需要精确的领域 了有效的便于贸易组织和管理的产品分类方式。常见 训练数据和大量的运算时间;定义 (包括注释、说明 的商品分类体系如联合国国际贸易标准分类 (SITC )、 等)中提取的语义词有限,难以反映真正的相似关系; 商品名称及编码协调制度 (简称HS 编码)、我国的 《全 两个定义之间的相似度高,并不意味着两个定义是等 国主要产品分类与代码第1部分:可运输产品》和 《全 价或从属关系。 国主要产品分类与代码第2 部分:不可运输产品》、我 2. 行业分类与商品分类对应的研究现状 国的海关进出口商品分类 (以下简称HS ,可参见海关 现有文献大多在各个行业中列举了适用于本行业 月报)。 的多种分类体系,而缺少国民经济行业分类与商品分 类的对应方法研究。如农产品领域[3] [4] 1. 专利分类与行业分类对应的研究现状 、林产品领域 等。 对于专利分类与行业分类之间进行对应的研究, 3. 专利分类与商品分类对应的研究现状 包括人工判定方法1 [2] 、映

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档