Month 00, 0000 Title of Presentation (Edit using View Menu Header and Footer) 情报分析的工作流程 提纲 数据采集 数据导入 数据规范/数据结构化 数据分析 生成报告 案例分析—— 锌铁合金 Thomson Data Analyzer所处理的标准数据 DWPI Patent Family – 基本方法 提纲 数据采集 数据导入 数据清理/数据结构化 数据分析 生成报告 数据的清理 为什么要规范数据: Alloy, alloys; “human-computer interaction” and “human computer interaction” ;单数/复数变化;拼写错误;美式/英式拼写;公司名称/机构的不同书写格式的不同; TDA数据清理工具 TDA数据清理工具 “List Cleanup” 数据清理工具 TDA数据清理工具 TDA数据清理工具 TDA数据清理工具 TDA数据清理工具 提纲 数据采集 数据导入 数据规范/数据结构化 数据分析 生成报告 矩阵分析的类型: 同现矩阵(Co-occurrence Matrix) 寻找同时出现在两个矩阵参数中的记录。 自相关系数矩阵(Auto-Correlation Matrix) 利用矩阵分析在相同的字段中,寻找关系密切的项目。如寻找合作密切的公司、发明人。 互相关系数矩阵(Cross-Correlation Matrix) 利用矩阵分析在不同字段中,寻找关系密切的项目。如在相同领域研发相似的专利权人 主成分关系矩阵(Factor Matrix) 寻找经常共同出现在相同专利文献的项目,比如经常相伴出现的词(NLP聚成词簇。 Map类型: 自相关系数地图(Auto-Correlation Map) 在相同的字段中,寻找关系密切的项目。如寻找合作密切的公司、发明人、国家。 互相关系数地图(Cross-Correlation Map) 在不同字段中,寻找关系密切的项目。如寻找哪些公司在相同的研发领域关系密切。 主成分地图 (Factor Map) 寻找经常共同出现在相同专利文献的项目,比如经常相伴出现的词(NLP);经常相伴出现的发明人;IPC;Manual Code,聚成词簇。 数据源导入Thomson Data Analyzer: 清理、规范、分组工作完成,开始进行分析: 快速浏览,观察数据 List:一维分析 矩阵分析:二维分析 文本比较: Map:最好利用分过组的数据进行分析 预制的分析模块 :三维分析/分析报告 语言障碍: 有关同一发明的专利文献多次出版,大量的重复数据 按技术大类灵活的扩检/缩检;自然语言一词多义/一义多词的困扰 公司名称多变的困扰 专利文献语言晦涩,造成浏览、筛选、检索的困难 专业数据库的解决方案: (Derwent World Patents Index on the Delphion) U:半导体与电子电路 U11-半导体材料与处理 U12-半导体分立器件 U13-集成电路 U14-存储,膜混合电路 U21-逻辑电路,电子交换与编码 U22-脉冲发生与操纵 U23-振荡与调制 U24-放大器与低功耗设计 U25-阻抗网络 半导体材料、单晶生长、集成电路设计、封装、贴装、测试 电荷转移器件、辐射传感器/检测器、模拟电路、数字电路、集成电路结构、数字/模拟混合电路、大规模、超大规模集成电路 数字电路:可重复编程/擦写/使用部件:ROM;电可编程ROM;随机存储RAMS;电可擦除可改写可编程ROM;可编程逻辑器件等。 德温特手工代码:U13-C04B2: 电可擦写、可编程ROMS 专利信息数据采集中的常见问题: 数据源导入Thomson Data Analyzer: 清理、规范、分组工作完成,开始进行分析: 快速浏览,观察数据 List:一维分析 矩阵分析:二维分析 文本比较: Map:最好利用分过组的数据进行分析 预制的分析模块 :三维分析/分析报告 分析报告 Clean:Combine Author Networks(发明人聚组) Clean:DWPI Clean Up ( DWPI Only) Export: Fro Aureka.vpm(生成可以导入Aureka的数据文件,记录之间以***TDA***) Export: Groups to Excel(将“组”导出到Excel) Export: Groups to Text (将“组”导
原创力文档

文档评论(0)