CN114969251B 基于大规模语料的新兴技术识别方法和装置 (北京智谱华章科技有限公司).docxVIP

  • 0
  • 0
  • 约3.12万字
  • 约 42页
  • 2026-01-23 发布于重庆
  • 举报

CN114969251B 基于大规模语料的新兴技术识别方法和装置 (北京智谱华章科技有限公司).docx

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN114969251B(45)授权公告日2025.01.10

(21)申请号202210530965.6

(22)申请日2022.05.16

(65)同一申请的已公布的文献号申请公布号CN114969251A

(43)申请公布日2022.08.30

(73)专利权人北京智谱华章科技有限公司

地址100084北京市海淀区中关村东路1号

院6号楼6层603A专利权人安徽大学

(51)Int.CI.

GO6F16/334(2025.01)

GO6F16/383(2019.01)

GO6F40/284(2020.01)

(56)对比文件

CN109344402A,2019.02.15CN112685562A,2021.04.20审查员陈晓

(72)发明人殷俊褚晓泉段毅成赵姝郭双瑞仇瑜李青赵慧军刘德兵

(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201

专利代理师单冠飞

权利要求书3页说明书17页附图2页

(54)发明名称

基于大规模语料的新兴技术识别方法和装置

(57)摘要

CN114969251B本公开涉及数据分析技术领域,具体涉及一种基于大规模语料的新兴技术识别方法和装置,该方法包括:确定研究领域构建候选文献集,并对候选文献集进行关键词提取,以获得候选关键词数据集;根据候选文献集中候选文献数量以及关键词的相关信息对候选关键词数据集进行过滤,得到候选关键词过滤集;计算候选关键词过滤集中各关键词的新兴分数值;基于各关键词的新兴分数值和设定的新兴分数阈值对候选关键词过滤集进行筛选,得到候选新兴技术关键词数据集;采用动态回溯法对候选新兴技术关键词数

CN114969251B

度。

确定研究领域,构建研究领域的候选文献集,并对候选文献集进行关键词提取,以获得候选关键词数据集

根据候选文献集中候选文献数量以及关键词的相关信息对候选关键词数据集进行过滤,得到候选关键词过滤集

计算候选关键词过滤集中各关键词的新兴分数值

基于各关键词的新兴分数值和设定的新兴分数阈值对候选关键词过滤集进行筛选,得到候选新兴技术关键词数据集

采用动态回溯法对候选新兴技术关键词数据集进行处理,获得目标新兴技术关键词数据集

S101

S102

S103

S104

S105

CN114969251B权利要求书1/3页

2

1.一种基于大规模语料的新兴技术识别方法,其特征在于,包括:

确定研究领域,构建所述研究领域的候选文献集,并对所述候选文献集进行关键词提取,以获得候选关键词数据集;

根据所述候选文献集中候选文献数量以及所述关键词的相关信息对所述候选关键词数据集进行过滤,得到候选关键词过滤集;

计算所述候选关键词过滤集中各关键词的新兴分数值;

基于所述各关键词的新兴分数值和设定的新兴分数阈值对所述候选关键词过滤集进行筛选,得到候选新兴技术关键词数据集;

采用动态回溯法对所述候选新兴技术关键词数据集进行处理,获得目标新兴技术关键词数据集;

其中,所述根据所述候选文献集中候选文献数量以及所述关键词的相关信息对所述候选关键词数据集进行过滤,得到候选关键词过滤集,包括:确定研究时间范围,基于所述研究时间范围确定基础期、近期和活跃期;计算所述候选关键词数据集中的各关键词分别在所述活跃期的第一出现次数;计算所述候选关键词数据集中的各关键词分别在所述基础期的第二出现次数,基于各关键词的所述第一出现次数和所述第二出现次数,确定各关键词的第一评估比值;计算所述候选关键词数据集中的各关键词分别被使用的机构数量;基于所述第一出现次数、所述第一评估比值、所述机构数量和候选文献数量,对所述候选关键词数据集进行过滤,得到候选关键词过滤集;

所述基于所述第一出现次数、所述第一评估比值、所述机构数量和候选文献数量,对所述候选关键词数据集进行过滤,得到候选关键词过滤集,包括:基于所述候选文献数量确定第一活跃阈值和第二活跃阈值,并计算所述活跃期时所有关键词的第三出现次数和所述基础期时所有关键词的第四出现次数,基于所述第三出现次数和所述第四出现次数获得第二评估比值,基于所述第二评估比值和所述第二活跃阈值获得评估阈值;将所述第一出现次数小于所述第一活跃阈值的关键词、所述第一评估比值小于所述评估阈值的关键词和

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档