- 0
- 0
- 约3.12万字
- 约 42页
- 2026-01-23 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN114969251B(45)授权公告日2025.01.10
(21)申请号202210530965.6
(22)申请日2022.05.16
(65)同一申请的已公布的文献号申请公布号CN114969251A
(43)申请公布日2022.08.30
(73)专利权人北京智谱华章科技有限公司
地址100084北京市海淀区中关村东路1号
院6号楼6层603A专利权人安徽大学
(51)Int.CI.
GO6F16/334(2025.01)
GO6F16/383(2019.01)
GO6F40/284(2020.01)
(56)对比文件
CN109344402A,2019.02.15CN112685562A,2021.04.20审查员陈晓
(72)发明人殷俊褚晓泉段毅成赵姝郭双瑞仇瑜李青赵慧军刘德兵
(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201
专利代理师单冠飞
权利要求书3页说明书17页附图2页
(54)发明名称
基于大规模语料的新兴技术识别方法和装置
(57)摘要
CN114969251B本公开涉及数据分析技术领域,具体涉及一种基于大规模语料的新兴技术识别方法和装置,该方法包括:确定研究领域构建候选文献集,并对候选文献集进行关键词提取,以获得候选关键词数据集;根据候选文献集中候选文献数量以及关键词的相关信息对候选关键词数据集进行过滤,得到候选关键词过滤集;计算候选关键词过滤集中各关键词的新兴分数值;基于各关键词的新兴分数值和设定的新兴分数阈值对候选关键词过滤集进行筛选,得到候选新兴技术关键词数据集;采用动态回溯法对候选新兴技术关键词数
CN114969251B
度。
确定研究领域,构建研究领域的候选文献集,并对候选文献集进行关键词提取,以获得候选关键词数据集
根据候选文献集中候选文献数量以及关键词的相关信息对候选关键词数据集进行过滤,得到候选关键词过滤集
计算候选关键词过滤集中各关键词的新兴分数值
基于各关键词的新兴分数值和设定的新兴分数阈值对候选关键词过滤集进行筛选,得到候选新兴技术关键词数据集
采用动态回溯法对候选新兴技术关键词数据集进行处理,获得目标新兴技术关键词数据集
S101
S102
S103
S104
S105
CN114969251B权利要求书1/3页
2
1.一种基于大规模语料的新兴技术识别方法,其特征在于,包括:
确定研究领域,构建所述研究领域的候选文献集,并对所述候选文献集进行关键词提取,以获得候选关键词数据集;
根据所述候选文献集中候选文献数量以及所述关键词的相关信息对所述候选关键词数据集进行过滤,得到候选关键词过滤集;
计算所述候选关键词过滤集中各关键词的新兴分数值;
基于所述各关键词的新兴分数值和设定的新兴分数阈值对所述候选关键词过滤集进行筛选,得到候选新兴技术关键词数据集;
采用动态回溯法对所述候选新兴技术关键词数据集进行处理,获得目标新兴技术关键词数据集;
其中,所述根据所述候选文献集中候选文献数量以及所述关键词的相关信息对所述候选关键词数据集进行过滤,得到候选关键词过滤集,包括:确定研究时间范围,基于所述研究时间范围确定基础期、近期和活跃期;计算所述候选关键词数据集中的各关键词分别在所述活跃期的第一出现次数;计算所述候选关键词数据集中的各关键词分别在所述基础期的第二出现次数,基于各关键词的所述第一出现次数和所述第二出现次数,确定各关键词的第一评估比值;计算所述候选关键词数据集中的各关键词分别被使用的机构数量;基于所述第一出现次数、所述第一评估比值、所述机构数量和候选文献数量,对所述候选关键词数据集进行过滤,得到候选关键词过滤集;
所述基于所述第一出现次数、所述第一评估比值、所述机构数量和候选文献数量,对所述候选关键词数据集进行过滤,得到候选关键词过滤集,包括:基于所述候选文献数量确定第一活跃阈值和第二活跃阈值,并计算所述活跃期时所有关键词的第三出现次数和所述基础期时所有关键词的第四出现次数,基于所述第三出现次数和所述第四出现次数获得第二评估比值,基于所述第二评估比值和所述第二活跃阈值获得评估阈值;将所述第一出现次数小于所述第一活跃阈值的关键词、所述第一评估比值小于所述评估阈值的关键词和
您可能关注的文档
- CN114505989B 树脂供给装置、树脂密封装置和树脂密封品的制造方法 (山田尖端科技株式会社).docx
- CN114506347B 一种自动驾驶通过施工路段的系统和方法 (重庆长安汽车股份有限公司).docx
- CN114511714B 物体识别装置和物体识别方法 (株式会社日立制作所).docx
- CN114514236B 含有全氟烷基的核酸及其制造方法 (Agc株式会社).docx
- CN114518846B 数据处理方法及装置 (阿里巴巴(中国)有限公司).docx
- CN114519274B 一种气驱油藏注采参数分步优化方法 (中国石油大学(华东)).docx
- CN114548031B 信号检测方法和装置 (长鑫存储技术有限公司).docx
- CN114559923B 一种无人驾驶车辆自动紧急避障系统及其控制方法 (湖北汽车工业学院).docx
- CN114565528B 一种基于多尺度和注意力机制的遥感影像降噪方法及系统 (中南大学).docx
- CN114580160B 一种用于含裂纹功能梯度板传热问题的非局部方法 (河海大学).docx
最近下载
- 喷墨打印OLED技术全球竞争格局与发展策略.docx VIP
- 深度解析(2026)《GBT 45845.2-2025智慧城市基础设施整合运营框架 第2部分:开发与运维指南》.pptx VIP
- 2025年煤矿安全生产条例、两办意见、硬措施试卷(附答案).docx VIP
- SIMOCODE的参数设置及修改作业指导书.pdf.pdf VIP
- 煤矿两办意见和八项硬措施题(附答案).doc VIP
- 2023-2024学年江苏省南京市玄武区八年级(上)期末物理试卷及答案解析.pdf VIP
- 2022中国慢性自发性荨麻疹患者疾病负担白皮书.pdf VIP
- 雅思阅读:高频文章34 纸张与电脑.pdf VIP
- 2025年修订版《检验检测机构监督管理办法》知识试题库及答案.docx VIP
- 《居家与社区医疗相结合的养老服务规范》DB52T 1891-2025(贵州省标).pdf
原创力文档

文档评论(0)