专利算法笔试题目及详细答案.docx

专利算法笔试题目及详细答案

一、笔试题目(总分100分)

题目1:专利相似度快速匹配算法设计(40分)

背景:某专利数据库存储了10万+专利文献,每篇专利包含“权利要求书关键词集合”(平均每个集合含50个关键词,关键词为字符串,无重复)。需设计算法实现:给定一篇新专利的关键词集合S(含M个关键词),快速找出数据库中“关键词交集占比≥阈值T”的所有专利(交集占比=|S∩数据库专利关键词集|/min(M,数据库专利关键词集大小))。

要求:

1. 设计数据预处理方案(降低查询时的计算复杂度);

2. 给出查询算法的详细步骤;

3. 分析时间复杂度与空间复

文档评论(0)

1亿VIP精品文档

相关文档