基于向量空间模型的题库相似度检查算法.pdfVIP

  • 15
  • 0
  • 约1.29万字
  • 约 4页
  • 2017-08-31 发布于湖北
  • 举报

基于向量空间模型的题库相似度检查算法.pdf

基于向量空间模型的题库相似度检查算法.pdf

2010年 第 19卷 第 3期 计 算 机 系 统 应 用 基于向量空间模型的题库相似度检查算法① 汪忠国 吴 敏 (中国科学技术大学 现代教育技术中心 安徽 合肥 230026) 摘 要: 随着题库系统的广泛应用和题库中试题数量的 日益增大,如何避免试题重复,成为研究的重要问题。 利用向量空间模型.首先通过TF—IDF公式得到试题的文本权重向量,再通过余弦理论计算试题相似度, 并与设定的相似度阈值比较,得到相似度检查结果。在现有题库的基础上进行的实验结果显示,算法 计算出的试题相似度的准确率与专家人工判别相比达到94%。算法取得了较好的结果。 关键词: 向量空间模型;相似度检查;单文本词汇频率;逆文档频率;余弦理论 SimilarityCheckingAlgorithm inItem BankBasedonVectorSpaceM odel W ANG Zhong—Guo.W U M in (CenterofModemEducationalTechnology,UniversityofScienceandTech

文档评论(0)

1亿VIP精品文档

相关文档