- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于潜在语义分析的汉语问答系统答案提取.pdf
第29卷第10期 计 算 机 学 报 v01.29No.10
2006年10月 CHINESE OF 0ct.2006
JOURNALCOMPUTERS
基于潜在语义分析的汉语问答系统答案提取
余正涛’2h∞ 樊孝忠∞ 郭剑毅”’2’ 耿增民3’
1’(昆明理工大学信息工程与自动化学院昆明 650051)
2’(云南省汁算机技术应用重点实验室 昆明 650051)
3’(jE京理工大学计算机科学工程系北京 100081)
摘要为了解决在汉语问答系统答案提取时,由于词的同义或多义现象而导致的“漏提”或“错提”等问题,提出
了一种基于潜在语义分析(LSA)的问题和答案句子相似度计算方法.它利用空间向量模型作为问题和句子的表示
方法,借助于潜在语义分析理论,对大量问答作句子语料统计分析,构建了一个潜在的词一句子语义空间,从而消除
了词之间的相关性,并在语义空间上实现了问题与答案句子相似度计算,有效地解决了词的同义和多义问题.最后
结合问题类型和相似度计算结果,对汉语基于事实的简单陈述问题进行了答案句子提取实验.答案提取的MRR值
达到了o.47,明显优于空间向量模型.结果说明该方法具有很好的效果.
关键词 问答系统;答案提取;相似度;向量空问模型;潜在语义分析
中图法分类号TP391
Answer forChinese
Extracting Question—AnsweringSystem
BasedonLatentSemantic
Analysis
YU FAN GUOJian—Yi’2’GENG
Zheng—Ta01’’2’t3’Xiao—Zhon93’ Zeng—Min3’
’(Sf^ooZ nnd 650051)
o,,n,0rwln£i。nEnginPe“ngA“£om口£frJn,KHnmi”gUniwrsi£yo,Sc搪Hcg口”d丁名c^o£ogy.K“,lming
65005
2’(KeyLn60r口£Dryo,(10mp“£er丁|c^HoZogyo,yknnnnProuince,K“nmiNg1)
A户pz掂nfion
3’(DP户口r£men£o厂Co仇p“£er fn“““£e lO0081)
Science&Engi”e8ring,BP巧igo,丁kf^N。zogy,Be巧抽g
AbstractWhen answersinChinese willcause
extracting question—answeringsystem,synonymy
toloseseVeral
correctanswers,and willcausetoextract answers.Inorderto
polysemy wrong
solvethese amethodtocalculate between and
problems,thispaperproposes similar
文档评论(0)