- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向互联网的计算语言学研究1
第 1卷 第 1期 智 能 计 算 机 与 应 用 V01.1 NO.1
2011年 6月 INTELLIGENT COM PUTER AND APPLICAT10NS Jun.201l
面向互联网的计算语言学研究
王海峰,赵世奇
f百度公司,北京 100085)
摘 要 :近年来,计算语言学(ComputationalLinguistics:CL)在学术界和S-业界均得到了越来越多的关注,这主要得益于其在互联网领域
越来越广泛的应用,如搜索引擎、在线翻译系统、社交网络等。计算语言学的很多技术在互联网应用中都能找到用武之地。这其中既包括词法、
句法、语义等基础技术,也包括问答、翻译、文摘等应用技术。面对海量、高噪声的互联网数据及真实互联网应用需求,计算语言学技术也需要
进行调整与改进。本文将主要讨论在互联网大背景下的计算语言学研究,包括新应用、新资源、新挑战,以及新方法等。
关键词 :计算语言学;互联网
中图分类号:TP393.01 文献标识码:A 文章编号:2095—2163(2011)O1—0008—06
ComputationalLinguisticsforW eb
W ANG Haifeng,ZHA0 Shiqi
(BaiduInc.,Beijing100085,China)
Abstract: ComputationalLinguistics(CL1hasattractedmoreandmoreinterestinbothacademicandindustrycommunitiesinrecentyears,sinceit
playsallessentialroleinmanyIntemetapplications,includingsearchengines,onlinetrnaslationsystems,socialnetworks,andSOfbnl1.AlmostallCL
techniques,rangingrfommorphological,syntactic,nadsemanticanalysisoftexts,toquestionna swering,machinetranslation,summarization,andoth—
ercomplextechniques,canfindtheirscopesintheInternetapplications.However,conventionalmethodologiesinCLresearchneedtobeadaptedand
improved. SOastodealwithnew challengesraisingrfom thenew applicationrequirementsaswellasthelarge—scaleandhighlynoisywebcorpora.
ThispaperdiscusseshteCLresearchinthebackgroundofInteract,includingthenew applications,resources,challengesandmethodologies.
Keywords:CompuattionalLinguistics;Web
0 引言 用了计算语言学技术。计算语言学技术在这一领域的应用
计算语言学 (ComputationalLinguistics:CL)是语言学 可以概括为两点,即 “面向需求搜索信息”以及 “利用信息
与计算机科学的交叉学科,是指使用计算机建立形式化的 生成知识”。其中,前者 旨在从海量网络信息中搜索出满足
数学模型,来分析和处理 自然语言,因而又叫自然语言处理 用户需求的特定信息;后者则致力于对搜索到的信息进行
(NaturalIJanglJageProcessing:NLP)。计算语言学的研究 深
文档评论(0)