- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自然语言处理的现状与未来整理
二.自然语言处理的主要研究方向 句法结构的形式化描述方法通常有两种:句法结构树、依存关系图。前者描述了句子的组成成分及各个成分之间的结构关系,后者则描述了句子中词与词的依存关系。 任何句子都由关键成分(主、谓、宾)和修饰成分(定、状、补)构成,关键成分为主,修饰成分为辅。通常主语和宾语为名词或代词,谓语则为动词。谓语动词在句子中处于中心地位。 二.自然语言处理的主要研究方向 完全句法分析是要通过一系列的句法分析过程,最终得到一个句子的完整的句法树或依存树。浅层句法分析也叫部分句法分析或语块分析,它只是要求识别出句子中某些结构相对简单的成分,如非递归的名词短语、动词短语等。这些被识别出来的结构称之为语块(chunk),语块是一种介于词汇和句子之间的具有非传递特征的句子的重要成分,有时也可能就是通常的短语。 三.下一代信息检索研究 当前个性化模型: M= R’(R(Q,D),U) 基于用户参考文档模型: M=R(Q,D,U)=R(MQ,MD) 其中: MQ=F(Q,U) MD=F(D,U,V) 三.下一代信息检索研究 式中 MQ: 针对特定用户重估后的查询模型 MD: 针对特定用户重估后的文档模型 Q: 查询, D:文档, U:用户 V: 网页(文档)价值 R: 相关度计算 R’: 重排序 F: 反馈 三.下一代信息检索研究 三.下一代信息检索研究 四.自然语言处理的未来思考 未来以物联网为核心的信息空间 将会把人类社会和物理世界更加紧密地联系在一起,实现人类社会、信息空间、物理世界三者的全面连通与融合。信息空间与人类社会的关系将由以技术为中心转化为以服务为中心。为了实现服务的普适化(无所不在,随时随地),要将感知设备(如RFID,传感器等)和计算设备嵌入到物理世界的实体(人和物)中去,再由泛在网将它们全面的连通。 四.自然语言处理的未来思考 在网络环境下,作为社会主体的人通过具有共同的兴趣、爱好、价值及行为等特征相互联系在一起构成网络的虚拟社区,形成虚拟社会。虚拟社会是现实社会的映射,它与现实社会相互关联、相互影响,现实社会的矛盾与问题能够很快地反映到虚拟社会中,并能迅速的传播与扩展,当然也可以利用虚拟社会去化解和沟通。未来社会的进步和发展离不开物联网,也离不开人联网。 四.自然语言处理的未来思考 2.从需求出发 发展,应用 价值,意义,必要性 需求-应用问题-科学问题-实施方案- -预期效果 学术(研究)跟着工程走 ⑴国内外交往的信息及语言支持; ⑵互联网上海量信息的处理; ⑶国家文化产业振兴的支柱; ⑷经济与社会发展的保障; ⑸理论技术、应用需求及国际前沿的差距。 四.自然语言处理的未来思考 2.抓住时机 敏感性(前沿,实用) 三个计算(泛在-无所不在,无所不能;服务-以服务为中心,创新要更多地体现在商业运作模式上;人本-基于人,为了人,用社会计算社会,基于与面向) 三个深度结合(感知、连通与计算;软件与硬件;理论、技术与服务) 深度(如语义理解),广度(外延,如社会计算) 四.自然语言处理的未来思考 实现六个转变: ⑴计算功能-由数值计算到信息处理的转变; ⑵计算方法-由单机到多机分布计算、网格计算及云计算的转变; ⑶开发应用-由以技术为中心到以服务为中心的转变(商业运作模式),普适化; 四.自然语言处理的未来思考 (四)知识获取-由依赖专家到依赖用户(草根)的转变,专家-专人-自然标注(无组织)-众包(有组织的群体智慧); (五)研究方法-由以模型为重点到以数据(大)为重点; (六)信息处理-由表层特征(文本-语法,图像-形状、颜色、纹理等)向深层语义分析转变。由用户采用关键词搜索到个性化推荐,直接回答用户问题的转变。 四.自然语言处理的未来思考 3.用好资源 充分利用网上的海量信息; 充分利用(超大)计算机的速度和容量; 充分利用现有的资源、技术与方法; 充分重视基础研究与共性技术开发; 充分调动人的智慧与才能; 充分进行合作与交流(可嵌入到系统中); 充分考虑市场需求(以服务为中心)。 四.自然语言处理的未来思考 4.建设基地 基础理论与共性技术研究基地; 推广应用与工程技术开发基地; 交
文档评论(0)