- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
34 中文信息学报
要的信息,还应该像银行的窗口一样提供个性化的 多关于地点敏感、人物敏感、情感敏感的搜索功能。
服务。更进一步,它还应该像专家一样辅助用户做 发展独立的微博搜索和社会关系网络搜索或者把微
出决策并快速完成各种交易。根据中国互联网络信 博和社会关系网网络的内容纳入到通用的搜索,都
息中心的报告显示,中国网民规模达到4.85亿。同 是实时搜索的重要应用。
时,社交网络的用户呈现出同步的高速增长,2011 但是微博信息太过繁杂,若没有适当的过滤功
年中国微博用户数量已增长到1.95亿,半年增幅达 能,将使得搜索的结果杂乱无章,甚至充斥着很多灌
208.9%。中国庞大的网民数量为搜索的发展提供水、广告、欺诈的信息,从而利用价值大打折扣。另
了广阔的空间。同时,社会关系网络和移动互联网 rank和关键词索引和搜
外,使用目前的基于page
推动搜索引擎的技术将会发生重大的改变。自然语 索的技术,用户只能得到一组按照时间顺序排列的
言处理对用户意图的理解和对文本的理解能力的提 微博,用户需要花很长时间去阅读。语义分析技术
高,将使得搜索的准确性也将持续改善。互联网搜 从大规模杂乱无章的微博中萃取结构化的信息,支
索领域酝酿着前所未有的新机遇。然而搜索引擎的 持后续的数据挖掘和搜索,应该引起更多的关注。
成功是多方面因素共同作用的结果,需要技术和战 语义分析技术除了常规的自然语言处理包括分词、
略的巧妙配合。本文将深入分析目前搜索引擎技术 抽取关键词、适度的句法分析、分类之外,要进行语
发展的趋势,指出应该关注的若干重要领域,并且探 义角色标注和情感分析口。4]。
讨了搜索引擎的研发战略。 第三,社会关系网络和搜索的互相影响。社会
关系网络昭示了下一代互联网的趋势。社会关系网
2搜索引擎的发展趋势 络有望成为互联网的门户和目的地。譬如Face—
book已经有7亿用户,用户在其内停留的时间是花
首先,搜索引擎将会更加注重强大的信息的整 在搜索引擎的时间170%和花在邮件和门户的时间
合能力。搜索结果通过多角度、多数据渠道和多媒 的200%。在社会关系网络内提供了涉及新闻、视
体展现。譬如搜索北朝鲜,关于朝鲜的简介、新闻、 频、游戏、电子商务等几乎所有服务。人们使用社会
博客、论坛、视频、电视访谈、图片、还有wiki搜索结 关系网络进行信息发布,与别人通信和保持联络,表
果、电子商务搜索结果(比如亚马逊的书),实时的微 达自己的观点。企业可以跟踪用户对其品牌的认知
博,等等各类信息分门别类整齐排列。为了达到完 度和反馈并进行新品牌的营销推广。
美的整合,需要对诸数据源作深入的信息挖掘。通 在日常生活当中,人们每天都从自己信赖的人
过一套整合协议,通用搜索引擎平台可以包容来类 那里获取信息并在此基础上作出决定。如我向同事
垂直领域的资源,使用互联网中的庞大的暗网数据。 询问公司附近哪儿能找到最好的饭店;我向父母询
垂直搜索引擎和通用的搜索引擎从原来的竞争关系 问自己是否应该出国留学。在社会关系网络的支持
演变成双赢的生态和谐关系。与此相关的另外一个 下,当你进行搜索时,你可以看到好友的推荐信息。
明显的趋势是,搜索引擎业务和其他业务整合在一 利用社会关系网络可加强搜索能力[5]。用户使用
起,搜索成为其中的一个功能。例如,微软的英库 “赞”可以标记对所搜
原创力文档


文档评论(0)