- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Google、百度分别发力实体搜索:「直接给出答案」
编者注:本文来自@刚果不说话 的供稿,点击关注他的新浪微博。
实体搜索, 知识图谱等名词在今年开始逐步提升曝光率(Google、百度分别发力实体搜索产品)。Google 新近发布的 iOS 版 Voice Search App 也表现出了不逊于 Siri 的功能,还特别强调了其整合知识图谱带来的「直接回答问题」的能力」。
相比于 Siri 底层的实体属性、关联关系等知识数据强依赖于和 WolframAlpha 的合作关系,Google 凭借自身高投入的知识图谱项目似乎更值得被赋予更高的期望值,搜索引擎公司在获取海量数据和提取知识方面的数据和技术优势是不言自明的。 对于中文市场而言,工业界在这方面的投入并不明显。除了 LBS 相关的信息外,Siri 在中文市场也缺乏有力的合作伙伴。在「Google、百度发力实体搜索」一文中,我们观察到了一些百度投入实体数据建设的一些迹象,比如:类似盗梦空间的电影。也做了一些大胆的预测:百度正在实体搜索领域内悄悄发力,同时采取深挖实体关系这一和 Google 不同的技术方向。近期的确又观察到百度逐步将这一领域内的实验范围在扩大,验证了之前的部分猜想。对于有志于建设实体库、本体信息和语义网应用的新兴公司而言,可能后续还面领着更大的竞争。
1、不掉毛的狗
2、濒临灭绝的植物
3、开黄花的树
从这些搜索结果可以看出,和之前电影类一样,百度的技术方向和 Google 不同:百度主要是在「深度」,而 Google 则强调「广度」。像「不掉毛」「濒临灭绝」这些细致的属性,传统的实体信息提取技术是无法涵盖的。但这种深入的属性数据挖掘,一方面得益于大量的网页数据,另一方面也受限于互联网数据里大量的噪音影响,是个技术难度和收益都比较大的方向。从目前的结果来看,这些深入挖掘出的属性数据在质量方面的表现是不错的,比如「不掉毛的狗」的结果中,除了雪纳瑞等较为常见的不易掉毛的狗以外,甚至可以覆盖到「冠毛犬」。假如在保证数据的质量的前提下覆盖领域可以不断扩大,对于知识类的问题,机器可以像 IBM Watson 一样直接给出超出人类平均水平的解答。
实体数据的深耕代表着搜索引擎具有的「智慧」和「知识」越来越多,搜索引擎公司一方面会进一步加强自身搜索结果「直接回答问题」的能力;同时发力进军智能助理这个新兴移动领域应该是个没有争议的事情。
点此查看 @刚果不说话 的上一篇供稿:搜索引擎开始「实体搜索」新领域竞争,Google、百度分别发力实体搜索产品
文档评论(0)