网站大量收购独家精品文档,联系QQ:2885784924

Greplin 私人信息打包搜索.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Greplin 私人信息打包搜索

Greplin 私人信息打包搜索Greplin提供一种云搜索服务,不仅可以找到自己分散在Twitter、Facebook、LinkedIn等各大网站里的帖子、电邮和文件,还能找到朋友账户里分享的你的帖子和文件。 只有19岁的丹尼尔.Daniel Gross)在他服兵役之前离开以色列,申请了美国企业孵化器Y Combinator并获得了面试的机会,三个月中格罗斯并没有开发出令人满意的项目,但一个小小的灵感改变了故事的情节。他走在去参加聚会的路上,记不起来把地址存到哪里了。在Facebook事件板块里,或是在电子邮件里,还是在他的日程表里?费劲儿从他手机上去搜索所有这些东西是件痛苦的事情。于是,他有了创建一个能对各种分散信息进行聚合搜索的网站想法,于是Greplin网站诞生了,并且在当时马上获得了78万美元的天使投资。 Greplin的服务就像是一个桌面搜索,它编制索引做出可搜索的在线社交网络账户,即一些人所说的“私人云”。免费版可以索引出来自Twitter、Facebook、谷歌邮箱(Gmail)、谷歌文件和日程(Google Docs Calendar)、Dropbox和LinkedIn网站的账户信息,而付费版本加入了其他资源和更多的索引空间。 如何工作 Greplin是云服务,所以没有需要安装的软件和要记录的文件,只是一个从任何电脑或手机都可以登录的网页。它提供一个安全的(安全超文本传输协议)网页用以搜索和显示结果。 结果经过对来源和信息类型进行选择性筛选,以各种形式呈现出来,比如数据流、消息、人物、事件和文件夹。甚至在Dropbox和“谷歌文件”的PDF文档里进行搜索也简单明了。 并且,Greplin的搜索速度很快。输入几个字母后,结果在不到一秒的时间里就可以显示出来。再添加上其他字母后,改变立刻就能显示出来。在大多数情况下,匹配词用黄色高亮显示,所以很容易辨认在结果里显示的特定条目,而且显示结果里还有清楚的来源信息,比如是来自Facebook 还是Twitter。在每个节段末尾,还有一个选项去获取更多的消息、数据流和人物,但是这只在还有更多这类条目的时候才可以使用。Greplin的搜索功能是整合性搜索“零散结果”设计模式中一个很棒的工具。 为了使Greplin能够获得一个账户中的信息和好友,系统使用Facebook Connect 体系,对于其他服务则使用开放式协议“OAuth”。这使得设置过程极为简单并且十分安全:选择一项服务把浏览程序发送给这项服务以授权给Greplin。 搜索引擎本身基于开源全文搜索引擎Lucene的核心功能,它专门用来进行私人信息搜索。特别之处是,Greplin的搜索自动进行左截断通配符搜索,例如以“lib”开始搜索会与“library”、“liberty”和“Libya”的条目匹配,而不是“alibi”或“glib”。而这并不是谷歌和其他网络搜索引擎通常工作的方式,Greplin速度很快而且单词是高亮显示的,所以进程一清二楚。 核心的搜索引擎Lucene的搜索规模可以大至数亿文件,它已经应用于LinkedIn、Digg、Netflix和Yelp等大型网站。并且,因为目前Greplin在亚马逊的云服务中执行,公司可以方便地为更多用户加入更多服务器,给每一批新用户安排一个新服务器。网页搜索引擎和企业搜索引擎做不到这一点,因为相关性依赖于整个索引中的文件频率,这正是要求复杂性分配和分散型体系结构的地方。更新索引所需时间应该是即时到20分钟。在一个为期三天的测试中,加入一个新资源很快,但是它不能清除已在谷歌邮箱里标记出来的邮件列表中的垃圾邮件。 Greplin对共享账户和机构账户来说是一个非常好的应用,像是那些小企业、本地图书馆和非营利机构。 问题依然明显 对于个人应用,隐私和安全是更大的问题,Greplin也在努力解决这个网络世界的通病。使用OAuth和Facebook Connect 系统意味着Greplin不会为其他网站储存用户名和密码,这样即使它们被黑了,尽管所有索引信息可能会暴露,但那些网站上的账户也不会受到攻击。格罗斯表示,“我们绝没有盘算要出售任何私人身份信息。我们用户的隐私对我们而言是至高无上之重要的。”这在Greplin网站的书面政策里也清晰地言明了,然而,书面政策里并没有对聚合搜索或趋势,以及许多公司肯定会挖掘和出售的非个人数据进行任何说明。不过,Greplin会在必要时于20分钟之内删除所有来自索引的信息,这样也可以让用户更加安心一些。 还有一点值得改进,Greplin搜索结果是公共内容和私人内容、新内容和旧内容的混合。搜索可以找到Twitter时间表、Twitter私密消息、谷歌邮箱公共列表和私人

文档评论(0)

linsspace + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档