- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
15岁学生开发阅读应用:智能算法过滤不重要内容
北京时间1月10日消息,据国外媒体报道,15岁,通常是一名少年刚刚进入人生高中阶段的时候,当同龄人纷纷选择在这个年龄段尽情玩乐的时候,名为 泰楠·唐铎普特(Tanay Tandonput)高中生却开发了一款名为“Clipped”的精品阅读应用,并对其所使用的基于自然语言处理的智能算法申请了专利。
日前,唐铎普特抽空接受了美国知名商业杂志《Fast Company》撰稿人大卫·扎克斯(David Zax)的专访。在采访中,唐铎普特透露,最初开发Clipped只是为了帮助自己在学校更好的参与辩论赛,这一工作并没有影响到自己作为普通高中生的生 活。除此之外,他还认为“发布产品没有年轻与否之说,更没有年龄限制。”
以下是文章主要内容:
我们曾邀请唐铎普特到现场来参与我们的访问,但由于没有取得学车执照(learner’s permit是美国考驾照的前一步,与国内交规考试的差别就是拿到学车执照的人就可以上路了,不过必须要有驾照的人坐在旁边),因此唐铎普特最终没能成 行。对于唐铎普特的难处,我们感到十分理解。因为唐铎普特不仅需要频繁参加学校举办的各种辩论赛、上课、与朋友出行游玩,而且他大部分的业余时间都被花在 了自己于年前推出的一款精品阅读应用“Clipped”的开发工作中。
当下新闻阅读类的应用不胜枚举,部分应用的用户体验十分出色,其中就包括大名鼎鼎的新闻聚合社交应用Flipboard。除了Flipboard以 外,还有无数的初创公司投身于这个领域,比如Zite、Cir.ca和Summly。不过,由唐铎普特开发的Clipped应用的主打功能却很有意思,那 就是自动帮助用户过滤无用内容,然后根据关键信息给出一个简练的内容摘要。用户只需要提交一个文章地址,Clipped就会利用基于自然语言处理的智能算 法过滤掉没有太多意义或者不重要的细节内容,通过统计和关键字的组合分析,Clipped能够对信息块的重要度进行排名,并选出那些关联系数最高的句子。 然后,Clipped根据分析结果生成内容摘要,最后还会重新读取自动生成的摘要进行分析,以确保选定的信息内容是合理的。然后,该应用才会将最终结果呈 现给用户阅读。一般来说,一篇文章经过Clipped过滤之后只会剩下三句话左右。
Clipped对“精简”的理念贯彻的十分彻底,他们甚至在Clipped应用内部内置了一个新闻摘要检索功能。这也就是说,即使被Clipped 精简过的文章内容已经很少了,开发商还是认为其中包含了部分用户不感兴趣的内容,所以Clipped允许用户根据自己的兴趣输入关键词进行检索,也就是让 用户对已经精简过的内容再进行一次主动筛选。目前,Clipped已推出Android版和iOS版应用,同时推出了桌面版的浏览器插件,可支持 Safari、Firefox、Chrome和IE浏览器。此外,Clipped还为开发者提供了API,开发者可将Clipped的功能内置到自己的应 用中。
唐铎普特坦言,自己对自然语言处理技术非常痴迷,自己最初开发Clipped就是为了让自己在学校的辩论赛中可以以更快的速度阅读到有用信息。所 以,当他最初设计Clipped时,就考虑到了要让用户一开启应用就可以立刻看到最重要信息这一方面。不过,唐铎普特也坦言,目前的Clipped还远远 称不上完美,仍然有着许多需要提高的地方。
日前,我们有幸采访到了唐铎普特,以下是本次专访主要内容:
扎克斯:你是怎么想到开发Clipped这个点子的?
唐铎普特:我是一名十分热衷于“林肯—道格拉斯”式辩论(The Lincoln-Douglas Debates)的辩手,因此在每次辩论前我都需要进行许多准备工作,这一过程十分冗繁。因此我产生了让一篇文章浓缩成短小精悍短文的想法。去年,我编写 出了基于自然语言处理智能算法的第一个版本,然后花了去年一整年的时间对此进行修改。最后,我认为这一算法不仅适用于辩论领域,而且还适用于新闻文章及其 他文献的阅读领域。
扎克斯:部分用户反映Clipped的文章精简功能有时并不好用。
唐铎普特:新版Clipped中的自然语言处理智能算法主要针对长度在一页至两页之间的文章,目标文章风格主要是叙述性或信息类,而不是主要针对阐述观点类的文章。不过,目前我正在针对阐述观点类的文章对这一算法进行优化。
在一个普通的上课日中,我在回家后通常会先做3、4个小时的家庭作业,然后同朋友出去玩1、2个小时,最后才回家利用一天中剩余的时间处理Clipped方面的工作。
扎克斯:当你在为自己的辩论赛而开发这一自然语言处理智能算法的时候,你自己是怎么使用这一工具的?
唐铎普特:以前,我通常会快速阅览许多文章,如果我喜欢其中某一篇文章的话会从头开始阅读。比如,在一场普通的 辩论赛中,我
文档评论(0)