- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于图书“基因”的阅读推荐:BookLamp.doc
基于图书“基因”的阅读推荐:BookLamp
亚马逊和苹果分别对Goodreads和BookLamp的收购是两者在阅读市场上角力的具现化最新缩影。哪个选择更正确?现在还很难说。
热词:图书”基因”分析 BookLamp 阅读市场博弈
几乎每一家购书网站和阅读社交网站都会向读者推荐图书,但它们往往是基于读者既往的购买史和阅读史做出推荐。那么,有没有一项服务能基于图书本身的内容和语言进行推荐,而不被图书的流行程度、“水军”的造势或者出版商的营销手段等外部因素所左右呢?美国爱达荷州的一家大数据图书分析服务提供商书灯公司(BookLamp)就可以提供此类图书推荐服务。BookLamp的前身是成立于2003年6月的新奇计划公司(Novel Projects, Inc.),这家公司希望通过语义的不断计算与挖掘,开发出各类新颖的软件和服务。2007年2月,他们将语义技术结合出版产业,创立了BookLamp公司。这个团队最有代表性的项目是2010年8月上线的“图书基因组计划”(Book Genome Project),该服务利用自然语言分析技术为用户推荐图书,并为出版行业提供帮助。
一、核心技术:图书“基因”分析技术
一直以来,购书网站上的图书推荐引擎提供服务的方式不外乎以下几种:“购买了某本书的人还购买了这些书……”“这些书是编辑精选……”“这些书正在热销……”“这些书广受好评……”。然而,就算购买了同一本书,不同读者的阅读兴趣和阅读习惯仍然可能存在巨大差异;作者热门或图书卖得好也不甚靠谱;而流行趋势、编辑精选等基本就是营销造势的结果。以上推荐方法都不能准确地帮读者找到自己喜欢的书,因为它们都是基于一本书外在的特征、条件和状况,而不是根据图书的题材、内容、语言风格以及作者能力和水平等更内在的特点来做出推荐――因此是不全面的,很多时候也是不准确的。
BookLamp的图书“基因”分析技术则另辟蹊径,不关注作者也不关注读者,仅根据书籍自身的“基因”来作出阅读推荐。具体来说,BookLamp将一本书的“基因”总结为语言风格和故事情节两方面,其中,语言风格DNA由语言密度、语言节奏、对话、描述和运动组成;故事情节DNA则由关键主题词组和写作手法组成。对于后一点,BookLamp的创始人亚伦?史坦顿(Aaron Stanton)曾在接受媒体采访时打过一个恰如其分的比喻,“就像你吃了一块很好吃的巧克力蛋糕,如果你想找到其他口味类似的蛋糕,你所需要知道的不仅仅只有其成分,还需要知道各个成分的比例。”从这个角度来看,一本书的关键主题就是其成分,而写作手法就是其成分比例。在对一本书进行分析时,BookLamp会对书的内容进行扫描,将全文分解为一百个场景,然后依据自然语言算法分析每个场景的“DNA”――语言、情节、写作思路、主题及形式等(BookLamp总结了2000多个特性),同时计算不同主题所占成分(BookLamp总结了132个主题),多方位评估书的内容,并基于评估结果绘制图书的“基因图谱”。比如说,史蒂芬?金的《午夜行凶》(Salems Lot)在图书基因组计划中被解析出四个主要特征:吸血鬼/超自然;葬礼/死亡/追悼;家庭/家庭环境;痛苦恐惧/消极情绪。BookLamp将这四个特征随故事线进展所占比例的变化用图表描绘出来,遂形成《午夜行凶》的基因图谱,如图1所示。
图1 《午夜行凶》基因图谱
二、用户价值及商业模式
“基因图谱”分析有助于读者找到心仪的图书。用户在使用BookLamp支持的服务时,先选取自己喜欢的一本或几本书,BookLamp会将该书的“基因图谱”与数据库中的进行适配,为用户推荐同类型的、用户也可能喜欢的图书。用户会惊喜地发现,BookLamp为自己推荐的图书与自己喜欢的书具有相似的语气、观点、描述,甚至有类似的戏剧冲突。举例而言,如果读者喜欢《达?芬奇密码》,想要找一本类似的小说,BookLamp会先拉取系统此前对该小说的分析数据。分析数据显示,《达?芬奇密码》有18.6%的内容涉及宗教和宗教机构,9.4%的内容涉及警方和谋杀案的调查,8.2%的内容涉及艺术和艺术画廊,6.7%的内容涉及秘密结社,以及历史文化、旅行、寻求真相等其他元素。然后该系统会用这些故事情节DNA数据以及该书的语言风格DNA数据去比对数据库中的其他书籍,最后返回《失落的秘符》《最后的圣殿骑士》《巴拉巴德的七把钥匙》等小说,这些书的内容都包含与《达?芬奇密码》相似的元素与元素比例、语言风格,如图2所示。
图2 《达?芬奇密码》的基因图谱及与之相似的图书
上文分析了BookLamp能为读者创造的价值,那么,BookLamp采用怎样的商业模式呢?一方面,和Pandora或者豆瓣类似,BookLam
您可能关注的文档
最近下载
- 智算中心及算力产业集群项目运营管理方案.docx VIP
- 2025安徽芜湖市湾沚区招聘社区工作者11人考试备考题库及答案解析.docx VIP
- 锅炉安装改造维修质量保证体系文件(手册+程序文件+表格+工艺文件汇编)-符合TSG 07-2019特种设备质量保证管理体系.docx
- 甲状腺科普宣教.pptx VIP
- 贵州省2025年高职院校分类考试招生中职生文化综合语文试题答案.docx VIP
- 智算中心及算力产业集群项目节能评估报告.docx VIP
- 甲状腺的科普宣教.pptx VIP
- 高考试题——物理(全国卷)云南.doc VIP
- 智算中心建设可行性分析.docx VIP
- 产前筛查实验室标准操作程序文件.pdf VIP
文档评论(0)