共享文化大数据的新机制-科学网.PPT

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
共享文化大数据的新机制-科学网

共享文化大数据的新机制 李幼平 杨 鹏 2013年4月 追求“内容自寻读者” 万维网(World Wide Web)是“博大精深”的文化大数据,它与个人的有限需求之间,缺乏顺从人意的直达机制 本文建议,定义最小内容基元,并借助泛在无线电广播,创造“内容自寻读者”的主动服务机制 新机制不但能大比例分担核心网的共享类流量,而且有望从国家层面找到保证公共内容安全的有效措施 共享文化的三个科学问题 奥巴马政府又出了“大数据”的题目,要求科学家从大数据中萃取有价值的信息,并从国家层面找到保证信息安全的有效措施。 中国政府发出“用好互联网,管好互联联网”的号召,提倡用“三网融合”营造“国家公共文化服务体系”。 无论“大数据战略”还是“公共文化战略”,提法虽然不同,最终都希望实现全民对文化大数据的科学享用,都需要回答三个科学问题: 1,共享如何不限人数? 2,服务如何匹配个人? 3,国家如何依法治理? 试图借助网络物理变革回答问题 无线复制体现网络物理变革 无线电广播轻松回答三个问题中的两个 无线电是“一点对无限点”的单向电磁辐射 “无限点”意味着支持“共享不限人数”,不管多少人分享电磁波带来的数据,永无“带宽拥塞” “一点”支持内容集结一体,在卫星实施分发的过程中,国家自然获得理顺内容和依法管理的机会 唯一障碍:单向系统没有互动环节,难以匹配个人 广播内容自带互动环节,障碍将出现重大突破 具体办法是,文件前缀嵌入沟通读者与作者的语义短包作为取舍内容的文化基元,让作者与读者在网络终端实现直接互动 自帯互动环节:1kB内容标签 毕升把汉字当成是可按语义聚分的最小文化基元;网络需要可按语义取舍的最小文化基元UCL UCL(Uniform Content Label)统一内容标签 表达读者喜好 (个人常用网站、栏目, 或感兴趣的专业话题) 5B 1 KB 表达作者语义 (描述内容的要义) 支持依法管理 (国家授权,科学管理) 8B 1B 2B 16B 64B ~100B ~100B ~128B ~600B 网站 栏目 专业话题 时间戳 内容代码 内容标题 内容要义 内容出处指纹 内容指纹 待定 定义泛在广播 无线电波转瞬即逝,“泛”而“不常在” 存储和内容匹配技术帮助它成为 anywhere、anytime、anyone 的 Ubiquitous Data Radio UD Radio 发明超级门户机制 内容标签UCL含有标题、摘要,本身是一种可读的短文件 把大量网站的UCL短文件集结一体,形成海含众多网站主页的“超级门户”(super portal) 其他媒体都是“零阶”的,唯独它是“高阶”的 超级门户是“有关数据的数据”(data about data),是“引领众多媒体的超级媒体”(medium about media) 集结后的UCL内容品种足够多,千差万别的个人都可以从中得到个性需求的提醒;集结后的总字节量又足够地小,只需用一个低速率的广播信道,就足以承载多元内容面向全民的泛在服务。 广科院的低码率UD Radio 广播科学研究院发明一种调频波段的低码率OFDM信道,形成穿墙入户“直达所有网络的所有终端”的物理能力。 由于码速率很低,接收环节是一种功耗极低的嵌入式小芯片,很容易寄生于PC机、TV机、Pad机、手机的主芯片之中 UD Radio每天把百万种UCL数据包直接存入任意网络的任意终端,广大民众可以在第一时间免费得到任意媒体的任意标题摘要。 从工程上体现主动服务的超级门户机制。 互联网边缘增添广播结构 图3 Internet的边缘增添泛在广播的次结构 减少内容分发跳数 “小世界”的说法起源于Milgram的“六度分离”猜想,即全球几十亿人中的任意一人,经过五次中间介绍,总可以找到另一位陌生的人。 1998年,Watts等人在NATURE杂志上发表题为“Collective Dynamics of ‘Small-World’ Network”的论文,指出聚类动力学是小世界的成因。 对获取网页的平均路由跳数D进行实测统计,得知WWW网络90%以上网页的 D在 6与 23之间。 出现D~lnlnN超小世界 2009年PHYSICAL REVIEW LETTERS杂志发表题为“Navigating Ultrasmall Worlds in Ultrashort Time”的文章 指出当幂指数γ处于2至3之间时,采用贪婪路由可使网络的D~lnlnN,并可实现超短时间的内容引导。 其中N为网络节点总数量,取N等于全球人口70亿,则可算得D~3,超越了原先“六度分离”的猜想,实现了“超小世界”和“超快引导”。 这是一个了不起的理论工作,激励中国专家坚定信心,朝着更小跳数的目标继续前进。 东

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档