- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
大数据和人工智能论文(2)--第1页
大数据和人工智能论文(2)
大数据和人工智能论文篇二
用人工智能读懂大数据
关于大数据,现在有两个概念,一个是数据大,另一个就是容量
大。“大”确实是一个问题,随之而来的大数据处理问题也是一个老
问题。之所以说这是个老问题就在于,之前在气象数据的处理里,有
各种不同的图象、文本,动态情况带来的变化也很多,导致我们也遇
到很大的数据量。因此数据大并不是网络时代才有的问题,只是现在
更加严重。
网络数据面临的根本困难
网络数据跟以往数据的不同在于网络时代的数据虽然量很多,但
是有用的不到30%、40%,好用的更不多,只有7%,经过“清洗”
的不到1%。这和我们以往的数据大不一样,气象数据尽管有噪声问
题,但是从来没有数据虚假、无用、造谣的,但是在网络里就不一样
了。
此外,网络数据跟用户和社会关联,也就是说这种数据是在社会
间产生,在人与人之间不断传播,因此它所造成的影响和效果是跟以
往的数据不一样的。
以往,我们比较多的是从形式、规模这些维度来考虑大数据,在
形式上它很复杂,规模上它数量很大,但网络数据还将涉及更多我们
之前没有涉及的维度,如语义的维度、内容的维度。
首先是人机交互的变化。通常我们在用计算机的时候只是把程序
输入进去,计算机根据程序来完成计算,然后把结果输出给用户,这
中间计算机不需要了解用户的意图或数据的来源。因为所有的数据有
在计算机存在的语音和语义,但计算机并没有理解这些内容。到了网
络时代,人机界面起到非常大的变化。也就是说人们把自己的需求用
文本、图象、语音输入到计算机里,计算机必须得通过这些了解用户
意图,然后根据用户意图输出用户需要的信息,在此信息的内容已经
需要计算机考虑了。
大数据和人工智能论文(2)--第1页
大数据和人工智能论文(2)--第2页
在网络时代计算机必须要涉及到信息的内容,这意味着计算机不
仅需要了解用户意图,同时要了解用户的兴趣等,这是语义的维度。
如果要了解网络计算机新的需求以及了解用户意图、兴趣和体验
等,我们要做到两点。首先就是把没用上的或者“不好”的数据转变
成知识,或者我们通过理解这些数据的内容、信息的内容,把它们变
成网络时代信息处理的新需求。其次,如果计算机要从文本、图象、
语音去理解用户的意图,那这个理解必须涉及三个层面的问题。第一
个方面,计算机得了解某句话的字面意思,即自然语义;第二个方面,
用户输入这句话的用意何在,潜意识里想要做什么;第三个方面,这句
话的真实含义是什么,判断用户是否赞同此说法等。因此我们提供一
条网络信息,计算机至少需要了解这三层意思。但过去计算机信息处
理里没有此要求,这就是我们现在传统信息面临的最根本的挑战。
用人工智能处理网络数据
传统的信息处理方法显然是能不能解决上述问题的,原因在于我
们所有的信息处理方法是建立在与语义无关的假设上,不管是通信理
论、控制理论或者信息处理理论都是跟语义无关的,也就是说在传统
理论里必须把信息内容抽掉,这就是所有信息理论建立的依据,因为
不采取这样的方法就不能建立一般的内容。
到了网络时代传统的方法遇到困难了,当我们输入信息X送到机
器上,阅读者或者接收者者接受信息X,中间都没有误差,但我们接
下来从机器那里我们能不能了解到X背后的含义呢?显然传统的剥离信
息内容的处理方法解决不了这个问题。
但我们现在还是在采用传统方法进行网络上的信息处理。具体是
文档评论(0)