探索大数据及人工智能最全试卷试题.doc

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
探索大数据和人工智能最全试题 1、2012 年 7 月,为挖掘大数据的价值 ,阿里巴巴集团在管理层设立 ()一职 ,负责全面推进“数据分享平台”战略 ,并推出大型的数据分享平台。 首席数据官 B.首席科学家 C.首席执行官 D.首席架构师 2、整个 MapReduce 的过程大致分为 Map、 Shuffle、 Combine、()? Reduce B.Hash C. Clean D. Loading 3、在 Spak的软件栈中 ,用于交互式查询的是 SparkSQL B.Mllib C.GraphX D. Spark Streaming 4、在数据量一定的情况下 , MapReduce 是一个线性可扩展模型 ,请问服务器数量与处 ( )理时间是什么关系 ? 数量越多处理时间越长 B.数量越多处理时间越短 C.数量越小处理时间越短 D.没什么关系 5、下列选项中 ,不是 kafka 适合的应用场景是 ? A.日志收集 B.消息系统 C.业务系统 D.流式处理 6、大数据的多样性使得数据被分为三种数据结构 ,那么以下不是三种数据结构之一的是 A.结构化数据 B.非结构化数据 C.半结构化数据 D.全结构化数据 7、下列选项中 ,不是人工智能的算法中的学习方法的是 ? A.重复学习 B.深度学习 C.迁移学习 D.对抗学习 8、自然语言处理难点目前有四大类 ,下列选项中不是其中之一的是 A.机器性能 B.语言歧义性 C.知识依赖 D.语境 9、传统的机器学习方法包括监督学习、无监督学习和半监督学习 ,其中监督学习是学习给定标签的数据集。 请问标签为离散的类型 ,称为分类 ,标签为连续的类型 , 称为什么 ? A.给定标签 B.离散 C.分类 D.回归 10、中国移动自主研发、发布的首个人工智能平台叫做 () A.九天 OneNET C.移娃 D.大云 11、HDFS中 Namenodef 的 Metadata 的作用是 ? A.描述数据的存储位置等属性 B.存储数据 C.调度数据 D. 12、电信行业的客户关系管理中 ,客服中心优化可以实现严重问题及时预警 ,请问是用的什么技术实现的 ? 大数据技术 B.互联网技术 C.游戏技术 D.影像技术 13、随着闭源软件在数据分析领域的地盘不断缩小 ,老牌 IT 厂商正在改变商业模 ,向着什么靠拢 ? A.闭源 B.开源 C.独立 D.封闭 14、以下不是非结构化数据的项是 ? A.图片 B.音频 C.数据库二维表数据 D.视频 15、以下数据单位换算错误的是 ? A.1KB=1024B 1GB=1024MB C.1TB=1000GB D. 1MB=1024KB 16、下列选项中 ,不是 Flume 的特点的是 ? A.可靠性 B.集中式架构 C.可扩展性 D.可管理性 17、BP 神经网络模型拓扑结构不包括 A.输入层 B.隐层 C.翰出层 D.显层 18、以下哪个不是语音识别的范畴 ? A.语音听写 B.语音台成 C.语音转写 D.语音唤醒 19、以下哪个场景可以称为大数据场景 ? A.故宫游客人 B.故宫门票收入 C.美团 APP的定位信息 D.文章内容 20、2011 年 5 月是哪家全球知名咨询公司在《 Big data: The next frontier for innovation, competition and productivity 》研究报告中指出 ,数据已经渗透到每一个行业和业务职能之中 ,逐渐成为重要的生产因素的 ? A.比尔恩门 B.麦肯锡 C.扎克伯格 D.乔图斯 21、下列选项中 ,哪项是分布式文件存储系统 ? A.HDFS Flume Kafka Zookeeper 22、下列选项中 ,正确描述 Flume 对数据源的支持的是 A.只能使用 HDFS数据源 B.可以配置数据源 C.不能使用文件系统 D.不能使用目录方式 23、机器学习研究如何通过计算的手段 ,利用经验来改善系统自身的性能 ,请问机器学习利用数据训练出什么 ? A.模型 B.表结构 C.结果 D.报表 24、下列选项中 ,不是人工智能的算法中的学习方法的是 A.重复学习 B.深度学习 C.迁移学习 D.对抗学习 25、语音识别产品体系有四部分 ,下列哪项不是体系之一 ? A.语音合成 B.语音播放 C.语音识别 D.语义理解 26、今年 ,大数据分析将出现革命性的新方法 ,从前的很多算法和基础理论可能会产生理论级别的突破。而哪项技术将继续成为大数据智能分析的核心技术 机器学习 B.智能物流 C.脑科学 D.智能终端 27、以下哪个不属于大数据在电信行业的数据商业化方面的应用 A.精准广告 B.网络管理 C.营销洞察 D.大数据检测和决策 28、RDD是由多个什么组成 ? A.p

文档评论(0)

zdq1533 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档