2025年会计继续教育大数据前沿技术及应用题库及答案.docxVIP

2025年会计继续教育大数据前沿技术及应用题库及答案.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2025年会计继续教育大数据前沿技术及应用题库及答案

一、单项选择题(每题1分,共30分)

1.在Hadoop生态中,负责资源调度与任务管理的组件是

A.Hive??B.YARN??C.HBase??D.Pig

答案:B

2.下列哪项技术最适合实现“实时流式会计凭证异常检测”

A.MapReduce??B.SparkStreaming??C.Sqoop??D.Flume

答案:B

3.会计大数据平台采用Lambda架构的核心目的是

A.降低存储成本??B.同时支持批处理与流处理??C.简化ETL流程??D.提高单机性能

答案:B

4.在数据湖环境中,对原始凭证影像进行OCR识别后,通常先存入

A.RDS??B.HDFS冷存??C.KafkaTopic??D.Alluxio缓存

答案:C

5.使用Python对TB级凭证表做聚合运算时,效率最高的库是

A.NumPy??B.pandas??C.Dask??D.Matplotlib

答案:C

6.下列关于数据血缘(DataLineage)的描述,错误的是

A.可追踪字段级变化??B.只能用于离线分析??C.有助于审计合规??D.支持影响分析

答案:B

7.在会计电子档案系统中,采用区块链技术最核心的价值是

A.提高查询速度??B.降低存储空间??C.防篡改与可验证??D.节省带宽

答案:C

8.使用SparkSQL进行多表关联时,出现数据倾斜的典型表现是

A.任务全部失败??B.某个Task耗时极长??C.内存溢出??D.结果集为空

答案:B

9.下列哪项不属于数据资产目录(DataCatalog)的元数据

A.字段业务含义??B.更新频率??C.负责人邮箱??D.服务器IP地址

答案:D

10.在会计大数据平台中,对敏感字段“客户银行卡号”进行脱敏,最符合会计准则的做法是

A.直接删除??B.替换为哈希值并保留映射表??C.用号全遮挡??D.移位加密

答案:B

11.使用FlinkCEP(复杂事件处理)监测报销流程时,若需捕捉“先借款后报销且间隔超过30天”的事件,应选用的模式是

A.followedBy??B.notNext??C.within??D.times

答案:A

12.下列关于Parquet列式存储格式的优点,错误的是

A.压缩比高??B.支持谓词下推??C.适合高频小量更新??D.与Spark原生集成好

答案:C

13.在数据治理中,对“应收账款余额”字段设置质量规则“闭合账期后不能为负”,属于

A.完整性约束??B.一致性约束??C.准确性约束??D.及时性约束

答案:C

14.使用KafkaConnect将Oracle总账数据实时同步到HDFS时,最佳实践是

A.直接写原始表??B.采用增量+快照模式??C.全量覆盖??D.关闭事务日志

答案:B

15.在会计RPA流程中,对“发票验真”机器人而言,最关键的容错机制是

A.自动重试并截屏??B.降低并发??C.增加带宽??D.使用静态IP

答案:A

16.下列关于数据沙盒(DataSandbox)的描述,正确的是

A.只允许生产查询??B.可让分析师自助探索敏感数据??C.完全脱离权限管控??D.用于备份

答案:B

17.使用GraphX对“关联交易”网络进行连通分量计算时,最核心的顶点是

A.度中心性最高??B.连通分量ID??C.边权重??D.标签传播

答案:B

18.在会计大数据平台中,对“收入确认”模型做A/B测试,最关键的指标是

A.数据量大小??B.准确率差异??C.服务器温度??D.网络延迟

答案:B

19.下列哪项最能体现“可解释AI”在会计场景的价值

A.模型压缩??B.特征重要性可视化??C.分布式训练??D.自动调参

答案:B

20.在数据主权合规要求下,跨境传输“薪酬明细”数据前,必须

A.进行K匿名化??B.获得员工明示同意??C.关闭SSL??D.使用明文

答案:B

21.使用DeltaLake对“固定资产卡片”表做Upsert时,依赖的键是

A.任意列??B.主键或唯一列??C.分区列??D.注释列

答案:B

22.在会计大数据平台中,使用Airflow调度ETL任务,重试策略通常配置为

A.一次重试间隔1小时??B.三次重试间隔指数退避??C.无重试??D.无限重试

答案:B

文档评论(0)

139****4220 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档