面向商业数据分析实验的数据合成系统设计.pdfVIP

  • 0
  • 0
  • 约5.75万字
  • 约 5页
  • 2025-05-29 发布于江西
  • 举报

面向商业数据分析实验的数据合成系统设计.pdf

第6期无线互联科技No.6

2025年3月WirelessInternetScienceandTechnologyMarch,2025

面向商业数据分析实验的数据合成系统设计

李洋,李云矫,韩赟

(云南师范大学管理学院,云南昆明650032)

摘要:实验数据是实验教学和科研创新的关键要素。商业数据分析领域的科研实验和教学实验长期

受限于数据的隐私性和敏感性而无法获取足量的真实数据。将机器学习技术应用于合成实验数据,

基于Python编程语言生态,使用机器学习算法库SDV,文章设计了一种为商业数据分析实验提供合成

数据的软件系统SD4BA,分析真实数据样本模式,训练数据生成器,产生任意数量的合成数据。通过

对合成数据的主要特征进行评估,其与真实数据样本具有相似模式并实现了数据脱敏,可为商业数据

分析实验提供较高保真度的足量数据。

关键词:商业数据分析;机器学习;合成数据;数据脱敏

中图分类号:G482文献标志码:A

[3]

0引言的真实数据集,它比开放数据集有更好的及时性,

在数字经济时代背景下,数据是形成新质生产力比真实数据样本有更大的数据量,同时还具有较低的

[1]

的优质生产要素。产业数字化促进了企业的数字法律风险和较高的保真性,对于实验教学质量和科研

化转型,商业数据分析(BusinessAnalytics,BA)已成探索有很大的促进作用。但高质量业务数据由于受

为数字化企业发展新质生产力、打造核心竞争力的重到稀缺性、技术成本、市场垄断等因素影响,往往须付

要因素。BA实验是BA人才培养和科学研究的重要费才能获取,且价格较高,这提高了学习者和研

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档