- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
一、大数据:从生活感知到学术定义的认知跃迁演讲人
大数据:从生活感知到学术定义的认知跃迁012025高中科技实践:大数据概念的落地路径02大数据技术体系:从采集到应用的全流程解析03总结:大数据概念的核心价值与实践意义04目录
2025高中科技实践之大数据概念课件
各位同学、老师们:
今天站在这里,和大家分享“大数据概念”这个主题,我的心情既亲切又激动。作为一名从事数据科学教育十余年的从业者,我见证了大数据从“学术名词”到“社会基础设施”的蜕变,也深刻体会到:对于新一代学习者而言,理解大数据不仅是掌握一项技术工具,更是培养数字时代的思维方式。接下来,我将以“是什么—为什么—怎么做”的逻辑主线,结合高中科技实践的具体场景,带大家系统梳理大数据的核心概念与实践路径。
01大数据:从生活感知到学术定义的认知跃迁
1生活中的“数据洪流”:我们早已身处大数据时代大家是否注意过这些场景?打开购物APP,页面自动推送你最近搜索过的商品;刷短视频时,系统总能精准推荐你感兴趣的内容;疫情期间,健康码实时更新的风险区域数据……这些“精准”与“实时”的背后,都藏着大数据的影子。
我曾带学生做过一个小调查:统计自己一天内产生的数据量。结果发现,一条微信聊天记录、一张手机照片、一次运动手环的步数上传,甚至智能手表的心率监测,都在以KB、MB、GB的量级积累。据IDC统计,2025年全球数据总量将达到175ZB(1ZB=1021字节),相当于每人每天产生约1.7MB数据——这就是我们所处的“数据爆炸”时代。
2学术视角下的大数据:超越“大”的多维特征维基百科将大数据定义为“无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合”。但更关键的是,大数据的“大”不仅是规模,更是5V特征的综合体现:
Volume(海量性):从TB(太字节)到PB(拍字节)、EB(艾字节)的跨越。例如,某电商平台“双11”单日产生的交易数据可达数百PB;
Velocity(高速性):数据产生与处理的实时性要求。比如,股票交易系统需在毫秒级内处理百万条交易指令;
Variety(多样性):结构化数据(表格、数据库)、半结构化数据(JSON、XML)与非结构化数据(文本、图像、视频)并存。我曾指导学生分析校园论坛的留言,其中既有用户ID、发帖时间等结构化信息,也有大量口语化的文本内容;
2学术视角下的大数据:超越“大”的多维特征Veracity(真实性):数据质量的挑战。比如,传感器可能因故障产生异常值,网络爬虫抓取的信息可能存在重复或错误;
Value(价值性):数据本身是“原材料”,需通过分析挖掘隐含价值。就像石油需要提炼,数据需经清洗、建模才能转化为决策依据。
3传统数据与大数据的本质区别或许有同学会问:“我们用Excel处理的成绩表也是数据,和大数据有什么不同?”关键在于处理逻辑的变革:传统数据处理是“样本思维”(抽取少量数据推断整体),而大数据更强调“全量思维”(尽可能分析所有数据);传统方法依赖“因果关系”(寻找A导致B的直接原因),而大数据更关注“相关关系”(发现A与B的强关联模式)。举个例子:气象部门用传统方法预测降雨,需分析气压、温度等关键因素;而大数据方法可能发现“某社交平台上‘雨伞’搜索量激增”与降雨概率的关联——这种关联未必能解释因果,但能辅助预测。
02大数据技术体系:从采集到应用的全流程解析
1大数据处理的“四步链路”要让数据“说话”,需经历采集—存储—处理—应用四个核心环节。这就像烹饪:采集是“买菜”,存储是“备菜”,处理是“烹饪”,应用是“上菜”。
1大数据处理的“四步链路”1.1数据采集:从“被动记录”到“主动感知”我曾带学生用Arduino开发板连接光照传感器,连续一周采集教室不同时段的光线强度,这就是典型的传感器采集实践。05网络爬虫:用Python编写简单脚本,从公开网页抓取新闻标题、商品价格等信息(需注意遵守网站的robots协议,避免法律风险);03数据不会自己“送上门”,需要工具“采集”。常见的采集方式包括:01用户行为日志:APP的点击记录、网站的访问轨迹,这些数据会被系统自动记录并存储。04传感器采集:智能手环的加速度传感器、校园气象站的温湿度传感器,都是通过物理设备实时获取数据;02
1大数据处理的“四步链路”1.2数据存储:从“单机硬盘”到“分布式云存储”面对海量数据,传统的单机存储(如电脑硬盘)已无法满足需求,因此需要分布式存储技术——简单说,就是把数据“拆分成小块”,存储在多台服务器上,需要时再“拼起来”。常见的存储工具有:
HDFS(Hadoop分布式文件系统):适合存储海量非结构化数据(如日志、文本);
云存储(如阿里云OSS、腾讯云COS):通过互联网访问,支持弹性扩展(需要时可自动增加存
您可能关注的文档
- 2025 高中经济学常识税收的基本特征课件.pptx
- 2025 高中经济学常识投资理财的选择课件.pptx
- 2025 高中经济学常识我国的分配制度课件.pptx
- 2025 高中经济学常识消费结构课件.pptx
- 2025 高中经济学常识效率优先兼顾公平课件.pptx
- 2025 高中经济学常识信用风险课件.pptx
- 2025 高中经济学常识幸福指数课件.pptx
- 2025 高中经济学常识养老经济课件.pptx
- 2025 高中经济学常识影响消费水平的因素课件.pptx
- 2025 高中经济学常识约翰梅纳德凯恩斯课件.pptx
- 2025浙江温州市公用事业发展集团有限公司面向高校招聘工作人考前自测高频考点模拟试题最新.docx
- 2025年蓬安县财政局下属单位招聘备考题库附答案.docx
- 广安市农业农村局2025年公开遴选市动物卫生监督所工作人员备考题库附答案.docx
- 南昌市劳动保障事务代理中心招聘3名劳务派遣驾驶员参考题库附答案.docx
- 2025浙江绍兴市新昌县机关事业单位招用编外聘用人员36人备考题库最新.docx
- 浙江国企招聘-2025嘉兴海盐县城市投资集团有限公司招聘7人笔试备考试题附答案.docx
- 长沙银行2026校园招聘备考题库最新.docx
- 2026年度中国地震局事业单位公开招聘备考题库附答案.docx
- 2025福建省晋江圳源环境科技有限责任公司招聘6人模拟试卷附答案.docx
- 浙江国企招聘-2025温州平阳县城发集团下属房开公司招聘5人公笔试备考试题附答案.docx
最近下载
- 生育保险待遇申请表(模板).pdf VIP
- DB61_T 5001-2021 城镇道路路面检测与评价技术规程.docx VIP
- 吸脂手术配合流程.pptx VIP
- T_ZJATA 0033-2025 塑胶玩具中双酚类和烷基酚类物质迁移量的测定 液相色谱-串联质谱法.pdf VIP
- 广铁科信发〔2019〕103号中国铁路广州局集团有限公司关于公布《广州局集团公司地方涉铁工程建设管理办法》的通知.pdf VIP
- 水产品质量管理制度.docx VIP
- 高频精选:基层护林员面试题及答案.doc VIP
- 各地建设用地土壤污染风险筛选值(氟化物、钼、铊等等常用).pdf VIP
- DB42/T 2181-2024城镇道路路面检测评价技术标准.docx VIP
- DB23T 3528-2023 黄芩与油莎豆间作保苗培肥标准化栽培技术规程.pdf VIP
原创力文档


文档评论(0)