excel工作簿提取数据教学案例-精选教育文档.docxVIP

excel工作簿提取数据教学案例-精选教育文档.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Excel 工作簿提取数据教学案例 1 引言 很多高校都是培养应用型人才, 熟练应用 Excel 对就业有极 大帮助。 但在教学中很多老师不注重办公软件的应用特性, 泛泛 而教,学生学之无味,失去学习的兴趣。通过案例分析可使得教 学生动,极大地刺激学生的学习兴趣。 这里以石油行业的数据提取为案例。 石油行业数据存在以下 特点:行数长度不定;一行记录全是名称;存在一行数据全是单 位说明; 存在多个有效的数据表且位置不定; 每张表的实际行数 及实际列数不定。提出基于 C#勺Excel工作簿复杂表格提取方 法,可以解决上述问题。 Excel 数据分析 Visual C#连接 Excel 数据利用到 ADOActiveX Data Object, 即 ActiveX 数据对象),通过 Microsoft Jet OLE DB Provider (OLEDB, Object Linked and Embed Database 对象链接与嵌入 勺数据库)连接 Excel 文件,将数据写入 DataSet[2] 。案例数 据存在稳定特征与不稳定特征: 通过对案例数据分析可以归纳成表 1 所述特征。 案例设计原理 复杂表格提取采用以下步骤:数据导入、数据预处理、表格 定位、表格提取。单个文件表格的提取:①确定数据文件的基本 结构,包括文件记录的条数,每条记录具体信息的个数、记录从 文件的第几行开始等; ②用多线程方法读取文件, 提高对大数据 文件读取的速度。 而复杂表格的提取关键是实现表格在二维表中 的定位。确定表格只需要确定真实表格的某一顶点的位置及表格 长和宽即可。 列概要信息定义为收集获取二维表中每一列的连续 区段起始序列以及其连续长度信息, 某一列上的连续区段表示在 一列上从开始到结束, 其中连续存在数据的区段, 都被记录为一 条 Record ,一列上的所有 Record 记录在链表 ColumnElement 上, 每一列都被涵括在链表 Column 中。表格定位算法: ( 1)从第一行开始读取记录,行数为 position ,当首次遇 到非空数据时记录下 position ,直到数据为空时计算长度 length ,将 position 和 length 的值存储在 Record 中。 建立一个空队列 Queue,对每个Record进行关联性检 测,读列 i :1-n ,ColumnELement[i] 的 Record 信息,将首个非 空列首个 Record 入队,若下一条 Record 与 Queue.last ()相 关联则入队, 直到邻接列中不存在关联区段。 数据区―记录值有 如下特点: ①数据域都是数字类型; ②同一表格记录开始于同一 行,结束于同一行。关联即属于同一表格。 获取表格位置信息(SheetMessage)。队列Record组 成的一组连续区段,其总数就等于该表格的 X 轴宽 size ,该表 格Y轴向的长取队列中 Record最短的length,该Record.length 代表完整且没有多余信息表格的长。 Queue[0] 所在的列 i 以及 Queue[0].position 表示起始坐标。那么就导出了表格的位置信 息(( i ,Queue[0].position ) ,size ,length )。在 ColumnElement 中移除已经使用过的 Record,重新进行关联检测,获得余下数 据。 4 结论 根据上述方法分析数据(( 0, 0), 6, 13)、(( 1, 24), 4, 11)、(( 7 , 11), 4, 14)、(( 5 , 14), 2, 7)数据 中各参数表示((起始坐标值), X轴宽,Y轴长)。验证得知 与实际的表格位置相同。 这种算法采取先识别再定位导入, 简化 人工的识别避免降低人工操作失误,排除因不同规范导致的差 异。教学中能通过此案例调动学生学习的积极性。

文档评论(0)

2105194781 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档