网络环境下excel表格解析的研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
 网络环境下 excel 表格解析的研究 单发启,潘为民* (北京邮电大学计算机学院,北京 100876) 5 10 15 20 25 摘要:Excel 是当前最被广泛使用的用来作为数据存储和处理的软件之一,很多公司把发布 的数据信息以 Excel 表的形式挂靠到公司网站上。本文开发了一个基于 java 开发语言的用 于解析网络 Excel 文件的框架。jsoup 包是一款基于 Java 的 HTML 解析器,通过 jsoup 获 取网站 Excel 文件链接,然后用 get()方法获取 Excel 文件的二进制格式数据。再用 Apache POI 工具包解析二进制数据 ,将获取的数据导入 Mysql 数据库。 关键词:Excel;Java;Apche POI;Jsoup;船期 中图分类号:TP317 Research of Excel Parsing under the Network Environment SHAN Faqi, PAN Weimin (Computer Science,Beijing University of Posts and Telecommunications, Beijing 100876) Abstract: Excel is one of the most widely used softwares for data storage and processing.Many companies release data in the form of Excel at their websites.This article has developed a framework to parse Excel files under network environment based on Java.Jsoup package is a Java HTML parser,with it to get links of website Excel files,then obtain binary format data of the Excel files.At last parse the binary data using the Apache POI toolkit and import the data obtained into Mysql database. Keywords: Excel; Java; Apche POI; Jsoup; Schedule 0 引言 Microsoft Excel 是微软公司的办公软件 Microsoft office 的组件之一,是由 Microsoft 为 Windows 和 Apple Macintosh 操作系统的电脑而编写和运行的一款试算表软件。直观的界面、 出色的计算功能和图表工具,再加上成功的市场营销,使 Excel 成为最流行的微机数据处理 软件 【1】 。 本文开发的框架目的在于采集世界上一百多个船运公司的可供使用的船期数据。船期是 30 35 船公司对船舶使用的安排计划,简单的讲就是什么类型的船舶什么时间从起运港到目的港的 时间安排。船期数据是海量的,而且在不断的更新。船运公司除了用纯网页的形式在网站上 展示船期外,很多还在网站上提供了 Excel 下载链接,对于如此庞大的数据收集采用手工方 式显然是不可能的。所以,对 Excel 的解析至关重要。 Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,具有卓越的通用性、 高效性、平台移植性和安全性,广泛应用于个人 PC、数据中心、游戏控制台、科学超级计 算机、移动电话和互联网,同时拥有全球最大的开发者专业社群。对于 HTML,Excel 的解析 java 有很多非常方便的开源开发包。其中应用比较广泛的,也是本框架采用的是 Jsoup, Apache POI 包 【2】 。 Jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。 40 它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出 和操作数据 【3】 。 Apache POI 是用 Java 编写的免费开源的跨平台的 Java API,Apache POI 提供 API 给 作者简介:单发启,(1987-),男,研究生,多媒体与网络信息处理。E-mail: shfaqi@126.com 通信联系人:潘为民,(1969-) , 男,副教授,数据挖掘与通讯、金融软件。E-mail: bigpan@ -1- Java 程式对 Microsoft Office 格式档案读和写的功能。 1 框架

文档评论(0)

baihuamei + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档