- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
华中科技大学硕士学位论文
华
中
科
技
大
学
硕
士
学
位
论
文
II
II
Abstract
The pace of informatization is increasing rapidly. Implementing “Research management database”, as a means of information construction, to improve information management status of current research and management departments, has very important significance. Informatization has an important early work, the data building, which contains regulating data in different formats from different places, and then organized in a uniform manner, and finally store in the database.
Start from the demand, the data warehousing work is divided into two parts: data acquisition and data processing. Based on the characteristics of the existing data source data acquisition is divided into two modes of importing and crawling. This paper analyzes the characteristics of importing and crawling separately then designed and implemented a code framework. For data processing, three representatives as an entry point to detail the source of this problem, the solution is to set forth the data processing needs to pay attention to all aspects of. Finally, through the detailed correctness testing and performance testing, the reliability and stability of the system are verified.
Technically, all the work in this article is based on JavaEE platform using Hibernate and Spring Framework, and transaction processing technique to ensure accuracy and consistency of the data warehousing. For the data crawling aspects, we use HttpClient to visit the external sites with java thread pool to execute in parallel crawling task to improve efficiency. Through the appropriate use of design patterns, the entire code framework has a good design and scalability.
Framework to achieve in the subject has an important role to play in the actual work completed in advance of the data construction work, guiding significance for the subsequent construction work.
Keywords: Data import; Transaction processing; Crawler; Multithreading
III
III
目 录
摘 要 I
Abstract II
缩略语V
1 绪论
您可能关注的文档
- 面向突发断电嵌入式linux工控系统可靠性设计-机械电子工程专业毕业论文.docx
- 美国高校服务学习研究-国际与比较教育专业毕业论文.docx
- 棉田深翻对黄萎病重病田的抑制效应研究-作物专业毕业论文.docx
- 面向实时数据仓库的达梦数据交换平台改进-计算机技术专业毕业论文.docx
- 黄芪多糖对布鲁氏菌感染巨噬细胞的调节作用-药理学专业毕业论文.docx
- 煤码头公司建立破碎筛分系统的相关研究-物流工程专业毕业论文.docx
- 民生性财政支出对居民消费影响研究-财政学专业毕业论文.docx
- 马蹄肾的临床研究-内科学(肾病)专业毕业论文.docx
- 面向说话人识别的非线性频谱变换研究-信号与信息处理专业毕业论文.docx
- 黄连阿胶胶囊治疗不寐(阴虚火旺证)临床研究-中医内科学专业毕业论文.docx
- 酶法合成蔗糖尿病6酯的研究-生物化工专业毕业论文.docx
- 黄河流域河南段不同环境梯度下菊科植物多样性研究-生态学专业毕业论文.docx
- 面向无水港与集装箱班列联动的布局与发展研究-物流工程专业毕业论文.docx
- 民间融资的法律规制研究-经济法学专业毕业论文.docx
- 魅力型领导、组织合法性与新企业绩效关系实证研究-企业管理专业毕业论文.docx
- 面向大数据的ETL设计与实现-计算机软件与理论专业毕业论文.docx
- 煤炭上市公司资本结构优化研究-企业管理专业毕业论文.docx
- 美国HJ公司XX服装品牌中国推广策略研究-工商管理专业毕业论文.docx
- 面向5G的大规模MIMO预编码算法研究-通信与信息系统专业毕业论文.docx
- 煤矿许用毫秒延期电雷管延期精度的实验研究-采矿工程专业毕业论文.docx
最近下载
- RS Components 电工电料 电动机启动器 3RK1903-0BA00 使用说明.pdf VIP
- 瑞幸咖啡企业的供应链战略.pptx VIP
- 尚爱空压机SM.00.00.01空缩机通用说明书(中文)分解.doc VIP
- 2025版结直肠癌CSCO诊疗指南更新版解读(全文).docx VIP
- 2025年版《普通高中课程标准》英语.docx VIP
- 固定收益证券全套教学课件.pptx
- DB51_T2151-2016_实验室安全管理指南_四川省.docx VIP
- 制冷系统节能减排解决方案lotus.pdf VIP
- 旅游委托协议书正式模版.pdf VIP
- 网络与信息安全管理员(信息安全管理员)模拟习题含参考答案.docx VIP
原创力文档


文档评论(0)