- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
重庆大学硕士学位
重庆大学硕士学位论文
英文摘要
PAGE
PAGE IV
the method is feasible,universal and of high accuracy in web content extraction.
Keywords: Content extraction; web page cleaning; web page segmentation; HTML
重庆大学硕士学位论
重庆大学硕士学位论文
目
录
目 录
中文摘要I
英文摘要 II
HYPERLINK \l _bookmark0 1 绪论 1
HYPERLINK \l _bookmark1 1.1 研究背景及意义 1
HYPERLINK \l _bookmark2 1.2 国内外研究现状 2
HYPERLINK \l _bookmark3 1.3 论文研究内容 3
HYPERLINK \l _bookmark4 1.4 论文的组织结构 4
HYPERLINK \l _bookmark5 2 背景知识和相关技术 5
HYPERLINK \l _bookmark6 2.1 引言 5
HYPERLINK \l _bookmark7 2.2 正文提取概述 5
HYPERLINK \l _bookmark8 2.3 网页类型 5
HYPERLINK \l _bookmark9 2.4 HTML 简介 6
HYPERLINK \l _bookmark10 2.5 网页分块 8
HYPERLINK \l _bookmark11 2.6 正则表达式 10
HYPERLINK \l _bookmark12 2.6.1 正则表达式概述 10
HYPERLINK \l _bookmark13 2.6.2 正则表达式常用语法 11
HYPERLINK \l _bookmark14 2.7 本章小结 15
HYPERLINK \l _bookmark15 3 网页结构特征 16
HYPERLINK \l _bookmark16 3.1 引言 16
HYPERLINK \l _bookmark17 3.2 网页基本构成 16
HYPERLINK \l _bookmark18 3.3 网页布局技术 17
HYPERLINK \l _bookmark19 3.2.1 框架布局 18
HYPERLINK \l _bookmark20 table 布局 18
HYPERLINK \l _bookmark21 div+css 布局 19
HYPERLINK \l _bookmark22 3.4 网页标签过滤 20
HYPERLINK \l _bookmark23 3.5 基于容器标签的网页分块 22
HYPERLINK \l _bookmark24 3.6 本章小结 27
HYPERLINK \l _bookmark25 4 结合内容特征的正文提取 28
HYPERLINK \l _bookmark26 4.1 引言 28
HYPERLINK \l _bookmark27 4.2 网页文本分布特征 28
HYPERLINK \l _bookmark28 4.3 标点符号分布 29
HYPERLINK \l _bookmark29 4.4 结合网页结构特征与内容特征的正文提取 30
HYPERLINK \l _bookmark30 4.5 本章小结 31
HYPERLINK \l _bookmark31 5 实验结果与分析 33
HYPERLINK \l _bookmark32 5.1 引言 33
HYPERLINK \l _bookmark33 5.2 系统的设计与实现 33
HYPERLINK \l _bookmark34 5.3 评价指标 34
HYPERLINK \l _bookmark35 5.4 实验结果与分析 35
HYPERLINK \l _bookmark36 5.5 本章小结 37
HYPERLINK \l _bookmark37 6 总结与展望 38
HYPERLINK \l _bookmark38 6.1 本文工作总结 38
HYPERLINK \l _bookmark39 6.2 下一步工作 38
HYPERLINK \l _bookmark40 致 谢 40
HYPERLINK \l _bookmark41 参考文献 41
HYPERLINK \l _bookmark42 附 录 44
HYPERLINK \l _bookmark43 A. 作者在攻读硕士学位期间发表的论文目录
您可能关注的文档
- 结合潜在属性的协同过滤模型分析-计算机应用技术专业论文.docx
- 结合驱动层安全控制技术的个人信息管理系统-计算机应用技术专业论文.docx
- 结合权重因子与特征向量的文本聚类研究与应用-计算机技术专业论文.docx
- 结合全局和局部特征的人体行为识别技术研究-模式识别与智能系统专业论文.docx
- 结合全局与局部信息的活动轮廓模型研究-应用数学专业论文.docx
- 结合认知记忆策略的对外形似字教学设计-汉语国际教育专业论文.docx
- 结合乳腺肿瘤患者血浆游离DNA和无创产前检测结果的模拟研究-外科学专业论文.docx
- 结合入侵检测的安全网管系统研究与实现-计算机应用技术专业论文.docx
- 结合社会化网络的文献计量及应用框架研究-计算机软件与理论专业论文.docx
- 结合社区结构的博客检索系统设计与实现-计算机科学与技术专业论文.docx
- 结合位点确定的高分子杂化体的制备及其功能研究-化学工艺专业论文.docx
- 结合文本倾向性分析的股评可信度计算研究-计算机科学与技术专业论文.docx
- 结合我的创作雨中景观浅谈油画中的构思-美术专业论文.docx
- 结合先验形状信息和序贯学习的心血管内超声外弹力膜检测-生物医学工程专业论文.docx
- 结合显式与隐式算法的PZT型智能钢筋损伤监测的三维数值模拟-土木工程专业论文.docx
- 结合显著性目标检测与图像分割的服饰提取算法研究及实现-计算机应用技术专业论文.docx
- 结合相干斑抑制和区域生长的SAR海冰图像MRF分割方法研究-电子与通信工程专业论文.docx
- 结合消费偏好动态演变机制的个性化商品推荐方法研究-管理科学与工程专业论文.docx
- 结合小波变换和独立分量分析的肌电信号处理新方法-检测技术与自动化装置专业论文.docx
- 结合小波域去噪和运动估计的监控场景分析研究-通信与信息系统专业论文.docx
原创力文档


文档评论(0)