- 1
- 0
- 约2.4万字
- 约 21页
- 2023-05-10 发布于四川
- 举报
本申请公开了用于获取网页信息的方法和装置。所述方法的一具体实施方式包括:解析目标网站中的网页,生成所述网页的结构树,从所述结构树的节点中提取至少一个网页元素,生成网页元素集合;对所述网页元素集合中的每个网页元素,确定该网页元素包含预设关键词库中的关键词的数量;根据各个网页元素包含的关键词的数量,在所述网页元素集合中选取出网页元素作为待提取网页元素,并由所选取的待提取网页元素生成信息提取模板;利用所述信息提取模板将所述目标网站中的网页的网页内容转换为结构化数据,从所述结构化数据中获取所述网页的信息
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 108090104 A
(43)申请公布日
2018.05.29
(21)申请号 20161
您可能关注的文档
最近下载
- 工程变更指令.doc VIP
- 【课件】现场用-黄晓宇- 国际工程全过程成本管控1.0班主任1812.pptx VIP
- 02J331_地沟及盖板图集.docx
- 《管理会计基本指引》和34项管 理会计应用指引【含解读】(2019).pdf VIP
- 等保测评方案.docx VIP
- 20天快速背诵中考英语单词(打印背诵版) .pdf VIP
- 调制叶绿素荧光原理及PAM-2500荧光仪应用.pdf VIP
- 北师大版初中数学初一下册全书知识点讲义(提高).docx
- IPC国际电子部件协会电子组件IPC-7711 7721 C版维修手册.pdf
- IPC-7711D-7721D-中文版 CN 2024 电子组件的返工、修改和维修标准.pdf VIP
原创力文档

文档评论(0)