互联网旅游信息挖掘和展示技术研究-计算机应用技术专业论文.docxVIP

下载本文档

0
0
约4.5万字
约 59页
2019-01-15 发布于上海
举报
版权申诉

互联网旅游信息挖掘和展示技术研究-计算机应用技术专业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

互联网旅游信息挖掘和展示技术研究-计算机应用技术专业论文

浙江大学硕七学位论文摘要摘要本文首先通过 Flickr 提供的数据下载接口得到带有经纬度信息图像以及其对应元数据(如上传用户 ID 、上传时间、拍摄时间等)、地理标签(经纬度信息)和文本标签等信息。在这些信息基础上，提出了结合 K-means 聚类和 AP 聚类的图像聚类算法，以获得在空间位青上相近的图像集合。然后，给定包含空间上相近图像所组合成集合，对集合中每幅图像提取其 81盯 (8cale-invariant feature transform) 特征，并利用 KD 树存储从每幅图像中所提取的 81FT 特征，然后通过 BBF(Best-Bin First)算法搜索该集合中任意两幅图像之间相似特征点，构建视觉相似图像集合。为从该集合中获取代表性标签来标注该集合图像，本文在 TF-IDF(term frequency inverse document frequency) 的基础上结合实际提出了 WT机IDF-UF ，最后利用Naive 8can Methods 去除那兽随机性标签。最终，获得每一类在空间相近、在视觉上相似图像集合所对应热门地标 [6)名称、地理位置、热门度和代表性图像等属性信息。为了对这些空间相近、视觉相似的图像集合及其标签进行存储，本文通过全球四叉树按照显示级别将地理空间划分为不同大小配方形，对阁像集合进行编码，然后将地理空间上任一点经纬度值映射为所在级别的四叉树编码，以进行索引。最后，本文利用 Google Maps API 和 AJAX 技术来直观、动态的展示上述信息。关键词:热门地标空间数据库全球四叉树林签云浙江大学li)jlt:学位论文 Abstract Abstract In this thesis，API of Flick.r is implemented to obtain images and their corresponding metadata ( such as the image ID，uploading time，the time the images taken photograph) ，the geo tags and annotated textual tags. After getting abovementioned information，we use k-means and AP algorithms together to group similar images within neighboring spatial distances. In order to find visually similar images within each group，BBF(Best-Bin First) algorithm is conducted to align each images by SIFT local features. Then，WTF-IDF-UF is conducted to obtain informative tags for each group which contain visually similar images with neighbored distance，and the Naive Scan Methods are used to remove random irrelevant tags. At last，we can get the name，location，popularity of the hot landmarks 邸 well as the representative images for each image group. In order to be阳r store each image group and their corresponding information ，a global quadtree is introduced in this thesis. The basic idea of global quadtree is to segment the map into different squares and map any location in the map to a quadcode at any levels. 创 last we use Google maps API and AJAX to show the information intuitively