厦门大学数据库室-谢荣东-论文阅读进展报告-20150717.pptVIP

厦门大学数据库室-谢荣东-论文阅读进展报告-20150717.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
厦门大学数据库室-谢荣东-论文阅读进展报告-20150717

厦门大学数据库实验室 论文阅读报告(1) 报告人:谢荣东 指导老师:林子雨 2015.7.17 Part 1 空间数据上Top-k 关键词模糊查询算法 论文一 综述 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 作者:胡 骏、范 举、李国良、陈姗姗;清华大学计算机科学与技术系数据库研究组 发表信息:2012年11月于《计算机学报》 关键词:基于位置的服务; 空间数据上的关键词检索; 字符串近似匹配 学术贡献:1、首次提出了空间数据上的Top-k关键词模糊查询问题;2、提出了有效的索引结构RigionTrie,并基于该结构设计了高效的Top-k算法 论文一 主要内容 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 问题:移动端文本位置查询的Top-k优化问题,如地图位置查询等 方法:定义一个新的相关性函数 设计新型的索引结构RigionTrie,根据文本和空间特性对 POI点进行有效的组织 基于以上两点设计了一个“基于RigionTrie的Top-k算法” 论文一 参考文献 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 胡骏, 范举, 李国良, 等. 空间数据上 Top—k 关键词模糊查询算法[J]. 计算机学报, 2012, 35(11): 2237-2246. Part 2 kNN 文本分类器类偏斜问题的一种处理对策 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 论文二 综述 作者:郝秀兰、陶晓鹏,、徐和祥;复旦大学计算机与信息技术系 发表信息: 2015年于《计算机研究与发展》 关键词:文本分类; kNN ;类偏斜;文本训练集的临界点;权重调节;随机重取样 学术贡献:1、提出了一个新概念—文本训练数据集的临界点(CP),并给出算法求CP的值;2、将CP的近似值LA或UA。训练样本数与传统的决策规则结合起来,形成自适应的加权KNN分类 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 论文二 主要内容 问题:传统KNN分类,训练样本中类的实例数量会影响分类效果,分类器会被大类控制,忽略小类 方法:提出一个“训练样本数及文本训练集的临界点--CP”概念,对训练集中的样本数进行折衷处理。本质上是利用CP对训练集样本进行跟方缩小,减小样本间差异 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 论文二 参考文献 郝秀兰, 陶晓鹏, 徐和祥, 等. kNN 文本分类器类偏斜问题的一种处理对策[J]. 计算机研究与发展, 2015, 46(1): 52-61. Part 3 Diversity-Aware Top-k Publish/Subscribe for Text Stream 论文三 综述 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 作者:陈力思、丛高;南洋理工大学 发表信息: 2015SIGMOD 关键词:text stream; diversification; publish/subscribe 主要内容:提出一个解决DAS查询的新方法,提高60%-75%的性能 论文三 标题 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Chen L, Cong G. Diversity-Aware Top-k Publish/Subscribe for Text Stream[C]//Proceedings of the 2015 ACM SIGMOD Inte

文档评论(0)

zhaoxiaoj + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档