CN107194560-CN201710335698-LBSN中基于好友聚类的社交搜索评价方法.pdfVIP

CN107194560-CN201710335698-LBSN中基于好友聚类的社交搜索评价方法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CN107194560-CN201710335698-LBSN中基于好友聚类的社交搜索评价方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 107194560 A (43)申请公布日 2017.09.22 (21)申请号 201710335698.6 (22)申请日 2017.05.12 (71)申请人 东南大学 地址 211189 江苏省南京市江宁区东南大 学路2号 (72)发明人 曹玖新 孙洋 周丹丹  (74)专利代理机构 南京众联专利代理有限公司 32206 代理人 杜静静 (51)Int.Cl. G06Q 10/06(2012.01) G06Q 50/00(2012.01) G06F 17/30(2006.01) 权利要求书3页 说明书8页 附图1页 (54)发明名称 LBSN中基于好友聚类的社交搜索评价方法 (57)摘要 本发明公开了LBSN中一种基于好友聚类的 社交搜索评价方法。从Foursquare真实数据集中 提取基于位置信息和联系人信息等多维特征,提 出基于好友聚类的KNN搜索算法,设计基于倒排 索引的搜索引擎,结合距离等因素使搜索结果更 加精确、搜索速度得到提升。为使搜索结果更加 精确,首先,在研究用户好友的基础上,对好友进 行聚类。由于LBSN属于异构网络,数据集比较稀 疏,通过聚类可以使数据更加稠密,消除奇异点, 降低因数据稀疏导致的不利影响;其次,搜索算 法的设计上,在考虑了传统社交影响力的基础 上,增加了专业相关度和距离远近两个指标,即 A 综合搜索得分、社交得分和距离得分。最后,综合 0 三个指标构建并训练线性规划模型得到搜索结 6 5 4 果,使得搜索结果是用户满意的。 9 1 7 0 1 N C CN 107194560 A 权 利 要 求 书 1/3页 1.一种LBSN中基于好友聚类的社交搜索评价方法,其特征在于,所述评价方法包括以 下步骤,1)爬取的Foursquare真实数据集中有联系人信息和位置信息,通过对数据的统计 与分析,提取出联系人特征、签到特征、评价特征和时间特征,共15种数据类型,包括用户 ID、好友ID、签到ID、签到位置描述、签到发生时区、签到位置ID、签到位置经纬度、签到位置 名称、签到位置的类型ID、签到位置的类型名称、签到发生时间、评价文本ID、评价文本内 容、评价发生时间,构建社交搜索模型并给出形式化描述,筛选发生在纽约的数据集,这种 方法同样适用于其他城市; 2)从步骤1)处理好的数据集中提取位置名称、位置类型、位置描述三种数据类型,构建 “位置名称-文档”式倒排索引,在此基础上,基于Lucene技术构建社交搜索引擎; 3)线上部分设计搜索算法,在基于搜索得分的位置排序部分,搜索用户输入搜索内容, 经语义分词产生话题,与步骤2)倒排索引中的文档进行相似度匹配,根据专业相关性得分 索引出备选位置和基于得分的位置排序; 4)在搜索算法中基于社交得分的位置排序部分,从步骤1)处理好的数据集中提取联系 人数据、签到数据和评价数据,线下通过K-Means算法聚类搜索用户的好友,通过KNN算法查 找搜索用户一定数量的最近邻,线上通过这些最近邻对搜索用户施加社交影响,通过设计 最近邻的区域活跃度和对位置的评价两个社交特征计算步骤3)中的备选位置的社交得分 并排序; 5)在搜索算法中基于距离远近的位置排序部分,从步骤1)处理好的数据集中提取位置 经纬度数据,通过地球上两点间的距离公式,计算搜索用户当前位置和步骤3)中备选位置 的各自距离,量化成得分并排序; 6)综合步骤3)、步骤4)、步骤5)中的三种位置排序,构建线性回归模

您可能关注的文档

文档评论(0)

18273502 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档