- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CN107194560-CN201710335698-LBSN中基于好友聚类的社交搜索评价方法
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 107194560 A
(43)申请公布日
2017.09.22
(21)申请号 201710335698.6
(22)申请日 2017.05.12
(71)申请人 东南大学
地址 211189 江苏省南京市江宁区东南大
学路2号
(72)发明人 曹玖新 孙洋 周丹丹
(74)专利代理机构 南京众联专利代理有限公司
32206
代理人 杜静静
(51)Int.Cl.
G06Q 10/06(2012.01)
G06Q 50/00(2012.01)
G06F 17/30(2006.01)
权利要求书3页 说明书8页 附图1页
(54)发明名称
LBSN中基于好友聚类的社交搜索评价方法
(57)摘要
本发明公开了LBSN中一种基于好友聚类的
社交搜索评价方法。从Foursquare真实数据集中
提取基于位置信息和联系人信息等多维特征,提
出基于好友聚类的KNN搜索算法,设计基于倒排
索引的搜索引擎,结合距离等因素使搜索结果更
加精确、搜索速度得到提升。为使搜索结果更加
精确,首先,在研究用户好友的基础上,对好友进
行聚类。由于LBSN属于异构网络,数据集比较稀
疏,通过聚类可以使数据更加稠密,消除奇异点,
降低因数据稀疏导致的不利影响;其次,搜索算
法的设计上,在考虑了传统社交影响力的基础
上,增加了专业相关度和距离远近两个指标,即
A 综合搜索得分、社交得分和距离得分。最后,综合
0 三个指标构建并训练线性规划模型得到搜索结
6
5
4 果,使得搜索结果是用户满意的。
9
1
7
0
1
N
C
CN 107194560 A 权 利 要 求 书 1/3页
1.一种LBSN中基于好友聚类的社交搜索评价方法,其特征在于,所述评价方法包括以
下步骤,1)爬取的Foursquare真实数据集中有联系人信息和位置信息,通过对数据的统计
与分析,提取出联系人特征、签到特征、评价特征和时间特征,共15种数据类型,包括用户
ID、好友ID、签到ID、签到位置描述、签到发生时区、签到位置ID、签到位置经纬度、签到位置
名称、签到位置的类型ID、签到位置的类型名称、签到发生时间、评价文本ID、评价文本内
容、评价发生时间,构建社交搜索模型并给出形式化描述,筛选发生在纽约的数据集,这种
方法同样适用于其他城市;
2)从步骤1)处理好的数据集中提取位置名称、位置类型、位置描述三种数据类型,构建
“位置名称-文档”式倒排索引,在此基础上,基于Lucene技术构建社交搜索引擎;
3)线上部分设计搜索算法,在基于搜索得分的位置排序部分,搜索用户输入搜索内容,
经语义分词产生话题,与步骤2)倒排索引中的文档进行相似度匹配,根据专业相关性得分
索引出备选位置和基于得分的位置排序;
4)在搜索算法中基于社交得分的位置排序部分,从步骤1)处理好的数据集中提取联系
人数据、签到数据和评价数据,线下通过K-Means算法聚类搜索用户的好友,通过KNN算法查
找搜索用户一定数量的最近邻,线上通过这些最近邻对搜索用户施加社交影响,通过设计
最近邻的区域活跃度和对位置的评价两个社交特征计算步骤3)中的备选位置的社交得分
并排序;
5)在搜索算法中基于距离远近的位置排序部分,从步骤1)处理好的数据集中提取位置
经纬度数据,通过地球上两点间的距离公式,计算搜索用户当前位置和步骤3)中备选位置
的各自距离,量化成得分并排序;
6)综合步骤3)、步骤4)、步骤5)中的三种位置排序,构建线性回归模
您可能关注的文档
- CN107216541-CN201710584367-一种EVA耐高温低收缩发泡材料.pdf
- CN107216097-CN201710635596-一种绝缘电线杆.pdf
- CN107216071-CN201710344089-一种深层地热井低温段固井保温水泥浆及其制备方法.pdf
- CN107215473-CN201710428445-一种与飞行器一体化的无隔道亚声速进气道.pdf
- CN107214438-CN201710433010-一种高强度地埋石油管道用埋弧焊剂的制备工艺.pdf
- CN107213990-CN201710317109-电除尘系统性能评估及运行优化系统.pdf
- CN107213422-CN201710397126-一种治疗痛风的中药组合药.pdf
- CN107213249-CN201710282758-九蒸九制熟地黄的炮制工艺方法.pdf
- CN107213157-CN201710424963-一种具有潜在治疗帕金森病的药物.pdf
- CN107212859-CN201710473893-一种发育指标测试器.pdf
- CN107194541-CN201710271378-一种基于自适应权重Voronoi图的配电网供电分区方法.pdf
- CN107194536-CN201710238790-一种项目投资的供电可靠性负效益评估方法及装置.pdf
- CN107194535-CN201710238630-一种大电网静态稳定态势快速量化评估方法及系统.pdf
- CN107194526-CN201710198540-一种基于模糊聚类的售电侧市场化改革进度评估方法.pdf
- CN107194512-CN201710378236-鸡精的货架期预测方法.pdf
- CN107194495-CN201710266598-一种基于历史数据挖掘的光伏功率纵向预测方法.pdf
- CN107194476-CN201710385491-基于半马尔科夫链的变压器预防老化维修策略制定方法.pdf
- CN107194430-CN201710393571-一种样本筛选方法及装置,电子设备.pdf
- CN107194413-CN201710270756-一种基于多特征融合的判别型级联外观模型的目标匹配方法.pdf
- CN107194195-CN201710505693-一种胫骨植入物抗感染效果的评价方法.pdf
最近下载
- 羊水栓塞护理措施.pptx VIP
- 星球版八年级上册地理第四章《第一节 因地制宜发展农业》教案.docx VIP
- 2025年粤东西北教师全员轮训心得体会2篇.doc VIP
- TCRHA-成人床旁心电监测护理规程.pdf VIP
- 中联W6015-8A塔吊说明书操作手册.pdf VIP
- 过滤材料和部件市场前景预测与技术创新策略研究报告.pdf
- 新生儿甲状腺功能降低.pptx
- 8.27-安徽A10联盟2025届高三8月底开学摸底考试题及答案1号卷·A10联盟2025届高三上学期8月底开学摸底考物理答案.pdf VIP
- 华为HCIE-CloudServiceSolutionsArchitect云服务练习试题.doc
- 8.27-安徽A10联盟2025届高三8月底开学摸底考试题及答案A10联盟2025届高三上学期8月底开学摸底考英语答案 1.docx VIP
文档评论(0)