- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用友TurboCRM查重与全文检索
TurboCRM查重与全文检索
用友软件股份有限公司
CRM标准产品开发部 姜益磊
2010年 09月 16日
查重与全文检索
功能介绍
规则说明
实际应用
系统配置
全文检索
查重
中文、英文、字母、数字如何查重和全文检索
根据名称进行查重
根据电话进行查重
根据电子邮件、网址进行查重
全文检索
附录
功能介绍
从技术实现角度来看,查重是在全文检索的基础上进行的,这里我们主要解释一下全文检索,全文检索是计算机程序通过扫描相关信息中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置。当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程。
功能上全文检索需要具有建立索引,处理查询返回结果集,增加索引,优化索引结构等功能。结构上具有索引引擎,查询引擎,文本分析引擎和对外接口等。
功能介绍
本系统为客户、线索、联系人三个对象提供了查重功能,即按照一定的查重条件,查找出与当前对象信息相同的记录。系统只支持同类型对象的查重,例如在客户中进行查重,查重结果是相匹配的客户记录,而不会出现相匹配的线索或联系人记录。
配置路径:【系统配置】-【客户化平台】-【查重和全文检索】
规则说明
查重无权限限制,任何员工都可以进行查重操作;
系统暂不提供自定义查重条件的功能;
系统只支持同类型对象的查重。
对象查重规则
实际应用
系统配置
1、编辑,对全文索引进行设置
2、系统暂时只提供的客户、联系人、线索三个对象的查重检索
3、结果显示类型:显示快速查看、显示基本属性
4、通过编辑可以设置快速查看属性
5、新建时自动查重功能
实际应用
查重和全文检索编辑
选择全文检索显示类型
1、显示快速查看
检索结果显示红色选择框内的字段
2、显示基本属性
检索结果显示系统默认字段例如:名称、创建时间、修改时间
新建时数据查重
重新生成索引
根据目前对象数据生成索引,没有索引则不能进行查重或检索,索引生成后显示成功
索引文件物理路径在系统安装目录下search\index\
可直接拷贝作为备份
实际应用
在【营销管理】【服务管理】【营销服务管理】【呼叫中心】模块内,系统快捷按钮下都有全文检索输入框
全文检索
输入要检索关键字“王宝强”,检索结果如下:检索客户2条;联系人1条;
实际应用
查重
下面以客户为例,具体说明查重功能的使用。
下图为客户列表页面,在客户列表中,存在两条以“test01”及两条以“王宝强”开头的记录,现在我们将通过查重功能,将这几条记录查找出来。
实际应用
单击“查重”,选择“查重匹配当前列表”,进入到查重条件设置页面。
用户可以选择匹配字段来匹配查重,本系统中所匹配字段有名称、电话、网址、电子邮件。
如左图:选择“名称”,公司查重规则
点击“下一步”
实际应用
选择导出属性后点击导出
点击导出
实际应用
查看导出Excel,将会发现把这几条数据查询出来。
注意:之前在客户列表中有名称为test02、test03、test04…,并没有认为是重复数据,在PPT后一个部分会对此进行说明。
中文、英文、字母、数字如何查重和全文检索
根据名称进行查重
首先,去除数据名称为英文、字母、数字采用完全匹配,即字段信息完全一样的条目才能通过查重找出;
名称为中文的采用以下步骤处理:
库中名称的头部(省、市)、尾部(后缀信息),例:北京市特博深信息科技股份有限公司---去除头部(北京市)、尾部(股份有限公司);
接着,在第一步剩余的字段中去除常见字(详见附录),即:去除剩余字段(特博深)信息科技中的常见字:信息、科技;
然后,在数据库中寻找和第二步剩余的字段有相邻两个字的拼音相同的字段,即:寻找和剩余字段(特博深)相邻两个字拼音相同的字段,此时可以找出:特波深、特博生、忑博深…
最后,在第三步寻找出的结果中,寻找和第二步剩余的字段在汉字上匹配度在50%以上的条目,此时查询到的结果即查重的结果。
中文、英文、字母、数字如何查重和全文检索
根据电话进行查重
首先,去除数据库中电话在小于5位或5位的数字串,去除数字串中的分隔符。例:电话86-010123中,去除小于5位或5位的数字串86、010、123,去除分隔符“-”,剩下数字
然后,根据剩下的数字串进行完全匹配,即寻找数字串完全一样的条目;
最后,在第二步完全匹配的条目中,把包含该电话的对象进行名称匹配查重一遍(详见 名称匹配查重),此时得到的条目即根据电话匹配查重的结果。
中文、英文、字母、数字如何查重和全文检索
根据电子邮件、网址进行查重
根据电子邮件查重与根据网址查重的方式一样,都是根据电子邮件或网址字段做完全匹配(查出完全一样的),再把包含该电子邮件或网址的对象进行名称匹配查重一遍(详见 名称匹配查重),最后得到的条目
文档评论(0)