- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SSO功能实现中的数据整合方案初探
摘要:SSO(Single Sign On)是并购整合后期的技术整合中必须要实现的一个功能,而通常不能直接将并购者的用户数据与被并购者的用户数据直接合并,本文着重分析了在实现SSO数据整合中可能存在的问题,并针对各个问题给出了初步的解决方案。
关键词:SSO;查重;去重
中图分类号:TP391.1 文献标识码:A文章编号:1007-9599 (2011) 10-0000-02
Data Integration Solutions Study in Function Implementation
Sun Chao
(Beijing Wo Wo Group Information Technology Co.,Ltd.,Beijing100080,China)
Abstract:SSO(Single Sign On)is a function which be must implemented in post-merger integration of technology integration process,but usually the bought usersdata can not be merged directly with original usersdata,so this article focuses on analysis of the problems which may exists in during data integration in achieving SSO and offer a elemental solution.
Keywords:SSO;Finding duplicate;Removing duplicate
一、前言
对于实施并购行为的互联网企业,如何将收购得来的用户相关的各项数据进行有效整合便成为并购后期的技术整合阶段的一个重要环节,也是后续各项整合的基础。如果在用户整合过程中要求收购网站(以下简称为分站)的用户必须重新在收购者的网站(以下简称为主站)上进行注册才可以使用主站的各项会员功能,将会大大降低用户的使用体验,并且在这一过程可能会导致用户的流失,这样并购的效果就会打折扣。因而用户整合的基本目标是:分站用户能够无需注册即可登录主站并能使用各项会员功能。这中情况在IT中被称之为SSO(Single sign on)问题。本文着重分析了实现SSO中的数据整合中可能存在的问题并给出了相应的解决方案。
二、SSO数据整合中可能会遇到的问题
要实现SSO登录,前提就是对分站的用户数据进行整合,以使得程序在登录验证时能够查到相应的数据,对于现在的企业而言,各种各样的数据都是用RDBMS进行存储,用户的数据也不会例外。在数据整合方面的可能存在的问题有下面几个:
(一)数据库系统不同,现在企业中常用的RDBMS中有My SQL,SQL Server,Oracle,DB2,由于数据库系统众多,主站和分站所使用的数据库系统可能会有所不同,即使是数据库相同也会存在版本不同的问题。
(二)即使当主站和分站使用的数据库相同,版本也相同,在主站和分站用户数据间可能会存在下述问题:
1.同一个信息用不同的类型进行存储。如注册时间、登录时间字段,在主站可能会用int类型进行存储,而在分站中可能会用datetime类型来表示,因而在进行整合时必须加以转化。再如手机号码,可以用int类型进行存储,也可以用字符串类型进行存储。
2.字段类型相同但长度或精度不同。比如对于地址字段,在分站相关表中长度可能是255个字符,而在主站的对应表则是100个字符。对于数字类型的字段则有可能存在精度要求的不同。
3.不同的字段名表示相同的含义。在软件开发中不同的企业有不同开发规范,在字段命名上也会有不同的规范和要求,这样就可能会导致主站和分站用不同的字段名表示同一个属性,增加了数据整合中的分析工作。
(三)登录名重复现在的网站在登录时通常会采用用户名邮箱作为登录名来进行登录,甚至有些网站(如支付宝)还采用手机号作为登录名。主站和分站的登录名(用户名、邮箱、手机号)有可能存在重复的问题,如果在实施SSO前没有解决重复问题,则在用户登录时程序可能无法进行正常的登录验证,导致用户无法登录或者登录后看到的却是其他用户的信息。
(四)无效数据和脏数据通常每一个网站都会有一定数量的“死”用户。这些用户在注册后就没有再登录过或者由于其他的原因这些用户已经遗忘了。另外在测试和运营过程中可能会引入一些脏数据。
三、问题分析
前两个问题说明无法直接将分站的用户数据直接导入到主
原创力文档


文档评论(0)