- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
S1-AP UE ID混淆导致终端无法上网分析案例
(湖南电信无线网优中心)
1、问题描述
前段时期,较多4G用户反映终端突然无法上网,现象为刷新网页或发送即时通讯消息时终端4G图标只显示上行方向图标(下行方向为灰色),无法加载网页或发送消息,需使用飞行模式、重启手机或者等待较长时间后才能正常。
使用测速专家查看出现问题终端信息可以看到,用户仍处于4G网络中,但无法正常上网。显示有内部IP无外部IP,或显示有上行数据无下行数据标识。见图一:
图一:问题终端在测速专家中显示的信息
2、分析处理过程
2.1 问题终端信令跟踪和相关信息采集
收到问题反馈后,无线网与核心网人员开展协同分析,通过用户信令跟踪结合现场提供的信息发现了如下异常:
1、通过中兴CTS在核心网跟踪测试号码,发现测试号码在无法上网时,核心网无法寻呼到用户,消息如图二:
图二:问题终端无法上网时CTS测跟踪信令(无法寻呼到用户)
图二中,18:47:50因user-inactivity导致UE Context释放;而随后下行数据到达,多次Paging后UE无响应。此次UE已无法正常上网,断网时间视终端不同从十几分钟到几十分钟。
2、通过反馈确认以上故障在我省中兴、华为、阿朗三种LTE无线基站设备中均存在,初步怀疑和我省中兴核心网有关。
3、回溯多次类似故障信令,发现在UE在寻呼无响应前,均有一条“突然”出现的Path Switch Request消息,指示一次X2切换请求的动作,而此时对应UE并未移动且服务小区信号良好。见图三:
图三:问题终端无法上网时CTS测跟踪信令(Path Switch Request消息)
图三中,18:47:50 开始,X2切换的目标基站发起Path Switch Request,其Cell id查工参表为“开福区海东青B栋”;而该UE在18:47:09通过其INITIAL UE MESSAGE带上来的Cell id对应基站为“芙蓉区马王堆集团”。以上两基站直线距离为3.7公里,而信令时差仅为41秒,上述切换显然不是一次正常切换。
2.2 问题终端X2切换流程分析
一次正常的X2切换中,目标eNodeB发送Path Switch Request消息给MME,将UE已经进行了小区切换的信息通知给MME。其中不但包括目标小区的TAI 和ECGI,还包括该UE的Source MME UE S1AP ID。见图四:
基站和MME之间(S1 AP协议的控制层),通过MME UE S1AP ID(MME内分配)和ENB UE S1AP ID(基站内分配)对来标识UE。基于以上异常现象,初步分析是用户A在持续上网中,MME收到了一条Path Switch Request消息,携带的source MME S1AP UE ID与用户A一样,因此MME当做用户A进行处理,即MME通知SGW对A用户进行下行路由修改,导致用户上网故障。由前文故障实例亦可验证,进行“切换”的两个基站距离较远,且之间并无邻区关系,即不可能是用户A正常移动后发起X2口切换,应该是B用户发起X2口切换被当做A用户处理了。
图四:X2切换整体流程
2.3 针对问题现象的几点疑问和分析
基于上述分析,得出以下几个疑问:
1、为什么用户A和B的MME S1-AP UE ID会相同,且出现在同一个MME上:
依据协议(3GPP 23.401 5.2.5),MME S1-AP UE ID是S1-MME接口临时标识用户的,在MME内有效。据此推测:
(1)MME将相同的MME S1-AP UE ID同时分配给了2个用户,导致该标识冲突;
(2)eNB将本应发给其他MME的Path Switch Request消息发送给了错误的MME(我省有两套MME),导致MME上出现了冲突。
对于(1),通过前文信令跟踪分析,用户A还处于ECM-CONNECTED态,MME不会将该MME S1-AP UE ID分配给另外一个用户,排除该原因。
对于(2),经过与中兴基站研发沟通确认,现场版本确实存在这样的bug,eNB概率性的会将Path Switch Request消息发错MME。
2、为什么现场这种现象出现的概率比较明显:
问题复现和信令跟踪是在中兴设备区进行的,现场出现本案问题的几率很明显,经过中兴MME研发确认,MME在这种异常场景下的保护机制还存在问题:如果MME对MME S1-AP UE ID的分配增加冷却机制,即对于刚刚释放的MME S1-AP UE ID冷却一段时间后再分配给其它用户,这样就会增大两套MME上分配MME S1-AP UE ID的范围,使得两套MME分配相同的MME S1-AP UE ID的概率大大降低,从而降低用户故障出现的概率。
文档评论(0)