实体检测记录.docxVIP

  • 2
  • 0
  • 约4.04千字
  • 约 12页
  • 2026-06-27 发布于四川
  • 举报

实体检测记录

第一章背景与目标

1.1业务痛点

过去三年,客服中心平均每月收到与“实体识别错误”相关的投诉327单,占整体投诉量的18.4%。投诉集中在三类场景:

1.用户上传发票,系统把“北京XX医院”识别成“北京XX医药”;

2.用户口述“我要买iPhone15Pro”,语音转写返回“我要买爱疯十五泼”;

3.用户填写收货地址“广东省东莞市南城区第一国际3栋2103”,系统拆成“广东省/东莞市/第一国际3栋”,漏掉“南城区”与门牌号。

这些错误直接导致售后赔付、物流退件、品牌口碑下滑,财务口径测算2023年因此损失1120万元。

1.2项目目标

用6个月时间建立一套“无标题实体检测”闭环机制,实现:

实体识别准确率≥97%,覆盖13类业务实体(人名、组织、地址、日期、金额、产品型号、车牌、银行卡号、手机号、邮箱、IP、基因序列、化学式);

单条文本平均处理耗时≤120ms;

投诉量下降70%以上;

不依赖外部商业化API,全部模型与词典可私有部署,满足等保3级要求。

第二章技术路线

2.1整体架构

采用“规则+模型+知识图谱”三段式引擎:

1.规则层:正则、AC自动机、窗口词典,负责高置信度实体快速拦截;

2.模型层:BERT+BiLSTM+CRF微调,负责歧义消溶;

3.图谱层:自研Neo4j

文档评论(0)

1亿VIP精品文档

相关文档