- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
覃文华声纹认证技术的产业化模式
“清华大学 — 得意升文 ”声纹处理联合实验室管委会主任 覃文华
本文为覃文华于 2006 年 1 月 20 日在国际中文语言资源联盟年会 (CCC) 上的致辞。
刚才郑方院长已经就技术领域做了详尽的阐述, 下面我简要说明一下我们在声纹身份认
证技术方面已经形成的产业化模式。
所有的技术的产业化大概都需要产业界和投资界的充分介入。 首先介绍一下我们与清华大学
的合作模式和结构。 我们的投资主体天资控股有限公司是在高新技术领域具有丰富经验的投
资机构,北京得意音通技术有限公司则是在声纹基础技术方面拥有 7、 8 项发明专利以及几
十项著作权的高新技术企业,同时也是国际中文语言资源联盟的主要发起者和理事长单位。
我们共同投资了一家公司: 北京得意升文技术有限公司, 来对北京得意音通公司的声纹基础
技术做民用方面的产业化应用推广。 北京得意升文技术有限公司为了做好声纹基础技术产业
化的应用和推广, 还需要不断地进行研发和提升, 还需要得到学界的支持, 以共同形成一个
持续的研发环境。 为此,我们与在这方面有非常强大的背景技术的清华大学信息技术研究院
再度合作,投资成立了清华大学 -得意升文声纹处理联合实验室。就设在 5 楼,欢迎大家有
时间上去坐坐。 这是一个清华大学和我们企业共同成立的联合实验室, 它的功能是不断地对
来自于清华大学和北京得意音通公司的基础声纹技术在产业化过程中所需要的技术优化和
应用产品进行研究和开发。
我们认为声纹身份认证技术的产业化应用需要有三个方面的支撑。 一个是声纹识别的基
础技术和专利。 如果没有获得基础技术的支撑, 没有获得一批应用型的基础专利, 那么整个
产业化应用就是一个无本之源。 这方面主要依托于北京得意音通的原有技术, 并通过联合实
验室不断地进行研发和提升。 在中文语言资源方面的计算机技术领域, 就像刚才海淀区于军
副区长所说的,我们的技术所处的领域还是少量的没有被国外的信息技术跨国企业所垄断,
能够达到国际先进水平的高技术领域, 毫不夸张的说, 甚至是国际领先的信息技术领域。 这
个技术基础是我们最重要的一个支撑。 另外,所有的产业化应用必须要有一个应用和基础技
术之间非常好的一个接口。 就是说如果不能规模化, 所有的基础技术都没有办法进入实际的
应用领域。 在这方面,我们经过大量的沟通和工作,获得了许多战略合作伙伴的认同, 其中
完成了前期沟通和准备, 最接近实施阶段的是, 我们将与国家信息中心合作, 建设一个海量
(千万级 )声纹数据库,从而为电子政务、征信系统、电子商务、门户网站等领域所需的各类
应用提供开放性的基于声纹的多模态精准认证基础平台。 第三个方面, 就是以声纹库为基础,
开发一系列有针对性的应用产品,服务于政府用户、企业用户和个人用户。
在此基础上,除了与国家信息中心及海内外风险投资基金合作建设海量 (千万级 )声纹
库,形成一个中立的、具有公信力的认证体系和平台之外,我们还将与银行、电信、民航、
零售等民用行业领先企业合作进行各行业垂直应用开发。 我们也会与各类投资基金合作, 共
同进行基于声纹认证技术及海量声纹库的商业应用模式的孵化和培育。 从而为广大的互联网
用户和电话用户提供便捷的、个性化的、安全的服务。
最后,对于声纹识别这项基础技术再简要地阐述一下我们的独特理解。针对目前 “人 -
计算机、计算机 -计算机、计算机 -人 ”之间的交互模式,现有的基于网络的远程身份认证手
段,包括业界最认同的 PKI/ CA 技术,最终都摆脱不了对 “物 ”的依赖,都普遍存在 “认物、
不认人、不能识别主观意识 ”的致命缺陷。人类在这样的 “技术进步 ”中被 “物化 ”和 “消解 ”了,
被逐渐地 “去中心化 ”了。著名的美国大片 “黑客帝国 ”非常逼真地对这种 “演化 ”的最终结果做出了预言。 而包含有语音、语义、语境及个人声纹特征的人类话语作为人类最原始、最符合
人性、最为便捷的信息交流方式, 我们认为是最适合用来转变上述信息技术应用的潜在危局
的手段。 在我们正在研发的具备革命性意义的系统中, 人与人以自然的话语模式, 通过普适
网络系统所进行的任何远程交谈和交易,将能够同时包涵参与人的身份信息和个人以话语、
语境、意识等所表达的,远远超过 “文本 ”能包含的信息。从而在当今跨时空的交互网络中,
恢复人的真实存在和相对于 “机器 ”的尊严。
谢谢各位嘉宾,并借此机会,预祝各位新春快乐,合家幸福!
文档评论(0)