本篇文章1314字,读完约3分钟
近日,领先的声控ai公司云之声宣布,与国内领先的一站式医疗健康生态平台平安豪医生(01833.hk)联合开发的声控登录系统(也称声控锁),经过多次模型优化和升级迭代,成功率达到近99%,达到行业一流水平。
声纹识别(vpr)又称说话人识别,是一种通过声音识别说话人的技术,分为说话人识别和说话人确认。前者用来判断几个人中的哪一个说了某个演讲,也就是说,n选择一个;后者用于确认某个特定的讲话是否是由指定的人讲的,这是一个一对一的匹配问题。不同的任务和应用将使用不同的声纹识别技术。例如,可能需要识别技术来缩小刑事调查的范围,而银行交易则需要确认技术。
云之声的声波纹技术负责人表示,作为中国为数不多的拥有全栈语音技术能力的人工智能公司之一,云之声已经深入声波纹技术多年。该团队的许多技术骨干在由国家标准与技术研究所(nist)赞助的说话人识别技术评估中获得了第一名。早在2004年,仍在摩托罗拉工作的云之盛公司创始人黄伟博士就带领团队开发了世界上第一个手机声纹认证系统,配备该系统的相关产品总销量超过2亿台。
近年来,随着深度学习的兴起,云之声率先在国内将该技术应用于语音识别,并将其引入到声纹识别领域,解决了声纹技术的一系列实际困难,并将其应用到实际产品中。这一次,云芝生和平安医生共同创建了平安医生客户用户的声波纹登录系统,这是成功的案例之一。
云志声纹技术负责人指出,虽然声纹识别具有明显的优势,但要准确区分语音特征并不容易。首先,声纹识别系统的性能会受到用户语音状态的影响,如用户的身体状况和情绪,这些都会影响识别的准确性。其次,环境噪声以及采集和传输音频的硬件配置会对识别系统产生不同程度的干扰。
为了解决上述困难,云之声声纹技术团队做出了一系列的技术挑战和创新。首先,依托云之声强大的语音信号前端处理技术,如vad、语音降噪等。,准确捕捉人声并消除背景噪声;其次,云之声将dnn引入传统声纹识别器的技术框架,并集成了最新的端到端声纹识别技术。基于云之声超级计算机平台和海量的声纹训练数据,该模型可以学习成千上万的说话人。每个人都有多种发声特征,针对云中的每个用户采用说话人自适应技术,以达到更好的效果;在信道处理中,plda信道补偿技术可以将信道影响降至最低。
据悉,为了保证用户登录的安全性,云之声为平安医生的客户端声纹登录系统提供了数字字符串注册和登录的弱文本关联技术,使得项目更加困难和安全。与传统的固定密码登录模式不同,系统采用了一种随机数串登录模式,即当用户登录时,系统会随机发出8位随机数串,可以有效避免记录攻击等安全问题。
在同一个账户下,云之声声纹识别产品可以支持6人注册。在客户端,云之声提供了打包的sdk,支持声纹注册、登录、解绑定等接口,供上层调用api实现产品逻辑。同时,云之盛还提供了一个成熟的声波纹服务私有化方案,该方案基于金融、客户服务、快递等不同行业丰富的私有云部署经验,能够有效保护客户数据安全。
公开信息显示,云芝生与平安好医生在移动医疗领域有着长期的合作关系。2017年12月,双方共同成立上海颖艺智能科技有限公司,共同探索基于智能语音识别等技术的家庭智能医疗服务终端建设。
标题:登陆成功率 99%,云知声携手平安好医生推声纹登录系统
地址:http://www.ictaa.cn/hlwxw/4561.html