SDY电竞|昇得源体育

欢迎访问decowallfinishes.com |
会(hui)员(yuan)登录(lu) 免费注册
发布采购

声纹识别可以识别说话人的身份,实现“一对一”的语音控制

日期:2020-11-19 类别: 阅读:6384 (来源:互联网)

除了(le)指(zhi)纹识别(bie)和人(ren)脸识别(bie),你还能想到(dao)哪些生物(wu)识别(bie)方法(fa)?虽(sui)然声纹识别(bie)一直很低调,但不(bu)可否认(ren),它是人(ren)工(gong)智能领域的又一黑(hei)技术。与指(zhi)纹识别(bie)相比,声纹识别(bie)技术可以(yi)实(shi)现(xian)(xian)无感(gan)知、无接触。毕竟很多老人(ren)不(bu)太懂人(ren)工(gong)智能和生物(wu)识别(bie),而声纹识别(bie)只用声音,即使我(wo)到(dao)不(bu)了(le)现(xian)(xian)场,也可以(yi)通过(guo)电话远程(cheng)确认(ren)身份。

除了(le)指纹识别(bie)和人脸识别(bie),你还能(neng)想到(dao)哪些生物识别(bie)方(fang)法?没错!就是(shi)声纹识别(bie)。虽然声纹识别(bie)一直很(hen)低调,但不(bu)可否认,它是(shi)人工(gong)智能(neng)领(ling)域的又(you)一黑技(ji)术。

语音识别不(bu)是(shi)声纹识别

声纹识别听起来很高级,BQ24032ARHLR其实很多小伙伴手机里都有这个功能。小黑,以iPhone为例。当你打开Siri语音助手时,系统会让你先读一些具体的句子。这一步是识别你的声纹,让别人唤醒你的Siri。

现(xian)在很(hen)多(duo)智能家居都可以通过声(sheng)音(yin)控制,比(bi)如用小爱心音(yin)箱开灯(deng)关灯(deng),或(huo)者(zhe)给智能电视(shi)下达换台(tai)指令。所以很(hen)多(duo)朋(peng)友认(ren)为这也是(shi)声(sheng)纹识别(bie)。事(shi)实上,目前大多(duo)数语音(yin)控制都属(shu)于语音(yin)识别(bie)。

简而(er)言(yan)之,语(yu)(yu)(yu)音(yin)识别(bie)(bie)(bie)(bie)就是识别(bie)(bie)(bie)(bie)语(yu)(yu)(yu)音(yin)中(zhong)的(de)内(nei)容(rong),利用AI自动将我们(men)的(de)口语(yu)(yu)(yu)单词(ci)转(zhuan)换成相应的(de)单词(ci)。而(er)声(sheng)纹(wen)识别(bie)(bie)(bie)(bie)可以识别(bie)(bie)(bie)(bie)说话人的(de)身份,实现“一对一”的(de)语(yu)(yu)(yu)音(yin)控制。因此,声(sheng)纹(wen)识别(bie)(bie)(bie)(bie)不(bu)关注语(yu)(yu)(yu)音(yin)信号的(de)语(yu)(yu)(yu)义,而(er)是从语(yu)(yu)(yu)音(yin)信号中(zhong)提取个(ge)体声(sheng)纹(wen)特征,挖掘(jue)出语(yu)(yu)(yu)音(yin)信号中(zhong)包含的(de)个(ge)性因素。

声纹识别有什(shen)么特别之处?

我们(men)说话时发(fa)声(sheng)器官的大(da)小(xiao)和形状(zhuang)是很不一样的,所(suo)以(yi)(yi)任何两个(ge)(ge)人(ren)不可能有相同的声(sheng)纹图。正是通(tong)过这个(ge)(ge)特征,声(sheng)纹识别可以(yi)(yi)通(tong)过比较同一音素上的声(sheng)音来(lai)判断声(sheng)音是否属于同一个(ge)(ge)人(ren)。

声(sheng)(sheng)纹(wen)识(shi)别是基(ji)于语(yu)音(yin)(yin)(yin)中包(bao)(bao)含(han)的(de)说话人独(du)特的(de)个性(xing)信(xin)息,然后利用计算(suan)机和现(xian)有的(de)识(shi)别技术,自动识(shi)别当前语(yu)音(yin)(yin)(yin)对应的(de)说话人身份。声(sheng)(sheng)纹(wen)识(shi)别系统包(bao)(bao)括说话人模型训练和测试语(yu)音(yin)(yin)(yin)识(shi)别两(liang)个阶(jie)段。

训(xun)(xun)练阶段:为使用系(xi)统的(de)(de)(de)说(shuo)(shuo)话(hua)人(ren)预留足够的(de)(de)(de)语音(yin),从不同说(shuo)(shuo)话(hua)人(ren)的(de)(de)(de)语音(yin)中提取声学(xue)特征。然(ran)后根据(ju)每个(ge)说(shuo)(shuo)话(hua)人(ren)的(de)(de)(de)语音(yin)特征,训(xun)(xun)练相(xiang)应的(de)(de)(de)说(shuo)(shuo)话(hua)人(ren)模型,最后将所(suo)有(you)的(de)(de)(de)说(shuo)(shuo)话(hua)人(ren)模型进(jin)行(xing)组装(zhuang),形成(cheng)系(xi)统的(de)(de)(de)说(shuo)(shuo)话(hua)人(ren)模型库(ku)。

在(zai)识(shi)(shi)别(bie)阶段,当说(shuo)话(hua)人进行(xing)识(shi)(shi)别(bie)和认证(zheng)时,系统从识(shi)(shi)别(bie)的(de)(de)语音中提取相(xiang)同的(de)(de)特征(zheng),并将语音特征(zheng)与说(shuo)话(hua)人模型库进行(xing)比较,得(de)到相(xiang)应说(shuo)话(hua)人模型的(de)(de)相(xiang)似度(du)得(de)分,最(zui)后根据识(shi)(shi)别(bie)得(de)分判断说(shuo)话(hua)人的(de)(de)身份(fen)。

指纹和人脸(lian)识别(bie)不(bu)可(ke)能察(cha)觉不(bu)到。

与(yu)指(zhi)纹识别相比,声纹识别技(ji)术可(ke)以实现(xian)无感知、无接触。不需要用(yong)手指(zhi)去触碰(peng)很多(duo)人留下的(de)细菌指(zhi)纹识别装置。相比于(yu)人脸识别,尤(you)其(qi)是在大家都(dou)戴(dai)口罩(zhao)的(de)特殊时期,不摘口罩(zhao)仍(reng)然可(ke)以用(yong)声纹识别信息。

哪些场景会应(ying)用于(yu)声纹识(shi)别?

其实现在远程交互(hu)的(de)方(fang)式越来(lai)(lai)越多了。在一些特定的(de)智能场景中,没有办法通过(guo)指(zhi)纹或人脸来(lai)(lai)识(shi)别(bie),所以声纹识(shi)别(bie)成(cheng)为唯一能够识(shi)别(bie)我们身份(fen)的(de)技术。既然声纹识(shi)别(bie)这么(me)强大,可以应(ying)用(yong)到哪(na)些场景?

每(mei)个人都(dou)应(ying)该在银(yin)行(xing)的(de)电(dian)话客服做过业务,每(mei)次都(dou)要(yao)上报一(yi)系列可以(yi)证明身份的(de)信息,比如身份证、手(shou)机号等。但如果(guo)以(yi)后推广(guang)声(sheng)纹识别,银(yin)行(xing)可以(yi)通(tong)过声(sheng)纹识别身份,通(tong)过电(dian)话或网(wang)上也(ye)可以(yi)轻松办理业务。

当然,社保(bao)局也(ye)可以利(li)用(yong)声纹识(shi)(shi)别(bie)来(lai)防止养老(lao)金被冒领。毕竟很多老(lao)人(ren)不太懂(dong)人(ren)工智能和生物识(shi)(shi)别(bie),而声纹识(shi)(shi)别(bie)只用(yong)声音,即使(shi)我到(dao)不了(le)现(xian)场,也(ye)可以通过电话远程确认身份(fen)。

声纹(wen)识别(bie)(bie)还可(ke)以(yi)应用到火车、飞机的安检过(guo)程中,可(ke)以(yi)有效识别(bie)(bie)和提(ti)示危险人物。对电话诈骗、刑事(shi)案(an)件也有很大帮助(zhu)。警(jing)察和司法人员可(ke)以(yi)通(tong)过(guo)声纹(wen)识别(bie)(bie)锁(suo)定嫌疑人或缩小调查范围。

但是声纹识别(bie)的(de)(de)缺(que)点(dian)也很(hen)明显(xian),对环(huan)境的(de)(de)要求很(hen)高(gao)。在嘈杂的(de)(de)环(huan)境下(xia),声纹不(bu)易(yi)获得(de);人的(de)(de)声音也会随着年龄、身体状况、情绪的(de)(de)影响而变化;不(bu)同的(de)(de)麦克风和通道对识别(bie)性能有(you)影响。

声纹识别(bie)作为最先进的(de)生物特征识别(bie)技(ji)术之(zhi)一,在未来会有更有意义的(de)使(shi)用(yong)场景。比如在操作智能音(yin)箱时,会根据用(yong)户的(de)声纹判断不(bu)同用(yong)户的(de)使(shi)用(yong)习惯(guan),从而提供(gong)更加(jia)人(ren)性化的(de)服务。但是(shi)小黑(hei)觉得人(ren)工智能要想实现真正的(de)一对一声纹识别(bie),需(xu)要时间(jian)去学习。