產(chǎn)品參數(shù)
一、產(chǎn)品概述:
智能語(yǔ)音控制器是一個(gè)配合中控使用的離線語(yǔ)音終端,基于MIPS芯片,運(yùn)行Linux系統(tǒng),支持單麥/雙麥遠(yuǎn)講識(shí)別。運(yùn)行算法有:基于深度神經(jīng)網(wǎng)絡(luò)算法的本地語(yǔ)音識(shí)別、語(yǔ)音增強(qiáng)、語(yǔ)音降噪、聲源定位、波束成型、本地語(yǔ)音合成。在單麥版本的基礎(chǔ)上,增加了雙麥聲源定位(180度)、波束成型,利用麥克風(fēng)的空域?yàn)V波特性,通過(guò)對(duì)喚醒人的角度定位,形成定向拾音波束,并對(duì)波束以外的噪聲進(jìn)行抑制,以保證較高的錄音質(zhì)量,再將錄音數(shù)據(jù)做本地識(shí)別,最適合真實(shí)復(fù)雜場(chǎng)景下的語(yǔ)音控制;在語(yǔ)音交互方面,智能語(yǔ)音控制器支持10M范圍內(nèi)遠(yuǎn)場(chǎng)語(yǔ)音喚醒+識(shí)別,在常見(jiàn)的各種噪音環(huán)境中,平均喚醒率超過(guò)95%,平均識(shí)別率超過(guò)95%,喚醒識(shí)別效果處于行業(yè)領(lǐng)先地位。
二、功能描述:
1、采用高靈敏度數(shù)字麥克風(fēng)錄音,雙麥克風(fēng)陣列180°聲源定位,定向拾音波束,抑制環(huán)境噪音;
2、基于最新的 DNN 深度神經(jīng)網(wǎng)絡(luò)識(shí)別算法,在離線的狀態(tài)下支持本地普通話識(shí)別,識(shí)別指令可達(dá)萬(wàn)條;
3、本地語(yǔ)音合成;
4、消除設(shè)備播放的聲音,實(shí)現(xiàn)播放時(shí)可語(yǔ)音識(shí)別全雙工交互;
5、遠(yuǎn)場(chǎng)識(shí)別,遠(yuǎn)距離拾音,識(shí)別距離可達(dá)10米;
6、識(shí)別率高達(dá)95%;
7、內(nèi)置系統(tǒng)識(shí)別詞條,例如:調(diào)大音量、調(diào)小音量、打開(kāi)播放、關(guān)閉播放;切換到家庭模式、切換到會(huì)議模式、切換到近距離模式。