摘 要:語音傳輸指數(shù)(Speech Transmission Index,STI)是一個(gè)用于評(píng)估語音信號(hào)傳輸質(zhì)量的指標(biāo),測(cè)量方法有完整STI法與公共廣播系統(tǒng)語音傳輸指數(shù)(Speech Transmission Index for Public Address Systems,STIPA)法,使用AWA6292型多功能聲級(jí)計(jì)與AWA5512型智能聲源,介紹采用STIPA法所進(jìn)行的無擴(kuò)聲時(shí)的測(cè)量、有擴(kuò)聲系統(tǒng)且含有傳聲器輸入時(shí)的測(cè)量、有擴(kuò)聲系統(tǒng)且通過線路輸入的測(cè)量,并詳細(xì)介紹儀器的操作,可將其應(yīng)用于會(huì)議室、教室、禮堂、體育館、廣播站,以及聽力輔助系統(tǒng)的測(cè)試中,為相關(guān)領(lǐng)域的從業(yè)者提供有價(jià)值的參考。語言是人與人之間溝通交流的主要手段。很多情況下,語言信號(hào)會(huì)受說話人與聽者之間信號(hào)路徑或傳輸通路的影響而減弱,導(dǎo)致在聽者位置處的語言可懂度降低。
語言清晰度(又稱語言可懂度)描述的是語音信息經(jīng)通信系統(tǒng)或公共廣播系統(tǒng)傳播后的清晰程度和完整性。很早的時(shí)候,人們通過人工測(cè)試的方式評(píng)估語言清晰度:一位朗讀者在讀一些沒有意義的字詞和音節(jié),而聽者要盡可能正確記錄聽到的信息。結(jié)果以百分比形式給出,100%是滿分。GB/T 15508-1995就規(guī)定了這種“采用一個(gè)或幾個(gè)聽音人正確記錄一個(gè)或幾個(gè)發(fā)音人所發(fā)意義不連貫的音節(jié)比率,以定量地度量語言傳遞系統(tǒng)質(zhì)量的一種方法”。這種主觀方法既費(fèi)時(shí)費(fèi)力,試驗(yàn)結(jié)果受各種因素影響較大。
為確定經(jīng)過傳輸通路后語言可懂度的降低程度,一個(gè)快速客觀的測(cè)量方法被開發(fā)出來,即語音傳輸指數(shù)(STI)。它是預(yù)測(cè)說話人發(fā)出的語音經(jīng)過傳輸通路到達(dá)聽者后的可懂度的客觀度量。通過對(duì)傳輸通路發(fā)出特定的測(cè)試信號(hào),然后分析接收到的信號(hào),導(dǎo)出傳輸通路的傳輸品質(zhì)并使用0~1之間的值表達(dá),這就是STI。根據(jù)STI值,就可確定傳輸通路可能的語言可懂度。雖然STI方法仍有一定的局限性,但也被證明在很多條件下是非常有效的。GB/T 12060.16-2017《聲系統(tǒng)設(shè)備第16部分:通過語音傳輸指數(shù)客觀評(píng)價(jià)語言可懂度》規(guī)定了有關(guān)要求,同時(shí)指出:雖然漢語語言體系與西方語言體系有較大區(qū)別,但有研究表明,使用現(xiàn)有的STI方法客觀評(píng)價(jià)漢語的語言可懂度也具有適用性。GB/T 12060.16-2017修改采用的IEC標(biāo)準(zhǔn)有最新版本IEC 60268-16:2020。
簡(jiǎn)單來說,語音傳輸指數(shù)是衡量語音傳輸質(zhì)量的一個(gè)指標(biāo),該參數(shù)可以較為全面反映混響時(shí)間、信噪比和回聲等對(duì)語言清晰度的影響,并且考慮了系統(tǒng)失真、心理聲學(xué)效果(掩蔽效應(yīng))等因素。它的值范圍為0~1,值越大說明清晰度越好。好的擴(kuò)聲系統(tǒng)即使用在聲學(xué)條件較差的環(huán)境也能達(dá)到0.45到0.65的結(jié)果,而在聲學(xué)環(huán)境較好的場(chǎng)所,能達(dá)到0.70至0.90。更直觀的例子是,一間優(yōu)秀的錄音棚內(nèi),從麥克風(fēng)到監(jiān)聽音箱之間典型的STI值能達(dá)到0.90至0.97。圖1所示為評(píng)定等級(jí),圖中字母為等級(jí)名稱,上面數(shù)字代表該等級(jí)的STI中心值,下面數(shù)字代表該等級(jí)的STI邊界值。A+是極高的語言可懂度,A、B和C是高的語言可懂度,D是較好的語言可懂度,E是高品質(zhì)的擴(kuò)聲系統(tǒng),F(xiàn)是較好品質(zhì)的擴(kuò)聲系統(tǒng),G是語音報(bào)警系統(tǒng)的目標(biāo)值,H是語音報(bào)警系統(tǒng)的正常下限,I是有限的語言可懂度,J和U是STI值太低,不宜用于擴(kuò)聲系統(tǒng)。
圖1 STI 的評(píng)定等級(jí)
1、STI測(cè)量方法
1.1 STI 測(cè)量方法
STI有兩種測(cè)量方法:使用調(diào)制信號(hào)的直接法和基于系統(tǒng)脈沖響應(yīng)的間接法。
每個(gè)方法都有它的優(yōu)點(diǎn)和缺點(diǎn),兩者也不一定能給出相同的結(jié)果。本文主要介紹直接法。
測(cè)量中應(yīng)盡量避免其他聲源干擾,測(cè)試信號(hào)的響應(yīng)時(shí)間應(yīng)足夠短,測(cè)試時(shí)間應(yīng)夠長(zhǎng)以消除測(cè)量誤差。
1.2 完整 STI 法
最初,完整STI 測(cè)量包括98個(gè)獨(dú)立的測(cè)試信號(hào),包含7個(gè)倍頻帶粉紅噪聲載波,其中心頻率為125、250、500、1000、2000、4000、8000Hz;每一個(gè)載波分別用14個(gè)極低頻的簡(jiǎn)諧信號(hào)調(diào)制。調(diào)制信號(hào)的頻率為:0.63、0.80、1.0、1.25、1.6、2.0、2.5、3.15、4.0、5.0、6.3、8.0、10、12.5 Hz(相隔1/3倍頻程),98個(gè)測(cè)試信號(hào)按序依次生成。測(cè)量時(shí)每個(gè)調(diào)制信號(hào)平均10s,一個(gè)完整STI測(cè)量需要大約15min,因此,現(xiàn)在很少使用。而間接法被廣泛應(yīng)用于完整的STI。
1.3 STI 法原理
在語音信號(hào)中,信號(hào)的強(qiáng)度隨時(shí)間而變化,產(chǎn)生了語音強(qiáng)度包絡(luò)的變化。強(qiáng)度包絡(luò)的緩慢波動(dòng)與詞和句子的邊緣對(duì)應(yīng),而強(qiáng)度包絡(luò)的快速波動(dòng)則與詞所包含的音位吻合。STI 測(cè)量可以確定語音信號(hào)經(jīng)過傳輸通路后強(qiáng)度包絡(luò)受影響的程度,得到的調(diào)制遞函數(shù)能夠量化通路對(duì)語音信號(hào)強(qiáng)度包絡(luò)的影響。
STI 法通過計(jì)算一系列語音包含頻帶的計(jì)權(quán)貢獻(xiàn),得到一個(gè)0~1之間的值,該值即為語音傳輸指數(shù)。
1.4 STIPA 法
STIPA是完整STI的一種簡(jiǎn)化形式,稱之為公共廣播系統(tǒng)語音傳輸指數(shù)。它是基于使用較少數(shù)量的調(diào)制指數(shù)進(jìn)行的測(cè)量。STIPA測(cè)試信號(hào)僅由1個(gè)測(cè)試信號(hào)組成,在7個(gè)倍頻帶中的每一個(gè)波段都預(yù)設(shè)兩個(gè)調(diào)制如表1所示。這14個(gè)調(diào)制指數(shù)是同時(shí)產(chǎn)生的。一次測(cè)量時(shí)間僅需15~25s,比完整STI要短得多,是直接方法的主要應(yīng)用途徑。調(diào)制指數(shù)也可以使用間接法得出,稱為STIPA(IR)。
STIPA是世界上測(cè)量語言清晰度應(yīng)用最廣泛的方法,本文所用的測(cè)量?jī)x器就是使用STIPA法進(jìn)行測(cè)量的。
1.5 STIPA 測(cè)試信號(hào)的生成
(1)使用一個(gè)每倍頻程降低3dB的低通濾波器,從63Hz開始對(duì)白噪聲進(jìn)行濾波,生成粉紅噪聲。
(2)使用表1中的7個(gè)125~8000 Hz 的倍頻程帶通濾波器對(duì)粉紅噪聲進(jìn)行濾波。
(3)對(duì)每個(gè)倍頻帶載波信號(hào)按如式(1)所示的調(diào)制函數(shù)進(jìn)行調(diào)制。
mfm(t)=0.5{1+0.55[sin(2πf1mt)-sin(2πf2mt)]}(1)
式中:mfm(t)為振幅調(diào)制函數(shù),f1m、f2m為表1中的第一個(gè)調(diào)制頻率和第二個(gè)調(diào)制頻率,t為時(shí)間秒。
(4)由于STIPA只使用男聲頻譜的測(cè)試信號(hào),使用如表2所示男聲的修正值對(duì)各倍頻帶進(jìn)行修正。
(5)將所有調(diào)制過的載波信號(hào)進(jìn)行疊加,構(gòu)成STIPA的測(cè)試信號(hào)。
2、STIPA測(cè)量?jī)x器
STIPA測(cè)量需要一個(gè)測(cè)試聲源和一臺(tái)STIPA分析儀。測(cè)試聲源可以是預(yù)先錄制有STIPA信號(hào)的音頻文件,再將這個(gè)文件輸入公共廣播系統(tǒng)發(fā)聲,也可以使用語音音箱或校準(zhǔn)過的測(cè)試揚(yáng)聲器作為測(cè)試聲源,它應(yīng)盡可能與說話者具有相似的方向性。STIPA分析儀主要由傳聲器、前置放大器、模數(shù)轉(zhuǎn)換器以及硬件和軟件組成,以提供計(jì)算STI所需的處理工具。所有這些都可以集成到單個(gè)設(shè)備中,或者是分開的硬件和軟件的組合?,F(xiàn)在,一臺(tái)安裝有STIPA測(cè)試軟件的聲級(jí)計(jì)就是一臺(tái)STIPA分析儀。
AWA6292型多功能聲級(jí)計(jì)如圖2(a)所示,是采用數(shù)字信號(hào)處理和物聯(lián)網(wǎng)技術(shù)的新一代手持式聲學(xué)測(cè)量?jī)x器,性能符合GB/T 3785.1/IEC 61672-1對(duì)1級(jí)聲級(jí)計(jì)和GB/T 3241.1/IEC 61260-1對(duì)1級(jí)濾波器的要求,可以選擇工業(yè)噪聲測(cè)量、環(huán)境噪聲測(cè)量、職業(yè)衛(wèi)生噪聲測(cè)量和建筑聲學(xué)測(cè)量等模塊。當(dāng)選用建筑聲學(xué)測(cè)量模塊時(shí),配置總值積分測(cè)量、倍頻程和1/3倍頻程濾波器、混響時(shí)間測(cè)量和STIPA測(cè)量等軟件模塊,可以完成大多數(shù)建筑聲學(xué)測(cè)量項(xiàng)目,尤其適用于廳堂和室內(nèi)場(chǎng)所的聲學(xué)和擴(kuò)聲特性測(cè)量。
AWA5512型智能聲源如圖2(B)所示,是一種由電動(dòng)式揚(yáng)聲器發(fā)聲的聲源,其性能指標(biāo)符合GB/T 12060.16-2017《聲系統(tǒng)設(shè)備第16部分:通過語音傳輸指數(shù)客觀評(píng)價(jià)語言可懂度》中對(duì)STIPA信號(hào)的要求??梢杂蓛?nèi)置揚(yáng)聲器發(fā)出1kHz正弦波、白噪聲、粉紅噪聲、STIPA測(cè)試信號(hào)、參考語音信號(hào)(中文、英文)、延遲信號(hào)等聲信號(hào),在距離聲源1m處產(chǎn)生60dB(A)±1dB(A)或70dB(A)±1dB(A)聲壓級(jí);也可以由線路輸出這些信號(hào)的電信號(hào),還可以由線路輸入外加各種測(cè)試信號(hào),并在100~10000Hz頻率范圍內(nèi)保持±1dB的頻響不均勻度,可以用作多種用途測(cè)試聲源。
圖 2 STIPA 測(cè)量?jī)x器
3、測(cè)量場(chǎng)景
需要STI測(cè)試的可能場(chǎng)景有4種,如表3所示,其中確定了傳輸通道、說話者和收聽者。場(chǎng)景1與場(chǎng)景4基本相同,都是測(cè)量時(shí)說話者通過傳聲器到擴(kuò)聲系統(tǒng),再由揚(yáng)聲器系統(tǒng)發(fā)聲,只是場(chǎng)景1中說話者與聽者不在一個(gè)房間(場(chǎng)所),而場(chǎng)景4中說話者與聽者同在一個(gè)房間(場(chǎng)所),所以下面分3種場(chǎng)景進(jìn)行介紹。在STIPA測(cè)試期間,所有的說話者都被STIPA測(cè)試信號(hào)源所取代,所有的聽者(和聽者的位置)都是所用STIPA分析儀的測(cè)試位置。
表 3 STIPA 測(cè)量場(chǎng)景
根據(jù)以上場(chǎng)景,可以使用儀器進(jìn)行如下測(cè)量:
對(duì)于場(chǎng)景1和4,具有播音員(或演講者)的擴(kuò)聲系統(tǒng)如圖3所示。
圖 3 有擴(kuò)聲時(shí)STI 法測(cè)量原理框圖(傳聲器輸入)
使用擴(kuò)聲傳聲器講話或播音,再在擴(kuò)聲系統(tǒng)播放的場(chǎng)所,使用智能聲源對(duì)著擴(kuò)聲傳聲器發(fā)出STI-PA信號(hào),模擬人類講話者發(fā)出測(cè)試信號(hào)。測(cè)試時(shí),智能聲源應(yīng)置于正常說話距離處,傳聲器的軸線指向正常發(fā)話方向;測(cè)試信號(hào)級(jí)與正常說話聲壓級(jí)相當(dāng),即距離揚(yáng)聲器0.5m處的A計(jì)權(quán)聲壓級(jí)為66dB。在傳聲器輸入處檢查測(cè)試信號(hào)頻譜,在125~8000Hz之間所對(duì)應(yīng)的各倍頻帶范圍內(nèi)頻率響應(yīng)不大于±1dB,調(diào)節(jié)智能聲源或測(cè)試揚(yáng)聲器的均衡來滿足要求。
對(duì)場(chǎng)景2,預(yù)先錄制公告的擴(kuò)聲系統(tǒng)如圖4所示。如果擴(kuò)聲系統(tǒng)不含系統(tǒng)傳聲器而是直接通過播放器播放音頻,則需要通過外部信號(hào)發(fā)生器(智能聲源線路輸出)將STIPA信號(hào)輸入至系統(tǒng)中,通過調(diào)節(jié)擴(kuò)音系統(tǒng)持續(xù)播放大小可調(diào)的STIPA測(cè)試信號(hào)。測(cè)量時(shí),擴(kuò)聲系統(tǒng)處于最高可用增益工作狀態(tài),測(cè)試信號(hào)通過擴(kuò)聲調(diào)音臺(tái)線路輸入擴(kuò)聲系統(tǒng),擴(kuò)聲系統(tǒng)處于穩(wěn)定工作狀態(tài)。
圖 4 有擴(kuò)聲時(shí)STI 法測(cè)量原理框圖(線路輸入)
對(duì)場(chǎng)景3,沒有擴(kuò)聲系統(tǒng)的房間如圖5所示。STIPA測(cè)試信號(hào)應(yīng)通過合適的揚(yáng)聲器(智能聲源如圖5(a)所示)在說話人位置處播放,聲級(jí)計(jì)如圖5(b)所示的傳聲器的軸線指向正常發(fā)話方向,揚(yáng)聲器應(yīng)能模擬人類講話者的聲音大小,即在距離1米處聲壓級(jí)達(dá)到60dB(A),在IEC 60268-16標(biāo)準(zhǔn)中明確定義對(duì)它的要求。
圖 5 無擴(kuò)聲時(shí)STI 法測(cè)量原理框圖
4、測(cè)量步驟
4.1 整個(gè)過程中的步驟
通常,大多數(shù)STI測(cè)量的總體程序包括以下步驟:
(1)規(guī)劃:研究技術(shù)文件、藍(lán)圖及與項(xiàng)目和傳輸通道相關(guān)的所有其他文件。
(2)測(cè)量計(jì)劃:起草一份詳細(xì)的測(cè)量計(jì)劃,其中包括使用的設(shè)備、校準(zhǔn)程序、測(cè)量的數(shù)量和位置等。
(3)校準(zhǔn):確保所有設(shè)備在使用前經(jīng)過正確校準(zhǔn)和測(cè)試。
(4)設(shè)置信號(hào)源:根據(jù)所涉及的場(chǎng)景類型,選擇合適的信號(hào)源(例如文件、音頻播放器、對(duì)講機(jī))。為聲壓級(jí)正確配置信號(hào)源(在1m距離處標(biāo)稱為60dB(A))。在測(cè)量開始前至少2秒啟動(dòng)測(cè)試信號(hào),并保持其播放。
(5)收集測(cè)量數(shù)據(jù):按照規(guī)劃的測(cè)量位置和網(wǎng)格,進(jìn)行所有測(cè)量并記錄所有數(shù)據(jù)。通常會(huì)在每個(gè)位置進(jìn)行多次測(cè)量。
(6)后處理:使用軟件工具(如測(cè)量設(shè)備制造商提供的工作表)對(duì) STI數(shù)據(jù)進(jìn)行必要的后處理。例如,在無噪聲條件下進(jìn)行測(cè)量,再通過計(jì)算將操作狀態(tài)下的環(huán)境噪聲頻譜添加到MTF矩陣中。
(7)報(bào)告:描述設(shè)置、測(cè)量結(jié)果和結(jié)論。
4.2 聲源的設(shè)定
一般將聲源置于三腳架上,對(duì)準(zhǔn)系統(tǒng)傳聲器如圖3所示,或?qū)⒙曉粗糜谧烂娌⑵漭敵鲭娦盘?hào)加入擴(kuò)聲系統(tǒng)的線路輸入如圖4所示,或?qū)⒙曉粗糜谌_架并對(duì)準(zhǔn)聲級(jí)計(jì),并保持講話者與收聽者之間的距離如圖5所示。聲源輸出STIPA測(cè)試信號(hào),聲壓級(jí)通常置于60dB(A)±1dB(A)@1m檔,在嘈雜的場(chǎng)所背景噪聲較大,需要考慮倫巴效應(yīng)時(shí)將其置于70dB(A)±1dB(A)@1m檔。
4.3 聲級(jí)計(jì)的操作
點(diǎn)擊“STI”進(jìn)入STI界面,界面顯示如圖6所示。步驟區(qū)顯示:一個(gè)完整的STI測(cè)量需進(jìn)行6次測(cè)量,根據(jù)6次測(cè)量的STI計(jì)算出平均STI。
圖 6 STI 測(cè)試準(zhǔn)備界面
測(cè)量區(qū)表中縱向是:125、250、500、1000、2000、4000、8000 Hz7個(gè)倍頻帶中心頻率。橫向是測(cè)量指標(biāo):Leq(dB)、mi1、mi2、TI1、TI2、MTI,根據(jù)測(cè)量時(shí)長(zhǎng)計(jì)算。
進(jìn)入需要測(cè)量的“STI”界面后,初始狀態(tài)為“準(zhǔn)備中”(圖標(biāo)為,顯示為藍(lán)色),頁面上顯示的指標(biāo)均為0或者是上一次測(cè)量值,觸摸點(diǎn)擊“
”開始測(cè)量,儀器狀態(tài)變?yōu)椤皽y(cè)量中”(圖標(biāo)為
,顯示為藍(lán)色),測(cè)量15s后本次測(cè)量結(jié)束并自動(dòng)跳轉(zhuǎn)至下一測(cè)量界面,狀態(tài)為“準(zhǔn)備中”。6次測(cè)量結(jié)束后不再跳轉(zhuǎn),如圖7所示。手動(dòng)點(diǎn)擊步驟區(qū)的“平均”可查看6次的STI、Rank和平均值,如圖8所示。可通過點(diǎn)擊步驟區(qū)的編號(hào)查看對(duì)應(yīng)界面。
圖7測(cè)量結(jié)束界面 圖8平均界面
6 次測(cè)量結(jié)束后點(diǎn)擊“保存”保存該組STI,保存的數(shù)據(jù)可以通過點(diǎn)擊“歷史記錄”進(jìn)行調(diào)閱。
測(cè)量過程中不能暫停測(cè)量,若想停止當(dāng)前測(cè)量,可以通過“”結(jié)束本次測(cè)量,也可通過頁面左上角的返回“<”按鈕或儀器下方的強(qiáng)制返回按鈕(按關(guān)機(jī)鍵)停止測(cè)量。
掩蔽:指兩個(gè)聲音同時(shí)呈現(xiàn)時(shí),一個(gè)聲音因受到另一個(gè)聲音影響而減弱的現(xiàn)象。開啟掩蔽,當(dāng)人耳聽到一個(gè)較響的低頻聲時(shí),它會(huì)掩蔽更高的頻率,如果它們之間的聲級(jí)差超過一個(gè)給定的閾值,更高頻率的聲音就可能聽不到。
可以調(diào)閱保存的測(cè)量結(jié)果數(shù)據(jù),查看歷史詳情,允許打印、刪除。
4.4 其他操作
在測(cè)量開始前和/或開始后,需要測(cè)量說話者位置的聲壓級(jí),以及聲系統(tǒng)頻率響應(yīng)、失真和測(cè)量收聽者位置的聲壓級(jí)、環(huán)境噪聲和混響時(shí)間,這些都可以使用AWA6292型多功能聲級(jí)計(jì)來完成。
5、應(yīng)用
可用STI測(cè)量各種不同電子系統(tǒng)和聲學(xué)環(huán)境下的語言可懂度,典型的應(yīng)用包括:
(1)測(cè)量公共廣播系統(tǒng)和擴(kuò)聲系統(tǒng);
(2)測(cè)量房間、教室和廳堂的語言可懂度(自然聲或使用擴(kuò)聲系統(tǒng));
(3)評(píng)價(jià)直接的言語交流(不使用擴(kuò)聲系統(tǒng)),包括房間和各種聲學(xué)環(huán)境(例如在交通工具內(nèi));
(4)測(cè)量和鑒定通信電路(系統(tǒng)),例如內(nèi)部通信和無線通信系統(tǒng);
(5)測(cè)量和鑒定語音報(bào)警系統(tǒng)和緊急通知系統(tǒng);
(6)聽力輔助系統(tǒng)的語言可懂度評(píng)價(jià)。
STI的用戶涉及各行各業(yè),例如擴(kuò)聲系統(tǒng)和聲頻系統(tǒng)的鑒定者、聲頻和無線通信設(shè)備的制造商、聲頻系統(tǒng)的安裝者、聲學(xué)和電聲工程師、語音報(bào)警系統(tǒng)和其他類型緊急通知系統(tǒng)的鑒定者、STI方法的研究者和STI測(cè)量?jī)x器的開發(fā)者,ISO 3382-3和國(guó)家標(biāo)準(zhǔn)GB/T 36075.3-2018已將STI作為評(píng)價(jià)開放性辦公室聲環(huán)境的重要控制性參量。
6、結(jié)語
使用AWA5512型智能聲源和AWA6292型多功能聲級(jí)計(jì)可以在各種場(chǎng)合很方便測(cè)量語音傳輸指數(shù),根據(jù)測(cè)得的STI指數(shù)評(píng)定并采取措施提高聲學(xué)場(chǎng)所和擴(kuò)聲系統(tǒng)的語言可懂度,在會(huì)議室、教室、禮堂、體育館、廣播站,以及聽力輔助系統(tǒng)等場(chǎng)合都有廣泛用途。該組合還可以在廳堂、體育館等公共場(chǎng)所按GB/T 28049-2011和GB/T 4950-2011測(cè)量其擴(kuò)聲特性,如傳輸幅頻特性、傳聲增益、聲場(chǎng)不均勻度、最大聲壓級(jí)、總噪聲級(jí)、系統(tǒng)總噪聲級(jí)等,是建筑聲學(xué)最常用的測(cè)量?jī)x器。
該文章已收錄于《噪聲與振動(dòng)控制》第44卷 第5期