專利名稱:一種基于標(biāo)簽擴(kuò)增與多頻譜圖融合的聲音場(chǎng)景識(shí)別方法
專利號(hào)\申請(qǐng)?zhí)枺?/strong>2018104796140
注 冊(cè) 地:中國
專利類型:發(fā)明
專利領(lǐng)域:電學(xué)
聯(lián) 系 人:溫建梅
聯(lián)系方式:020-38743199
簡(jiǎn)介說明:
當(dāng)前權(quán)利人:華南師范大學(xué)
本發(fā)明公開了一種基于標(biāo)簽擴(kuò)增與多頻譜圖融合的聲音場(chǎng)景識(shí)別方法,包括:利用不同的信號(hào)處理技術(shù),為聲音場(chǎng)景數(shù)據(jù)生成多種頻譜圖;針對(duì)每種頻譜圖,分別訓(xùn)練一個(gè)深度卷積神經(jīng)網(wǎng)絡(luò)模型,做為基礎(chǔ)分類模型;利用標(biāo)簽擴(kuò)增技術(shù),為樣本擴(kuò)增超類別標(biāo)簽,使用人為構(gòu)造的層次標(biāo)簽,將原有網(wǎng)絡(luò)模型改進(jìn)為多任務(wù)學(xué)習(xí)模型,優(yōu)化基礎(chǔ)分類模型的性能;利用改進(jìn)的基礎(chǔ)分類模型提取樣本特征,拼接聲音場(chǎng)景文件的多個(gè)深度特征,并加以降維得到全局特征。融合對(duì)應(yīng)不同頻譜圖的多個(gè)全局特征,訓(xùn)練SVM分類器,做為最終分類模型。本發(fā)明應(yīng)用多頻譜圖特征融合技術(shù),有效提升識(shí)別性能;提出的標(biāo)簽擴(kuò)增及模型提升方法,能有效優(yōu)化基礎(chǔ)分類器性能,可推廣到其它應(yīng)用研究中。