本書系統(tǒng)地介紹了語音識別在大模型時代的新技術(shù)與新應(yīng)用。全書共16章,原理部分涵蓋聲學(xué)特征、隱馬爾可夫模型(HMM)、高斯混合模型(GMM)、深度神經(jīng)網(wǎng)絡(luò)(DNN)、語言模型和加權(quán)有限狀態(tài)轉(zhuǎn)換器(WFST)、語音大模型,重點(diǎn)描述了GMM-HMM、DNN-HMM和端到端(E2E)三種語音識別框架;應(yīng)用部分包含Kaldi、W
"近年來人工智能技術(shù)突飛猛進(jìn),以語音識別為代表的音頻處理技術(shù)取得了大量突破,但該領(lǐng)域內(nèi)理論結(jié)合實(shí)戰(zhàn)的入門書籍卻較為缺乏,本書旨在為有志學(xué)習(xí)音頻信號處理的讀者提供一本實(shí)用的入門書籍。本書共13章,第1章和第2章是基礎(chǔ)部分,包括聲學(xué)基礎(chǔ)知識及Python基礎(chǔ)等內(nèi)容;第3到4章介紹了音頻信號的獲取及分析方法;第5~8章介紹了
本書是一本Hi-Fi音響入門圖書。本書從技術(shù)和藝術(shù)的角度,全面介紹了Hi-Fi音響的相關(guān)知識,旨在為音樂、音響愛好者提供入門指導(dǎo),幫助讀者提高音樂欣賞水平和音響設(shè)備的使用技能。本書包括電聲基礎(chǔ)、音響釋疑、音樂與欣賞3個部分。在電聲基礎(chǔ)部分,作者介紹了音響發(fā)燒的誤區(qū),如片面追求技術(shù)指標(biāo)、忽視聽音環(huán)境等,強(qiáng)調(diào)了正確認(rèn)識和欣
本書的撰寫主要分為四個章節(jié):第一章數(shù)字音頻藝術(shù)的基本藝術(shù)體系;第二章數(shù)字音頻藝術(shù)教育;第三章廣播劇與影視動漫聲音研究;第四章數(shù)字音頻的文化產(chǎn)業(yè)分析。主要內(nèi)容:1、理清數(shù)字音頻創(chuàng)意產(chǎn)業(yè)發(fā)展的脈絡(luò),建立數(shù)字音頻創(chuàng)意發(fā)展編年史。2、形成數(shù)字音頻創(chuàng)意教育引導(dǎo)機(jī)制的研究報告,提出音頻創(chuàng)意產(chǎn)業(yè)發(fā)展的咨詢報告。3、綜合性分析音頻創(chuàng)意
本書系統(tǒng)地闡述語音信號處理的原理、方法、技術(shù)和應(yīng)用,同時給出部分內(nèi)容對應(yīng)的MATLAB程序。全書共14章,第1~7章是基本理論部分,包括緒論、語音信號的數(shù)字模型、語音信號短時時域分析、語音信號短時頻域分析、語音信號倒譜分析、語音信號線性預(yù)測分析和矢量量化;第8~14章是應(yīng)用部分,包括語音編碼原理及應(yīng)用、語音識別原理及應(yīng)
全書共分11章,主要介紹了聲學(xué)基礎(chǔ)知識、音頻信號的數(shù)字化、數(shù)字音頻壓縮編碼的基本原理及相關(guān)標(biāo)準(zhǔn)、信道編碼與調(diào)制技術(shù)、光盤存儲技術(shù)、電子樂器數(shù)字接口(MIDI)、數(shù)字音頻文件格式、音頻處理與控制設(shè)備、數(shù)字音頻工作站、數(shù)字聲音廣播、音頻測量與分析等內(nèi)容。每章都附有小結(jié)與習(xí)題,以指導(dǎo)讀者加深對本書主要內(nèi)容的理解。本書可作為高
本教材結(jié)合語音信息處理的理論與實(shí)踐部分,主要內(nèi)容包括語音產(chǎn)生與感知機(jī)理、語音信號處理、語音識別、統(tǒng)計語音合成、語音增強(qiáng)、聲紋識別、語音對話以及語音信息處理的前瞻技術(shù)等。全書共分8章。第1章介紹語音產(chǎn)生與感知機(jī)理,以及與此相關(guān)的語言基礎(chǔ)知識,是全書的理論基礎(chǔ)。第2章介紹語音信號處理的基礎(chǔ),包括語音產(chǎn)生與感知的數(shù)學(xué)模型、語
本書是一本深入探討B(tài)BC監(jiān)聽音箱的專著。BBC在聲學(xué)領(lǐng)域貢獻(xiàn)卓著,其研發(fā)的監(jiān)聽音箱具有悠久的歷史和廣泛的影響力,對當(dāng)今的聲音美學(xué)理念和音響產(chǎn)品產(chǎn)生了深遠(yuǎn)影響。作者楊立新先生憑借多年對BBC設(shè)計理念的系統(tǒng)性研習(xí)、對BBC聲學(xué)文獻(xiàn)和監(jiān)聽音箱的深入研究,以及對原始設(shè)備的精心修復(fù)經(jīng)驗(yàn),為讀者提供了全面而系統(tǒng)的BBC監(jiān)聽音箱知識
本教材是以筆者2003年編寫并由中國廣播電視出版社出版發(fā)行的《錄音技術(shù)》的基礎(chǔ)上重新編寫的,該書一直是我校錄音藝術(shù)專業(yè)的專業(yè)課指定教材。次年該教材被廣播電影電視總局評為優(yōu)秀科技類(著作類)成果二等獎,并多次再版,受到廣大讀者的褒獎。 由于聲頻技術(shù)的發(fā)展勢頭十分迅猛,從拾音、控制及處理、重放,信源和信道編碼及傳輸方面都發(fā)
本書從人類聽覺、視覺的處理機(jī)制出發(fā),系統(tǒng)地介紹了聽覺和視覺感知模型、音視頻(圖像)壓縮編碼技術(shù)、音視頻(圖像)處理技術(shù)、基于內(nèi)容的音視頻(圖像)檢索技術(shù)、數(shù)字音視頻技術(shù)的交叉應(yīng)用等內(nèi)容。同時,本書還給出了相關(guān)知識的應(yīng)用實(shí)例,這寫實(shí)例都具有較高的參考和實(shí)用價值。本書涵蓋的學(xué)科領(lǐng)域十分廣泛,包括人工智能、信號處理、圖像處理