深度學(xué)習(xí)入門與實(shí)踐
定 價(jià):59.8 元
叢書(shū)名:新自動(dòng)化——從信息化到智能化
大約在一百年前,電氣化改變了交通運(yùn)輸行業(yè)、制造業(yè)、醫(yī)療行業(yè)、通信行業(yè),如今AI帶來(lái)了同樣巨大的改變。AI的各個(gè)分支中發(fā)展為迅速的方向之一就是深度學(xué)習(xí)。本書(shū)主要涉及以下內(nèi)容:第1部分是神經(jīng)網(wǎng)絡(luò)的基礎(chǔ),學(xué)習(xí)如何建立神經(jīng)網(wǎng)絡(luò),以及如何在數(shù)據(jù)上面訓(xùn)練它們。第2部分進(jìn)行深度學(xué)習(xí)方面的實(shí)踐,學(xué)習(xí)如何構(gòu)建神經(jīng)網(wǎng)絡(luò)與超參數(shù)調(diào)試、正則化以及一些高級(jí)優(yōu)化算法。第3部分學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)(CNN),以及如何搭建模型、有哪些經(jīng)典模型。它經(jīng)常被用于圖像領(lǐng)域,此外目標(biāo)檢測(cè)、風(fēng)格遷移等應(yīng)用也將涉及。后在第4部分學(xué)習(xí)序列模型,以及如何將它們應(yīng)用于自然語(yǔ)言處理等任務(wù)。序列模型講到的算法有循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)、注意力機(jī)制。通過(guò)以上內(nèi)容的學(xué)習(xí),讀者可以入門深度學(xué)習(xí)領(lǐng)域并打下扎實(shí)基礎(chǔ),為后續(xù)了解和探索人工智能前沿科技做知識(shí)儲(chǔ)備。本書(shū)配有電子課件,需要配套資源的教師可登錄機(jī)械工業(yè)出版社教育服務(wù)網(wǎng)www.cmpedu.com免費(fèi)注冊(cè)后下載。
本教材的作者是海外引進(jìn)人才,既有國(guó)外學(xué)習(xí)工作的背景,也有在國(guó)內(nèi)院校教學(xué)的經(jīng)驗(yàn),本書(shū)正是將二者有機(jī)結(jié)合起來(lái),編寫(xiě)而成的深度學(xué)習(xí)的入門級(jí)教材。通過(guò)本書(shū)的學(xué)習(xí),可以打下扎實(shí)基礎(chǔ),為后續(xù)了解人工智能前沿做知識(shí)儲(chǔ)備。
前 言不論你是生活在哪里、工作學(xué)習(xí)于什么領(lǐng)域,可能都已經(jīng)發(fā)現(xiàn)人工智能的時(shí)代已經(jīng)飛快地向人們走來(lái),這種感受就像是浪潮不斷漲起,它將過(guò)去的一些傳統(tǒng)的工作方式革新甚至取代。比如說(shuō),人工智能在圖像識(shí)別、圖像生成、自然語(yǔ)言翻譯、自動(dòng)駕駛領(lǐng)域的進(jìn)步,使得傳統(tǒng)的安保、插畫(huà)、翻譯、駕駛等工作受到前所未有的挑戰(zhàn)。未來(lái)它也將不斷改變現(xiàn)代人的生活,并且變革人們的工作內(nèi)容。這背后的技術(shù)進(jìn)步正是由于深度學(xué)習(xí)的人工智能第三次科技浪潮的興起,它順應(yīng)著數(shù)據(jù)的大爆發(fā)與芯片技術(shù)的高度發(fā)展,孕育了當(dāng)今時(shí)代新的發(fā)展機(jī)遇,值得年輕的學(xué)生與技術(shù)工作者去努力學(xué)習(xí)。然而現(xiàn)有的教材通常側(cè)重理論基礎(chǔ),與實(shí)踐結(jié)合不夠,或者實(shí)踐的講解不夠深入、詳細(xì)。同時(shí)有些國(guó)外經(jīng)典教材是英文撰寫(xiě),不利于國(guó)內(nèi)英語(yǔ)基礎(chǔ)不好的讀者學(xué)習(xí)。我深入了解到工業(yè)界學(xué)習(xí)者和在校學(xué)生的這些學(xué)習(xí)需求,所以編寫(xiě)了本書(shū)。深度學(xué)習(xí)自身是一個(gè)實(shí)踐性要求極高的領(lǐng)域,需要借助實(shí)例去講解,所以本書(shū)參考了吳恩達(dá)教授的課程,在編寫(xiě)中詳細(xì)地介紹了各種深度學(xué)習(xí)模型的數(shù)學(xué)運(yùn)算原理,對(duì)各種發(fā)展成熟的神經(jīng)網(wǎng)絡(luò)都有深入分析,為此閱讀本書(shū)需要高等數(shù)學(xué)、線性代數(shù)的基礎(chǔ)知識(shí),并且會(huì)使用Python編程語(yǔ)言進(jìn)行簡(jiǎn)單的操作與數(shù)據(jù)分析。本書(shū)主要涉及以下內(nèi)容:第1部分是神經(jīng)網(wǎng)絡(luò)的基礎(chǔ),學(xué)習(xí)如何建立神經(jīng)網(wǎng)絡(luò),以及如何在數(shù)據(jù)上面訓(xùn)練它們。接下來(lái)在第2部分進(jìn)行深度學(xué)習(xí)方面的實(shí)踐,學(xué)習(xí)如何構(gòu)建神經(jīng)網(wǎng)絡(luò)與超參數(shù)調(diào)試、正則化以及一些高級(jí)優(yōu)化算法。第3部分學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)(CNN),以及如何搭建模型、有哪些經(jīng)典模型。它經(jīng)常被用于圖像領(lǐng)域,此外目標(biāo)檢測(cè)、風(fēng)格遷移等應(yīng)用也將涉及。后在第4部分學(xué)習(xí)序列模型,以及如何將它們應(yīng)用于自然語(yǔ)言處理等任務(wù)。序列模型講到的算法有循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)、注意力機(jī)制。通過(guò)以上內(nèi)容的學(xué)習(xí),讀者可以入門深度學(xué)習(xí)領(lǐng)域并打下扎實(shí)基礎(chǔ),為后續(xù)了解和探索人工智能前沿科技做知識(shí)儲(chǔ)備。我開(kāi)始有寫(xiě)一本深度學(xué)習(xí)教材的想法源于2020年開(kāi)始在東北大學(xué)秦皇島分校講機(jī)器學(xué)習(xí)與深度學(xué)習(xí)相關(guān)課程,在實(shí)踐中積累教學(xué)經(jīng)驗(yàn),梳理了該領(lǐng)域的知識(shí),雖然內(nèi)容繁多還有些雜亂,但是對(duì)讀者應(yīng)該有用。這個(gè)時(shí)候正好學(xué)院的郭院長(zhǎng)組織編寫(xiě)自動(dòng)化系列教材,能與機(jī)械工業(yè)出版社合作,我就開(kāi)始編寫(xiě)本書(shū)。這期間科研工作也極為忙碌,所以經(jīng)歷了落筆、停滯、繼續(xù)重啟、再停滯,如此重復(fù)。中間想過(guò)放棄,但是羅編輯的耐心解答、郭院長(zhǎng)的悉心鼓勵(lì)以及呂同學(xué)的大力幫忙,終還是讓這本書(shū)得以成形,也圓了我編著書(shū)籍的夢(mèng)想。同時(shí)也要感謝我的家人在這期間對(duì)我的關(guān)懷和幫助,他們一直支持著我,無(wú)論我是在國(guó)外留學(xué)還是回國(guó)工作。后,本人能力水平有限,希望讀者不吝賜教。王舒禹2022年12月
目 錄前言第1部分神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)第1章深度學(xué)習(xí)簡(jiǎn)介1.1神經(jīng)網(wǎng)絡(luò)1.2神經(jīng)網(wǎng)絡(luò)的監(jiān)督學(xué)習(xí)應(yīng)用1.3為什么深度學(xué)習(xí)會(huì)興起第2章神經(jīng)網(wǎng)絡(luò)的編程基礎(chǔ) 2.1二分類2.2邏輯回歸2.3邏輯回歸的代價(jià)函數(shù)2.4梯度下降法2.5計(jì)算圖2.6使用計(jì)算圖求導(dǎo)數(shù)2.7邏輯回歸中的梯度下降2.8m個(gè)樣本的梯度下降2.9向量化2.10向量化邏輯回歸2.11向量化邏輯回歸的輸出2.12Python中的廣播2.13numpy向量2.14logistic損失函數(shù)的解釋第3章淺層神經(jīng)網(wǎng)絡(luò)3.1神經(jīng)網(wǎng)絡(luò)概述3.2神經(jīng)網(wǎng)絡(luò)的表示3.3計(jì)算一個(gè)神經(jīng)網(wǎng)絡(luò)的輸出3.4多樣本向量化3.5激活函數(shù)3.6激活函數(shù)的導(dǎo)數(shù)3.7神經(jīng)網(wǎng)絡(luò)的梯度下降3.8理解反向傳播3.9隨機(jī)初始化第4章深層神經(jīng)網(wǎng)絡(luò)4.1深層神經(jīng)網(wǎng)絡(luò)概述4.2前向傳播和反向傳播4.3深層網(wǎng)絡(luò)中矩陣的維數(shù)4.4為什么使用深層表示4.5超參數(shù)第2部分改善深層神經(jīng)網(wǎng)絡(luò):超參數(shù)調(diào)試、正則化以及優(yōu)化第5章深度學(xué)習(xí)的實(shí)踐5.1訓(xùn)練、驗(yàn)證、測(cè)試集5.2偏差、方差5.3機(jī)器學(xué)習(xí)基礎(chǔ)5.4正則化5.5正則化如何降低過(guò)擬合5.6dropout正則化5.7理解dropout5.8其他正則化方法5.9歸一化輸入5.10梯度消失/梯度爆炸5.11梯度的數(shù)值逼近5.12梯度檢驗(yàn)第6章優(yōu)化算法 6.1mini-batch梯度下降6.2理解mini-batch梯度下降法6.3動(dòng)量梯度下降法6.4RMSprop6.5Adam 優(yōu)化算法6.6學(xué)習(xí)率衰減6.7局部問(wèn)題第7章超參數(shù)調(diào)試、正則化7.1調(diào)試處理7.2超參數(shù)的合適范圍7.3歸一化網(wǎng)絡(luò)的激活函數(shù)7.4將batch norm擬合進(jìn)神經(jīng)網(wǎng)絡(luò)7.5batch歸一化分析7.6softmax回歸7.7訓(xùn)練一個(gè)softmax分類器7.8TensorFlow第3部分卷積神經(jīng)網(wǎng)絡(luò)及應(yīng)用第8章卷積神經(jīng)網(wǎng)絡(luò)8.1計(jì)算機(jī)視覺(jué)8.2邊緣檢測(cè)示例8.3邊緣檢測(cè)內(nèi)容8.4填充8.5卷積步長(zhǎng)8.6三維卷積8.7單層卷積網(wǎng)絡(luò)8.8簡(jiǎn)單卷積網(wǎng)絡(luò)示例8.9池化層8.10卷積神經(jīng)網(wǎng)絡(luò)示例8.11為什么使用卷積第9章深度卷積網(wǎng)絡(luò):實(shí)例探究9.1經(jīng)典網(wǎng)絡(luò)9.2殘差網(wǎng)絡(luò)9.3殘差網(wǎng)絡(luò)為什么有用9.4網(wǎng)絡(luò)中的11卷積9.5谷歌Inception網(wǎng)絡(luò)9.6遷移學(xué)習(xí)9.7數(shù)據(jù)增強(qiáng)第10章目標(biāo)檢測(cè)10.1目標(biāo)定位10.2特征點(diǎn)檢測(cè)10.3目標(biāo)檢測(cè)10.4滑動(dòng)窗口的卷積實(shí)現(xiàn)10.5Bounding Box預(yù)測(cè)10.6交并比10.7非極大值抑制10.8Anchor Boxes10.9YOLO算法第11章特殊應(yīng)用:人臉識(shí)別和神經(jīng)風(fēng)格遷移11.1One-Shot學(xué)習(xí)11.2Siamese網(wǎng)絡(luò)11.3Triplet損失11.4人臉驗(yàn)證與二分類11.5神經(jīng)風(fēng)格遷移11.6深度卷積網(wǎng)絡(luò)學(xué)習(xí)什么11.7代價(jià)函數(shù)11.8內(nèi)容代價(jià)函數(shù)11.9風(fēng)格代價(jià)函數(shù)11.10一維到三維推廣第4部分序列模型第12章循環(huán)序列模型12.1為什么選擇序列模型12.2數(shù)學(xué)符號(hào)12.3循環(huán)神經(jīng)網(wǎng)絡(luò)模型12.4通過(guò)時(shí)間的反向傳播12.5不同類型的循環(huán)神經(jīng)網(wǎng)絡(luò)12.6語(yǔ)言模型和序列生成12.7對(duì)新序列采樣12.8循環(huán)神經(jīng)網(wǎng)絡(luò)的梯度消失12.9GRU單元12.10長(zhǎng)短期記憶12.11雙向循環(huán)神經(jīng)網(wǎng)絡(luò)12.12深層循環(huán)神經(jīng)網(wǎng)絡(luò)第13章序列模型和注意力機(jī)制13.1序列結(jié)構(gòu)的各種序列13.2選擇可能的句子13.3集束搜索13.4改進(jìn)集束搜索13.5集束搜索的誤差分析13.6注意力模型直觀理解13.7注意力模型附錄附錄A深度學(xué)習(xí)符號(hào)指南A.1數(shù)據(jù)標(biāo)記與上下標(biāo)A.2神經(jīng)網(wǎng)絡(luò)模型A.3正向傳播方程示例A.4通用激活公式A.5損失函數(shù)A.6深度學(xué)習(xí)圖示附錄B線性代數(shù)B.1基礎(chǔ)概念和符號(hào)B.2矩陣乘法〖=(〗