多視圖深度學(xué)習(xí)方法與應(yīng)用
定 價:118 元
- 作者:荊曉遠(yuǎn)等
- 出版時間:2025/8/1
- ISBN:9787030821652
- 出 版 社:科學(xué)出版社
- 中圖法分類:TP181
- 頁碼:226
- 紙張:
- 版次:1
- 開本:B5
多視圖深度學(xué)習(xí)是人工智能和機(jī)器學(xué)習(xí)領(lǐng)域的一個重要研究方向,在計算機(jī)視覺、自然語言處理和數(shù)據(jù)挖掘等領(lǐng)域廣泛應(yīng)用。其核心在于探索如何利用深度學(xué)習(xí)模型,從多視角或多模態(tài)數(shù)據(jù)中提取有效信息,最終實現(xiàn)信息的融合與增強。本書內(nèi)容涵蓋部分傳統(tǒng)多視圖學(xué)習(xí)方法,以及當(dāng)前主流的多視圖特征學(xué)習(xí)與深度表示學(xué)習(xí)方法。全書共10章,分為3個部分:第Ⅰ部分(第1、2章)闡述多視圖學(xué)習(xí)的研究背景、應(yīng)用領(lǐng)域的研究現(xiàn)狀和未來發(fā)展趨勢;第Ⅱ部分(第3~5章)介紹多視圖特征學(xué)習(xí)的應(yīng)用與研究成果;第Ⅲ部分(第6~10章)討論多視圖深度表示學(xué)習(xí)的應(yīng)用與研究進(jìn)展。
更多科學(xué)出版社服務(wù),請掃碼獲取。
1988.9-1992.7,江蘇科技大學(xué)計算機(jī)及應(yīng)用專業(yè),本科
1992.9-1995.7,南京理工大學(xué)模式識別與智能控制專業(yè),碩士
1995.9-1998.12,南京理工大學(xué)模式識別與智能控制專業(yè),博士1998.12-2001.7,中興通訊公司南京研究所工程師
2001.7-2004.3,中國科學(xué)院自動化研究所副研究員、附屬公司研究部副經(jīng)理
2004.3-2005.6,哈爾濱工業(yè)大學(xué)深圳研究生院副教授
2005.6-2007.1,哈爾濱工業(yè)大學(xué)深圳研究生院教授、博士生導(dǎo)師
2007.1-2018.8,南京郵電大學(xué)自動化學(xué)院教授、博士生導(dǎo)師、副院長
2011.6至今,武漢大學(xué)計算機(jī)專業(yè)博士生導(dǎo)師、楚天學(xué)者特聘教授
2018.8至今,廣東石油化工學(xué)院計算機(jī)學(xué)院院長1. 作為通訊作者、第一作者發(fā)表論文177篇,其中SCI檢索論文126篇、EI檢索51篇。
2. 代表性論文:
(1) 荊曉遠(yuǎn)、張新玉等,Multiset Feature Learning for Highly Imbalanced Data Classification, IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI),2021,SCI影響因子23.6,中科院大類一區(qū);
(2) 賈曉棟、荊曉遠(yuǎn)等,Semi-supervised Multi-view Deep Discriminant Representation Learning, IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI),2021,SCI影響因子23.6,中科院大類一區(qū);
(3) 賈曉棟、荊曉遠(yuǎn)等,Human Collective Intelligence Inspired Multi-view Deep Representation Learning,IEEE擔(dān)任武漢大學(xué)-北京大學(xué)通用人工智能計劃(通計劃)博士生導(dǎo)師、華南理工大學(xué)博士生導(dǎo)師等;擔(dān)任國家自然科學(xué)獎會評專家、人工智能領(lǐng)域中科院SCI大類一區(qū)期刊《Pattern Recognition》等多個國際期刊編委、廣東省云機(jī)器人工程技術(shù)研究中心主任、廣東省石化裝備智能安全重點實驗室常務(wù)副主任、廣東省計算機(jī)學(xué)會常務(wù)理事、茂名市計算機(jī)學(xué)會會長、武漢大學(xué)B類學(xué)科帶頭人、香港理工大學(xué)客座研究員等;獲得教育部新世紀(jì)優(yōu)秀人才、湖北省楚天學(xué)者特聘教授、湖北省創(chuàng)新群體帶頭人、廣東省教育廳創(chuàng)新團(tuán)隊帶頭人等計劃支持,入選愛思唯爾(Elsevier)中國高被引學(xué)者、全球前2%科學(xué)家等榜單。
目錄
前言
第Ⅰ部分 多視圖學(xué)習(xí)與深度學(xué)習(xí)
第1章 多視圖學(xué)習(xí)概述 3
1.1 背景與意義 4
1.2 多視圖學(xué)習(xí)研究現(xiàn)狀與進(jìn)展 5
1.2.1 多視圖聚類方法研究 6
1.2.2 多視圖分類方法研究 9
1.2.3 多視圖回歸方法研究 14
1.2.4 多視圖決策方法研究 15
1.3 多視圖學(xué)習(xí)研究不足與展望 18
1.4 本書內(nèi)容安排 19
參考文獻(xiàn) 20
第2章 多視圖學(xué)習(xí)方法綜述 23
2.1 多視圖特征表示學(xué)習(xí) 24
2.1.1 基于連接的多視圖特征表示學(xué)習(xí) 24
2.1.2 基于對齊的多視圖特征表示學(xué)習(xí) 26
2.1.3 基于共享-獨有的多視圖特征表示學(xué)習(xí) 29
2.1.4 基于可解釋的多視圖特征表示學(xué)習(xí) 30
2.2 深度學(xué)習(xí) 31
2.2.1 深度有監(jiān)督學(xué)習(xí) 32
2.2.2 深度半監(jiān)督學(xué)習(xí) 33
2.2.3 深度無監(jiān)督學(xué)習(xí) 35
2.2.4 深度強化學(xué)習(xí) 37
2.3 本章小結(jié) 39
參考文獻(xiàn) 39
第Ⅱ部分 多視圖特征學(xué)習(xí)的應(yīng)用與研究
第3章 基于子空間學(xué)習(xí)的多視圖特征學(xué)習(xí)方法 45
3.1 子空間學(xué)習(xí)概述及本章研究內(nèi)容 45
3.2 組遞歸鑒別子空間學(xué)習(xí) 47
3.2.1 樣本集分解與遞歸學(xué)習(xí) 47
3.2.2 投影向量選擇規(guī)則 49
3.2.3 矩陣形式遞歸學(xué)習(xí)終止準(zhǔn)則 50
3.2.4 算法實現(xiàn)步驟 51
3.3 不相關(guān)局部敏感多視圖鑒別分析 51
3.3.1 局部敏感多視圖鑒別分析 52
3.3.2 跨視圖的一致性 53
3.3.3 不相關(guān)的多視圖變換 54
3.3.4 問題建模與目標(biāo)函數(shù)優(yōu)化 54
3.4 實驗驗證與有效性評估 56
3.4.1 數(shù)據(jù)集介紹 56
3.4.2 對比方法及實驗設(shè)置 59
3.4.3 分類效果評估 59
3.4.4 GRDSL、ULSMDA關(guān)鍵組成部分評估 61
3.4.5 運行時間評估 63
3.4.6 參數(shù)敏感性評估 64
3.5 本章小結(jié) 65
參考文獻(xiàn) 65
第4章 基于字典學(xué)習(xí)的多視圖特征學(xué)習(xí)方法 67
4.1 字典學(xué)習(xí)定義及本章研究內(nèi)容 67
4.2 不相關(guān)多視圖鑒別字典學(xué)習(xí) 68
4.2.1 UMD2L方法模型 69
4.2.2 UMD2L目標(biāo)函數(shù)優(yōu)化 70
4.2.3 基于字典編碼的分類機(jī)制 71
4.3 多視圖低秩字典學(xué)習(xí) 72
4.3.1 MLDL模型 73
4.3.2 MLDL目標(biāo)函數(shù)優(yōu)化 75
4.3.3 MLDL的分類機(jī)制 78
4.4 多視圖低秩共享結(jié)構(gòu)化字典學(xué)習(xí) 80
4.4.1 MLS2DL模型 80
4.4.2 MLS2DL目標(biāo)函數(shù)優(yōu)化 82
4.4.3 MLS2DL的分類機(jī)制 85
4.5 實驗驗證與有效性評估 86
4.5.1 數(shù)據(jù)集介紹 86
4.5.2 對比方法及實驗設(shè)置 88
4.5.3 分類效果評估 89
4.5.4 UMD2L、MLDL、MLS2DL關(guān)鍵組成部分評估 92
4.5.5 運行時間評估 95
4.5.6 參數(shù)敏感性評估 96
4.6 本章小結(jié) 101
參考文獻(xiàn) 101
第5章 基于半監(jiān)督鑒別分析的多視圖特征學(xué)習(xí)方法 103
5.1 半監(jiān)督鑒別分析定義及本章研究內(nèi)容 104
5.2 不相關(guān)半監(jiān)督視圖內(nèi)和視圖間流形鑒別學(xué)習(xí) 105
5.2.1 SI2MD機(jī)制 106
5.2.2 半監(jiān)督不相關(guān)約束 108
5.2.3 USI2MD總目標(biāo)函數(shù)及分類機(jī)制 109
5.3 實驗驗證與有效性評估 110
5.3.1 對比方法及實驗設(shè)置 110
5.3.2 分類效果評估 111
5.3.3 USI2MD關(guān)鍵組成部分評估 113
5.3.4 運行時間評估 113
5.3.5 參數(shù)敏感性評估 114
5.4 本章小結(jié) 115
參考文獻(xiàn) 115
第Ⅲ部分 多視圖深度表示學(xué)習(xí)的應(yīng)用與研究
第6章 基于譜內(nèi)識別與譜間相關(guān)分析深度網(wǎng)絡(luò)的多光譜人臉識別方法 119
6.1 多光譜深度學(xué)習(xí)研究基礎(chǔ)及本章研究內(nèi)容 120
6.2 基于譜內(nèi)識別與譜間相關(guān)分析的深度識別網(wǎng)絡(luò) 121
6.2.1 IDICN模型 121
6.2.2 譜內(nèi)識別分析 123
6.2.3 譜間相關(guān)分析 124
6.2.4 目標(biāo)函數(shù)優(yōu)化與求解 125
6.3 實驗設(shè)置與結(jié)果分析 126
6.3.1 HK PolyU多光譜數(shù)據(jù)集上的實驗結(jié)果 128
6.3.2 CMU多光譜數(shù)據(jù)集上的實驗結(jié)果 129
6.3.3 UWA多光譜數(shù)據(jù)集上的實驗結(jié)果 131
6.4 有效性評估 132
6.4.1 識別效果評估 132
6.4.2 譜內(nèi)識別分析與譜間相關(guān)分析重要性評估 133
6.4.3 參數(shù)敏感性評估 135
6.5 本章小結(jié) 136
參考文獻(xiàn) 136
第7章 基于共享-獨有半監(jiān)督學(xué)習(xí)的多視圖深度鑒別表示學(xué)習(xí)方法 139
7.1 共享-獨有半監(jiān)督多視圖表示學(xué)習(xí)研究基礎(chǔ)及本章研究內(nèi)容 140
7.2 半監(jiān)督多視圖深度鑒別表示學(xué)習(xí) 141
7.2.1 共享-獨有多視圖深度鑒別表示學(xué)習(xí)框架 142
7.2.2 基于深度度量學(xué)習(xí)和密度聚類的半監(jiān)督學(xué)習(xí)方法 144
7.3 典型的多視圖學(xué)習(xí)任務(wù)評估 146
7.3.1 網(wǎng)頁分類 146
7.3.2 圖像分類 148
7.3.3 文檔分類 150
7.4 實驗驗證與有效性評估 152
7.4.1 消融實驗 152
7.4.2 改進(jìn)對比損失函數(shù)的有效性 153
7.4.3 不同對齊策略的影響 155
7.4.4 不同半監(jiān)督學(xué)習(xí)策略的影響 155
7.4.5 平衡因子對方法性能的影響 156
7.4.6 訓(xùn)練時間與收斂性 156
7.5 本章小結(jié) 159
參考文獻(xiàn) 159
第8章 基于協(xié)同嵌入的多視圖深度表示學(xué)習(xí)方法 162
8.1 協(xié)同嵌入研究基礎(chǔ)及本章研究內(nèi)容 162
8.2 協(xié)同嵌入多視圖表示學(xué)習(xí)框架 162
8.2.1 本章假設(shè)與相似性判斷策略 163
8.2.2 表示學(xué)習(xí)與坐標(biāo)對齊 164
8.2.3 多視圖標(biāo)記傳播算法 168
8.3 實驗驗證與有效性評估 170
8.3.1 數(shù)據(jù)集介紹 172
8.3.2 分類效果評估 173
8.3.3 特征表示對比 176
8.3.4 參數(shù)敏感性評估 179
8.3.5 訓(xùn)練時間與收斂性 180
8.4 本章小結(jié) 182
參考文獻(xiàn) 183
第9章 視圖間具有互補信息交流的多視圖深度表示學(xué)習(xí)方法 185
9.1 多視圖間信息交流研究基礎(chǔ)及本章研究內(nèi)容 185
9.2 受人類群體智能啟發(fā)的多視圖深度表示學(xué)習(xí)方法 186
9.2.1 人類交流模型與整體架構(gòu) 186
9.2.2 單輪視圖交流模型 187
9.2.3 多輪視圖交流模型 191
9.2.4 表示學(xué)習(xí)與分類 192
9.3 不同領(lǐng)域的多視圖任務(wù)評估 193
9.3.1 醫(yī)學(xué)領(lǐng)域的對比 193
9.3.2 生物信息學(xué)領(lǐng)域的對比 195
9.3.3 機(jī)器學(xué)習(xí)領(lǐng)域的對比 195
9.4 實驗驗證與有效性評估 198
9.4.1 視圖交流有效性評估 199
9.4.2 參數(shù)敏感性評估 202
9.4.3 互補信息交流普適性 203
9.4.4 與協(xié)同學(xué)習(xí)方法的區(qū)別 203
9.5 本章小結(jié) 204
參考文獻(xiàn) 204
第10章 語義可解釋多視圖深度表示學(xué)習(xí)方法 207
10.1 可解釋性多視圖表示學(xué)習(xí)研究基礎(chǔ)及本章研究內(nèi)容 208
10.2 基于對齊的語義可解釋多視圖表示學(xué)習(xí)方法 209
10.2.1 基于對比學(xué)習(xí)的語義對齊表示學(xué)習(xí)網(wǎng)絡(luò) 209
10.2.2 基于表示激活映射RAM的多視圖語義相關(guān)性解釋框架 211
10.2.3 基于類別激活映射CAM的特征重要性解釋方法 213
10.3 實驗設(shè)置與結(jié)果分析 213
10.3.1 跨視圖檢索實驗 214
10.3.2 基于RAM的語義相關(guān)性解釋實驗 215
10.3.3 RAM兼容CAM實驗 220
10.4 有效性評估 222
10.4.1 方法適用場景與先進(jìn)性 222
10.4.2 方法普適性 223
10.5 本章小結(jié) 223
參考文獻(xiàn) 224