深度學習模型及應用詳解
  • 推薦0
  • 收藏2
  • 瀏覽212

深度學習模型及應用詳解

付強 (作者) 

  • 書  號:978-7-121-37126-4
  • 出版日期:2019-09-01
  • 頁  數:
  • 開  本:
  • 出版狀態:上市銷售
  • 維護人:張慧敏
本書作者都是微軟人工智能及研究院的研究人員和應用科學家,具有深厚的機器學習背景,在一線針對產品需求和支持的場景進行了大量的深度學習模型及算法的研究和開發,在模型設計、訓練、評估、部署、推理優化等模型開發全生命周期積累了豐富的經驗。
本書分為4 部分,共13 章。其中第1 部分(第1、2 章)簡要介紹了深度學習的現狀、概念和實現工具。第2 部分(第3~5 章)以具體的實際應用展示基于深度學習技術進行工程實踐和開發的流程和技巧。第3 部分(第6~12 章)介紹了學術界和工業界最新的高階深度學習模型的實現和應用。第4 部分(第13章)介紹了深度學習領域的一些前沿研究方向,并對深度學習的未來發展進行展望。
本書面向的讀者是希望學習和運用深度學習模型到具體應用場景的企業工程師、科研院所的學生和科研人員。讀者學習本書的目的是了解深度學習模型和算法基礎后,快速部署到自己的工作領域,并取得落地成果。
微軟人工智能專家多年實踐經驗的結晶,深入淺出介紹了深度學習技術實踐,從感知機模型到對抗生成網絡和深度強化學習,從模型的原理到應用的細節
張若非
美國紐約州立大學計算機科學博士。微軟(美國)人工智能與研究院高級研究總監,全球合伙人,負責微軟在線廣告平臺機器學習模型、算法及系統的研究和建設。研究領域包括機器學習、數據挖掘、自然語言處理、計算機視覺和多媒體信息檢索。在這些領域的一流學術期刊和頂級學術會議發表論文50余篇,獲得美國發明專利12項。美國國家自然科學基金會(NSF)智能系統評審委員會委員,IEEE和ACM高級會員。
付 強
博士畢業于清華大學電子工程系,現任微軟(美國)搜索廣告部資深應用科學家,主要從事機器學習、深度學習、信息檢索、自然語言理解、圖像處理等方面的算法研究及其在搜索廣告產品中的應用。此前曾任微軟亞洲研究院研究員,研究將機器學習算法用于云計算平臺的系統建模、性能優化,以及故障自動診斷。在機器學習、數據挖掘、計算機系統等領域的國際頂級會議及期刊上共發表論文30余篇,持有4項美國專利。
高 斌
博士畢業于北京大學數學科學學院,現任微軟(美國)搜索廣告部資深機器學習科學家,此前曾擔任微軟亞洲研究院機器學習研究組主管研究員。主要從事機器學習、信息檢索、數據挖掘和計算廣告等領域的研究和開發。在國際頂級期刊和會議上發表相關論文40余篇,并持有30余項美國專利。主持研發的十余項創新技術已經被應用于必應搜索引擎、必應搜索廣告及微軟小冰等產品中。
張耿豪
博士畢業于美國加州大學伯克利分校,現任微軟(美國)搜索廣告部資深應用科學家。主要專注于機器學習、自然語言處理、信息檢索、人機界面等領域,并且在微軟負責必應搜索廣告業務及多項延伸的應用與研究,例如聊天機器人、以圖搜圖等。在國際頂級期刊和會議上發表相關論文20余篇,并持有3項美國專利。
葉 挺
碩士畢業于北京大學軟件工程研究所,現任微軟(美國)搜索廣告部工程師,主要從事深度學習算法的性能優化和分布式實現,成功將多個深度學習模型應用于必應的廣告服務中。在計算機會議KDD、ASE發表論文3篇,并取得發明專利3項。
前言

人工智能熱潮
人工智能已成為炙手可熱的名詞和話題,其范圍和影響力已經超越了學術研究和產業科技研究,成為一個社會性熱點。人工智能被廣泛認為是具有顛覆性的戰略技術領域,對未來的世界發展和社會進步有重大影響,是建設創新型國家和世界科技強國的重要支撐,各國也相繼發布關于人工智能的國家發展戰略和規劃。2017 年7 月,國務院發布了《新一代人工智能發展規劃》的精神和部署,對我國在人工智能基礎理論研究、核心技術、模型和算法、軟硬件支撐平臺、生態系統建設等方面規劃了藍圖。這進一步激起了學術界、工業界、政府等社會各方面人士對人工智能的關注、學習、研究和開發。
人工智能的引爆在很大程度上源自深度學習技術的突破,包括語音、視覺和決策規劃等領域。比如, 2012 年基于深度學習模型的AlexNet 首次奪得ImageNet 大規模視覺識別競賽(ILSVRC)的冠軍,之后所有這個競賽的優勝模型全部是基于深度學習的。2016 年3 月,DeepMind 基于深度強化學習模型的圍棋程序AlphaGo 戰勝圍棋世界冠軍李世石引起轟動,獲得廣泛關注,也敲響了人工智能在社會上熱潮開啟的晨鐘。隨即各個領域學習深度學習的興趣日漸高漲,深度學習模型、算法、框架、工具、軟硬件加速器等的研究和開發也如火如荼,在研究、科技和商業領域都獲得了迅猛發展。
機器學習發展路徑
大部分深度學習是基于深層神經元網絡的模型,屬于機器學習的一種。要學習深度學習,有必要了解機器學習的發展歷程。機器學習領域有很多流派,例如,強調“推理、知識、學習”的人工智能派和強調應用統計學的統計學派。
機器學習從提出、研究到發展,至今有六十多年了。這中間的研究人員有過很多方法論的嘗試,讓機器能夠像人一樣思考、判斷、預測。在這個過程中,不同的時期有不同的方法流行,而在另外一個時期又失去了吸引力,但后來可能又獲得新生。機器學習的發展過程可以用波浪式前進、螺旋式上升來概括。這也和每個時期的技術條件、研究水平、人們的認知水平,尤其是對人類大腦的了解,以及社會整體文明進步水平有關。
20 世紀80 年代初,機器學習研究主要集中在對知識的描述和表達、存儲,以及用知識庫進行推理方面。其中,用符號表示人工智能(symbolic AI)比較流行,它集中在高層次的、人類可理解的,對問題、邏輯和搜索的符號表達上,以及基于其上的規則系統的構建,最具代表性的是專家系統。但是專家系統的功能和性能遠遠達不到人們的期望,而且專家系統也沒有數學理論的支持,很難證明這種方法論的穩定性和正確性。
20 世紀90 年代后期,隨著Vapnik 統計學習理論的研究成熟,迎來了統計機器學習的黃金時期。此時出現眾多的統計學習模型,比如貝葉斯網絡、樸素貝葉斯、最大熵、支持向量機(Support Vector Machine,SVM)、決策樹(decisiontree),普遍使用的梯度提升決策樹(GBDT)、隨機森林(random forest)、矩陣分解模型等,可以說是百花齊放,在各種分類、回歸、聚簇問題上的準確性明顯提高。因此,在搜索、廣告、推薦等大量的互聯網場景下獲得了廣泛的應用。統計機器學習模型獲得成功的一個重要原因是它有穩固的統計學和最優化等數學理論的支撐,為機器學習研究和學習能力的提高提供了理論上的保證和方向上的指導。機器學習模型不是一個黑盒子,而是基于嚴格的數學計算,這非常重要。在整個21 世紀的第一個十年,都是統計機器學習的天下,但是這些統計機器學習模型往往需要領域專業人士和數據科學家做大量的特征工程( feature engineering)工作,設計有效的特征,才能輸入模型,得到滿意的效果。
在眾多統計學習模型中,人工神經網絡是一大類算法。人工神經網絡的發展同樣經歷了高潮低谷的交替起伏。在深度學習興起之前的約20 年時間里,由于計算能力和數據量的限制,人工神經網絡的有效訓練和學習往往只能停留在淺層次的小規模神經網絡上,限制了其學習性能。此外,人工神經網絡學習得到的模型也缺乏直觀的可解釋性。這些因素使得人工神經網絡逐漸失去了吸引力。
近年來,由于大數據的發展,大量可用數據產生,以及計算能力的不斷提升,神經網絡卷土重來。同時,改善的模型結構及訓練算法的提高,使深度學習得到了爆發,尤其是直接應用在一些做特征工程非常困難的原始數據的場景下,性能有突破性的進展,包括語音識別、圖像理解、自然語言處理 (NLP)、機器翻譯等,都取得了顯著的改進。
本書的初衷
人工智能熱激發了大家對深度學習的學習興趣,但是目前的一些深度學習書籍要么是面向學校和機器學習的研究人員,重理論、少實踐且不夠實用;要么只是對一些深度學習框架和工具的介紹和翻譯,而沒有比較全面的深度學習模型的講解、具體應用的實例及實際使用中經驗和注意事項的分享。本書的作者都是在微軟人工智能及研究院的研究人員和應用科學家,具有深厚的機器學習背景,在一線針對產品需求和支持的場景進行了大量的深度學習模型及算法的研究和開發,在模型設計、訓練、評估、部署、推理優化等模型開發全生命周期積累了豐富的經驗。
本書面向的讀者是希望學習和運用深度學習模型到具體應用場景的企業工程師、科研院所的學生和科研人員。他們的目的不是找一本教科書從學術角度學習深度學習,像深度學習研究人員一樣設計新的模型和算法,而是對深度學習模型和算法做一個基礎了解后,快速部署到他們的工作領域,并取得落地成果。這正是我們寫作本書的初衷和希望有所貢獻的地方:讓讀者“打基礎、讀得懂、用得快、重實踐、重應用”,重點是建立起分析問題、對問題形式化和應用深度學習建模、使用工具實現模型訓練和推理、在實際中需要考慮的約束限制、進行取舍和工程調優等一系列的方法論,從而獲得能舉一反三解決新的問題的能力。
本書內容定位
基于這個寫作目的,在講解基礎的前提下,側重在實際應用中讓讀者快速掌握基于深度學習模型的系統開發,本書的內容覆蓋以下幾個部分。
第1 部分(第1、2 章)講解深度學習的現狀、概念和實現工具。
第2 部分(第3~5 章)介紹深度學習在自然語言處理、計算機視覺、預測等應用中常見模型的舉例及實現,包括自然語言處理中的詞嵌入向量模型;圖像理解中普遍使用的卷積神經網絡(CNN)及其在物體檢測(object detection)方面的應用;應用于機器翻譯的遞歸神經網絡模型(RNN)和長短期記憶模型(LSTM)。
第3 部分(第6~12 章)介紹學術界和工業界最新的一些高階深度學習模型和實現,以及它們在互聯網搜索、廣告、對話機器人、電商等領域的應用,包括:用于對話機器人的DeepProbe 模型;用于單張照片產品識別和屬性生成的VPR模型;用于信息檢索和語義向量生成的DeepIntent 模型;用于文本語義嵌入和匹配的fastText 模型;生成對抗網絡(GAN),以及在圖像生成和自然語言處理中的應用;強化學習模型的模型結構、訓練算法和應用。這些模型和實現都已經應用在微軟的眾多產品中,并獲得了很好的效果。
第4 部分(第13 章)是討論及展望,包括模型在線推理的優化及硬件加速的實現等。最后對目前深度學習技術的局限性做出分析,對其發展方向和下一個浪潮進行展望。
本書學習建議
我們建議讀者按順序閱讀本書第1 部分和第2 部分,它們是本書的基礎,難度由淺入深。學習了第1 部分深度學習理論和常用工具后,再學習第2 部分常見的深度學習模型。在學習過程中要配合實踐,使用介紹的工具在一些實驗數據集和示例問題上完成深度學習模型的訓練及性能評估,掌握模型開發流程中的數據準備、訓練、調試超參、評估、部署等全部步驟。第3 部分是進階內容,講解一些應用于計算機視覺、自然語言處理及理解和決策任務的高級深度學習模型,各章節之間相互獨立,內容沒有前后依托關系,讀者可以根據自己的興趣和背景選擇閱讀。深度學習是一門實驗科學,要在理論基礎上結合應用大量進行實踐,才能真正掌握并解決實際問題。
深度學習技術發展迅猛,新的模型、算法、工具、流程不斷涌現,在傳統互聯網領域及各個行業的應用層出不窮,新的問題、新的解決方案也持續被提出。本書難以對深度學習各個層面做出全面深入的描述,一些最新的模型和應用也許沒有包括進來。本書如能對讀者學習深度學習模型、算法、實踐和應用有所幫助,并在實踐中產生加速和推動作用,那就達到了我們的目的。
由于本書作者水平、理解能力、經驗和表達能力所限,一些錯誤、不足之處在所難免,懇請各位讀者指正。
張若非
2019 年7 月于美國硅谷山景城

目錄

目錄

第1 章
神經網絡發展史 / 1
1.1 神經網絡的早期雛形 / 3
1.1.1 聯結主義和Hebb 學習規則 / 4
1.1.2 Oja 學習規則及主分量分析 / 5
1.1.3 早期的神經元模型 / 5
1.2 現代神經網絡 / 6
1.2.1 反向傳播算法 / 6
1.2.2 神經網絡的通用函數近似性 / 8
1.2.3 深度的必要性 / 9
1.3 深度學習發展歷史中的重要神經網絡 / 10
1.3.1 深度神經網絡的興起 / 10
1.3.2 自組織特征映射 / 10
1.3.3 霍普菲爾德神經網絡 / 11
1.3.4 玻爾茲曼機及受限玻爾茲曼機 / 12
1.3.5 深度信念網 / 14
1.3.6 其他深度神經網絡 / 15
1.4 本章小結 / 15
參考文獻 / 16
第2 章
深度學習開源框架 / 17
2.1 主流的深度學習開源框架 / 18
2.2 簡單神經網絡模型在不同框架上的實現對比 / 29
2.3 本章小結 / 44
參考文獻 / 45
第3 章
多層感知機在自然語言處理方面的應用 / 46
3.1 詞和文本模型的發展歷程 / 47
3.2 Word2Vec 模型:基于上下文的分布式表達 / 49
3.2.1 Skip-Gram 算法的訓練流程 / 50
3.2.2 Skip-Gram 算法的網絡結構 / 53
3.2.3 代價函數 / 54
3.3 應用TensorFlow 實現Word2Vec 模型 / 58
3.3.1 定義計算圖:訓練語料庫預處理 / 60
3.3.2 模型計算圖的實現 / 63
3.4 Word2Vec 模型的局限及改進 / 66
3.5 本章小結 / 67
參考文獻 / 68
第4 章
卷積神經網絡在圖像分類中的應用 / 69
4.1 圖像識別和圖像分類的發展 / 72
4.2 AlexNet / 73
4.2.1 網絡模型結構 / 74
4.2.2 AlexNet 的具體改進 / 79
4.2.3 代價函數 / 83
4.3 應用TensorFlow 實現AlexNet / 83
4.3.1 讀取訓練圖像集 / 83
4.3.2 模型計算圖的實現 / 84
4.4 本章小結 / 85
參考文獻 / 86
第5 章
遞歸神經網絡 / 87
5.1 遞歸神經網絡應用背景介紹 / 88
5.2 遞歸神經網絡模型介紹 / 89
5.2.1 遞歸神經網絡模型結構 / 89
5.2.2 雙向遞歸神經網絡 / 90
5.2.3 長短期記憶模型 / 91
5.3 遞歸神經網絡展望 / 94
5.4 本章小結 / 95
參考文獻 / 95
第6 章
DeepIntent 模型在信息檢索領域的應用 / 96
6.1 信息檢索在搜索廣告中的應用發展 / 97
6.2 含有注意力機制的RNN 模型 / 99
6.2.1 網絡模型結構 / 100
6.2.2 代價函數 / 104
6.3 應用TensorFlow 實現DeepIntent 模型 / 107
6.3.1 定義計算圖 / 107
6.3.2 定義代價函數及優化算法 / 114
6.3.3 執行計算圖進行訓練 / 118
6.4 本章小結 / 119
參考文獻 / 120
第7 章
圖像識別及在廣告搜索方面的應用 / 121
7.1 視覺搜索 / 122
7.2 方法和系統 / 124
7.2.1 圖像DNN 編碼器 / 124
7.2.2 利用Rich-CDSSM 降低維度 / 125
7.2.3 快速最近鄰搜索系統 / 127
7.2.4 精密層 / 127
7.2.5 端到端服務系統 / 128
7.3 評測 / 129
7.4 用于演示的Visual Shopping Assistant 應用程序 / 131
7.5 相關工作 / 132
7.6 本章小結 / 133
第8 章
Seq2Seq 模型在聊天機器人中的應用 / 134
8.1 Seq2Seq 模型應用背景 / 135
8.2 Seq2Seq 模型的應用方法 / 136
8.3 含有注意力機制的多層Seq2Seq 模型 / 137
8.3.1 詞嵌入層 / 137
8.3.2 可變深度LSTM 遞歸層 / 138
8.3.3 注意力機制層 / 139
8.3.4 投影層 / 139
8.3.5 損失函數(loss function)和端到端訓練 / 140
8.4 信息導向的自適應序列采樣 / 142
8.5 多輪項目推薦 / 143
8.6 熵作為信心的度量 / 143
8.6.1 直觀的定義和討論 / 143
8.6.2 序列后驗估計的不確定性 / 145
8.6.3 信息導向的抽樣:最大化預期信息增益的原則 / 145
8.6.4 Seq2Seq 模型的3 個應用程序 / 146
8.6.5 應用程序1:查詢理解和重寫 / 147
8.6.6 應用程序2:相關性評分 / 152
8.6.7 應用程序3:聊天機器人 / 156
8.7 本章小結 / 160
參考文獻 / 160
第9 章
word2vec 的改進:fastText 模型 / 162
9.1 fastText 模型的原理 / 163
9.1.1 回顧Skip-Gram 算法 / 163
9.1.2 subword 模型 / 164
9.1.3 subword 形態 / 167
9.1.4 分層softmax / 168
9.1.5 fastText 的模型架構 / 170
9.1.6 fastText 算法實現 / 171
9.2 應用場景:搜索廣告中的查詢詞關鍵詞匹配問題 / 172
9.3 本章小結 / 173
參考文獻 / 174
第10 章
生成對抗網絡 / 175
10.1 生成對抗網絡的原理 / 176
10.1.1 GAN 的基本模型 / 176
10.1.2 GAN 優化目標的原理 / 178
10.1.3 GAN 的訓練 / 179
10.1.4 GAN 的擴展模型 / 180
10.2 應用場景:搜索廣告中由查詢詞直接生成關鍵詞 / 182
10.2.1 生成模型的構建 / 182
10.2.2 判別模型的構建 / 184
10.2.3 條件生成對抗網絡的構建 / 185
10.3 本章小結 / 186
參考文獻 / 187
第11 章
深度強化學習 / 188
11.1 深度強化學習的原理 / 189
11.1.1 強化學習的基本概念 / 189
11.1.2 馬爾可夫決策過程 / 191
11.1.3 價值函數和貝爾曼方程 / 192
11.1.4 策略迭代和值迭代 / 194
11.1.5 Q-Learning / 196
11.1.6 深度Q 網絡 / 198
11.1.7 策略梯度 / 201
11.1.8 動作評價網絡 / 202
11.2 應用場景:基于深度強化學習的推薦系統 / 203
11.3 本章小結 / 206
參考文獻 / 206
第12 章
工程實踐和線上優化 / 208
12.1 Seq2Seq 模型介紹 / 209
12.2 LSTM 優化分析 / 211
12.2.1 優化一:指數運算的近似展開 / 214
12.2.2 優化二:矩陣運算的執行速度優化 / 218
12.2.3 優化三:多線程并行處理 / 224
12.3 優化應用實例:RapidScorer 算法對GBDT 的加速 / 227
12.3.1 背景介紹 / 228
12.3.2 RapidScorer 數據結構設計 / 231
12.3.3 RapidScorer 矢量化 / 233
12.3.4 RapidScorer 實驗結果 / 237
12.4 本章小結 / 238
參考文獻 / 239
第13 章
深度學習的下一個浪潮 / 240
13.1 深度學習的探索方向展望 / 241
13.1.1 設計更好的生成模型 / 241
13.1.2 深度強化學習的發展 / 241
13.1.3 半監督學習與深度學習 / 242
13.1.4 深度學習自身的學習 / 242
13.1.5 遷移學習與深度學習的結合 / 242
13.1.6 用于推理的深度學習 / 243
13.1.7 深度學習工具的標準化 / 243
13.2 深度學習的應用場景展望 / 243
13.2.1 醫療健康領域 / 243
13.2.2 安全隱私領域 / 248
13.2.3 城市治理領域 / 249
13.2.4 藝術創作領域 / 250
13.2.5 金融保險領域 / 252
13.2.6 無人服務領域 / 254
13.3 本章小結 / 257
參考文獻 / 258__

讀者評論

相關博文

0k000澳客网竞彩