機器學習互聯網業務安全實踐
  • 推薦0
  • 收藏0
  • 瀏覽75

機器學習互聯網業務安全實踐

王帥 , 吳哲夫 (作者) 

  • 書  號:9787121355684
  • 出版日期:2019-09-01
  • 頁  數:
  • 開  本:
  • 出版狀態:上市銷售
  • 維護人:張春雨

相關圖書

實戰深度學習算法:零起點通關神經網絡模型(基于Python和NumPy實現)

徐彬 (作者)

深度學習是機器學習的重要分支。本書系統地介紹了如何用 Python 和 NumPy 一步步地實現深度學習的基礎模型,無須借助 TensorFlow、PyTorc...

 

知識圖譜:方法、實踐與應用

陳華鈞 王昊奮 漆桂林 (作者)

知識圖譜是較為典型的多學科交叉領域,涉及知識工程、自然語言處理、機器學習、圖數據庫等多個領域。本書系統地介紹知識圖譜涉及的關鍵技術,如知識建模、關系抽取、圖存儲...

 

深度學習之TensorFlow工程化項目實戰

李金洪 (作者)

這是一本非常全面的、專注于實戰的AI 圖書,兼容TensorFlow 1.x 和2.x 版本,共75 個實例。 全書共分為5 篇:第1 篇,介紹了學習準備、搭...

 

OpenCV輕松入門:面向python

李立宗 (作者)

本書基于面向 Python 的 OpenCV(OpenCV for Python),介紹了圖像處理的方方面面。本書以 OpenCV 官方文檔的知識脈絡為主線,并...

 

聊天機器人:對話式體驗產品設計

Amir Shevat (作者) 淘寶(中國)軟件有限公司 (譯者)

從亞馬遜的Alexa語音助手到蘋果的Siri,從Slack的聊天機器人到短信和電子郵件機器人,我們越來越依賴于軟件驅動的聊天應用。在這本實用指南中,作者Amir...

¥65.00

自然語言處理實踐:聊天機器人技術原理與應用

王昊奮 等 (作者)

聊天機器人作為人工智能技術的殺手級應用,發展得如火如荼,各種智能硬件層出不窮。《自然語言處理實踐:聊天機器人技術原理與應用》系統地闡述了聊天機器人的分類和關鍵技...

¥39.00
互聯網產業正在從IT時代邁入DT時代(數據時代),同時互聯網產業的繁榮也催生了黑灰產這樣的群體。那么,在數據時代應該如何應對互聯網業務安全威脅?機器學習技術在互聯網業務安全領域的應用正是答案。本書首先從機器學習技術的原理入手,自成體系地介紹了機器學習的基礎知識,從數學的角度揭示了算法模型背后的基本原理;然后介紹了互聯網業務安全所涉及的重要業務場景,以及機器學習技術在這些場景中的應用實踐;最后介紹了如何應用互聯網技術棧來建設業務安全技術架構。作者根據多年的一線互聯網公司從業經驗給出了很多獨到的見解,供讀者參考。本書既適合機器學習從業者作為入門參考書,也適合互聯網業務安全從業者學習黑灰產對抗手段,幫助他們做到知己知彼,了解如何應用機器學習技術來提高與黑灰產對抗的能力。
1、機器學習技術在業務安全中的快速入門指南;
2、以案例地形式生動展現了互聯網業務面臨的安全威脅以及如何利用機器學習技術與之對抗。


王帥,花名“蓮華”,美麗聯合集團(蘑菇街)安全部風控算法技術負責人。2015年初加入蘑菇街,主要負責風控相關的反作弊算法,從無到有搭建了電商平臺的風控策略架構體系,主要研究方向是基于機器學習的風控算法策略。

吳哲夫,本科就讀于山東大學,研究生就讀于北京大學,曾在微軟亞洲研究院實習,畢業后就職于阿里巴巴(北京),現供職于美麗聯合集團。
機器學習學科的發展大體經歷了規則學習、統計學習、深度學習這三大階段。從最早的結構化的人機賽棋,到廣泛領域的知識問答,再到當下紅極一時的自動駕駛等工業領域,機器學習已經被成功應用到模式識別、數據挖掘、自然語言處理、人工智能、語音識別、圖像識別等各個領域,并且被綜合應用到信息檢索、生物信息技術、自動駕駛、無人機、AR/VR、醫療、教育等各個行業。

機器學習的很多方法在原理上是相通的,只不過適用的領域不同。機器學習的能力比較強大,應用范圍廣泛,要解決的問題多且繁雜,因此并不存在一個適用于所有問題的結構化方法。這就要求機器學習工程師具備較高的素質,除了掌握計算機科學基礎的三個方面的知識(系統、軟件、理論),還要對機器學習算法有深入的了解,只有這樣才可以搭建出一個適用于工業界應用的好框架。

基礎決定深度。一般來講,機器學習由模型(建模)、策略(學習方法)、算法(實現)三部分組成,叫作機器學習三要素。這三部分層層遞進,推理的難度逐漸增加,對人的要求也不一樣:在建模過程中需要有理解能力,在設計學習方法時需要有數學推理能力,最終將學習方法實現為算法時需要有轉化能力。當然,一些資深的程序員或者ACM(Association for Computing Machinery)競賽的參賽者,本身有非常強的代碼理解能力,這些能力能幫助他們理解算法,并進一步理解機器學習的過程。

要想成為一名優秀的機器學習工程師,必須有良好的數學基礎。在本科階段學習的數值分析、線性代數、概率與統計、離散數學等課程知識,對于理解大多數模型來說已經足夠了。概率與統計及離散數學是理解模型的基礎,線性代數決定了你實現算法的能力,數值分析決定了推衍過程。

目錄

第1章 互聯網業務安全簡述 1
1.1 互聯網業務安全現狀 1
1.2 如何應對挑戰 4
1.3 本章小結 6
參考資料 6
第2章 機器學習入門 8
2.1 相似性 9
2.1.1 范數 9
2.1.2 度量 12
2.2 矩陣 20
2.2.1 線性空間 20
2.2.2 線性算子 24
2.3 空間 33
2.3.1 內積空間 33
2.3.2 歐幾里得空間(Euclid space) 34
2.3.3 酉空間 37
2.3.4 賦范線性空間 38
2.3.5 巴拿赫空間 39
2.3.6 希爾伯特空間 43
2.3.7 核函數 44
2.4 機器學習中的數學結構 46
2.4.1 線性結構與非線性結構 46
2.4.2 圖論基礎 47
2.4.3 樹 56
2.4.4 神經網絡 62
2.4.5 深度網絡結構 80
2.4.6 小結 95
2.5 統計基礎 96
2.5.1 貝葉斯統計 96
2.5.2 共軛先驗分布 99
2.6 策略與算法 106
2.6.1 凸優化的基本概念 106
2.6.2 對偶原理 120
2.6.3 非線性規劃問題的解決方法 129
2.6.4 無約束問題的最優化方法 134
2.7 機器學習算法應用的經驗 145
2.7.1 如何定義機器學習目標 145
2.7.2 如何從數據中獲取最有價值的信息 149
2.7.3 評估模型的表現 154
2.7.4 測試效果遠差于預期怎么辦 156
2.8 本章小結 159
參考資料 160
第3章 模型 163
3.1 基本概念 163
3.2 模型評價指標 166
3.2.1 混淆矩陣 167
3.2.2 分類問題的基礎指標 167
3.2.3 ROC曲線與AUC 171
3.2.4 基尼系數 173
3.2.5 回歸問題的評價指標 175
3.2.6 交叉驗證 175
3.3 回歸算法 177
3.3.1 最小二乘法 177
3.3.2 脊回歸 181
3.3.3 Lasso回歸線性模型 181
3.3.4 多任務Lasso 181
3.3.5 L1、L2正則雜談 182
3.4 分類算法 183
3.4.1 CART算法 183
3.4.2 支持向量機 186
3.5 降維 188
3.5.1 貝葉斯網絡 189
3.5.2 主成分分析 195
3.6 主題模型LDA 198
3.6.1 馬爾可夫鏈蒙特卡羅法 198
3.6.2 貝葉斯網絡與生成模型 199
3.6.3 學習方法在LDA中的應用 206
3.7 集成學習方法(Ensemble Method) 215
3.7.1 Boosting方法 216
3.7.2 Bootstrap Aggregating方法 220
3.7.3 Stacking方法 221
3.7.4 小結 222
參考資料 223
第4章 機器學習實踐的基礎包 226
4.1 簡介 226
4.2 Python機器學習基礎環境 228
4.2.1 Jupyter Notebook 228
4.2.2 Numpy、Scipy、Matplotlib和pandas 231
4.2.3 scikit-learn、gensim、TensorFlow和Keras 250
4.3 Scala的基礎庫 266
4.3.1 Zeppelin 266
4.3.2 Breeze 267
4.3.3 Spark MLlib 276
4.4 本章小結 281
參考資料 282
第5章 機器學習實踐的金剛鉆 283
5.1 簡介 283
5.2 XGBoost 284
5.3 Prediction IO(PIO) 287
5.3.1 部署PIO 287
5.3.2 機器學習模型引擎的開發 294
5.3.3 機器學習模型引擎的部署 296
5.3.4 PIO系統的優化 297
5.4 Caffe 298
5.5 TensorFlow 304
5.6 BigDL 306
5.7 本章小結 308
參考資料 308
第6章 賬戶業務安全 310
6.1 背景介紹 310
6.2 賬戶安全保障 312
6.2.1 注冊環節 312
6.2.2 登錄環節 314
6.3 聚類算法在賬戶安全中的應用 315
6.3.1 K-Means算法 315
6.3.2 高斯混合模型(GMM) 317
6.3.3 OPTICS算法和DBSCAN算法 326
6.3.4 應用案例 331
6.4 本章小結 334
參考資料 334
第7章 平臺業務安全 335
7.1 背景介紹 335
7.2 電商平臺業務安全 338
7.3 社交平臺業務安全 343
7.4 復雜網絡算法在平臺業務安全中的應用 346
7.4.1 在電商平臺作弊團伙識別中的應用 346
7.4.2 在識別虛假社交關系中的應用 351
7.5 本章小結 353
參考資料 354
第8章 內容業務安全 355
8.1 背景介紹 355
8.2 如何做好內容業務安全工作 357
8.2.1 面臨的挑戰 357
8.2.2 部門協作 358
8.2.3 技術體系 359
8.3 卷積神經網絡在內容業務安全中的應用 361
8.3.1 人工神經網絡(Artificial Neural Network) 361
8.3.2 深度神經網絡(Deep Neural Network) 367
8.3.3 卷積神經網絡(Convolutional Neural Network) 379
8.3.4 應用案例 392
8.4 本章小結 405
參考資料 405
第9章 信息業務安全 406
9.1 背景介紹 406
9.2 反欺詐業務 407
9.3 反爬蟲業務 412
9.3.1 驗證問題的可分性 412
9.3.2 提升模型效果 413
9.4 循環神經網絡在信息安全中的應用 414
9.4.1 原始RNN(Vanilla RNN) 414
9.4.2 LSTM算法及其變種 415
9.4.3 應用案例 419
9.5 本章小結 429
參考資料 430

第10章 信貸業務安全 432
10.1 背景介紹 432
10.2 信貸業務安全簡介 434
10.3 分類算法在信貸業務安全中的應用 438
10.3.1 典型分類算法的介紹 438
10.3.2 應用案例:邏輯回歸模型在信貸中風控階段的應用 463
10.4 本章小結 468
參考資料 469
第11章 業務安全系統技術架構 470
11.1 整體介紹 470
11.2 平臺層 471
11.3 數據層 473
11.4 策略層 474
11.5 服務層 480
11.6 業務層 481
11.7 本章小結 484
參考資料 484
第12章 總結與展望 486
12.1 總結 486
12.2 展望 487
參考資料 489
后記一 490
后記二 491
本書常見數學符號定義 492

讀者評論

0k000澳客网竞彩