實戰機器學習|使用Spark

實戰機器學習|使用Spark

作者:江良志, 出版社:碁峰出版, 出版日期:2018-05-28

定價 620 元, 最低 369 元起... TAAZE * 讀冊生活 (電子書)大學簡體電腦書店iRead 灰熊愛讀書 完整列出比價資訊...

商品條碼:9789864767731, ISBN:9864767739
分類標籤:中文書 » 電腦 » 程式語言 » 程式設計 » 中文電子書

 

內容簡介

實戰機器學習|使用Spark
學習熱門的機器學習演算法
本書介紹熱門的機器學習演算法及其實作方式。你將會了解如何在Spark ML這套開發框架之內,實作各種機器學習概念。首先,我們會帶你在單一節點與多重節點的運算叢集上,完成Spark的安裝工作;接著,說明如何執行以Scala和Python語言撰寫的Spark ML程式;然後以幾套資料集為範例,深入探索分群、分類與迴歸;最後,利用Spark ML來處理文字資料。

打造可以應用於工作中的機器學習程式
弄懂概念之後,便可運用來實作演算法,可能是從頭開始,或是將既有的系統轉移到這個新平台,像是從Mahout或Scikit轉移到Spark ML。當你讀完本書之時,應該能夠善加運用Spark,打造可以應用於工作中的機器學習程式。

本書將帶您:
.實際動手嘗試最新版的Spark ML
.以Scala與Python語言撰寫Spark程式
.在本機以及Amazon ECS雲端平台上,安裝並設置Spark開發環境
.取用公開的機器學習資料集,使用Spark進行資料的載入、處理、清理與轉換等動作
.處理巨量的文字資料,包括特徵萃取,並使用文字資料作為輸入餵給機器學習模型
.撰寫Spark函式,評估機器學習模型的表現能力
商品簡介由 iRead 灰熊愛讀書 所提供

相關書籍