博客來精選推薦Python+Spark 2.0+Hadoop機器學習與大數據分析實戰



博客來旅遊好書

Python+Spark 2.0+Hadoop機器學習與大數據分析實戰





Python+Spark 2.0+Hadoop機器學習與大數據分析實戰 評價



網友滿意度:



努力努力~~ 就算上班只有領死薪水

但是加值自己另一個實在的方式就是讀書了!!

當然還有很多原因是為了要考試啦XD

雖然讀書考試真的很辛苦,

只要一想到未來還有機會

可以參與外派的工作

我就又有鬥志了!!!

跟大家推薦讀來相當上手的

Python+Spark 2.0+Hadoop機器學習與大數據分析實戰

整體的編輯跟內容相當清楚豐富~

推薦給想進修努力的大家噢!

一起加油吧!!



小鴨 博客來e-coupon傳送門

Python+Spark 2.0+Hadoop機器學習與大數據分析實戰



本週熱銷商品:





SAMSUNG GALAXY Series 完全進化







HTC Butterfly活用術 制霸秘技300招







商品訊息功能:

商品訊息描述:

◆本書淺顯易懂的原理說明

◆Step by Step實機操作

◆範例程式詳細解說

◆大幅降低機器學習與大數據技術的學習門檻


機器學習正熱門

機器學習是近20多年興起的多領域學科,機器學習演算法可從大量數據中建立模型,並利用模型對未知數據進行預測。近年來各大公司google、 facebook、microsoft、IBM…等,全力投入機器學習研究與應用,以Google為例,Google早已將機器學習,運用在垃圾郵件判 斷、自動回覆、照片分類與搜尋、翻譯、語音辨識等功能。在你在不知不覺中,機器學習已經讓日常生活更便利。

「大數據」與「機器學習」相輔相成

大數據的特性: 大量資料、多樣化、速度快。因此如何從大量資料中擷取出有用的資訊,是大數據的主要課題。機器學習需要大量資料進行訓練,並且訓練過程需大量運算。正好大 數據的興起帶來大量資料,以及可儲存大量數據的分散式儲存技術,例如:Hadoop HDFS、NoSQL..。還有分散式運算可進行大量運算,例如Spark 基於記憶體內的分散式運算框架,可以大幅提升效能。

Python與Spark與Hadoop的完美結合

本書的主題是Python+Spark+Hadoop機器學習與大數據分析:使用Python開發Spark應用程式,具有多重好處,既可以享有 Python語言特性所帶來的好處:程式碼簡明、易學習、高生產力的特質。再加上Spark基於記憶體內的分散式運算框架,非常適合需多次重覆運算的機器 學習演算法,可以大幅提升效能。Spark可輕易讀取Hadoop分散式儲存技術HDFS。Spark也可以在Hadoop 新MapReduce架構YARN執行。

Python與Spark機器學習與資料視覺化

Python資料分析的相 關模組如NumPy、Matplotlib、Pandas、Scikit-learn,讓Python成為資料分析主要語言之一。使用Python開發 Spark機器學習應用時,你仍然可以繼續使用這些模組,這對於Python開發者帶來很大的方便,例如:你可以使用Spark ML Pipeline機器學習、訓練、預測。並且可以將Spark DataFrames轉換為Pandas DataFrame。轉換後你就可以運用Python豐富的資料視覺化套件,例如matplotlib、Bokeh…等,進行資料視覺化。

本書特色

實機操作建置Sp台中水晶店ark+Hadoop機器學習與大數據平台

一般人學習大數據的困難是,沒有多台機器建立分散式系統,但是透過本書介紹使用Virtual Box虛擬機器的方法,就能在自家電腦演練建立Hadoop叢集,並且建立Python Spark機器學習開發環境。

以實務範例程式學會Python+Spark機器學習與大數據

以 大數據實務案例MovieLens(電影喜好推薦引擎)、StumbleUpon (網頁二元分類)、Covtype(森林覆蓋多元分類),BikeSharing(類Ubike租借數量迴歸分析),介紹如何使用Python Spark運用機器學習演算法:決策樹、邏輯迴歸、支持向量機器SVM、單純貝氏。進行資料處理、訓練、建立模型、訓練驗證找出最佳模型、預測結果。

?

商品訊息簡述:

  • 出版社:博碩

    新功能介紹
  • 出版日期:2016/10/04
  • 語言:繁體中文


Python+Spark 2.0+Hadoop機器學習與大數據分析實戰





arrow
arrow

    ksl94rr61a 發表在 痞客邦 留言(0) 人氣()