Home > Information
Check-outs :

Spark大数据处理:原理、算法与实例

  • Hit:79
  • Rating:0
  • Review:0
  • Trackback:0
  • Email:0


轉寄 列印
第1級人氣樹(0)
人氣指樹
  • keepsite
  • Introduction
  • Collection(0)
  • Review(0)
  • Rating(0)

本書以時下最為流行的Hadoop所存在的缺陷為出發點,深入淺出地介紹了下一代大數據處理核心技術Spark的優勢和必要性,並以最簡潔的指引步驟展示了如何在10分鍾內建立一個Spark大數據處理環境。在此基礎上,本書以圖文並茂和豐富的示例代碼講解的形式系統性地揭示了Spark的運行原理、算子使用、算法設計和優化手段,為讀者提供了一個快速由淺入深掌握Spark基礎能力和高級技巧的參考書籍。本書共六章,涉及的主題主要包括大數據處理技術從Hadoop發展到Spark的必然性、快速體驗Spark的指引、Spark架構和原理、RDD算子使用方法和示例、Spark算法設計實例、Spark程序優化方法。本書適合需要使用Spark進行大數據處理的程序員、架構師和產品經理作為技術參考和培訓資料,亦可作為高校研究生和本科生教材。劉軍,男,1976年生人,博士,副教授,碩士生導師,北京郵電大學數據科學中心主任。2003年至2007年任職於IBM中國研究院,擔任高級研究員及部門經理,建立IBM中國研究院電信融合網絡管理研究方向,主持研發Websphere及Tivoli電信產品線中多項關鍵技術,期間發表多篇國際會議及刊物論文,並申請獲得多項美國專利。2007年至2012年創辦歡城(北京)科技有限公司,開創中國無端網絡游戲產業,並擔任中國軟件協會網頁游戲專業委員會委員。公司產品多次榮獲國內互聯網業界獎項,2008年獲中國互聯網協會「最具運營價值Webgame」獎項, 2012年至今在北京郵電大學信息與通信工程學院任教,研究方向為電信及互聯網大數據分析、高速數據流挖掘算法,並牽頭組建北京郵電大學數據科學中心。開設研究生課程《海量數據處理中的雲計算》,發表大數據分析相關SCI/EI檢索論文十余篇,並獨著《Hadoop大數據處理》一書,該書被哈工大、中南大學等多所高校的相關課程作為教材使用。

Please login for this service.
Please login for this service.
Please login for this service.
Please login for this service.