阿里巴巴集團內部使用,效果顯著 大數據的統計計算是進行資料探索和分析採擷的基礎。在實際應用中會遇到兩個問題:一個是需要使用多少資源;另一個是計算時間,它關係到資料探索分析的效率和效果。人們都希望花更少的錢,並且希望計算時間更短,但對於某個確定的計算過程,它們是成反比的。 本書作者從統計計算的演算法入手,重構其計算過程,從而同時降低資源使用量和計算時間。作者提出一套完整的關於大數據統計的計算理論,包括常用的各種統計量和統計方法,開發的資料分析工具已經在阿里巴巴集團內部的多個部門使用,並取得顯著效果。專家推薦 本書提出了一套適合於分散式運算的統計計算方法,透過對一些基礎統計量的計算,可獲得有關資料集更全面的統計資訊,進而可以進行進階的統計分析,例如,區間估計、線性回歸、主成分分析等。可以說,本書從統計計算的角度,整理出一套對大數據分析有實用價值的統計理論,並形成參考程式。-潘愛民 阿里雲首席架構師 相信大多數從事數值計算的技術人員都讀過一系列叫作Numerical Recipe in C/Fortran/Java 的書。眼前這本書或許可以叫作Numerical Statistics Recipes in Java,和那個系列一樣,對重新快速學習和使用數值統計演算法來實現資料分析應用的讀者來說,這本書是一本不錯的入門手冊。-何萬青 博士 英特爾技術計算集團技術計算架構師
Splunk实践指南
不懂程式也能學會的大數據分析術:使用 ...
数据架构:大数据、数据仓库以及Dat ...
标准大数据实践
資料探勘:概念與方法
圖解資料庫
資料探勘:程序與模式:使用Excel ...
DT时代:从“互联网+”到“大数据× ...
東京大学のデータサイエンティスト育成 ...
東京大學資料科學家養成全書:使用Py ...
社群大數據:網路口碑及輿情分析
大数据是这样计算的:XLab实例入门
重构大数据统计
大数据技术全解:基础、设计、开发与实 ...
R语言与数据挖掘最佳实践和经典案例
大數據時代
大数据时代的历史机遇:产业变革与数据 ...
大数据:技术与应用实践指南
大数据技术概论
Flume:构建高可用、可扩展的海量 ...
地図や案内図のつくり方
管理海量数据:压缩、索引和查询(經典 ...