Apache Spark? 是一個(gè)快速的, 用于海量數(shù)據(jù)處理的通用引擎.
官方網(wǎng)址: http://spark.apache.org
中文文檔: http://spark.apachecn.org
花了大概兩周左右的時(shí)間饺谬,在原來(lái) Spark 2.0.2 中文文檔 版本的基礎(chǔ)上,終于迭代出該 Spark 2.2.0 中文文檔 的版本了钝计。
衷心感謝每一位貢獻(xiàn)者谓谦,感謝 ApacheCN 讓我們聚在一起奮斗熬拒,我們一直在努力 矗愧。御吞。儿子。
網(wǎng)址: http://spark.apachecn.org/docs/cn/2.2.0
github: https://github.com/apachecn/spark-doc-zh (如果覺(jué)得不錯(cuò)瓦哎,請(qǐng)各位大佬們給個(gè) star)
貢獻(xiàn)者: https://github.com/apachecn/spark-doc-zh#貢獻(xiàn)者
建議反饋: https://github.com/apachecn/spark-doc-zh#聯(lián)系方式
以下是 Spark 2.2.0 中文文檔 的目錄索引:
Apache Spark 2.2.0 官方文檔中文版
概述
編程指南
快速入門(mén)
Spark 編程指南
Spark Streaming 編程指南
DataFrames, DataSets 和 SQL
Structured Streaming 編程指南
MLib(機(jī)器學(xué)習(xí)) - 該版本暫時(shí)還未計(jì)劃翻譯這些,如果需要閱讀柔逼,請(qǐng)參閱 2.0.2 的中文文檔的 MLib(機(jī)器學(xué)習(xí)) 部分蒋譬。
GraphX(圖形處理)
Spark(R on Spark)
部署
集群概述
提交應(yīng)用
Spark Standalone
Spark On Mesos
Spark On YARN
更多
配置
監(jiān)控
優(yōu)化指南
Job 調(diào)度
安全性
硬件推薦
構(gòu)建 Spark
其它中文文檔:
TensorFlow R1.2 中文文檔
sklearn 0.18 中文文檔
Spark 2.2.0 中文文檔
Spark 2.0.2 中文文檔
Kudu 1.4.0 中文文檔
Zeppelin 0.7.2 中文文檔
Elasticsearch 5.4 中文文檔
Kibana 5.2 中文文檔
關(guān)于學(xué)習(xí) Spark 的部分,英文好點(diǎn)的話愉适,跟著 Spark 官方文檔的英文版走就行了犯助。
如果英語(yǔ)不是很好,可以閱讀下由 ApacheCN 組織翻譯的 Spark 2.2.0 官方文檔中文版维咸。
從概述開(kāi)始剂买,然后編程指南的快速入門(mén),Spark 編程指南癌蓖,Spark streaming 一步一步往下走瞬哼。
文檔中附帶了一些基礎(chǔ)的案例,也附帶了相應(yīng)的代碼租副,可用于基礎(chǔ)性學(xué)習(xí)坐慰,一開(kāi)始不要急著寫(xiě)代碼,先看文檔用僧,一些基本的概念懂了之后结胀,再開(kāi)始試著慢慢的寫(xiě)代碼两残,即可入門(mén) 。把跨。人弓。
當(dāng)然,學(xué)習(xí) Spark 時(shí)最好還是有一些前置技能比較好着逐,比如使用過(guò) Storm 之類的崔赌,就更容易上手了。
歡迎提出任何建議耸别,更歡迎加入我們一起來(lái)學(xué)習(xí)健芭,go far,go together.