Apache Spark ドキュメント

セットアップ手順、プログラミングガイド、その他のドキュメントは、以下に示す各安定版Sparkで利用できます。

プレビューリリースのドキュメント

上記にリンクされているドキュメントは、Sparkの入門、および組み込みコンポーネントMLlibSpark Streaming、およびGraphXについて説明しています。

さらに、このページにはSparkを学習するためのその他のリソースが掲載されています。

動画

Sparkイベントの動画については、Apache Spark YouTubeチャンネルをご覧ください。さまざまなトピックの動画については、個別のプレイリストがあります。プレイリストを閲覧するだけでなく、以下の動画への直接リンクを見つけることもできます。

スクリーンキャストチュートリアル動画

Sparkサミットの動画

Meetupトーク動画

以下にリストされている動画に加えて、ベイエリアのmeetupからのすべてのスライドはこちらで閲覧することもできます。

トレーニング資料

  • Spark Summit 2014のトレーニング資料と演習はオンラインで入手できます。これらには、講演の動画とスライド、およびラップトップで実行できる演習が含まれています。トピックには、Spark core、チューニングとデバッグ、Spark SQL、Spark Streaming、GraphX、MLlibが含まれます。
  • Spark Summit 2013にはトレーニングセッションが含まれており、スライドと動画はトレーニングデーのアジェンダで入手できます。このセッションには、Amazon EC2で実行できる演習も含まれています。
  • UC Berkeley AMPLabは、Sparkと関連プロジェクトに関するトレーニングキャンプを定期的に開催しています。それぞれのスライド、動画、およびEC2ベースの演習はオンラインで入手できます。
    • AMP Camp 4 (Strata Santa Clara, 2014年2月) — BlinkDB、MLlib、GraphX、Tachyonに焦点を当てています
    • AMP Camp 3 (カリフォルニア州バークレー、2013年8月)
    • AMP Camp 2 (Strata Santa Clara, 2013年2月)
    • AMP Camp 1 (カリフォルニア州バークレー、2012年8月)

ハンズオン演習

  • Spark Summit 2014のハンズオン演習。これにより、ラップトップにSparkをインストールし、基本概念、Spark SQL、Spark Streaming、GraphX、MLlibを学習できます。
  • Spark Summit 2013のハンズオン演習。これらの演習では、小さなEC2クラスターを起動し、データセットをロードして、Spark、Shark、Spark Streaming、MLlibでクエリを実行できます。

外部チュートリアル、ブログ記事、および講演

書籍

サンプル

研究論文

Sparkは当初、UC Berkeleyの研究プロジェクトとして開発され、設計の多くは論文に記録されています。研究ページには、当初の動機と方向性の一部が記載されています。