Sparkニュース

Spark 4.0 プレビューリリース

次期Spark 4.0リリースの大規模なコミュニティテストを可能にするため、Apache SparkコミュニティはSpark 4.0.0 preview2リリースを公開しました。このプレビューはAPIまたは機能のいずれの点でも安定版リリースではありませんが、コミュニティがSpark 4.0となるコードを早期に試せるようにすることを目的としています。リリースをテストしたい場合は、ダウンロードし、メーリングリストまたはJIRAのいずれかを使用してフィードバックをお送りください。ドキュメントはこちらのリンクで入手可能です。

Spark 4.0 プレビューリリース

次期Spark 4.0リリースの大規模なコミュニティテストを可能にするため、Apache SparkコミュニティはSpark 4.0のプレビューリリースを公開しました。このプレビューはAPIまたは機能のいずれの点でも安定版リリースではありませんが、コミュニティがSpark 4.0となるコードを早期に試せるようにすることを目的としています。リリースをテストしたい場合は、ダウンロードし、メーリングリストまたはJIRAのいずれかを使用してフィードバックをお送りください。

Spark+AI Summit (2020年6月22-25日、バーチャル) アジェンダ公開

Spark + AI Summit 2020 のアジェンダが公開されました!サミットは6月22日に開幕します。今年のサミットはグローバルイベントとして、完全にバーチャルで、誰でも無料で参加できます。さらに、サミットは5日間に拡張され、200以上のセッション、4倍のトレーニング、そしてビジョナリーやソートリーダーによる基調講演が行われます。ビッグデータ、アナリティクス、AIの未来を形作る何万人ものエンジニア、科学者、開発者、アナリスト、リーダーと共に参加しましょう。 全スケジュールをチェックし、参加登録を!

Spark 3.0 プレビューリリース

次期Spark 3.0リリースの大規模なコミュニティテストを可能にするため、Apache SparkコミュニティはSpark 3.0.0 preview2リリースを公開しました。このプレビューはAPIまたは機能のいずれの点でも安定版リリースではありませんが、コミュニティがSpark 3.0となるコードを早期に試せるようにすることを目的としています。リリースをテストしたい場合は、ダウンロードし、メーリングリストまたはJIRAのいずれかを使用してフィードバックをお送りください。ドキュメントはこちらのリンクで入手可能です。

Spark 3.0 プレビューリリース

次期Spark 3.0リリースの大規模なコミュニティテストを可能にするため、Apache SparkコミュニティはSpark 3.0のプレビューリリースを公開しました。このプレビューはAPIまたは機能のいずれの点でも安定版リリースではありませんが、コミュニティがSpark 3.0となるコードを早期に試せるようにすることを目的としています。リリースをテストしたい場合は、ダウンロードし、メーリングリストまたはJIRAのいずれかを使用してフィードバックをお送りください。

Python 2サポート終了計画

ご存知の通り、Pythonコア開発チームおよびPandasやNumPyなどの多くの利用されているPythonパッケージは、2020年1月1日以降にPython 2のサポートを終了します。Apache Sparkは、2015年のSpark 1.4リリース以降、Python 2と3の両方をサポートしてきました。しかし、Python 2/3互換性の維持はますます負担となり、SparkにおけるPython 3機能の使用を実質的に制限しています。Python 2のEOLが近づいていることを考慮すると、Sparkも最終的にPython 2サポートを終了する予定です。現在の計画は以下の通りです。

Spark が CloudSort Benchmark で最も効率的なエンジンとして優勝

Apache Spark が 2016 CloudSort Benchmark(Daytona および Indy カテゴリ)で優勝したことを発表できることを誇りに思います。南京大学、Alibaba Group、Databricks Inc. による合同チームは、NADSort という Spark 上に構築された分散ソートプログラムを使用してコンテストに参加し、100TB のデータをソートする最もコスト効率の高い方法として新世界記録を樹立しました。

Spark 2.0.2 リリース

Apache Spark 2.0.2 のリリースを発表できることを嬉しく思います!このメンテナンスリリースには、Spark のいくつかの領域での修正、および Structured Streaming の Kafka 0.10 およびランタイムメトリクスサポートが含まれています。

Spark 1.6.3 リリース

Spark 1.6.3 のリリースを発表できることを嬉しく思います!このメンテナンスリリースには、Spark のいくつかの領域での修正が含まれています。

Spark 1.6.2 リリース

Spark 1.6.2 のリリースを発表できることを嬉しく思います!このメンテナンスリリースには、Spark のいくつかの領域での修正が含まれています。

Spark Summit EU への発表募集開始

Spark Summit EU への発表募集が開始されました!イベントは10月25-27日にブリュッセルで開催されます。アプリケーション、開発、データサイエンス、エンタープライズ、Sparkエコシステム、研究など、さまざまなSpark関連トピックに関する投稿を歓迎します。ご検討いただくためには7月1日までに提出してください。

Spark 2.0 のプレビューリリース

次期Spark 2.0リリースの大規模なコミュニティテストを可能にするため、Apache SparkチームはSpark 2.0 のプレビューリリースを公開しました。このプレビューはAPIまたは機能のいずれの点でも安定版リリースではありませんが、コミュニティがSpark 2.0となるコードを早期に試せるようにすることを目的としています。リリースをテストしたい場合は、ダウンロードし、メーリングリストまたはJIRAのいずれかを使用してフィードバックをお送りください。

Spark 1.6.1 リリース

Spark 1.6.1 のリリースを発表できることを嬉しく思います!このメンテナンスリリースには、実験的な Dataset API の大幅な更新を含む、Spark のいくつかの領域での修正が含まれています。

Spark Summit San Francisco への発表募集開始

Spark Summit San Francisco への発表募集が開始されました!イベントは6月6-8日にサンフランシスコで開催されます。アプリケーション、開発、データサイエンス、ビジネス価値、Sparkエコシステム、研究など、さまざまなSpark関連トピックに関する投稿を歓迎します。ご検討いただくためには2月29日までに提出してください。

Spark Summit East (2016年2月16日、ニューヨーク) アジェンダ公開

Spark Summit East のアジェンダが公開されました。Netflix、Comcast、Blackrock、Bloombergなどの組織からの60の講演が含まれています。第2回 annual Spark Summit East は2月16-18日にニューヨークで開催され、講演者のフルプログラムとSparkトレーニングの機会が提供されます。詳細は Spark Summit East ウェブサイトで入手でき、そこから参加登録もできます。

Spark 1.6.0 リリース

Spark 1.6.0 のリリースを発表できることを嬉しく思います!Spark 1.6.0 は API 互換の 1.X ラインにおける7番目のリリースです。このリリースでは、Spark コミュニティは248人の開発者からの貢献を得て、成長を続けています!

Spark Summit East 2016 の CFP (Call for Papers) 締め切り間近!

Spark Summit East の発表募集が締め切り間近です!イベントは2月16日~18日にニューヨーク市で開催されます。アプリケーション、開発、データサイエンス、エンタープライズ、研究など、さまざまなSpark関連トピックに関する投稿を歓迎します。ご検討いただくためには11月22日までに提出してください。

Spark 1.5.2 リリース

Spark 1.5.2 のリリースを発表できることを嬉しく思います!このメンテナンスリリースには、DataFrame API、Spark Streaming、PySpark、R、Spark SQL、MLlib を含む Spark のいくつかの領域での修正が含まれています。

Spark Summit East 2016 への発表募集開始

第2回 Spark Summit East のアブストラクト募集が開始されました!イベントは2月16日~18日にニューヨーク市で開催されます。アプリケーション、開発、データサイエンス、エンタープライズ、研究など、さまざまなSpark関連トピックに関する投稿を歓迎します。

Spark 1.5.1 リリース

Spark 1.5.1 のリリースを発表できることを嬉しく思います!このメンテナンスリリースには、DataFrame API、Spark Streaming、PySpark、R、Spark SQL、MLlib を含む Spark のいくつかの領域での修正が含まれています。

Spark 1.5.0 リリース

Spark 1.5.0 のリリースを発表できることを嬉しく思います!Spark 1.5.0 は API 互換の 1.X ラインにおける6番目のリリースです。230人の開発者からの貢献と1,400以上のコミットにより、Spark史上最大のリリースとなりました!

Spark Summit Europe アジェンダ公開

Spark Summit Europe のアジェンダが公開されました。Barclays、Netflix、Elsevier、Intel などの組織からの38の講演が含まれています。ヨーロッパ初の Spark 会議であるこの会議は、2015年10月27~29日にアムステルダムで開催され、講演者のフルプログラムと Spark トレーニングの機会が提供されます。詳細は Spark Summit Europe ウェブサイトで入手でき、そこから参加登録もできます。

Spark 1.4.1 リリース

Spark 1.4.1 のリリースを発表できることを嬉しく思います!これは85人の開発者からの貢献を含むメンテナンスリリースです。Spark 1.4.1 には、DataFrame API、Spark Streaming、PySpark、Spark SQL、MLlib を含む Spark のいくつかの領域での修正が含まれています。

Spark Summit 2015 のビデオ公開

Spark Summit 2015 のビデオとスライドがすべて オンラインで利用可能になりました!講演には、技術ロードマップの議論、Sparkコンポーネントの詳細な解説、そしてSpark上に構築されたユースケースが含まれます。

Spark 1.4.0 リリース

Spark 1.4.0 のリリースを発表できることを嬉しく思います!Spark 1.4.0 は API 互換の 1.X ラインにおける5番目のリリースです。210人の開発者からの貢献と1,000以上のコミットにより、Spark史上最大のリリースとなりました!

Spark Summit Europe 発表

初の Spark Summit Europe のアブストラクト募集が開始されました。イベントは10月27日から29日にアムステルダムで開催されます。ユースケースや継続的な開発など、Spark関連のさまざまなトピックに関する投稿を歓迎します。

Spark Summit East 2015 のビデオ公開

Spark Summit East 2015 のビデオとスライドがすべて オンラインで利用可能になりました。Spark コミュニティからの最新ニュース、およびそれらに基づいて構築されたユースケースやアプリケーションを入手するためにご覧ください。

Spark 1.3.0 リリース

Spark 1.3.0 のリリースを発表できることを嬉しく思います!Spark 1.3.0 は API 互換の 1.X ラインにおける3番目のリリースです。174人の開発者からの貢献と1,000以上のコミットにより、Spark史上最大のリリースとなりました!

Spark 1.2.1 リリース

Spark 1.2.1 のリリースを発表できることを嬉しく思います!これは69人の開発者からの貢献を含むメンテナンスリリースです。Spark 1.2.1 には、コアAPI、Streaming、PySpark、SQL、GraphX、MLlib を含む Spark のいくつかの領域での修正が含まれています。

Spark Summit East アジェンダ公開、West の CFP (Call for Papers) 受付中

Spark Summit East のアジェンダが公開されました。Goldman Sachs、Baidu、Salesforce、Novartis、Cisco などの組織からの38の講演が含まれています。米国東海岸初の Spark 会議であるこの会議は、2015年3月18~19日にニューヨーク市で開催されます。詳細は Spark Summit East ウェブサイトで入手でき、そこから参加登録もできます。

Spark 1.2.0 リリース

Spark 1.2.0 のリリースを発表できることを嬉しく思います!Spark 1.2.0 は API 互換の 1.X ラインにおける3番目のリリースです。172人の開発者からの貢献と1,000以上のコミットにより、Spark史上最大のリリースとなりました!

Spark 1.1.1 リリース

Spark 1.1.1 のリリースを発表できることを嬉しく思います!これは55人の開発者からの貢献を含むメンテナンスリリースです。Spark 1.1.1 には、コアAPI、Streaming、PySpark、SQL、GraphX、MLlib を含む Spark のいくつかの領域での修正が含まれています。

Spark Summit East 2015 登録受付中

2015年3月18日と19日にニューヨーク市で開催される Spark Summit East 2015 の登録受付が開始されました。このカンファレンスは、Spark コミュニティの様々な人々に出会い、Spark のトレーニングワークショップに参加する絶好の機会となります。過去の Spark Summit に参加したことがない場合は、Spark Summit ウェブサイトで過去のイベントのコンテンツを見つけることができます。

Spark が Daytona Gray Sort 100TB Benchmark を制覇

Spark が 2014 Gray Sort Benchmark (Daytona 100TB カテゴリ) で優勝したことを発表できることを誇りに思います。Databricks の Spark コミッターである Reynold Xin、Xiangrui Meng、Matei Zaharia を含むチームが Spark を使用してベンチマークに挑戦しました。Spark は UCSD の Themis チームと並んで同率優勝し、ソートにおける新世界記録を樹立しました。

Spark Summit East 2015 (ニューヨーク) への発表募集開始

過去2年間の成功を経て、Spark Summit カンファレンスは2015年に拡張され、3月18~19日のニューヨークでのイベントと、6月15~17日のサンフランシスコでのイベントが提供されます。このカンファレンスは、Spark コミュニティの様々な人々に出会い、最新ニュース、ヒント、ユースケースを見る絶好の機会です。

Spark 1.1.0 リリース

Spark 1.1.0 のリリースを発表できることを嬉しく思います!Spark 1.1.0 は API 互換の 1.X ラインにおける2番目のリリースです。171人の開発者からの貢献により、Spark史上最大のリリースとなりました!

Spark 1.0.2 リリース

Spark 1.0.2 のリリースを発表できることを嬉しく思います!このリリースには30人の開発者からの貢献が含まれています。Spark 1.0.2 には、コアAPI、Streaming、PySpark、MLlib を含む Spark のいくつかの領域での修正が含まれています。

Spark 0.9.2 リリース

Spark 0.9.2 のリリースを発表できることを嬉しく思います!Apache Spark 0.9.2 はバグ修正を含むメンテナンスリリースです。すべての 0.9.x ユーザーにこの安定版リリースへのアップグレードを推奨します。このリリースには28人の開発者からの貢献がありました。

Spark Summit 2014 のビデオ公開

Spark Summit 2014 のビデオとスライドがすべて オンラインで利用可能になりました。Spark コミュニティからの最新ニュース、およびそれらに基づいて構築されたユースケースやアプリケーションを入手するためにご覧ください。さらに、サミットからの トレーニング資料もすべて無料で利用可能です。

Spark 1.0.1 リリース

Spark 1.0.1 のリリースを発表できることを嬉しく思います!このリリースには70人の開発者からの貢献が含まれています。Spark 1.0.0 には、コアAPI、PySpark、MLlib を含む Spark のいくつかの領域での修正が含まれています。また、Spark の (アルファ版) SQL ライブラリにも新機能が追加され、JSONデータサポート、パフォーマンスおよび安定性の修正が含まれています。

Spark Summit 2014 まであと2週間

サンフランシスコで6月30日から7月2日まで開催される Spark Summit 2014 まであと2週間です。サミットでは、Spark を使用している50以上の組織からの 講演 が行われ、ユースケースと継続的な開発に焦点が当てられます。

Spark 1.0.0 リリース

Spark 1.0.0 のリリースを発表できることを嬉しく思います!Spark 1.0.0 は 1.X ラインの最初のリリースであり、Spark のコアインターフェースの API 安定性を提供します。117人の開発者からの貢献により、Spark史上最大のリリースとなりました。このリリースでは、Spark の標準ライブラリが拡張され、既存の Spark ワークフローに SQL クエリを統合できる新しい SQL パッケージ (Spark SQL) が導入されました。機械学習ライブラリ MLlib は、スパースベクターサポートといくつかの新しいアルゴリズムで拡張されています。GraphX および Streaming ライブラリも新機能と最適化を導入しています。Spark のコアエンジンは、セキュアな YARN クラスターのサポート、Spark アプリケーションを送信するための統合ツール、およびいくつかのパフォーマンスと安定性の向上を追加します。

Spark Summit アジェンダ公開

Spark Summit 2014 カンファレンスのアジェンダが オンラインで利用可能になりました。50以上の組織からの講演があり、開発者コミュニティとユーザーコミュニティを結びつける最大の Spark イベントとなります。会場で参加するか、オンラインで視聴して、Spark の最新情報を入手してください。

Spark 0.9.1 リリース

Spark 0.9.1 のリリースを発表できることを嬉しく思います!Apache Spark 0.9.1 はバグ修正、パフォーマンス改善、YARN との安定性向上、および Scala と Python API の互換性向上を含むメンテナンスリリースです。すべての 0.9.0 ユーザーにこの安定版リリースへのアップグレードを推奨します。このリリースには37人の開発者からの貢献がありました。

Spark Summit 2014 の登録および発表募集開始

昨年の 最初の Spark Summit の成功を受けて、Spark Summit 2014 の登録と講演募集が開始されました。これはサンフランシスコで開催される3日間のイベントで、Spark コミュニティの複数の企業によって企画されています。イベントは 2014年6月30日から7月2日 まで、カリフォルニア州サンフランシスコで開催されます。

Spark がトップレベル Apache プロジェクトに昇格

Apache Software Foundation は本日、Spark が Apache Incubator からトップレベル Apache プロジェクトに昇格したことを 発表しました。これは、プロジェクトのコミュニティと製品が ASF の実力主義プロセスと原則の下で適切に管理されてきたことを示しています。これはコミュニティにとって大きな一歩であり、Spark の Apache への移行完了を、ユーザーの皆様と共有できることを大変誇りに思います。ASF の プレスリリースで、過去1年間の Spark の成長と、貢献者およびユーザーからの声について詳しくご覧ください。

Spark 0.9.0 リリース

Spark 0.9.0 のリリースを発表できることを嬉しく思います!Spark 0.9.0 はメジャーリリースであり、83人の開発者からの貢献により、Spark史上最大のリリースとなりました。このリリースでは、Spark の標準ライブラリが拡張され、新しいグラフ計算パッケージ (GraphX) が導入され、機械学習およびストリーム処理パッケージにいくつかの新機能が追加されました。また、外部集計、長寿命アプリケーションの簡易化された H/A モード、および強化された YARN サポートを含む、コアエンジンにも大幅な改善が施されました。

Spark 0.8.1 リリース

Spark の Scala 2.9 バージョンのメンテナンスおよびパフォーマンスリリースである Spark Release 0.8.1 を公開しました。0.8.1 には、YARN 2.2 のサポート、スタンドアロンスケジューラの高可用性モード、シャッフルの最適化、およびその他多くの改善が含まれています。すべてのユーザーにこのリリースへの更新を推奨します。新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。

Spark Summit 2013 終了

2013年12月初旬にサンフランシスコ市街で開催された Spark Summit 2013 は成功裏に終了しました!13カ国、180社以上の企業から450人以上の Spark 開発者および熱狂的なファンが集まり、プロジェクトリーダーや Spark、Shark、Spark Streaming および関連プロジェクトのプロダクションユーザーから、ユースケース、最近の開発、および Spark コミュニティのロードマップについて学びました。

最初の Spark Summit 発表: 2013年12月2日

最初の Spark Summit が 2013年12月2日にサンフランシスコ市街で開催される ことを発表できることを嬉しく思います。Spark、Shark、Spark Streaming および関連プロジェクトの主要なプロダクションユーザーから話を聞くことができます。また、開発の方向性や、さまざまなアプリケーションで Spark スタックをどのように使用できるかについても学びます。サミットは、Spark コミュニティの主要な組織によって企画およびスポンサーされています。

Spark 0.8.0 リリース

Apache Spark 0.8.0 のリリースを発表できることを誇りに思います。Spark 0.8.0 は、多くの新機能と使いやすさの向上を含むメジャーリリースです。また、Apache インキュベーターの下での最初のリリースでもあります。67人の開発者と24社からの貢献により、これまでの Spark の中で最大のリリースとなりました。主な新機能には、拡張されたモニタリングフレームワークと UI、機械学習ライブラリ、および YARN 上で Spark を実行するためのサポートが含まれます。

AMP Camp トレーニングキャンプ (バークレー) 登録受付中

Spark、Shark、GraphX および関連技術を対面で学習したいですか?AMP Lab は、8月29日と30日にバークレーで2日間のワークショップを開催します。ワークショップには、チュートリアル、ユーザーからの講演、および4時間以上のハンズオン演習が含まれます。AMP Camp ウェブサイトで登録受付中で、価格は1人あたり250ドルです。昨年のワークショップは完売したので、早めの登録をお勧めします。

Spark メーリングリストが Apache に移行

Spark プロジェクトが最近 Apache に移行したことに伴い、今月中にメーリングリストを Apache インフラストラクチャに移行する予定です。そのため、既存の Google グループは2013年9月1日に読み取り専用になります。Spark に関する最新情報を受け取る、または開発ディスカッションに参加するには、以下のリストに登録してください。

ほとんどのユーザーは User リストを希望するでしょうが、プロジェクトにコードを貢献することに興味のある個人も Dev リストに登録する必要があります。

Spark 0.7.3 リリース

Spark Release 0.7.3 を公開しました。これは、ストリーミングAPIの更新や `spark-shell` セッションにJARを追加する新機能を含むメンテナンスリリースです。すべてのユーザーにこのリリースへの更新を推奨します。新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。

Spark が Apache Incubator に採用される

Spark は最近、採用され、プロジェクトの長期的なホームとなる Apache Incubator の一部となりました。ソースコードと課題追跡を Apache に移行するには時間がかかりますが、Apache コミュニティに参加できることを嬉しく思います。プロジェクトホスティングの変更方法については、このサイトで最新情報をご確認ください。

Spark 0.7.2 リリース

いくつかのバグ修正と改善、および新しいコード例とAPI機能を含む新しいメンテナンスリリースである Spark 0.7.2 をリリースしました。すべてのユーザーにこのリリースへの更新を推奨します。新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。

Spark スクリーンキャスト公開

新しいユーザーが数分で Spark を使い始められるように、私たちが公開する短いハンズオンビデオトレーニングシリーズの最初の2つのスクリーンキャストを公開しました。

Strata の演習がオンラインで利用可能に

今年の Strata カンファレンスで、AMP Lab は Spark、Shark、Spark Streaming のチュートリアルを1日開催し、Amazon EC2 上のオンライン演習も含まれました。これらの演習が現在 オンラインで利用可能になりました。これにより、Amazon EC2 クラスターで実際のデータを使用して、自分のペースで Spark と Shark を学習できます。これらはシステムを学習するための素晴らしいリソースです。また、Strata チュートリアルの スライド、および昨年8月にバークレーで開催された AMP Camp ワークショップの ビデオ もオンラインで見つけることができます。

Spark 0.7.0 リリース

Spark の新しいメジャーバージョンである Spark 0.7.0 のリリースを発表できることを誇りに思います。このバージョンでは、Python API と Spark Streaming の アルファ版など、いくつかの主要な機能が追加されました。このリリースは、Spark リリース史上最も多くの貢献者(バークレー内外から31人の貢献者)によるものです。新機能の詳細については リリースノートをご覧いただくか、本日リリースをダウンロードしてください。

Spark/Shark チュートリアル for Amazon EMR

今週末、Amazon は Spark と Shark を Elastic MapReduce 上で簡単に起動できる 記事とコードを公開しました。記事には、S3 のデータからインタラクティブな Scala コマンドと Shark の SQL クエリの両方を実行する方法の例が含まれています。詳細については Amazon の記事をご覧ください。これは、Spark が EMR で起動できる初の Hadoop 以外のエンジンであるため、非常に興奮しています。

Spark 0.6.2 リリース

Spark の新しいバージョンである Spark 0.6.2 をリリースしました。これは、いくつかのバグ修正と使いやすさの向上(リリースノートを参照)を含むメンテナンスリリースです。すべてのユーザーにこのリリースへの更新を推奨します。

最初の Spark 開発ミートアップのビデオ公開

12月18日、Spark コードベースを学習し、プロジェクトに貢献したい人々のための、一連の Spark 開発ミートアップの最初のものを開催しました。予想をはるかに超える需要があり、80人以上が登録し、64人が参加しました。最初のミートアップは Spark 内部構造の紹介でした。参加者の一人のおかげで、YouTube にミートアップの ビデオがあります。また、スライドも公開しました。今後も Spark および Shark の開発ミートアップが開催される予定です。

Spark がニュースで取り上げられる

最近、Spark はニュースでかなりの注目を集めています。さらに詳しく知りたい読者のために、最近の記事をいくつかリストアップしたいと思います。

  • 人気のDBMS2ブログの編集者であるCurt Monashは、SparkとSharkの紹介、およびより詳細な技術概要を執筆しました。
  • Silicon Angle は、Amazon re:Invent での発表の後、Spark と Shark を取り上げました。
  • Datanami は、ビッグデータ研究プロジェクトの調査で Shark を取り上げました。
  • O'Reilly の Strata ブログは最近、SparkShark、および Spark 0.6 リリースを取り上げました。
  • DataInformed は2人の Spark ユーザーにインタビューし、異常検出、予測分析、データマイニングでのアプリケーションについて記事にしました。

その他、2月に開催される O’Reilly Strata conference では、Spark と Shark のチュートリアルが1日開催されます。火曜日の午前中には Spark、Shark、BDAS の入門が3時間、午後に ハンズオン演習セッションが3時間含まれます。

Spark 0.6.1 および 0.5.2 リリース

本日、Spark の2つのメンテナンスリリース: 0.6.1 および 0.5.2 を公開しました。どちらも重要なバグ修正といくつかの新機能(Hadoop 2 ディストリビューションとのビルド機能など)を含んでいます。各ブランチの最新バージョンへの更新を推奨します。新規ユーザーには 0.6.1 を推奨します。