Spark 3.5.6 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.5.6 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 4.0.0 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.5.5 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.5.4 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.4.4 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
次期Spark 4.0リリースの大規模なコミュニティテストを可能にするため、Apache SparkコミュニティはSpark 4.0.0 preview2リリースを公開しました。このプレビューはAPIまたは機能のいずれの点でも安定版リリースではありませんが、コミュニティがSpark 4.0となるコードを早期に試せるようにすることを目的としています。リリースをテストしたい場合は、ダウンロードし、メーリングリストまたはJIRAのいずれかを使用してフィードバックをお送りください。ドキュメントはこちらのリンクで入手可能です。
Spark 3.5.3 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.5.2 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
次期Spark 4.0リリースの大規模なコミュニティテストを可能にするため、Apache SparkコミュニティはSpark 4.0のプレビューリリースを公開しました。このプレビューはAPIまたは機能のいずれの点でも安定版リリースではありませんが、コミュニティがSpark 4.0となるコードを早期に試せるようにすることを目的としています。リリースをテストしたい場合は、ダウンロードし、メーリングリストまたはJIRAのいずれかを使用してフィードバックをお送りください。
Spark 3.4.3 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.5.1 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.3.4 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.4.2 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.5.0 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.3.3 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.4.1 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.4.0 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.2.4 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.3.2 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.2.3 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.3.1 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.2.2 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.3.0 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Apache Spark は、影響力のある実世界および研究システムに贈られるSIGMOD(ACM のデータ管理研究組織)による 今年のSIGMOD Systems Award を受賞しました。
Spark 3.1.3 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.2.1 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.2.0 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.0.3 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.1.2 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 2.4.8 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
spark-packages チームは、新しいリポジトリサービス https://repos.spark-packages.org を立ち上げました。これは spark-packages 上のアーティファクトの新しいホームとなります。
Spark 3.1.1 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.0.2 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
次期公式SparkリリースはSpark 3.1.0ではなくSpark 3.1.1となります。Spark 3.1.0 RC1の準備中に技術的な問題が発生しました。Spark devメーリングリストの[VOTE] Release Spark 3.1.0 (RC1)をご覧ください。
Spark 2.4.7 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.0.1 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 3.0.0 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark + AI Summit 2020 のアジェンダが公開されました!サミットは6月22日に開幕します。今年のサミットはグローバルイベントとして、完全にバーチャルで、誰でも無料で参加できます。さらに、サミットは5日間に拡張され、200以上のセッション、4倍のトレーニング、そしてビジョナリーやソートリーダーによる基調講演が行われます。ビッグデータ、アナリティクス、AIの未来を形作る何万人ものエンジニア、科学者、開発者、アナリスト、リーダーと共に参加しましょう。 全スケジュールをチェックし、参加登録を!
Spark 2.4.6 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 2.4.5 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
次期Spark 3.0リリースの大規模なコミュニティテストを可能にするため、Apache SparkコミュニティはSpark 3.0.0 preview2リリースを公開しました。このプレビューはAPIまたは機能のいずれの点でも安定版リリースではありませんが、コミュニティがSpark 3.0となるコードを早期に試せるようにすることを目的としています。リリースをテストしたい場合は、ダウンロードし、メーリングリストまたはJIRAのいずれかを使用してフィードバックをお送りください。ドキュメントはこちらのリンクで入手可能です。
次期Spark 3.0リリースの大規模なコミュニティテストを可能にするため、Apache SparkコミュニティはSpark 3.0のプレビューリリースを公開しました。このプレビューはAPIまたは機能のいずれの点でも安定版リリースではありませんが、コミュニティがSpark 3.0となるコードを早期に試せるようにすることを目的としています。リリースをテストしたい場合は、ダウンロードし、メーリングリストまたはJIRAのいずれかを使用してフィードバックをお送りください。
Spark 2.3.4 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 2.4.4 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
ご存知の通り、Pythonコア開発チームおよびPandasやNumPyなどの多くの利用されているPythonパッケージは、2020年1月1日以降にPython 2のサポートを終了します。Apache Sparkは、2015年のSpark 1.4リリース以降、Python 2と3の両方をサポートしてきました。しかし、Python 2/3互換性の維持はますます負担となり、SparkにおけるPython 3機能の使用を実質的に制限しています。Python 2のEOLが近づいていることを考慮すると、Sparkも最終的にPython 2サポートを終了する予定です。現在の計画は以下の通りです。
Spark 2.4.3 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 2.4.2 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 2.4.1 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 2.3.3 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 2.2.3 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark + AI Summit 2019 のアジェンダが公開されました!サミットは4月23日に始まり、Apache Sparkトレーニングの1日、そしてNetflix、Facebook、Uber、Yelp、Target、Appleなどのスピーカーが登場する100以上の講演が行われます!全スケジュールをチェックし、参加登録を!
Spark 2.4.0 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 2.3.2 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark+AI Summit Europe のアジェンダが公開されました!サミットは10月2日に始まり、Sparkトレーニングの1日、そしてDatabricks、Facebook、Intel、IBM、CERN、Uber、Googleのスピーカーが登場する100以上の講演が行われます。 全スケジュールをチェックし、参加登録を!
Spark 2.2.2 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 2.1.3 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 2.3.1 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark+AI Summit のアジェンダが公開されました!サミットは6月4日に始まり、Apache Sparkトレーニングの1日、そしてDatabricks、Facebook、Microsoft、Intel、IBM、Salesforce、Uber、UC Berkeleyのスピーカーが登場する180以上の講演が行われます!全スケジュールをチェックし、参加登録を!
Spark 2.3.0 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Apache Spark 2.2.1 のリリースを発表できることを嬉しく思います!変更点についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Apache Spark 2.1.2 のリリースを発表できることを嬉しく思います!変更点についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark Summit EU 2017 のアジェンダが公開されました!サミットは10月24日に始まり、Apache Sparkトレーニングの1日、そしてShell、Netflix、Intel、IBM、Facebook、Toonなどのスピーカーが登場する80以上の講演が行われます。 全スケジュールをチェックし、参加登録を!
Spark 2.2.0 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Apache Spark 2.1.1 のリリースを発表できることを嬉しく思います!変更点についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark Summit のアジェンダが公開されました!サミットは6月5日に始まり、Apache Sparkトレーニングの1日、そしてDatabricks、Facebook、Airbnb、Yelp、Salesforce、UC Berkeleyのスピーカーが登場する110以上の講演が行われます!全スケジュールをチェックし、参加登録を!
Spark Summit East のアジェンダが公開されました!サミットは2月7日に始まり、Sparkトレーニングの1日、そしてNetflix、Walmart Labs、Databricks、MIT、IBM、Microsoft、Facebook、CapitalOne、UC Berkeleyのスピーカーが登場する100以上の講演が行われます!全スケジュールをチェックし、参加登録を!
Spark 2.1.0 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Apache Spark が 2016 CloudSort Benchmark(Daytona および Indy カテゴリ)で優勝したことを発表できることを誇りに思います。南京大学、Alibaba Group、Databricks Inc. による合同チームは、NADSort という Spark 上に構築された分散ソートプログラムを使用してコンテストに参加し、100TB のデータをソートする最もコスト効率の高い方法として新世界記録を樹立しました。
Apache Spark 2.0.2 のリリースを発表できることを嬉しく思います!このメンテナンスリリースには、Spark のいくつかの領域での修正、および Structured Streaming の Kafka 0.10 およびランタイムメトリクスサポートが含まれています。
Spark 1.6.3 のリリースを発表できることを嬉しく思います!このメンテナンスリリースには、Spark のいくつかの領域での修正が含まれています。
Apache Spark 2.0.1 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 2.0.0 のリリースを発表できることを嬉しく思います!新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark 1.6.2 のリリースを発表できることを嬉しく思います!このメンテナンスリリースには、Spark のいくつかの領域での修正が含まれています。
Spark Summit EU への発表募集が開始されました!イベントは10月25-27日にブリュッセルで開催されます。アプリケーション、開発、データサイエンス、エンタープライズ、Sparkエコシステム、研究など、さまざまなSpark関連トピックに関する投稿を歓迎します。ご検討いただくためには7月1日までに提出してください。
次期Spark 2.0リリースの大規模なコミュニティテストを可能にするため、Apache SparkチームはSpark 2.0 のプレビューリリースを公開しました。このプレビューはAPIまたは機能のいずれの点でも安定版リリースではありませんが、コミュニティがSpark 2.0となるコードを早期に試せるようにすることを目的としています。リリースをテストしたい場合は、ダウンロードし、メーリングリストまたはJIRAのいずれかを使用してフィードバックをお送りください。
Spark Summit 2016 のアジェンダが公開されました!サミットは6月6日に始まり、Sparkトレーニングの1日、そしてAirbnb、Baidu、Bloomberg、Databricks、Duke、IBM、Microsoft、Netflix、Uber、UC Berkeleyのスピーカーが登場する90以上の講演が行われます!全スケジュールをチェックし、参加登録を!
Spark 1.6.1 のリリースを発表できることを嬉しく思います!このメンテナンスリリースには、実験的な Dataset API の大幅な更新を含む、Spark のいくつかの領域での修正が含まれています。
Spark Summit San Francisco への発表募集が開始されました!イベントは6月6-8日にサンフランシスコで開催されます。アプリケーション、開発、データサイエンス、ビジネス価値、Sparkエコシステム、研究など、さまざまなSpark関連トピックに関する投稿を歓迎します。ご検討いただくためには2月29日までに提出してください。
Spark Summit East のアジェンダが公開されました。Netflix、Comcast、Blackrock、Bloombergなどの組織からの60の講演が含まれています。第2回 annual Spark Summit East は2月16-18日にニューヨークで開催され、講演者のフルプログラムとSparkトレーニングの機会が提供されます。詳細は Spark Summit East ウェブサイトで入手でき、そこから参加登録もできます。
Spark 1.6.0 のリリースを発表できることを嬉しく思います!Spark 1.6.0 は API 互換の 1.X ラインにおける7番目のリリースです。このリリースでは、Spark コミュニティは248人の開発者からの貢献を得て、成長を続けています!
Spark Summit East の発表募集が締め切り間近です!イベントは2月16日~18日にニューヨーク市で開催されます。アプリケーション、開発、データサイエンス、エンタープライズ、研究など、さまざまなSpark関連トピックに関する投稿を歓迎します。ご検討いただくためには11月22日までに提出してください。
Spark 1.5.2 のリリースを発表できることを嬉しく思います!このメンテナンスリリースには、DataFrame API、Spark Streaming、PySpark、R、Spark SQL、MLlib を含む Spark のいくつかの領域での修正が含まれています。
第2回 Spark Summit East のアブストラクト募集が開始されました!イベントは2月16日~18日にニューヨーク市で開催されます。アプリケーション、開発、データサイエンス、エンタープライズ、研究など、さまざまなSpark関連トピックに関する投稿を歓迎します。
Spark 1.5.1 のリリースを発表できることを嬉しく思います!このメンテナンスリリースには、DataFrame API、Spark Streaming、PySpark、R、Spark SQL、MLlib を含む Spark のいくつかの領域での修正が含まれています。
Spark 1.5.0 のリリースを発表できることを嬉しく思います!Spark 1.5.0 は API 互換の 1.X ラインにおける6番目のリリースです。230人の開発者からの貢献と1,400以上のコミットにより、Spark史上最大のリリースとなりました!
Spark Summit Europe のアジェンダが公開されました。Barclays、Netflix、Elsevier、Intel などの組織からの38の講演が含まれています。ヨーロッパ初の Spark 会議であるこの会議は、2015年10月27~29日にアムステルダムで開催され、講演者のフルプログラムと Spark トレーニングの機会が提供されます。詳細は Spark Summit Europe ウェブサイトで入手でき、そこから参加登録もできます。
Spark 1.4.1 のリリースを発表できることを嬉しく思います!これは85人の開発者からの貢献を含むメンテナンスリリースです。Spark 1.4.1 には、DataFrame API、Spark Streaming、PySpark、Spark SQL、MLlib を含む Spark のいくつかの領域での修正が含まれています。
Spark Summit 2015 のビデオとスライドがすべて オンラインで利用可能になりました!講演には、技術ロードマップの議論、Sparkコンポーネントの詳細な解説、そしてSpark上に構築されたユースケースが含まれます。
Spark 1.4.0 のリリースを発表できることを嬉しく思います!Spark 1.4.0 は API 互換の 1.X ラインにおける5番目のリリースです。210人の開発者からの貢献と1,000以上のコミットにより、Spark史上最大のリリースとなりました!
初の Spark Summit Europe のアブストラクト募集が開始されました。イベントは10月27日から29日にアムステルダムで開催されます。ユースケースや継続的な開発など、Spark関連のさまざまなトピックに関する投稿を歓迎します。
サンフランシスコで6月15日から17日まで開催される Spark Summit 2015 まであと1ヶ月です。サミットでは、Spark を使用している50以上の組織からの 講演 が行われ、ユースケースと継続的な開発に焦点が当てられます。
Spark Summit East 2015 のビデオとスライドがすべて オンラインで利用可能になりました。Spark コミュニティからの最新ニュース、およびそれらに基づいて構築されたユースケースやアプリケーションを入手するためにご覧ください。
Spark 1.2.2 および Spark 1.3.1 のリリースを発表できることを嬉しく思います!これらは両方ともメンテナンスリリースで、合計で90人以上の開発者の作業が含まれています。
Spark 1.3.0 のリリースを発表できることを嬉しく思います!Spark 1.3.0 は API 互換の 1.X ラインにおける3番目のリリースです。174人の開発者からの貢献と1,000以上のコミットにより、Spark史上最大のリリースとなりました!
Spark 1.2.1 のリリースを発表できることを嬉しく思います!これは69人の開発者からの貢献を含むメンテナンスリリースです。Spark 1.2.1 には、コアAPI、Streaming、PySpark、SQL、GraphX、MLlib を含む Spark のいくつかの領域での修正が含まれています。
Spark Summit East のアジェンダが公開されました。Goldman Sachs、Baidu、Salesforce、Novartis、Cisco などの組織からの38の講演が含まれています。米国東海岸初の Spark 会議であるこの会議は、2015年3月18~19日にニューヨーク市で開催されます。詳細は Spark Summit East ウェブサイトで入手でき、そこから参加登録もできます。
Spark 1.2.0 のリリースを発表できることを嬉しく思います!Spark 1.2.0 は API 互換の 1.X ラインにおける3番目のリリースです。172人の開発者からの貢献と1,000以上のコミットにより、Spark史上最大のリリースとなりました!
Spark 1.1.1 のリリースを発表できることを嬉しく思います!これは55人の開発者からの貢献を含むメンテナンスリリースです。Spark 1.1.1 には、コアAPI、Streaming、PySpark、SQL、GraphX、MLlib を含む Spark のいくつかの領域での修正が含まれています。
2015年3月18日と19日にニューヨーク市で開催される Spark Summit East 2015 の登録受付が開始されました。このカンファレンスは、Spark コミュニティの様々な人々に出会い、Spark のトレーニングワークショップに参加する絶好の機会となります。過去の Spark Summit に参加したことがない場合は、Spark Summit ウェブサイトで過去のイベントのコンテンツを見つけることができます。
Spark が 2014 Gray Sort Benchmark (Daytona 100TB カテゴリ) で優勝したことを発表できることを誇りに思います。Databricks の Spark コミッターである Reynold Xin、Xiangrui Meng、Matei Zaharia を含むチームが Spark を使用してベンチマークに挑戦しました。Spark は UCSD の Themis チームと並んで同率優勝し、ソートにおける新世界記録を樹立しました。
過去2年間の成功を経て、Spark Summit カンファレンスは2015年に拡張され、3月18~19日のニューヨークでのイベントと、6月15~17日のサンフランシスコでのイベントが提供されます。このカンファレンスは、Spark コミュニティの様々な人々に出会い、最新ニュース、ヒント、ユースケースを見る絶好の機会です。
Spark 1.1.0 のリリースを発表できることを嬉しく思います!Spark 1.1.0 は API 互換の 1.X ラインにおける2番目のリリースです。171人の開発者からの貢献により、Spark史上最大のリリースとなりました!
Spark 1.0.2 のリリースを発表できることを嬉しく思います!このリリースには30人の開発者からの貢献が含まれています。Spark 1.0.2 には、コアAPI、Streaming、PySpark、MLlib を含む Spark のいくつかの領域での修正が含まれています。
Spark 0.9.2 のリリースを発表できることを嬉しく思います!Apache Spark 0.9.2 はバグ修正を含むメンテナンスリリースです。すべての 0.9.x ユーザーにこの安定版リリースへのアップグレードを推奨します。このリリースには28人の開発者からの貢献がありました。
Spark Summit 2014 のビデオとスライドがすべて オンラインで利用可能になりました。Spark コミュニティからの最新ニュース、およびそれらに基づいて構築されたユースケースやアプリケーションを入手するためにご覧ください。さらに、サミットからの トレーニング資料もすべて無料で利用可能です。
Spark 1.0.1 のリリースを発表できることを嬉しく思います!このリリースには70人の開発者からの貢献が含まれています。Spark 1.0.0 には、コアAPI、PySpark、MLlib を含む Spark のいくつかの領域での修正が含まれています。また、Spark の (アルファ版) SQL ライブラリにも新機能が追加され、JSONデータサポート、パフォーマンスおよび安定性の修正が含まれています。
サンフランシスコで6月30日から7月2日まで開催される Spark Summit 2014 まであと2週間です。サミットでは、Spark を使用している50以上の組織からの 講演 が行われ、ユースケースと継続的な開発に焦点が当てられます。
Spark 1.0.0 のリリースを発表できることを嬉しく思います!Spark 1.0.0 は 1.X ラインの最初のリリースであり、Spark のコアインターフェースの API 安定性を提供します。117人の開発者からの貢献により、Spark史上最大のリリースとなりました。このリリースでは、Spark の標準ライブラリが拡張され、既存の Spark ワークフローに SQL クエリを統合できる新しい SQL パッケージ (Spark SQL) が導入されました。機械学習ライブラリ MLlib は、スパースベクターサポートといくつかの新しいアルゴリズムで拡張されています。GraphX および Streaming ライブラリも新機能と最適化を導入しています。Spark のコアエンジンは、セキュアな YARN クラスターのサポート、Spark アプリケーションを送信するための統合ツール、およびいくつかのパフォーマンスと安定性の向上を追加します。
Spark Summit 2014 カンファレンスのアジェンダが オンラインで利用可能になりました。50以上の組織からの講演があり、開発者コミュニティとユーザーコミュニティを結びつける最大の Spark イベントとなります。会場で参加するか、オンラインで視聴して、Spark の最新情報を入手してください。
Spark 0.9.1 のリリースを発表できることを嬉しく思います!Apache Spark 0.9.1 はバグ修正、パフォーマンス改善、YARN との安定性向上、および Scala と Python API の互換性向上を含むメンテナンスリリースです。すべての 0.9.0 ユーザーにこの安定版リリースへのアップグレードを推奨します。このリリースには37人の開発者からの貢献がありました。
昨年の 最初の Spark Summit の成功を受けて、Spark Summit 2014 の登録と講演募集が開始されました。これはサンフランシスコで開催される3日間のイベントで、Spark コミュニティの複数の企業によって企画されています。イベントは 2014年6月30日から7月2日 まで、カリフォルニア州サンフランシスコで開催されます。
Spark 0.9.0 のリリースを発表できることを嬉しく思います!Spark 0.9.0 はメジャーリリースであり、83人の開発者からの貢献により、Spark史上最大のリリースとなりました。このリリースでは、Spark の標準ライブラリが拡張され、新しいグラフ計算パッケージ (GraphX) が導入され、機械学習およびストリーム処理パッケージにいくつかの新機能が追加されました。また、外部集計、長寿命アプリケーションの簡易化された H/A モード、および強化された YARN サポートを含む、コアエンジンにも大幅な改善が施されました。
Spark の Scala 2.9 バージョンのメンテナンスおよびパフォーマンスリリースである Spark Release 0.8.1 を公開しました。0.8.1 には、YARN 2.2 のサポート、スタンドアロンスケジューラの高可用性モード、シャッフルの最適化、およびその他多くの改善が含まれています。すべてのユーザーにこのリリースへの更新を推奨します。新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
2013年12月初旬にサンフランシスコ市街で開催された Spark Summit 2013 は成功裏に終了しました!13カ国、180社以上の企業から450人以上の Spark 開発者および熱狂的なファンが集まり、プロジェクトリーダーや Spark、Shark、Spark Streaming および関連プロジェクトのプロダクションユーザーから、ユースケース、最近の開発、および Spark コミュニティのロードマップについて学びました。
最初の Spark Summit が 2013年12月2日にサンフランシスコ市街で開催される ことを発表できることを嬉しく思います。Spark、Shark、Spark Streaming および関連プロジェクトの主要なプロダクションユーザーから話を聞くことができます。また、開発の方向性や、さまざまなアプリケーションで Spark スタックをどのように使用できるかについても学びます。サミットは、Spark コミュニティの主要な組織によって企画およびスポンサーされています。
Apache Spark 0.8.0 のリリースを発表できることを誇りに思います。Spark 0.8.0 は、多くの新機能と使いやすさの向上を含むメジャーリリースです。また、Apache インキュベーターの下での最初のリリースでもあります。67人の開発者と24社からの貢献により、これまでの Spark の中で最大のリリースとなりました。主な新機能には、拡張されたモニタリングフレームワークと UI、機械学習ライブラリ、および YARN 上で Spark を実行するためのサポートが含まれます。
Spark の開発を続けるにあたり、ユーザーからのフィードバックを得て、次に何を開発してほしいかを知りたいと考えています。そのための良い方法として調査を実施することにしました。定期的に実施する予定です。数分で参加できる場合は、こちらから調査に回答してください。皆様のご協力に感謝いたします。
Spark シェルを超えて、最初のスタンドアロン Spark ジョブを作成するのに役立つ、Scala でのスタンドアロンジョブという次のスクリーンキャストを公開しました。
Spark、Shark、GraphX および関連技術を対面で学習したいですか?AMP Lab は、8月29日と30日にバークレーで2日間のワークショップを開催します。ワークショップには、チュートリアル、ユーザーからの講演、および4時間以上のハンズオン演習が含まれます。AMP Camp ウェブサイトで登録受付中で、価格は1人あたり250ドルです。昨年のワークショップは完売したので、早めの登録をお勧めします。
Spark プロジェクトが最近 Apache に移行したことに伴い、今月中にメーリングリストを Apache インフラストラクチャに移行する予定です。そのため、既存の Google グループは2013年9月1日に読み取り専用になります。Spark に関する最新情報を受け取る、または開発ディスカッションに参加するには、以下のリストに登録してください。
ほとんどのユーザーは User リストを希望するでしょうが、プロジェクトにコードを貢献することに興味のある個人も Dev リストに登録する必要があります。
Spark Release 0.7.3 を公開しました。これは、ストリーミングAPIの更新や `spark-shell` セッションにJARを追加する新機能を含むメンテナンスリリースです。すべてのユーザーにこのリリースへの更新を推奨します。新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
Spark、AMP Lab の開発者、および一部のユーザーが数日前に Wired Enterprise 記事で紹介されました。Spark が業界でどのように使用されているかについて、ぜひお読みください。
Spark は最近、採用され、プロジェクトの長期的なホームとなる Apache Incubator の一部となりました。ソースコードと課題追跡を Apache に移行するには時間がかかりますが、Apache コミュニティに参加できることを嬉しく思います。プロジェクトホスティングの変更方法については、このサイトで最新情報をご確認ください。
いくつかのバグ修正と改善、および新しいコード例とAPI機能を含む新しいメンテナンスリリースである Spark 0.7.2 をリリースしました。すべてのユーザーにこのリリースへの更新を推奨します。新機能についてはリリースノートをご覧いただくか、本日リリースをダウンロードしてください。
新しいユーザーが数分で Spark を使い始められるように、私たちが公開する短いハンズオンビデオトレーニングシリーズの最初の2つのスクリーンキャストを公開しました。
今年の Strata カンファレンスで、AMP Lab は Spark、Shark、Spark Streaming のチュートリアルを1日開催し、Amazon EC2 上のオンライン演習も含まれました。これらの演習が現在 オンラインで利用可能になりました。これにより、Amazon EC2 クラスターで実際のデータを使用して、自分のペースで Spark と Shark を学習できます。これらはシステムを学習するための素晴らしいリソースです。また、Strata チュートリアルの スライド、および昨年8月にバークレーで開催された AMP Camp ワークショップの ビデオ もオンラインで見つけることができます。
Spark の新しいメジャーバージョンである Spark 0.7.0 のリリースを発表できることを誇りに思います。このバージョンでは、Python API と Spark Streaming の アルファ版など、いくつかの主要な機能が追加されました。このリリースは、Spark リリース史上最も多くの貢献者(バークレー内外から31人の貢献者)によるものです。新機能の詳細については リリースノートをご覧いただくか、本日リリースをダウンロードしてください。
今週末、Amazon は Spark と Shark を Elastic MapReduce 上で簡単に起動できる 記事とコードを公開しました。記事には、S3 のデータからインタラクティブな Scala コマンドと Shark の SQL クエリの両方を実行する方法の例が含まれています。詳細については Amazon の記事をご覧ください。これは、Spark が EMR で起動できる初の Hadoop 以外のエンジンであるため、非常に興奮しています。
Spark の新しいバージョンである Spark 0.6.2 をリリースしました。これは、いくつかのバグ修正と使いやすさの向上(リリースノートを参照)を含むメンテナンスリリースです。すべてのユーザーにこのリリースへの更新を推奨します。
予測分析に Spark を使用しているベイエリアの企業の一つである Quantifind は、最近、技術ブログに Spark を扱うための2つの有用なエントリを公開しました。
共有いただきありがとうございます。皆様からの情報も楽しみにしています!
12月18日、Spark コードベースを学習し、プロジェクトに貢献したい人々のための、一連の Spark 開発ミートアップの最初のものを開催しました。予想をはるかに超える需要があり、80人以上が登録し、64人が参加しました。最初のミートアップは Spark 内部構造の紹介でした。参加者の一人のおかげで、YouTube にミートアップの ビデオがあります。また、スライドも公開しました。今後も Spark および Shark の開発ミートアップが開催される予定です。
最近、Spark はニュースでかなりの注目を集めています。さらに詳しく知りたい読者のために、最近の記事をいくつかリストアップしたいと思います。
その他、2月に開催される O’Reilly Strata conference では、Spark と Shark のチュートリアルが1日開催されます。火曜日の午前中には Spark、Shark、BDAS の入門が3時間、午後に ハンズオン演習セッションが3時間含まれます。
Spark version 0.6.0 が本日リリースされました。このメジャーリリースは、パフォーマンスの向上と新機能(シンプルなスタンドアロンデプロイモードや Java API など)を幅広く提供します。詳細は リリースノートをご覧ください。
Spark に関する私たちの 論文が USENIX NSDI conference で Best Paper Award を受賞しました。講演のビデオとスライドは、NSDI ウェブサイトでオンラインでご覧いただけます。
定期的な ベイエリア Spark ユーザーミートアップの開催を開始しました。イベントの通知を受け取り、他の Spark 開発者やユーザーと会うには、meetup.com ページに登録してください。