Spark リリース 0.7.2

Spark 0.7.2 は、複数のバグ修正と機能改善を含むメンテナンスリリースです。ソースパッケージ(4 MB tar.gz)として ダウンロード いただくか、Hadoop 1 / CDH3 または CDH 4 用のビルド済みパッケージ(61 MB tar.gz)を入手してください。

すべてのユーザーに、このメンテナンスリリースへのアップデートを推奨します。

このバージョンでの修正と機能改善は以下の通りです。

  • Scala バージョンを 2.9.3 に更新しました。
  • Bagel のいくつかの機能改善。パフォーマンス修正と設定可能なストレージレベルが含まれます。
  • 新しい API メソッド: subtractByKey, foldByKey, mapWith, filterWith, foreachPartition など。
  • 新しいメトリクスレポートインターフェース SparkListener。各計算ステージの情報(タスク長、シャッフルされたバイト数など)を収集できます。
  • Java API を使用した新しい例をいくつか追加しました。K-means や pi の計算などが含まれます。
  • スタンドアロンモードで、ホストごとに複数のワーカーインスタンスを起動するサポートを追加しました。
  • 全体でさまざまなバグ修正を行いました。

このリリースに貢献した方々は以下の通りです。

  • Jey Kottalam (Maven ビルド、バグ修正、EC2 スクリプト、リリースパッケージング)
  • Andrew Ash (バグ修正、ドキュメント)
  • Andrey Kouznetsov (バグ修正)
  • Andy Konwinski (ドキュメント)
  • Charles Reiss (バグ修正)
  • Christoph Grothaus (バグ修正)
  • Erik van Oosten (バグ修正)
  • Giovanni Delussu (バグ修正)
  • Hiral Patel (バグ修正)
  • Holden Karau (エラーレポート、EC2 スクリプト)
  • Imran Rashid (メトリクスレポートシステム)
  • Josh Rosen (EC2 スクリプト)
  • Mark Hamstra (新しい API メソッド、テスト)
  • Mikhail Bautin (ビルド)
  • Mosharaf Chowdhury (バグ修正)
  • Nick Pentreath (Bagel、例)
  • Patrick Wendell (バグ修正)
  • Reynold Xin (バグ修正)
  • Stephen Haberman (バグ修正、テスト、subtractByKey)
  • Kalpit Shah (ビルド、ホストあたりの複数ワーカー)
  • Mike Potts (実行スクリプト)
  • Matei Zaharia (Bagel、バグ修正、ビルド)

このリリースにご協力いただいた皆様に感謝いたします。今後も皆様からの貢献をお待ちしております!


Spark ニュースアーカイブ