Spark リリース 0.7.2
Spark 0.7.2 は、複数のバグ修正と機能改善を含むメンテナンスリリースです。ソースパッケージ(4 MB tar.gz)として ダウンロード いただくか、Hadoop 1 / CDH3 または CDH 4 用のビルド済みパッケージ(61 MB tar.gz)を入手してください。
すべてのユーザーに、このメンテナンスリリースへのアップデートを推奨します。
このバージョンでの修正と機能改善は以下の通りです。
- Scala バージョンを 2.9.3 に更新しました。
- Bagel のいくつかの機能改善。パフォーマンス修正と設定可能なストレージレベルが含まれます。
- 新しい API メソッド: subtractByKey, foldByKey, mapWith, filterWith, foreachPartition など。
- 新しいメトリクスレポートインターフェース SparkListener。各計算ステージの情報(タスク長、シャッフルされたバイト数など)を収集できます。
- Java API を使用した新しい例をいくつか追加しました。K-means や pi の計算などが含まれます。
- スタンドアロンモードで、ホストごとに複数のワーカーインスタンスを起動するサポートを追加しました。
- 全体でさまざまなバグ修正を行いました。
このリリースに貢献した方々は以下の通りです。
- Jey Kottalam (Maven ビルド、バグ修正、EC2 スクリプト、リリースパッケージング)
- Andrew Ash (バグ修正、ドキュメント)
- Andrey Kouznetsov (バグ修正)
- Andy Konwinski (ドキュメント)
- Charles Reiss (バグ修正)
- Christoph Grothaus (バグ修正)
- Erik van Oosten (バグ修正)
- Giovanni Delussu (バグ修正)
- Hiral Patel (バグ修正)
- Holden Karau (エラーレポート、EC2 スクリプト)
- Imran Rashid (メトリクスレポートシステム)
- Josh Rosen (EC2 スクリプト)
- Mark Hamstra (新しい API メソッド、テスト)
- Mikhail Bautin (ビルド)
- Mosharaf Chowdhury (バグ修正)
- Nick Pentreath (Bagel、例)
- Patrick Wendell (バグ修正)
- Reynold Xin (バグ修正)
- Stephen Haberman (バグ修正、テスト、subtractByKey)
- Kalpit Shah (ビルド、ホストあたりの複数ワーカー)
- Mike Potts (実行スクリプト)
- Matei Zaharia (Bagel、バグ修正、ビルド)
このリリースにご協力いただいた皆様に感謝いたします。今後も皆様からの貢献をお待ちしております!
Spark ニュースアーカイブ