Spark リリース 0.6.1
Spark 0.6.1 は、いくつかの重要なバグ修正とパフォーマンス改善を含むメンテナンスリリースです。ソースパッケージ (2.4 MB tar.gz) または プリビルドパッケージ (48 MB tar.gz) としてダウンロードできます。
このバージョンでの修正と機能改善は以下の通りです。
- ワーカーがクラスターから切断される原因となっていた、過度に攻撃的なメッセージタイムアウトを修正しました。
- HDFS のローカリティに影響を与える、スケジューラにホスト名を公開していなかったスタンドアロンデプロイモードのバグを修正しました。
- シャッフルの接続再利用を改善し、小規模なシャッフルを大幅に高速化できるようにしました (Reynold Xin 氏提供)
- ブロックマネージャーの潜在的なデッドロックをいくつか修正しました (Tathagata Das 氏提供)
- Mesos から失敗したホストの ID を取得する際のバグを修正しました (Imran Rashid 氏提供)
- スポットインスタンスのより良い処理など、いくつかの EC2 スクリプトを改善しました (Josh Rosen 氏提供)
- Spark がバインドするローカル IP アドレスをカスタマイズ可能にしました (Mikhail Bautin 氏提供)
- Hadoop 2 ディストリビューションのサポート (Thomas Dudziak 氏提供)
- Debian ディストリビューションで Scala を配置するサポート (Thomas Dudziak 氏提供)
- ジョブに関するより多くの情報を表示するように、スタンドアロンクラスターの Web UI を改善しました。
- スタンドアロンクラスターで、ジョブを少数のノードに集中させるのではなく、分散させるオプションを追加しました (
spark.deploy.spreadOut)
すべての Spark 0.6 ユーザーに、このメンテナンスリリースへのアップデートを推奨します。
Spark ニュースアーカイブ