Spark 1.2.0 のリリースを発表できることを嬉しく思います! Spark 1.2.0 は、API 互換性のある 1.X ラインでの 3 回目のリリースです。これは Spark 史上最大のリリースであり、172 名の開発者からの寄稿と 1,000 以上のコミットが含まれています!
このリリースでは、非常に大規模なシャッフル向けに設計された新しいネットワーク転送サブシステムを含む、Spark Core の運用およびパフォーマンスの改善がもたらされます。Spark SQL は、外部データ ソース用の API、Hive 13 サポート、動的パーティショニング、および固定精度デシマル型を導入します。MLlib には、複数のアルゴリズムを構成するための新しいパイプライン指向のパッケージ (spark.ml) が追加されました。Spark Streaming には、Python API と耐障害性のための先書きログが追加されました。最後に、GraphX はアルファ版を卒業し、安定した API を導入します。