Spark Release 3.0.0

Apache Spark 3.0.0 は 3.x ラインの最初のリリースです。投票は2020年6月10日に可決されました。このリリースは、6月10日までのすべてのコミットを含むgitタグv3.0.0に基づいています。Apache Spark 3.0 は、Spark 2.x の多くのイノベーションを基盤とし、新しいアイデアを取り入れ、開発中の長期プロジェクトも継続しています。オープンソースコミュニティからの多大な貢献により、このリリースでは440人以上の貢献者からの貢献の結果、3400件以上のチケットが解決されました。

今年はSparkがオープンソースプロジェクトとして10周年を迎えます。2010年の最初のリリース以来、Sparkは最も活発なオープンソースプロジェクトの1つに成長しました。現在、Sparkはビッグデータ処理、データサイエンス、機械学習、データ分析ワークロードのための事実上の統一エンジンとなっています。

Spark SQL はこのリリースで最も活発なコンポーネントです。解決されたチケットの46%がSpark SQL向けです。これらの機能強化は、Structured StreamingやMLlibなどの上位ライブラリ、およびSQLやDataFramesなどの上位APIにメリットをもたらします。このリリースでは、さまざまな関連する最適化が追加されています。TPC-DS 30TBベンチマークでは、Spark 3.0 は Spark 2.4 の約2倍高速です。

Pythonは現在Sparkで最も広く使用されている言語です。PySparkはPython Package IndexであるPyPIで毎月500万以上のダウンロードがあります。このリリースでは、Python型ヒント、新しいPandas UDFタイプ、およびよりPythonicなエラー処理を備えたPandas UDF APIの再設計を含む、機能と使いやすさが向上しています。

Spark 3.0 の主な機能ハイライトは以下の通りです。アダプティブクエリ実行、動的パーティションプルーニング、ANSI SQL準拠、Pandas APIの大幅な改善、Structured Streamingの新しいUI、Rユーザー定義関数の呼び出しで最大40倍の速度向上、アクセラレータ対応スケジューラ、SQLリファレンスドキュメント。

Apache Spark 3.0.0 をダウンロードするには、ダウンロードページをご覧ください。JIRAで詳細な変更点を確認できます。ここでは、主要モジュールごとにグループ化された、ハイレベルな変更点のリストをまとめました。

Core, Spark SQL, Structured Streaming
MLlib
SparkR
GraphX
非推奨
既知の問題
クレジット

Core, Spark SQL, Structured Streaming

ハイライト

[Project Hydrogen] アクセラレータ対応スケジューラ (SPARK-24615)
アダプティブクエリ実行 (SPARK-31412)
動的パーティションプルーニング (SPARK-11150)
型ヒントを備えたPandas UDF APIの再設計 (SPARK-28264)
Structured Streaming UI (SPARK-29543)
カタログプラグインAPI (SPARK-31121)
Java 11 サポート (SPARK-24417)
Hadoop 3 サポート (SPARK-23534)
より良いANSI SQL互換性

パフォーマンス強化

アダプティブクエリ実行 (SPARK-31412)
- 基本的なフレームワーク (SPARK-23128)
- シャッフルパーティション数調整後 (SPARK-28177)
- 動的サブクエリ再利用 (SPARK-28753)
- ローカルシャッフルリーダー (SPARK-28560)
- スキュー結合最適化 (SPARK-29544)
- 連続シャッフルブロックの読み込みを最適化 (SPARK-9853)
動的パーティションプルーニング (SPARK-11150)
その他のオプティマイザールール
- Rule TransposeWindow (SPARK-20636)
- Rule ReuseSubquery (SPARK-27279)
- Rule PushDownLeftSemiAntiJoin (SPARK-19712)
- Rule PushLeftSemiLeftAntiThroughJoin (SPARK-19712)
- Rule ReplaceNullWithFalse (SPARK-25860)
- Rule Eliminate sorts without limit in the subquery of Join/Aggregation (SPARK-29343)
- Rule PruneHiveTablePartitions (SPARK-15616)
- Generateから不要なネストフィールドをプルーニング (SPARK-27707)
- Rule RewriteNonCorrelatedExists (SPARK-29800)
テーブルキャッシュ同期コストの最小化 (SPARK-26917, SPARK-26617, SPARK-26548)
集計コードを小関数に分割 (SPARK-21870)
INSERTおよびALTER TABLE ADD PARTITIONコマンドにバッチ処理を追加 (SPARK-29938)
AggregatorをUDAFとして登録可能にする (SPARK-27296)

SQL互換性強化

Proleptic Gregorian Calendarに切り替え (SPARK-26651)
Spark独自のdatetimeパターン定義を構築 (SPARK-31408)
テーブル挿入のためのANSIストア割り当てポリシーを導入 (SPARK-28495)
デフォルトでテーブル挿入でANSIストア割り当てルールに従う (SPARK-28885)
SQLConf spark.sql.ansi.enabled を追加 (SPARK-28989)
集計式にANSI SQL FILTER句をサポート (SPARK-27986)
ANSI SQL OVERLAY関数をサポート (SPARK-28077)
ANSIネストブラケットコメントをサポート (SPARK-28880)
整数オーバーフロー時に例外をスロー (SPARK-26218)
間隔算術演算のオーバーフローチェック (SPARK-30341)
無効な文字列から数値型へのキャスト時に例外をスロー (SPARK-30292)
間隔の乗算と除算のオーバーフロー動作を他の操作と一貫させる (SPARK-30919)
charおよびdecimalのANSI型エイリアスを追加 (SPARK-29941)
SQLパーサーはANSI準拠の予約キーワードを定義します (SPARK-26215)
ANSIモードがオンの場合、識別子として予約キーワードを禁止します (SPARK-26976)
ANSI SQL: LIKE ... ESCAPE構文をサポート (SPARK-28083)
ANSI SQL Boolean-Predicate構文をサポート (SPARK-27924)
相関サブクエリ処理のサポート向上 (SPARK-18455)

PySpark 強化

型ヒントを備えたPandas UDFの再設計 (SPARK-28264)
Pandas UDFがpd.DataFrameのイテレータを受け入れられるようにする (SPARK-26412)
Scalar Pandas UDFの引数および戻り値としてStructTypeをサポート (SPARK-27240 )
Pandas UDF経由でのDataFrame Cogroup をサポート (SPARK-27463)
DataFrameのイテレータを許可するmapInPandasを追加 (SPARK-28198)
一部のSQL関数は列名も受け付けるべき (SPARK-26979)
PySpark SQL例外をよりPythonicにする (SPARK-31849)

拡張性強化

カタログプラグインAPI (SPARK-31121)
データソースV2 APIのリファクタリング (SPARK-25390)
Hive 3.0および3.1メタストアサポート (SPARK-27970, SPARK-24360)
Sparkプラグインインターフェースをドライバーに拡張 (SPARK-29396)
Executorプラグインを使用したユーザー定義メトリクスでSparkメトリクスシステムを拡張 (SPARK-28091)
拡張された列指向処理サポートのための開発者API (SPARK-27396)
DSV2を使用した組み込みソース移行: parquet, ORC, CSV, JSON, Kafka, Text, Avro (SPARK-27589)
SparkExtensionsでのFunctionInjectionを許可 (SPARK-25560)

コネクタの強化

高パフォーマンスS3Aコミッターをサポート (SPARK-23977)
非決定性式による列プルーニング (SPARK-29768)
データソーステーブルでのspark.sql.statistics.fallBackToHdfsをサポート (SPARK-25474)
ファイルソースでのサブクエリフィルターによるパーティションプルーニングを許可 (SPARK-26893)
データソースフィルターでのサブクエリのプッシュダウンを回避 (SPARK-25482)
ファイルソースからの再帰的なデータロード (SPARK-27990)
Parquet/ORC
- 離散述語のプッシュダウン (SPARK-27699)
- ネストされた列プルーニングの一般化 (SPARK-25603) およびデフォルトで有効化 (SPARK-29805)
- Parquetのみ
  - ネストされたフィールドのParquet述語プッシュダウン (SPARK-17636)
- ORCのみ
  - ORCのマージスキーマをサポート (SPARK-11412)
  - ORCのネストスキーマプルーニング (SPARK-27034)
  - ORCの述語変換複雑性削減 (SPARK-27105, SPARK-28108)
  - Apache ORCを1.5.9にアップグレード (SPARK-30695)
CSV
- CSVデータソースでのフィルタープッシュダウンをサポート (SPARK-30323)
Hive Serde
- ネイティブデータソースでHive serdeテーブルを読み取る際のスキーマ推論なし (SPARK-27119)
- Hive CTASコマンドは、変換可能な場合はデータソースを使用すべき (SPARK-25271)
- パーティション化されたHiveテーブルへの挿入を最適化するためにネイティブデータソースを使用 (SPARK-28573)
Kafka
- Kafkaヘッダーのサポートを追加 (SPARK-23539)
- Kafkaデリゲーショントークンサポートを追加 (SPARK-25501)
- Kafkaソースに新しいオプションを導入: タイムスタンプによるオフセット（開始/終了） (SPARK-26848)
- Kafkaバッチソースおよびストリーミングソースv1で "minPartitions" オプションをサポート (SPARK-30656)
- Kafkaを2.4.1にアップグレード (SPARK-31126)
新しい組み込みデータソース
- 新しい組み込みバイナリファイルデータソース (SPARK-25348)
- 新しいNo-opバッチデータソース (SPARK-26550) およびNo-opストリーミングシンク (SPARK-26649)

機能強化

[Hydrogen] アクセラレータ対応スケジューラ (SPARK-24615)
結合ヒントの完全なセットを導入 (SPARK-27225)
SQLクエリにPARTITION BYヒントを追加 (SPARK-28746)
Thrift Serverにおけるメタデータ処理 (SPARK-28426)
Scala APIに高階関数を追加 (SPARK-27297)
バリアタスクコンテキストでのシンプルなall gatherをサポート (SPARK-30667)
Hive UDFはUDT型をサポート (SPARK-28158)
CatalystでのDELETE/UPDATE/MERGEオペレータをサポート (SPARK-28351, SPARK-28892, SPARK-28893)
DataFrame.tail を実装 (SPARK-30185)
新しい組み込み関数
- sinh, cosh, tanh, asinh, acosh, atanh (SPARK-28133)
- any, every, some (SPARK-19851)
- bit_and, bit_or (SPARK-27879)
- bit_count (SPARK-29491)
- bit_xor (SPARK-29545)
- bool_and, bool_or (SPARK-30184)
- count_if (SPARK-27425)
- date_part (SPARK-28690)
- extract (SPARK-23903)
- forall (SPARK-27905)
- from_csv (SPARK-25393)
- make_date (SPARK-28432)
- make_interval (SPARK-29393)
- make_timestamp (SPARK-28459)
- map_entries (SPARK-23935)
- map_filter (SPARK-23937)
- map_zip_with (SPARK-23938)
- max_by, min_by (SPARK-27653)
- schema_of_csv (SPARK-25672)
- to_csv (SPARK-25638)
- transform_keys (SPARK-23939)
- transform_values (SPARK-23940)
- typeof (SPARK-29961)
- version (SPARK-29554)
- xxhash64 (SPARK-27099)
既存の組み込み関数の改善
- 組み込み日時関数/操作の改善 (SPARK-31415)
- from_jsonのFAILFASTモードをサポート (SPARK-25243)
- array_sortに新しいコンパレータパラメータを追加 (SPARK-29020)
- filterは、要素だけでなくインデックスも入力として受け取れるようになりました (SPARK-28962)

監視とデバッグ容易性強化

新しいStructured Streaming UI (SPARK-29543)
SHS: 実行中のストリーミングアプリのイベントログをロールオーバー可能にする (SPARK-28594)
SHSのJDBCタブ (SPARK-29724, SPARK-29726)
ユーザーがバッチおよびストリーミングクエリで任意のメトリクスを定義および監視できるAPIを追加 (SPARK-29345)
クエリごとのプランニング時間を追跡するためのインストルメンテーション (SPARK-26129)
基本的なシャッフルメトリクスをSQLExchangeオペレータに配置 (SPARK-26139)
SQLタブにコールサイトではなくSQLステートメントが表示される (SPARK-27045)
SparkUIにツールチップを追加 (SPARK-29449)
履歴サーバーの並列パフォーマンスを改善 (SPARK-29043)
EXPLAIN FORMATTED コマンド (SPARK-27395)
切り捨てられたプランと生成されたコードをファイルにダンプすることをサポート (SPARK-26023)
クエリの出力を記述するためのdescribeフレームワークを強化 (SPARK-26982)
SHOW VIEWS コマンドを追加 (SPARK-31113)
SQLパーサーのエラーメッセージを改善 (SPARK-27901)
Prometheus監視をネイティブにサポート (SPARK-29429)
Executorメモリメトリクスをハートビートに追加し、Executor REST APIで公開 (SPARK-23429)
Executorメトリクスとメモリ使用量インストルメンテーションをメトリクスシステムに追加 (SPARK-27189)

ドキュメントとテストカバレッジ強化

SQLリファレンスを構築 (SPARK-28588)
WebUIのユーザーガイドを構築 (SPARK-28372)
SQL設定ドキュメントのページを構築 (SPARK-30510)
Spark設定のバージョン情報を追加 (SPARK-30839)
PostgreSQLからリグレッションテストを移植 (SPARK-27763)
Thrift-server テストカバレッジ (SPARK-28608)
UDFのテストカバレッジ (python UDF, pandas UDF, scala UDF) (SPARK-27921)

Kubernetes 上のネイティブSparkアプリ

ユーザー指定のドライバーおよびExecutor Podテンプレートをサポート (SPARK-24434)
外部シャッフルサービスなしでの動的割り当てを許可 (SPARK-27963)
K8Sでの動的割り当ての応答性向上 (SPARK-28487)
K8S上のSparkのKerberosサポート (SPARK-23257)
Kubernetesリソースマネージャー（クライアントモード）でのKerberosサポート (SPARK-25815)
Hadoop互換ファイルシステムを持つクライアント依存関係をサポート (SPARK-23153)
k8sバックエンドでの設定可能な認証シークレットソースを追加 (SPARK-26239)
Kubernetesでのサブパスマウントをサポート (SPARK-25960)
K8S向けのPySparkバインディングでPython 3をデフォルトにする (SPARK-24516)

その他の注目すべき変更点

Java 11 サポート (SPARK-24417)
Hadoop 3 サポート (SPARK-23534)
組み込みHive実行を1.2.1から2.3.7にアップグレード (SPARK-23710, SPARK-28723, SPARK-31381)
デフォルトでApache Hive 2.3依存関係を使用 (SPARK-30034)
Scala 2.12をGAにし、2.11を削除 (SPARK-26132)
動的割り当てでのExecutorタイムアウトロジックを改善 (SPARK-20286)
ディスク永続化RDDブロックはシャッフルサービスによって提供され、動的割り当てでは無視される (SPARK-27677)
ブラックリスティングによるハングを回避するために新しいExecutorを取得 (SPARK-22148)
Nettyのメモリプールアロケータの共有を許可 (SPARK-24920)
TaskMemoryManagerとUnsafeExternalSorter$SpillableIterator間のデッドロックを修正 (SPARK-27338)
StructuredStreamingのためのAdmissionControl APIを導入 (SPARK-30669)
Spark Historyメインページのパフォーマンス向上 (SPARK-25973)
SQLリスナーでのメトリクス集計を高速化・スリム化 (SPARK-29562)
シャッフルブロックが同じホストからフェッチされる場合にネットワークを回避 (SPARK-27651)
DistributedFileSystemのファイル一覧表示を改善 (SPARK-27801)
hadoop 2.6 のサポートを削除 (SPARK-25016)

動作の変更

各コンポーネントの移行ガイドをお読みください: Spark Core, Spark SQL, Structured Streaming, PySpark。

移行ガイドで省略されているその他の動作変更がいくつかあります。

Spark 3.0 では、非推奨となっていたクラス org.apache.spark.sql.streaming.ProcessingTime が削除されました。代わりに org.apache.spark.sql.streaming.Trigger.ProcessingTime を使用してください。同様に、org.apache.spark.sql.execution.streaming.continuous.ContinuousTrigger は Trigger.Continuous のために削除され、org.apache.spark.sql.execution.streaming.OneTimeTrigger は Trigger.Once のために非表示になりました。（SPARK-28199）
Scala 2.12 のアップグレードにより、DataStreamWriter.foreachBatch は Scala プログラムとのソース互換性がありません。Scala関数とJavaラムダを区別するために、Scalaソースコードを更新する必要があります。（SPARK-26132）

プログラミングガイド: Spark RDD Programming Guide および Spark SQL, DataFrames and Datasets Guide および Structured Streaming Programming Guide。

MLlib

ハイライト

Binarizer (SPARK-23578), StringIndexer (SPARK-11215), StopWordsRemover (SPARK-29808), および PySpark QuantileDiscretizer (SPARK-22796) に複数列サポートが追加されました。
ツリーベースの機能変換をサポート（SPARK-13677）
2つの新しい評価器 MultilabelClassificationEvaluator (SPARK-16692) と RankingEvaluator (SPARK-28045) が追加されました。
サンプルウェイトサポートが DecisionTreeClassifier/Regressor (SPARK-19591), RandomForestClassifier/Regressor (SPARK-9478), GBTClassifier/Regressor (SPARK-9612), RegressionEvaluator (SPARK-24102), BinaryClassificationEvaluator (SPARK-24103), BisectingKMeans (SPARK-30351), KMeans (SPARK-29967), GaussianMixture (SPARK-30102) に追加されました。
PowerIterationClustering の R API を追加しました。（SPARK-19827）
ML パイプラインの状態を追跡するための Spark ML リスナーを追加しました。（SPARK-23674）
Python で Gradient Boosted Trees に検証セットによる fit を追加しました。（SPARK-24333）
RobustScaler トランスフォーマーを追加しました。（SPARK-28399）
Factorization Machines 分類器と回帰器を追加しました。（SPARK-29224）
Gaussian Naive Bayes (SPARK-16872) および Complement Naive Bayes (SPARK-29942) を追加しました。
Scala と Python の ML 関数パリティ (SPARK-28958)
predictRaw はすべての分類モデルで公開され、predictProbability は LinearSVCModel を除くすべての分類モデルで公開されました。（SPARK-30358）

動作の変更

詳細については移行ガイドをお読みください。

移行ガイドで省略されているその他の動作変更がいくつかあります。

Spark 3.0 では、PySpark の multiclass logistic regression は（正しく）BinaryLogisticRegressionSummary のサブクラスではなく LogisticRegressionSummary を返します。BinaryLogisticRegressionSummary によって公開される追加メソッドは、この場合 anyway で動作しません。（SPARK-31681）
Spark 3.0 では、pyspark.ml.param.shared.Has* ミックスインは setter メソッド set*(self, value) を提供しなくなりました。代わりに、それぞれの self.set(self.*, value) を使用してください。詳細は SPARK-29093 を参照してください。（SPARK-29093）

プログラミングガイド: Machine Learning Library (MLlib) Guide。

SparkR

SparkR の相互運用性における Arrow 最適化 (SPARK-26759)
- R gapply(), dapply(), createDataFrame, collect() によるパフォーマンス向上
Rシェル、IDEの「eager execution」（SPARK-24572)
Power Iteration Clustering の R API (SPARK-19827)

動作の変更

詳細については移行ガイドをお読みください。

プログラミングガイド: SparkR (R on Spark)。

GraphX

プログラミングガイド: GraphX Programming Guide。

非推奨

Python 2 サポートを非推奨 (SPARK-27884)
R < 3.4 サポートを非推奨 (SPARK-26014)
UserDefinedAggregateFunction を非推奨 (Spark-30423)

既知の問題

dropDuplicates オペレータを持つストリーミングクエリは、Spark 2.x で書き込まれたチェックポイントで再開できない場合があります。これは Spark 3.0.1 で修正される予定です。（SPARK-31990）
Web UI では、ジョブリストページが40秒以上ハングする場合があります。これは Spark 3.0.1 で修正される予定です。（SPARK-31967）
JDK9+ で Arrow 用に io.netty.tryReflectionSetAccessible を設定 (SPARK-29923)
AWS SDK を 1.11.655 にアップグレードしたことにより、Hadoop 2.7.3 上の S3N ファイルシステム（jets3t ライブラリに基づくオープンソース NativeS3FileSystem）を使用しているユーザーは、AWS Signature V4 にアップグレードし、バケットエンドポイントを設定するか、S3A（"s3a://"プレフィックス）に移行することを強く推奨します。 jets3t ライブラリはデフォルトでAWS v2を使用し、s3.amazonaws.com をエンドポイントとして使用します。それ以外の場合、以下のケースで 403 Forbidden エラーが発生する可能性があります。
- ユーザーが "+" 文字を含む S3 パスにアクセスし、レガシー S3N ファイルシステムを使用する場合。例: s3n://bucket/path/+file。
- ユーザーが S3N ファイルシステムで S3 へのリクエストに署名するために AWS V2 シグネチャを設定している場合。
S3AFileSystem（例: "s3a://bucket/path"）を使用して S3Select または SQS コネクタで S3 にアクセスしている場合、すべて期待どおりに動作することに注意してください。（SPARK-30968）
パターン文字 'D' を使用した年中の日（day of year）の解析は、年フィールドが欠落している場合に誤った結果を返します。これは、パターン文字列を使用して日時文字列を日時値に解析する to_timestamp のような SQL 関数で発生する可能性があります。これは Spark 3.0.1 で修正される予定です。（SPARK-31939）
サブクエリ内の Join/Window/Aggregate は、キーに -0.0 と 0.0 の値がある場合、誤った結果につながる可能性があります。これは Spark 3.0.1 で修正される予定です。（SPARK-31958）
ウィンドウクエリが予期せず曖昧な自己結合エラーで失敗する場合があります。これは Spark 3.0.1 で修正される予定です。（SPARK-31956）

クレジット

最後に、しかし非常に重要なことですが、このリリースは以下の貢献者なしには不可能でした: Aaruna Godthi, Adam Binford, Adi Muraru, Adrian Tanase, Ajith S, Akshat Bordia, Ala Luszczak, Aleksandr Kashkirov, Alessandro Bellina, Alex Hagerman, Ali Afroozeh, Ali Smesseim, Alon Doron, Aman Omer, Anastasios Zouzias, Anca Sarb, Andre Sa De Mello, Andrew Crosby, Andy Grove, Andy Zhang, Ankit Raj Boudh, Ankur Gupta, Anton Kirillov, Anton Okolnychyi, Anton Yanchenko, Artem Kalchenko, Artem Kupchinskiy, Artsiom Yudovin, Arun Mahadevan, Arun Pandian, Asaf Levy, Attila Zsolt Piros, Bago Amirbekian, Baohe Zhang, Bartosz Konieczny, Behroz Sikander, Ben Ryves, Bo Hai, Bogdan Ghit, Boris Boutkov, Boris Shminke, Branden Smith, Brandon Krieger, Brian Scannell, Brooke Wenig, Bruce Robbins, Bryan Cutler, Burak Yavuz, Carson Wang, Chaerim Yeo, Chakravarthi, Chandni Singh, Chandu Kavar, Chaoqun Li, Chen Hao, Cheng Lian, Chenxiao Mao, Chitral Verma, Chris Martin, Chris Zhao, Christian Clauss, Christian Stuart, Cody Koeninger, Colin Ma, Cong Du, DB Tsai, Dang Minh Dung, Daoyuan Wang, Darcy Shen, Darren Tirto, Dave DeCaprio, David Lewis, David Lindelof, David Navas, David Toneian, David Vogelbacher, David Vrba, David Yang, Deepyaman Datta, Devaraj K, Dhruve Ashar, Dianjun Ma, Dilip Biswal, Dima Kamalov, Dongdong Hong, Dongjoon Hyun, Dooyoung Hwang, Douglas R Colkitt, Drew Robb, Dylan Guedes, Edgar Rodriguez, Edwina Lu, Emil Sandsto, Enrico Minack, Eren Avsarogullari, Eric Chang, Eric Liang, Eric Meisel, Eric Wu, Erik Christiansen, Erik Erlandson, Eyal Zituny, Fei Wang, Felix Cheung, Fokko Driesprong, Fuwang Hu, Gabbi Merz, Gabor Somogyi, Gengliang Wang, German Schiavon Matteo, Giovanni Lanzani, Greg Senia, Guangxin Wang, Guilherme Souza, Guy Khazma, Haiyang Yu, Helen Yu, Hemanth Meka, Henrique Goulart, Henry D, Herman Van Hovell, Hirobe Keiichi, Holden Karau, Hossein Falaki, Huaxin Gao, Huon Wilson, Hyukjin Kwon, Icysandwich, Ievgen Prokhorenko, Igor Calabria, Ilan Filonenko, Ilya Matiach, Imran Rashid, Ivan Gozali, Ivan Vergiliev, Izek Greenfield, Jacek Laskowski, Jackey Lee, Jagadesh Kiran, Jalpan Randeri, James Lamb, Jamison Bennett, Jash Gala, Jatin Puri, Javier Fuentes, Jeff Evans, Jenny, Jesse Cai, Jiaan Geng, Jiafu Zhang, Jiajia Li, Jian Tang, Jiaqi Li, Jiaxin Shan, Jing Chen He, Joan Fontanals, Jobit Mathew, Joel Genter, John Ayad, John Bauer, John Zhuge, Jorge Machado, Jose Luis Pedrosa, Jose Torres, Joseph K. Bradley, Josh Rosen, Jules Damji, Julien Peloton, Juliusz Sompolski, Jungtaek Lim, Junjie Chen, Justin Uang, Kang Zhou, Karthikeyan Singaravelan, Karuppayya Rajendran, Kazuaki Ishizaki, Ke Jia, Keiji Yoshida, Keith Sun, Kengo Seki, Kent Yao, Ketan Kunde, Kevin Yu, Koert Kuipers, Kousuke Saruta, Kris Mok, Lantao Jin, Lee Dongjin, Lee Moon Soo, Li Hao, Li Jin, Liang Chen, Liang Li, Liang Zhang, Liang-Chi Hsieh, Lijia Liu, Lingang Deng, Lipeng Zhu, Liu Xiao, Liu, Linhong, Liwen Sun, Luca Canali, MJ Tang, Maciej Szymkiewicz, Manu Zhang, Marcelo Vanzin, Marco Gaido, Marek Simunek, Mark Pavey, Martin Junghanns, Martin Loncaric, Maryann Xue, Masahiro Kazama, Matt Hawes, Matt Molek, Matt Stillwell, Matthew Cheah, Maxim Gekk, Maxim Kolesnikov, Mellacheruvu Sandeep, Michael Allman, Michael Chirico, Michael Styles, Michal Senkyr, Mick Jermsurawong, Mike Kaplinskiy, Mingcong Han, Mukul Murthy, Nagaram Prasad Addepally, Nandor Kollar, Neal Song, Neo Chien, Nicholas Chammas, Nicholas Marion, Nick Karpov, Nicola Bova, Nicolas Fraison, Nihar Sheth, Nik Vanderhoof, Nikita Gorbachevsky, Nikita Konda, Ninad Ingole, Niranjan Artal, Nishchal Venkataramana, Norman Maurer, Ohad Raviv, Oleg Kuznetsov, Oleksii Kachaiev, Oleksii Shkarupin, Oliver Urs Lenz, Onur Satici, Owen O’Malley, Ozan Cicekci, Pablo Langa Blanco, Parker Hegstrom, Parth Chandra, Parth Gandhi, Patrick Brown, Patrick Cording, Patrick Pisciuneri, Pavithra Ramachandran, Peng Bo, Pengcheng Liu, Petar Petrov, Peter G. Horvath, Peter Parente, Peter Toth, Philipse Guo, Prakhar Jain, Pralabh Kumar, Praneet Sharma, Prashant Sharma, Qi Shao, Qianyang Yu, Rafael Renaudin, Rahij Ramsharan, Rahul Mahadev, Rakesh Raushan, Rekha Joshi, Reynold Xin, Reza Safi, Rob Russo, Rob Vesse, Robert (Bobby) Evans, Rong Ma, Ross Lodge, Ruben Fiszel, Ruifeng Zheng, Ruilei Ma, Russell Spitzer, Ryan Blue, Ryne Yang, Sahil Takiar, Saisai Shao, Sam Tran, Samuel L. Setegne, Sandeep Katta, Sangram Gaikwad, Sanket Chintapalli, Sanket Reddy, Sarth Frey, Saurabh Chawla, Sean Owen, Sergey Zhemzhitsky, Seth Fitzsimmons, Shahid, Shahin Shakeri, Shane Knapp, Shanyu Zhao, Shaochen Shi, Sharanabasappa G Keriwaddi, Sharif Ahmad, Shiv Prashant Sood, Shivakumar Sondur, Shixiong Zhu, Shuheng Dai, Shuming Li, Simeon Simeonov, Song Jun, Stan Zhai, Stavros Kontopoulos, Stefaan Lippens, Steve Loughran, Steven Aerts, Steven Rand, Sujith Chacko, Sun Ke, Sunitha Kambhampati, Szilard Nemeth, Tae-kyeom, Kim, Takanobu Asanuma, Takeshi Yamamuro, Takuya UESHIN, Tarush Grover, Tathagata Das, Terry Kim, Thomas D’Silva, Thomas Graves, Tianshi Zhu, Tiantian Han, Tibor Csogor, Tin Hang To, Ting Yang, Tingbing Zuo, Tom Van Bussel, Tomoko Komiyama, Tony Zhang, TopGunViper, Udbhav Agrawal, Uncle Gen, Vaclav Kosar, Venkata Krishnan Sowrirajan, Viktor Tarasenko, Vinod KC, Vinoo Ganesh, Vladimir Kuriatkov, Wang Shuo, Wayne Zhang, Wei Zhang, Weichen Xu, Weiqiang Zhuang, Weiyi Huang, Wenchen Fan, Wenjie Wu, Wesley Hoffman, William Hyun, William Montaz, William Wong, Wing Yew Poon, Woudy Gao, Wu, Xiaochang, XU Duo, Xian Liu, Xiangrui Meng, Xianjin YE, Xianyang Liu, Xianyin Xin, Xiao Li, Xiaoyuan Ding, Ximo Guanter, Xingbo Jiang, Xingcan Cui, Xinglong Wang, Xinrong Meng, XiuLi Wei, Xuedong Luan, Xuesen Liang, Xuewen Cao, Yadong Song, Yan Ma, Yanbo Liang, Yang Jie, Yanlin Wang, Yesheng Ma, Yi Wu, Yi Zhu, Yifei Huang, Yiheng Wang, Yijie Fan, Yin Huai, Yishuang Lu, Yizhong Zhang, Yogesh Garg, Yongjin Zhou, Yongqiang Chai, Younggyu Chun, Yuanjian Li, Yucai Yu, Yuchen Huo, Yuexin Zhang, Yuhao Yang, Yuli Fiterman, Yuming Wang, Yun Zou, Zebing Lin, Zhenhua Wang, Zhou Jiang, Zhu, Lipeng, codeborui, cxzl25, dengziming, deshanxiao, eatoncys, hehuiyuan, highmoutain, huangtianhua, liucht-inspur, mob-ai, nooberfsh, roland1982, teeyog, tools4origins, triplesheep, ulysses-you, wackxu, wangjiaochun, wangshisan, wenfang6, wenxuanguan

Spark ニュースアーカイブ