Spark提供 | Apache Spark

「Spark」を使用するプロジェクトおよび製品名

Apache Sparkと連携する製品やプロジェクトを作成している組織、および関連するマーケティング資料については、「Apache Spark」およびそのロゴの商標を尊重するように注意してください。ASFの商標の適切な使用に関する包括的かつ権威あるガイダンスについては、ASF商標ガイドラインおよび関連するFAQを参照してください。

「Spark」を全く含まない名前は、Sparkプロジェクトとの商標上の問題は一切ありません。こちらをお勧めします。

「Spark BigCoProduct」のような名前は、一般的な「Spark」を含む名前と同様に、適切ではありません。ただし、上記のリンクには、「BigCoProduct, powered by Apache Spark」や「BigCoProduct for Apache Spark」のような名前の例外がいくつか記載されています。

「spark-foo」のようなソフトウェア識別子（Maven座標、モジュール名など）を作成することは一般的です。これらは許可されます。説明文での商標の nominative use (言及のための使用) も常に許可されます。例えば、「BigCoProductはApache Spark向けのウィジェットです」のような場合です。

企業および組織

リストに追加するには、dev@spark.apache.orgに、組織名、URL、使用しているSparkコンポーネントのリスト、およびユースケースの簡単な説明を記載してメールでお送りください。

UC Berkeley AMPLab - Sparkを最初に立ち上げたビッグデータ研究ラボ
- Spark上で様々なオープンソースプロジェクトを構築しています。
- 大学院生とプロのソフトウェアエンジニアのチームがスタックに取り組んでいます。
4Quant
Act Now
- NOW APPSは、ビッグデータ、リアルタイム、予測分析プラットフォームをSparkで稼働させています。通信データに適用されるバッチETLおよび分析の両方でSpark SQL、MLlib、GraphXコンポーネントを使用しており、オペレーターにより迅速でより有益な洞察と実行可能なデータを提供しています。
Agile Lab
- ビッグデータの強化。360度顧客ビュー、ログ分析、BI
Alibaba Taobao
- 世界初のSpark on YARN本番クラスタを構築しました。
Alluxio
- Alluxio（旧Tachyon）は、メモリ速度で異種ストレージシステムを統合する世界初のシステムです。
Amazon
Art.com
- トレンド分析とパーソナライゼーション
AsiaInfo
- Spark Core、Streaming、MLlib、Graphxを使用しています。SparkとHadoopエコシステムを活用して、通信業界やその他の産業分野のお客様にコスト効率の高いデータセンターソリューションを構築しています。
atp
- プログラムマーケティングの関連性を向上させるための予測モデルと学習アルゴリズム。
- 使用コンポーネント：Spark SQL、MLLib。
Autodesk
Baidu
Bakdata – Spark（およびShark）を使用して大規模データセットのインタラクティブな探索を実行しています。
Big Industries - Spark Streamingを使用：Big Content Platformは、ビジネス間コンテンツアセット管理サービスであり、検索可能な集約されたライブニュースフィード、パブリックドメインメディア、コンテンツアーカイブを提供します。
Celtra
ClearStory Data – ClearStoryのプラットフォームと統合されたData Intelligenceアプリケーションは、Sparkを活用して内部および外部のデータソース全体での分析を高速化し、包括的で実行可能な洞察を推進します。
Concur
- Spark SQL、MLlib
- 旅行および経費分析とパーソナライゼーションにSparkを使用しています。
Content Square
- Sparkを使用して生のデータを定期的に読み取り、Parquetに変換し、高度な分析ダッシュボード（集計、サンプリング、統計計算、異常検出、機械学習）を作成するために処理しています。
Conviva – ライブ体験
- リアルタイムのビデオ最適化を提供するためにSparkを使用する方法について、AmpCampでの私たちの講演をご覧ください。
Credit Karma
- Sparkを使用してパーソナライズされたエクスペリエンスを作成しています。
Databricks
- Apache Sparkのオリジナルの作成者によって設立されたDatabricksは、オープンソースプロジェクトの拡張とビッグデータおよび機械学習の簡素化に取り組んでいます。Sparkに関するすべての作業をオープンソースに維持することに深くコミットしています。
- Amazon Web ServicesおよびAzureでSparkおよびMLアプリケーションを実行するためのクラウド最適化プラットフォーム、および包括的なトレーニングプログラムを提供しています。
Data Mechanics
- Data Mechanicsは、顧客のAWS、GCP、またはAzureクラウド環境内のKubernetesクラスタにデプロイできるクラウドネイティブSparkプラットフォームです。
- データエンジニアリングワークロードでSparkを使いやすく、コスト効率の高いものにすることに注力しています。また、無料のクロスプラットフォームで部分的にオープンソースのSpark監視ツールであるData Mechanics Delightも開発しています。
Data Pipelines
- シンプルなノーコードUIで、ETLパイプラインをステップバイステップで構築およびスケジュールします。
Dianping.com
Drawbridge
eBay Inc.
- ログトランザクション集計と分析にSparkコアを使用しています。
Elsevier Labs
- ユースケース：機械読解パイプライン、ナレッジグラフ、コンテンツアズアサービス、コンテンツおよびイベント分析、コンテンツ/イベントベースの予測モデル、ビッグデータ処理の構築。
- ほとんどの作業には、Databricks Notebook上でScalaとPythonを使用しています。
EURECOM
Exabeam
Faimdata
- Spark/Shark/Spark Streaming上に小売業界向けのeコマースおよびデータインテリジェンスソリューションを構築しています。
Falkonry
Flytxt
- 通信ドメインにおける加入者プロファイリングとパーソナライゼーションのためのビッグデータ分析。Spark CoreとMLlibを使用しています。
Freeman Lab at HHMI
- リアルタイムでの大規模な脳活動記録のパターン分析と可視化にSparkを使用しています。
Fundacion CTIC
GraalSystems
- GraalSystemsは、クラウド環境でもベアメタルインフラストラクチャでも、どこでも使用できるクラウドネイティブデータプラットフォームです。
Groupon
GoDataDriven
- アムステルダムを拠点とするコンサルティング会社で、企業がSparkで成功できるよう支援しています。
Guavus
- ネットワークマシンデータのストリーム処理。
Hitachi Solutions
The Hive
IBM Almaden
InfoObjects
- SparkとHadoopに注力した受賞歴のあるビッグデータコンサルティング会社。
Inspur
IOMETE - IOMETEは、オンプレミスおよびプライベートクラウドにクラウドのようなエクスペリエンスを提供する最新のクラウドプリムデータレイクハウスプラットフォームを提供しています。Apache Sparkをクエリエンジンとして利用し、AWS、Azure、GCP、またはオンプレミスでSparkジョブとMLアプリケーションを実行できるようにします。詳細についてはIOMETEをご覧ください。
Istanbul Sehir University
Kenshoo
- デジタルマーケティングソリューションと予測メディア最適化。
Kelkoo
- Spark Core、SQL、Streamingを使用。製品レコメンデーション、BIおよび分析、リアルタイム悪意のあるアクティビティフィルタリング、データマイニング。
Knoldus Software LLC
Localytics
- モバイルアプリ分析およびマーケティングオートメーション製品を推進するバッチ、リアルタイム、および予測分析。
- 使用コンポーネント：Spark、Spark Streaming、MLLib。
MediaCrossing – ニューヨークおよびボストン地域のデジタルメディアトレーディングエキスパート。
- Hadoop Map/Reduceのドロップイン代替としてSparkを使用し、クエリに対する回答をはるかに短い時間で得ています。
MyFitnessPal
- Sparkを使用して、明示的および暗示的なユーザーシグナルを利用してユーザー入力の食品データをクリーンアップし、最終的に高品質の食品アイテムを特定することを目指しています。
- Sparkを使用して、レシピや食品のさまざまなレコメンデーションシステムを構築しています。
NASA JPL - Deep Space Network
Netease
Nokia Solutions and Networks
NTT DATA
Nube Technologies
- Nubeは、顧客ターゲティング、正確な在庫、効率的な分析を支援する、大規模なデータキュレーションソリューションを提供します。
Ooyala, Inc. – すべての画面でパーソナライズされたビデオエクスペリエンスを強化。
- 高速クエリにSparkを使用する方法に関するブログ記事をご覧ください。
- Cassandra、Spark、Sharkに関するプレゼンテーションをご覧ください：Cassandra, Spark, and Shark
Opentable
- ログ処理およびETLにApache Sparkを使用しています。取得したデータは、Spark MLLIB Matrix Factorizationによって強化されたレコメンダーシステムに供給されます。リアルタイム分析のためにSpark Streamingの使用を評価しています。
PanTera
- PanTeraは、大規模データセットを探索するためのツールです。Sparkを使用して、数百万から数十億のデータポイントからXYおよび地理的散布図を作成します。
- 使用コンポーネント：Spark Core（Scala API）、Spark SQL、GraphX。
PlanBMedia
Apache PredictionIO
- PredictionIOは現在、Apache Spark MLlib向けの2つのエンジンテンプレート（レコメンデーション（MLlib ALS）および分類（MLlib Naive Bayes））を提供しています。これらのテンプレートを使用すると、カスタム予測エンジンを効率的に作成し、本番環境にデプロイできます。
Premise
Quantifind
Radius Intelligence
- Radius MarketingおよびSalesインテリジェンスプラットフォーム（データ集計、データ処理、データクラスタリング、データ分析、および米国のすべてのビジネスの予測モデリングを含む）にScala、Spark、MLLibを使用しています。
Real Impact Analytics
- 通信事業者向けの С大?規模分析プラットフォームを構築しています。
RocketFuel
RONDHUIT
- Apache MahoutとSparkによる機械学習 http://www.rondhuit.com/services/training/mahout-ML.html
Sailthru
- マーケティングオートメーションとパーソナライゼーションのための予測モデルとレコメンデーションシステムを構築するためにSparkを使用しています。
Samsung Research America
Shopify
Simba Technologies
- Sparkおよびそれ以降のBI/レポート/ETL。
Sinnia
SK Telecom
- SK Telecomは、SparkとSharkで顧客のモバイル利用パターンを分析しています。
Sohu
Stanford DAWN
- 使いやすい機械学習のためのインフラストラクチャに関する研究ラボで、Apache Spark上で実行または高速化する複数の研究プロジェクトがあります。
Stratio
- Apache Sparkを中心としたオープンソースのビッグデータプラットフォームを提供しています。
Taboola – ウェブ上の「あなたにおすすめのコンテンツ」を推進。
Tencent
Tetra Concepts
TrendMicro
TripAdvisor
UC Santa Cruz
University of Missouri Data Analytics and Discover Lab
VideoAmp
- オンラインおよびテレビ視聴者向けのインテリジェントビデオ広告。
Vistar Media
- 外出中の消費者にリーチできるブランドを可能にするロケーションテクノロジー企業。
Yahoo!
Yandex
- 検索ロボットから識別されたアイランドを処理するために、Yandex IslandsでSparkを使用しています。
Zaloni
- Zaloniのデータレイク管理プラットフォーム（Bedrock）とセルフサービスデータ準備ソリューション（Mica）は、Sparkを活用して変換とデータ探索を高速に実行します。

「Spark」を使用するプロジェクトおよび製品名

企業および組織

最新ニュース