「Spark」を使用するプロジェクト名と製品名

Apache Sparkとそのロゴの商標を尊重するために、Apache Sparkと共に使用する製品やプロジェクトを作成する組織は、「Apache Spark」の商標とそのロゴの適切な使用方法に関する包括的で権威のあるガイダンスについては、ASF商標ガイドラインおよび関連するFAQを参照してください。

「Spark」を全く含まない名称は、Sparkプロジェクトとの商標問題の可能性がありません。これは推奨されます。

「Spark BigCoProduct」のような名称は認められません。「Spark」を含む名称は一般的に認められません。ただし、上記のリンクでは、「BigCoProduct, powered by Apache Spark」や「BigCoProduct for Apache Spark」のような名称に関するいくつかの例外が記述されています。

「spark-foo」のようなソフトウェア識別子(Maven座標、モジュール名など)を作成するのが一般的です。これらは許可されています。説明における商標の冠詞的使用も常に許可されています。「BigCoProductはApache Spark用のウィジェットです」など。

企業と組織

リストに自身を追加するには、組織名、URL、使用しているSparkコンポーネントのリスト、およびユースケースの簡単な説明を記載して、dev@spark.apache.orgにメールを送信してください。

  • UC Berkeley AMPLab - Sparkを最初に立ち上げたビッグデータ研究ラボ
    • Spark上で様々なオープンソースプロジェクトを開発しています。
    • 大学院生とプロのソフトウェアエンジニアのチームの両方がスタックに取り組んでいます。
  • 4Quant
  • Act Now
    • Sparkは、ビッグデータ、リアルタイム、予測分析プラットフォームであるNOW APPSを支えています。バッチETLと通信データに適用される分析の両方に対して、Spark SQL、MLlib、GraphXコンポーネントを使用し、オペレーターに迅速かつ有益な洞察と実行可能なデータを提供しています。
  • Agile Lab
    • ビッグデータの強化。360度顧客ビュー、ログ分析、BI
  • Alibaba Taobao
    • 世界で最初のSpark on YARN本番クラスタの1つを構築しました。
  • Alluxio
    • Alluxio(旧Tachyon)は、異なるストレージシステムをメモリ速度で統合する世界初のシステムです。
  • Amazon
  • Art.com
    • トレンド分析とパーソナライズ
  • AsiaInfo
    • Spark Core、Streaming、MLlib、Graphxを使用しています。SparkとHadoopエコシステムを活用して、通信業界やその他の産業セクターのお客様向けに費用対効果の高いデータセンターソリューションを構築しています。
  • atp
    • プログラマティックマーケティングの関連性を向上させるための予測モデルと学習アルゴリズム。
    • 使用コンポーネント:Spark SQL、MLLib。
  • Autodesk
  • Baidu
  • Bakdata – Spark(およびShark)を使用して、大規模データセットの対話型探索を実行しています。
  • Big Industries - Spark Streamingを使用:Big Content Platformは、検索可能なライブニュースフィード、パブリックドメインメディア、コンテンツアーカイブを集約したソースを提供するビジネスツービジネスコンテンツ資産管理サービスです。
  • Celtra
  • ClearStory Data – ClearStoryのプラットフォームと統合されたデータインテリジェンスアプリケーションは、Sparkを活用して内部および外部データソース全体の分析速度を向上させ、包括的で実行可能な洞察を促進します。
  • Concur
    • Spark SQL、MLlib
    • 旅行と経費の分析とパーソナライズにSparkを使用しています。
  • Content Square
    • Sparkを使用して、生データの定期的な読み取り、Parquetへの変換、高度な分析ダッシュボードの作成(集計、サンプリング、統計計算、異常検出、機械学習)を行っています。
  • Conviva – エクスペリエンスライブ
  • Credit Karma
    • Sparkを使用してパーソナライズされたエクスペリエンスを作成しています。
  • Databricks
    • Apache Sparkのオリジナル作成者によって設立されたDatabricksは、オープンソースプロジェクトの拡張とビッグデータおよび機械学習の簡素化に取り組んでいます。Sparkに関するすべての作業をオープンソースとして維持することに深く取り組んでいます。
    • Amazon Web ServicesとAzure上でSparkとMLアプリケーションを実行するためのクラウド最適化プラットフォームと、包括的なトレーニングプログラムを提供しました。
  • Data Mechanics
    • Data Mechanicsは、顧客のAWS、GCP、またはAzureクラウド環境内のKubernetesクラスタにデプロイできるクラウドネイティブのSparkプラットフォームです。
    • データエンジニアリングワークロードのためにSparkを簡単に使用し、費用対効果を高めることに重点を置いています。また、無料でクロスプラットフォームで、部分的にオープンソースのSpark監視ツールData Mechanics Delightも開発しています。
  • Data Pipelines
    • シンプルなノーコードUIを介して、段階的にETLパイプラインを構築およびスケジュールします。
  • Dianping.com
  • Drawbridge
  • eBay Inc.
    • ログトランザクションの集計と分析にSparkコアを使用しています。
  • Elsevier Labs
    • ユースケース:機械読解パイプライン、ナレッジグラフ、コンテンツ・アズ・ア・サービス、コンテンツおよびイベント分析、コンテンツ/イベントベースの予測モデル、ビッグデータ処理。
    • ほとんどの作業にDatabricks Notebook上でScalaとPythonを使用しています。
  • EURECOM
  • Exabeam
  • Faimdata
    • Spark/Shark/Spark Streaming上に構築された小売業界向けのeコマースとデータインテリジェンスソリューションを構築しています。
  • Falkonry
  • Flytxt
    • 通信分野における加入者プロファイリングとパーソナライズのためのビッグデータ分析。Spark CoreとMLlibを使用しています。
  • HHMIのFreeman Lab
    • 大規模な脳活動記録のパターンをリアルタイムで分析および視覚化するためにSparkを使用しています。
  • Fundacion CTIC
  • GraalSystems
    • GraalSystemsは、クラウド環境またはベアメタルインフラストラクチャのどこにでも使用できるクラウドネイティブのデータプラットフォームです。
  • Groupon
  • GoDataDriven
    • アムステルダムを拠点とするコンサルティング会社で、企業がSparkで成功するのを支援しています。
  • Guavus
    • ネットワークマシンデータのストリーム処理
  • Hitachi Solutions
  • The Hive
  • IBM Almaden
  • InfoObjects
    • SparkとHadoopに重点を置いた、受賞歴のあるビッグデータコンサルティング会社
  • Inspur
  • IOMETE - IOMETEは、クラウドのようなエクスペリエンスをオンプレミスとプライベートクラウドに拡張する、最新のクラウドプレミスデータレイクハウスプラットフォームを提供しています。クエリエンジンとしてApache Sparkを利用して、AWS、Azure、GCP、またはオンプレミスでSparkジョブとMLアプリケーションを実行できるようにします。IOMETEで詳細をご覧ください。
  • イスタンブール・シェヒル大学
  • Kenshoo
    • デジタルマーケティングソリューションと予測メディア最適化
  • Kelkoo
    • Spark Core、SQL、Streamingを使用しています。製品推奨、BIと分析、リアルタイムの悪意のあるアクティビティのフィルタリング、データマイニング。
  • Knoldus Software LLC
  • Localytics
    • バッチ、リアルタイム、および予測分析により、モバイルアプリ分析とマーケティングオートメーション製品を推進しています。
    • 使用コンポーネント:Spark、Spark Streaming、MLLib。
  • MediaCrossing – ニューヨークとボストン地域のデジタルメディア取引のエキスパート
    • クエリに対する正しい答えをはるかに短い時間で得るために、Hadoop Map/Reduceのドロップイン置換としてSparkを使用しています。
  • MyFitnessPal
    • 明示的および暗黙的なユーザーシグナルの両方を使用して、ユーザーが入力した食品データをクリーンアップし、高品質の食品アイテムを特定することを最終目標として、Sparkを使用しています。
    • レシピや食品に対するさまざまなレコメンデーションシステムを構築するためにSparkを使用しています。
  • NASA JPL - ディープスペースネットワーク
  • Netease
  • ノキア・ソリューションズ・アンド・ネットワークス
  • NTT DATA
  • Nube Technologies
    • Nubeは、顧客ターゲティング、正確な在庫、効率的な分析を支援する大規模なデータキュレーションのためのソリューションを提供しています。
  • Ooyala, Inc. – すべての画面でパーソナライズされたビデオエクスペリエンスを提供
  • Opentable
    • ログ処理とETLにApache Sparkを使用しています。取得されたデータは、Spark MLLIB Matrix Factorizationによって強化されたレコメンデーションシステムにフィードされます。リアルタイム分析のためにSpark Streamingの使用を評価しています。
  • PanTera
    • PanTeraは大規模データセットを探索するためのツールです。数百万から数十億のデータポイントからXY散布図と地理的散布図を作成するためにSparkを使用しています。
    • 使用しているコンポーネント:Spark Core(Scala API)、Spark SQL、GraphX
  • PlanBMedia
  • Apache PredictionIO
    • PredictionIOは現在、レコメンデーション(MLlib ALS)と分類(MLlib Naive Bayes)のためのApache Spark MLlibの2つのエンジンテンプレートを提供しています。これらのテンプレートを使用すると、本番環境への効率的な展開のためにカスタム予測エンジンを簡単に作成できます。
  • Premise
  • Quantifind
  • Radius Intelligence
    • 米国のすべての企業のデータ集約、データ処理、データクラスタリング、データ分析、および予測モデリングを含む、Radiusマーケティングおよび営業インテリジェンスプラットフォームのために、Scala、Spark、MLLibを使用しています。
  • Real Impact Analytics
    • 通信事業者向けの大規模分析プラットフォームを構築しています。
  • RocketFuel
  • RONDHUIT
  • Sailthru
    • マーケティングオートメーションとパーソナライズのために予測モデルとレコメンデーションシステムを構築するためにSparkを使用しています。
  • Samsung Research America
  • Shopify
  • Simba Technologies
    • Sparkおよびその他のBI/レポート/ETL
  • Sinnia
  • SK Telecom
    • SK Telecomは、SparkとSharkを使用して顧客のモバイル使用パターンを分析しています。
  • Sohu
  • Stanford DAWN
    • 使用可能な機械学習のためのインフラストラクチャに関する研究ラボで、Apache Spark上で実行または高速化する複数の研究プロジェクトがあります。
  • Stratio
    • Apache Sparkを中心としたオープンソースのビッグデータプラットフォームを提供しています。
  • Taboola – ウェブ上の「あなたにおすすめのコンテンツ」を提供
  • Tencent
  • Tetra Concepts
  • TrendMicro
  • TripAdvisor
  • UCサンタクルーズ
  • ミズーリ大学データ分析およびディスカバリーラボ
  • VideoAmp
    • オンラインおよびテレビ視聴者のためのインテリジェントなビデオ広告。
  • Vistar Media
    • 外出中の消費者にリーチできるようにする位置情報テクノロジー企業
  • Yahoo!
  • Yandex
    • Yandex Islandsで、検索ロボットから識別されたアイランドを処理するためにSparkを使用しています。
  • Zaloni
    • Zaloniのデータレイク管理プラットフォーム(Bedrock)とセルフサービスデータ準備ソリューション(Mica)は、変換とデータ探索の高速実行のためにSparkを活用しています。