Sora終了の真因──AI推論コストの壁が「夢のサービス」を次々と潰している

半年で消えた「夢の動画AI」

2026年に入ってから、AIの世界は本当に変化が激しい。

ハーネスエンジニアリング(AIの入出力を制御する技術)なんて言葉が出てきたと思ったら、次の週にはもう別の概念が登場している。正直、ついていくのがやっとだ。

でも最近気づいたのは、この「変化」には進化だけじゃなくて淘汰も含まれているということ。

2026年3月24日、OpenAIがSora終了を発表した。2024年12月に正式ローンチして、わずか約15ヶ月での撤退。Soraアプリは4月26日に、APIは9月24日に完全停止する。

ダウンロード数もピーク時の333万(2025年11月)から113万(2026年2月)へ、66%も落ちていた。Disneyも10億ドルの出資を撤回している。

技術的には動画生成は十分に機能していた。では、何が問題だったのか?

答えは「コスト」だ。AIにできることと、AIで商売になることの間には、想像以上に巨大な壁がある。

結論:「できる」と「儲かる」はまったく別の話

Soraが消えた理由は技術力の不足じゃない。

推論コスト──つまりAIがサービスとして動くたびにかかる計算コスト。これが収益を完全に圧倒していたんだよね。

数字で見るとわかりやすい。

  • Soraの生涯累計売上:約210万ドル(アプリ内課金)
  • ピーク時の1日の推論コスト:推定1,500万ドル

1日の運用コストが、全期間の売上の約7倍。これはもう事業として成立しない。

Cantor FitzgeraldのアナリストDeepak Mathivanan氏の分析によると、10秒の動画1本を生成するコストは約1.30ドル。4つの並列GPUで合計約40分のGPU時間を使う計算になる。

ピーク時には1日あたり約1,130万本の動画が生成されていたとされる。1,130万本 x 1.30ドルで1日1,500万ドル。年間換算で約54億ドルに達する。

ある業界分析では、こう指摘されている。

「Soraの失敗はAI動画が可能かどうかではない。消費者向けAI動画が現在の計算コストで利益を出せるかどうかだ」──AI推論コストに関する業界レポートより

この構造的な問題は、Soraだけの話じゃない。

なぜこんなにコストがかかるのか──推論コストの構造

動画制作の技術的な作業環境を映したモニター画面 Photo by Jakob Owens on Unsplash

「1日1,500万ドル」のインパクトがわかったところで、なぜここまでコストが膨らむのかを見ていこう。

動画生成が特に高い理由

動画生成AIのコストが突出して高いのには、明確な理由がある。

動画は1秒あたり数十フレームのレンダリングが必要になる。しかも単純な画像の連結じゃない。空間的な関係、運動の物理法則、照明の一貫性、時間的な整合性をすべて同時に計算しないといけない。

特にアテンション計算(入力データ間の関連性を評価する処理)が重い。推論時間の85%以上をこのアテンション計算が占める。しかも時空間の解像度に対して二次関数的にスケーリングする。5秒の720p動画で80,000トークン以上の処理が必要になる。

テキスト生成と比べると、計算量の桁が違うんだよね。

訓練コストの15〜20倍という現実

もう一つ知っておくべきなのは、AI全体のコスト構造だ。

2026年現在、推論はAI計算需要全体の約3分の2を占めている。2023年の約3分の1から倍増した形だ。

しかもモデルの訓練に10億ドルかかったとする。そのライフタイムの推論コストは訓練の15〜20倍、つまり150〜200億ドルかかるとされている。

訓練は一度きりだけど、推論はユーザーが使うたびに発生する。ユーザーが増えれば増えるほどコストも膨らんでいく。

NVIDIA H100のクラウド価格は2024年Q4の8〜10ドル/時から2026年Q1には2.99ドル/時へと、64〜75%下落した。それでも動画生成の計算量には追いつかないのが現状だ。

Soraだけじゃない──消えたAIサービスたち

下落トレンドを示す株式市場のチャート Photo by Arturo Anez on Unsplash

推論コストの壁にぶつかったのはSoraだけじゃない。コスト構造の問題で苦しんだ事例は他にもある。

  • Humane AI Pin:2.3億ドルの投資家資金を消費し、2025年2月に販売終了。クラウドサービス停止後、デバイスはリモートで無効化された
  • Builder.ai:14.5億ドルのピーク評価額を誇ったが、資金枯渇で閉鎖。Microsoftやカタール投資庁(QIA)からの調達も焼き尽くした
  • Google Doppl:AI試着アプリとして2025年6月にリリースするも、2026年4月30日に終了予定。1年持たなかった

共通しているのは、華やかなデモと大型調達のあとに、運用コストが収益を圧倒して撤退に追い込まれるパターンだ。

もっと広い視点で見ると、AI SaaSの粗利率は20〜60%にとどまる。従来のSaaS(70〜90%)を大幅に下回っている。AIを組み込むと、その分だけ利益率が削られる構造になっている。

OpenAI自体も2024年には37億ドルの売上に対して50億ドルの損失を計上。1ドル稼ぐのに1.35〜1.69ドルを費やしている計算になる。

じゃあ何が成功しているのか──生き残るAIの条件

失敗事例ばかり見てきたけど、当然すべてのAIが赤字というわけじゃない。商業的に成功しているAIサービスもある。

  • ChatGPT:週間アクティブユーザー9億人、推定ARR(年間経常収益)約250億ドル。有料AIサブスク市場シェア推定50〜60%
  • GitHub Copilot:有料契約者470万人、Fortune 100企業の90%が導入。推定ARR約10億ドル超
  • Anthropic:ARR約190億ドル、年間成長率7〜10倍。Claude Codeだけでもかなりの売上を上げている

成功しているAIの共通点は明確だ。

テキスト生成は動画生成よりも推論コストが圧倒的に低い。 そして1ユーザーあたりの収益が推論コストを上回る価格設定ができている。エンタープライズ市場でのスケールも効いている。

動画生成でも生き残っているサービスはある。Runwayは月額12ドルからのプロ市場特化で収益化に成功している。Kling AIはRunwayの約40%のコストで同等品質を実現し、累計1,000万本以上の動画を生成した。

特に注目なのはMidjourneyの事例だ。A100/H100からGoogle Cloud TPU v6eに移行することで、月間推論費を210万ドルから70万ドル未満に削減(65%削減)している。

読者が自分の状況に当てはめるなら、こう考えるとわかりやすい。

  • テキスト系AI(チャット、コーディング支援):比較的コスト効率が良く、持続性は高い
  • 画像生成AI:中程度のリスク。価格設定とインフラ次第
  • 動画生成AI:コスト圧力が最も高い。無料プランのみのサービスは要注意

それでも推論コスト問題は解決するのか?

成功事例やコスト削減技術を見ると楽観的になりがちだけど、話はそう単純じゃない。

楽観材料はある。GPT-4相当の推論コストは2022年末の約20ドル/100万トークンから2026年初頭の0.40ドルへ、3年で約1,000倍のコスト削減が実現した。量子化、知識蒸留、FlashAttention-4、投機的デコーディングといった技術の進歩は確かにすごい。NVIDIA Blackwellの登場で、トークンあたりコストは最大10倍削減される見込みもある。

一方で懐疑材料も無視できない。

  • 2028年までにAI推論だけで年間165〜326テラワット時を消費する可能性がある
  • Big Techは2026年にAIインフラへ6,500億ドルの投資を見込んでいる
  • 米国データセンターの電力消費は全国の約4%に達し、2020年から倍増した
  • Microsoft、Google、AmazonはAIデータセンター向けに原子力発電契約を締結している

つまりコストが下がっても、需要がそれ以上のペースで伸びている。いたちごっこの構造だ。

すべてのAIサービスがこの壁を乗り越えられるわけじゃない。技術の進歩は続くけど、「いつ解決するか」ではなく「誰が生き残れるか」という問いの方が現実的だと思う。

華やかなデモの裏側を見る目を持とう

コスト問題が一朝一夕には解決しない以上、僕たち開発者やユーザーには自分で見極める力が必要になる。

実は僕自身、過去にソーシャルレンディングで痛い目に遭った経験がある。年利15%という華やかなリターンの裏にあるリスクを見抜けなかった。結果、約750万円の損失を出している。投資もAIサービスも、裏側のコスト構造を理解しないまま飛びつくと痛い目に遭うという点では同じだと感じている。

AIサービスの持続可能性を見極めるには、こんな観点が役に立つ。

  • 推論コストの重さを推測する:テキスト < 画像 < 動画 < リアルタイム処理の順にコストが高い。自分が使っているサービスがどの位置にいるか意識してみてほしい
  • 価格設定が推論コストを回収できる水準か見る:月額20ドルのサービスと無料のサービスでは、持続可能性がまったく違う
  • 無料・格安の裏にVC資金の補填がないか疑う:Soraも実質的にOpenAIの資金で赤字を補填していた。VC資金が尽きたら終わるサービスは少なくない
  • 料金改定・機能制限の動きをウォッチする:値上げや利用制限の強化は、コスト圧力が高まっているサインかもしれない
  • エクスポート機能を確認しておく:サービス終了時にデータを持ち出せるか確認する。Soraは終了前のエクスポートを推奨していたが、知らなかったユーザーも多いはず

開発者としてAI機能をプロダクトに組み込む際も同じ視点が重要だ。APIの利用料金と自分のサービスの収益構造を突き合わせて、1ユーザーあたりのコストが持続可能かどうか事前にシミュレーションしておくべきだと思う。

具体的には、各AIプロバイダーの料金ページ(例:OpenAI APIのPricingページ)で1リクエストあたりのコストを確認し、自サービスの月間想定リクエスト数と掛け合わせてみるといい。

まとめ

ここまでSoraの終了から推論コストの壁まで見てきた。

要点を整理するとこうなる。

  • Soraは技術的失敗ではなくコスト構造の問題で終了した。生涯売上210万ドルに対し、1日の推論コストが1,500万ドルという壊滅的な収支だった
  • AIサービスの持続可能性は推論コストで決まる。特に動画生成はコスト圧力が桁違いに高い
  • 成功しているAIはコスト構造を工夫している。テキスト系の効率性、エンタープライズ向け価格設定、インフラの最適化がカギになる
  • 華やかなデモの裏側を見る目が必要。推論コストの重さ、価格設定の妥当性、VC資金依存度をチェックする習慣を持つこと

AIの進化は止まらない。でもその恩恵を受けるには、裏側の経済性を理解することが前提になる。

自分が日常的に使っているAIサービスのコスト構造を一度調べてみると、面白い発見があるはず。APIの料金ページを見るだけでも、そのサービスが「どれだけ無理をしているか」が見えてくるかもしれない。

参考リンク