米Luma AIは6月12日(現地時間)、テキストから高品質でリアルな動画を生成できる動画生成AIモデル「Dream Machine」をリリースした。

このリリースの最大の特徴は、誰でもすぐに体験できることである。AI動画生成はディープフェイクや誤情報の作成から知的財産権の侵害まで悪用の可能性が特に懸念されている領域であり、また生成に多くの計算リソースを消費する。そのためOpenAIの「Sora」や中国Kuaishou(快手)の「Kling」はアクセスに制限を設けているが、Lumaは誰でも試せるオープンなアプローチを選択した。Dream Machineのサイトにおいてユーザー登録するだけで、120フレーム/24fpsの動画を月30本まで無料作成できる。

Dream Machineは、スケーラブルで効率的なマルチモーダルトランスフォーマー(MulT)アーキテクチャ上に構築されており、動画によってトレーニングされている。Lumaは「物理的に正確で一貫性があり、アクションを詰め込んだシーンを生成できる」とアピールしており、実際に初期のベータテスターから、スムーズなカメラの動きや、指定されたオブジェクト、キャラクター、アクション、環境を忠実にレンダリングする能力が評価されていた。

試してみたところ、白熊が雪原を歩いていても雪に足跡が残らない不自然なシーンもあったが、動画の品質は高く、プロンプトを使って被写体をリアルに動かせる。

  • リファレンスイメージにも対応
  • 参考イメージをアップロードして、プロンプトと組み合わせることも可能

Dream Machineはリサーチプレビューだが、有料プランも用意されており、スタンダード(120生成/月):29.99ドル、Pro (400生成/月):99.99ドル、Premieer (2,000生成/月):499.99ドルとなっている。また、クリエイティブ・ソフトウェア用のAPIやプラグインを提供する計画も進めている。