Ep.809 ByteDance「Seedance 1.5 Pro」発表──“音と映像”を同時生成する動画AIの進化(2025年12月25日配信)
Failed to add items
Add to basket failed.
Add to Wish List failed.
Remove from Wish List failed.
Follow podcast failed
Unfollow podcast failed
-
Narrated by:
-
By:
About this listen
2025年も残りわずかとなった12月16日、動画プラットフォームの巨人・ByteDanceが、生成AI競争における強力なカードを切ってきました。同社の研究チーム「ByteDance Seed」が発表した新モデル、「Seedance 1.5 Pro」です。これは、OpenAIのSoraやGoogleのVeoといったライバルたちがひしめく動画生成AI市場に対し、「音」という武器で勝負を挑む野心的なモデルです。
これまでの動画生成AIの多くは、「無音の映像」を作り出すことに主眼が置かれていました。そのため、クリエイターは生成された映像に合わせて、後から効果音やセリフを別撮りして合成する必要がありました。しかし、今回登場したSeedance 1.5 Proの最大の特徴は、「最初から音と映像がセットで生成される」という点です。
例えば、京劇の役者が舞台で舞うシーンを生成すると、その足取りに合わせた床のきしみや、口の動きに完全にシンクロした歌声が同時に出力されます。また、アニメ調のキャラクターが告白するシーンでは、恥じらいのある表情に合わせて声のトーンも震えるといった、感情面での整合性も取れています。これは、映像生成と音声生成を別々のプロセスではなく、一つの統合されたモデルとして処理しているからこそ実現できる芸当です。
Web上の技術解説やデモ動画を確認すると、このモデルは特に「物語を作ること」に特化していることが分かります。一枚のキャラクター画像から動画を生成する「I2V」機能を使っても、カットが変わるたびに顔が変わってしまうという生成AI特有の弱点を抑え、一貫したキャラクター性を持たせたまま複数のシーンをつなげることができます。サスペンスドラマの緊迫した心音や、コメディの方言による掛け合いなど、ジャンルを問わず「使える」素材を生み出す能力は、ショートドラマ市場を独占するByteDanceならではの強みと言えるでしょう。
開発チームは「複雑なアクションシーンなどでの物理的な挙動にはまだ改善の余地がある」と認めていますが、TikTokやCapCutといった自社アプリにこの技術が実装されれば、一般ユーザーがスマホ一つで映画並みの作品を作る未来が、また一歩現実に近づくことになります。