ニュース

「5年後、10年後には当たり前になる」…映像における生成AIの可能性と課題

Adobe MAX Japan 2025セッション「生成AIが切り拓く映像クリエイティブの世界」より

セッション「生成AIが切り拓く映像クリエイティブの世界」に登壇した清水勝太氏

アドビが開催するクリエイター向けの祭典「Adobe MAX Japan 2025」が東京ビッグサイトで開催され、米Adobe CEOのシャンタヌ・ナラヤン氏も登壇した基調講演に続いて、様々なクリエイターなどがセッションを行って注目を集めた。その中で本稿では、「生成AIが切り拓く映像クリエイティブの世界」と題したセッションをお届けする。

このセッションは、合同会社KOEL・WITCRAFT合同会社のディレクター・クリエイティブコンダクターである清水勝太氏が、生成AIを活用した映像制作の現状と未来について語ったもの。

生成AIによる新たな映像制作の可能性と課題、そしてその将来とは。

生成AIによる動画制作、3つの強み

清水氏は、博報堂プロダクツ、ADKマーケティング・ソリューションズを経て、KOELを設立。2023年から生成AIを活用した映像・グラフィック制作を始めているという。2024年7月には生成AIを活用した広告やコンテンツの制作サービス「DO/AI」の立ち上げに、クリエイティブ統括責任者として参画している。

セッションで最初に紹介されたのは、国際AI映画制作コンペティション「Project Odyssey」に出展された「Sojourn - ROLEX -」。これは映像、音楽、ナレーション全てをAIで生成した作品で、「2日間ぐらいで制作した」と清水氏。

生成AIを使った動画「Sojourn - ROLEX -」の1場面

生成AIを使う動画制作のワークフローとして清水氏は、まず画像精製用のプロンプトを作成するためにChatGPTやClaude、DeepLを使用。こうして作成したプロンプトを使ってMidjourney、Adobe Firefly、StableDiffusionを用いて画像を生成する。生成した画像を使ってRunwa、Luma、KLING、Adobe Firefly、SORA、Hailuoによる動画生成を実施。

これに音楽作曲・生成のUdio、Suno、動画アップスケールのTopazを加え、最終的にAdobe Premiere Proで動画を編集した。

複数のサービスを併用しているのは、「画像に対してどの動画がワークするか毎回異なるので、使い分けたり検証したりしながら動画化した」(清水氏)からだという。

清水氏が活用した生成AIサービス。最終的にはAdobe Premiere Proで編集した

こうした生成AIを使った動画の制作に対して清水氏は、「(従来の)撮影やCGでできないなんてものはない」と指摘。同時に、「AIらしい表現も存在しない」という。結果として独特の表現が生じることもあるが、「ある種フィルターみたいなもの」だと清水氏は説明する。

それを踏まえた上で生成AIの強みとして清水氏は、「想像の拡張性」、「可視化」、「コストダウン」という3点を挙げる。

想像の拡張性は、「それが全てではないか」と清水氏がいうほどの強み。CGや撮影技術がなくてもアイデアを形にできて、短時間で無限に生成できる。「1枚2枚は創造できても100枚、200枚とそれ以上はなかなかできない」と清水氏。無限に生成できることで、「予想を超えたものや想定外のものも生成できる」。これは、フォトグラファーに撮影をお願いしたり、エディターが作業したりした場合に、自分が想定した以上のものが生まれるような、「クリエイティブジャンプ」が起きるのが強みだという。

同じプロンプトでも無数の異なる結果が生成されるため、クリエイティブジャンプが起きる

可視化は、最初の企画の段階で精度の高いビデオコンテンツを制作できるため、曖昧なコンセプトでも具体的なビジュアルがあるため、早期にチーム全体で共通の認識を持てる、というのが強みだという。

企画段階から精度の高いビデオコンテが作れるという
「LED×自動制御の光の農園」というテーマも、ビデオコンテとして仕上げればイメージしやすくなる

コストダウンは、キャスト、オーディション、ロケ地、ディレクション、撮影、衣装、ヘアメイク、移動、食事、宿泊……など、実際の撮影に必要なコストが削減できるため、コストダウンが図れるというもの。

この映像を撮影するためには多くのコストがかかるが、生成AIならPC1台で完結する。ただ、「簡単につくれそうと思いがちだが、果たしてそうか」と清水氏

生成AIにある5つの難しさ

こうした強みはありつつも、その反面「生成AIには5つの難しさがある」と清水氏は話す。

1つ目は「簡単につくれるという誤解」。そもそも1枚の画像には構図や衣装、登場人物、人物の位置、建物の高さ、時代、季節、時間など様々な要素が含まれる。例えばDO/AIが手がけたなかじましんや監督作品『しんちゃんとお父ちゃん』では、1カットに600枚以上の画像を生成したという。

1カットに生成した画像。よく見ると服の色が入れ替わっているなどの問題が発生している

生成してみると、登場人物の服装が入れ替わるなど、「狙ってもうまく出ない」(清水氏)ことがあって、600枚以上生成せざるをえなかったという。生成自体は数分で終わるものの、制作者が理想とするものを生成するには「非常に時間がかかる」(同)。

さらにそれを動画化しようとしてもプロンプト通りに動かず、数十テイクの生成が必要な場合もあるそうだ。

2つ目は「他者のイメージの可視化」で、個人のアート作品と異なり、広告や映画などのコンテンツは監督やクライアントなど、他者のアイデアや潜在的なイメージを可視化していく必要がある。「きれいな映像が欲しい」と言われて、さらに細かく聞き出そうとしても「一度実際の映像を見てから」といわれてしまうこともあるそうだ。そうした言語化できていない潜在的なイメージを可視化する難しさがあるという。

他者のイメージを可視化するには、多くの情報が必要になるが、それがそもそも難しい

3つ目が「一貫性の維持」で、構図やトーン、質感など、厳密に一貫性を持って生成することが「非常に難しい」と清水氏。特に人物や商品では一貫している必要があり、前述の作品では主人公の顔を1カットで800枚以上生成したという。

主人公の顔が変わってしまうといった一貫性の維持も難しい

こうした場合に、システム開発とクリエイティブの双方の技術が必要だと清水氏は説明する。ただ、現状はプログラミングの知識と映像的な知識を併せ持つ人材が少なく、技術的に一貫性を確保するのが困難だという。

4つ目は「ハルシネーションとの戦い」。これは現状における生成AI全体の課題である、虚偽や誤りを含んだ情報を生成してしまう問題だ。映像でも、指の本数や体の向き、足の長さ、物体にめり込む人物や宙に浮くなど現実では起こりえない現象を生成してしまう。

生成AIに共通したハルシネーション問題は動画制作でも問題になる
人がめり込む、余計な人が生成されるといったハルシネーションが発生している

こうしたハルシネーションを発見して修正するために、品質管理やレタッチャー、コンポジッターが必須で、「AIだけではどうにもできない」と清水氏は話す。

5つ目が「不確実性」。これはAIが学習し切れていない、特定地域特有のローカルなもの、激しい動きなど、理想とするものが必ずしも生成できない場合があるという。清水氏が例として上げたのは「バスケットでドリブルする動画」だ。何が生成できないのかが分からないので、実際にチャレンジしてから初めてそれに気付き、その時にはもう納期に間に合わないといった場合も起こりえる。清水氏は、「早めの判断や事前のテスト、人間の手によるバックアップが必要」だと指摘する。

バスケットボールのドリブルを生成すると、急にボールが2つになったり、動きがおかしかったりする

生成AIには企業情報が学習されるリスクなどもあって、生成AIを用いた広告を避ける企業も多いということで、清水氏も実際に断られたこともあるそう。それでも、最近は大企業が採用する例も出てきて、変化してきているそうだ。

ほかにも、生成AIは「美味しそうに見えない」という欠点もあるという。いわゆるシズル感のような表現が苦手で、実際の商品と全く映像を生成するのは「コストに見合わない」(同)。「将来のイメージや抽象的な表現のような、ファジー、曖昧でもいいという表現には有用」だと清水氏は言う。

こうした課題に対処するために清水氏らが結成したチームがDO/AI。現在13人まで拡大しているという。

生成AIでクリエイティブの民主化

生成AIによる映像に取り組んできた清水氏は、「予算がない時に予算以上のクリエイティブを制作するクリエイティブジャンプアップがトレンドになる」として、今後は「気付けば当たり前になって日常化する」という。

こうした状況で、「撮影やCGの仕事がAIに取って代わられたか」というと、決してそうとは言えないというのが清水氏の分析。例えば予算が限られていた場合は、そもそも今までも動画を撮影しようとはしていなかった。代わりにSNSキャンペーンを行う、といった動画以外のプロモーションだったのが、生成AIに置き換わる形で、「他の施策がAIに取って代わられた」という。

清水氏は、現状について「クリエイティブの民主化が訪れている」と指摘する。これまでのCGの登場に加えてAIの出現で、「ありとあらゆるコンテンツが作れる。誰でもマスクリエイターの時代」だと清水氏は言う。

「個人が企業CMを作る時代がやってくる」と清水氏は指摘。まずは今年から来年にかけて、これまで以上に高品質のAIショート動画がSNSに掲載され、個人クリエイターによる低価格で高品質のコンテンツが増加するというのが、清水氏の予測だ。

そうした個人の台頭に対して、「プロはどう差別化して生き残るか」と清水氏は問いかける。それに対して清水氏の回答は「チームの力が大事」というものだ。実際の企業CMなどでは、クライアントの対応、潜在的なイメージの言語化、「このシーンは撮影の方が早い」といったような撮影と併用するディレクション、ハルシネーションや著作権のチェックといった様々な対応が求められる。「案件が大きくなればなるほど、それが必要になる」と清水氏。

また、映像のプロフェッショナルであれば、現在の企画力や撮影、照明などの技術、クライアントへの対応など、これまでの積み重ねがあり、「細かいところが効いてくる」と清水氏。これまでのノウハウは、生成AIによる映像制作でも生かされるという認識だ。

とはいえ清水氏は、「生成AIとプロの協働がもたらす社会全体のクリエイティブの底上げとなり、次世代のクリエイティブが誕生する」と指摘。「新しい、見たことないクリエイティブがどんどんできてくるとポジティブに捉えている」と話した。

「生成AIはあくまでツールの1つ」。清水氏は、このツールを使って「何を表現するか」が大事だと説く。いずれにしても「技術の進化は不可逆的。5年後、10年後には必ず当たり前になる」。清水氏はそう強調し、「将来に不安を覚える人は、AIを使いこなす側に回っては」とアドバイスした。

Adobe Premiere Proの生成拡張を使った映像。清水氏は「拡張した部分が分からなくて衝撃的」だったという。「強力なサポートツールで、生成AIを使いこなすことが当たり前になる」と強調する

ちなみに清水氏は、生成AIが同じトーン、レンズ、映像について、「当たり前の一貫性が解決できたときにブレークスルーが起きるのでは」と予測している。

小山安博

某インターネット媒体の編集者からライターに転身。無節操な興味に従ってデジカメ、スマートフォン、キャッシュレスなどといったジャンルをつまみ食い。軽くて小さいものにむやみに愛情を感じるタイプで、「世界最小・最軽量」が大好物。たいてい何か新しいものを欲しがっている。