写真とAI

テキスト指示で“被写体の向き”まで変化 アドビの最新「生成AI」事情

画像から動画、音声など、幅広い生成が可能なAdobe Firefly

アドビが提供する生成AI機能について、直近のアップデートを解説する説明会が実施された。ここでは、Adobe FireflyやAdobe Photoshopに提供された生成AIの新機能について紹介する。

写真も動画もテキストで編集できるFirefly

Adobe Fireflyは、アドビの生成AIモデルとして更新が続けられており、画像生成における最新モデルは「Firefly Image 5」までアップデート。さらにベクターモデル、デザインモデル、ビデオモデル、オーディオモデルといったように、クリエイティブに関する様々な生成AIモデルが利用できるようになった。

これだけでなく、プロのクリエイターにとって課題となる「品質とビジョンのコントロールを解決する」という目的で実装されているのが、アドビモデル、パートナーモデル、ユーザーモデルという3種類のモデルだ。

アドビモデルは、アドビが提供するFireflyによる生成AIモデルで、コントロールされたコンテンツからのみ学習することで、著作権上の問題が起きることなく、商用でも安全に利用できるというのが1番の特徴となる。

最新の画像生成AI「Firefly Image 5」では、画面上のコンテキストを理解できるようになっている。元の画像に対してテキストで「横向きに変更」などと指示すると、被写体が変わらずに向きだけが変更できるようになっている。画面上のテキストを、同じテイストで変更することなども可能。

オリジナルの画像に対して、テキストによる様々な操作が可能
文字の置き換えも可能。夜景への変換では、単に空を暗くするだけでなく、照明を点灯させるなどの変化も

こうした機能を生かした「画像エディター」は3月11日(水)のリリース。元画像に対して「生成塗りつぶし」の機能を使って別の素材を追加したり、「生成削除」によって画面内の邪魔なオブジェクトを削除したり、といった機能を備える。

画像エディターでは、生成塗りつぶしや生成削除による編集ができる
生成拡張、生成アップスケールといった編集も可能

パートナーモデルは、他社の生成AI機能をFireflyの1機能のように使えるというもの。Fireflyを使うときと同じプロンプト入力画面のモデル選択で選べば、同じUIでそのまま他社のモデルを活用できる。

パートナーモデルは、Fireflyの各種操作の中で他のモデルを選ぶように選ぶことができる

GemniやFLUX、ChatGPTなどの豊富なパートナーモデルが用意され、アドビへの契約だけでそれぞれのパートナーモデルも利用できるため、複数の契約をする必要もなく、各生成AIのサービスにアクセスする必要もない。

豊富なパートナーモデルを用意

例えばNano Banana 2を使ってAdobe Stockの複数の写真を読み込ませれば、その写真を自然な形に組み合わせて合成してくれる。そのまま別のAIモデルを使って動画にすることも可能だ。

Adobe Stockから全く関係ない3人の画像と部屋の画像をピックアップしてNano Nananaで合成したのが右上。右下はそこから動画が生成されている

ユーザーモデルは、自社のアセットなどをFireflyに学習させることでオリジナルのカスタムモデルを作成できるというもの。スタイルや写真設定、自社製品の様々な角度の写真を追加学習させることで、様々なマーケット素材を、一貫性を持った形で作り出せるようになる。

ユーザーがカスタムしたもデルで生成できる。もちろん、こうした追加学習は他のモデルでは使われないという

FireflyのWeb版に新搭載されたのが、動画エディター内の「クイックカット機能」。AIによる動画編集機能で、例えば複数のテーマの講演を収めた1本の動画があったとして、その中から1つのテーマに関する動画を抜き出して、さらにそれを40秒にまとめたいという場合、クイックカットボタンからテキストで指示すると、コンテンツ内容から該当する部分だけを抜き出してまとめてくれる。文字起こしもされるので、さらにテキストからカット編集なども可能。

動画エディターに搭載されたクイックカット。テキストのプロンプトで動画を編集できる
文字起こしからの編集をすることもできる

AIが画像を認識して編集できるPhotoshop

PhotoshopのWeb版とモバイル版に搭載されたのが、「AIアシスタント」機能。まずはベータ版として提供される。この機能では、表示されている画像を認識したうえでテキストによる編集が行える。不要物を削除したり空や背景を置き換えたり、さらに手描きのイラストを写真に変換するといったこともできる。

テキストや手書きの指示によって編集できるAIアシスタント

モバイル版では、マイクを使って音声によるプロンプトでの指示も可能。ベータ版のため、アドビでは今後さらにブラッシュアップしていく考えだ。

他には「オブジェクト回転機能」を搭載。1枚の写真から、オブジェクトを認識してその背面や底面など、写真に写っていない領域も推測して生成する。生成したオブジェクトは、自由に回転させて他の画像と合成できる。この機能も現時点ではパブリックベータとなっている。

さらに、Illustrator向けには「ターンテーブル」機能が追加された。1枚のイラストから360度の様々なバリエーションを生成し、新たな視点のイラストが生成でき、アニメーションGIFへも書き出しできる。こちらもパブリックベータとなっている。

ほぼ同じ機能として、360度の様々な視点のバリエーションが生成できる2つの機能。ちなみにPhotoshopの場合、合成の後「調和」機能を使えば、より自然な合成ができる

クリエイティブ業界においてはAIの利用が進んでおり、今まではプロのクリエイターでないと難しかったような、アイデアを形にするような作業が一般的にできるようになってきたと同社は指摘。そうした中でプロのクリエイターが強みをどのように示せるかが重要になっており、アドビでは、AIは単なる自動化ツールではなく、ビジョンを実現する最高の相棒、アシスタントを目指しているという。

小山安博

某インターネット媒体の編集者からライターに転身。無節操な興味に従ってデジカメ、スマートフォン、キャッシュレスなどといったジャンルをつまみ食い。軽くて小さいものにむやみに愛情を感じるタイプで、「世界最小・最軽量」が大好物。たいてい何か新しいものを欲しがっている。