https://note.com/creative_edge/n/nd676706797f7
https://note.com/creative_edge/n/nd676706797f7
先週から、CL+の活動に「対話型の新しいデザインワークの検証」が追加されました。
「次世代のPhotoshopについて考える」シリーズと並行して、2〜5年後に主流になり得る新しいデザイン手法についての検証を続けています。
今日は、実写系キャラクターをChatGPT 4oで設計するプロセスをメモしておきます。
ChatGPT 4oで実写系キャラクターを設計する
ChatGPTとの対話を促すために、わざと情報不足のプロンプトを入力します。
プロンプト:
日本人の若い女性の正面を向いた顔を生成してください。
当然、条件が足りないのでChatGPT 4oから質問されます。
ChatGPT 4oからの質問:
正面を向いた日本人の若い女性の顔を生成するために、よりリアルであなたのイメージに近いものを作るには、以下のようなポイントを教えてもらえるとありがたいです:
髪型(例:ロング、ボブ、前髪あり/なし など)
表情(例:微笑み、真顔、驚き など)
メイクの有無(ナチュラル/濃いめ など)
雰囲気(例:清楚系、ギャル系、クール系、アイドル風 など)
背景(必要なら:白背景/屋外/室内など)
もちろん、おまかせでもOKです!どうしますか?
具体的にプロンプトを書きます。
プロンプト:
髪型はマチルダボブ、無表情、メイクなし、アイドル風、背景は白にしてください。

褒めて煽てて指示するプロンプト:
素晴らしいです!
今度は、この画像のまま、横顔を生成してください。

褒めて煽てて指示するプロンプト:
完璧です!
次は、正面を向いて、少しだけ笑顔にして生成してください。 微笑む感じです。

笑顔はバリエーションがあり、生成しやすいですが、悲しみや怒りなどの感情表現は難易度が高くなるため、この流れで生成させると実写表現から離れる可能性が高くなります(リアルなイラスト表現に寄ってしまう)。
ファッション(衣服)の試行錯誤
Mystic v2.5 (beta) は、ダイレクトに4K出力できる高性能な画像生成AIです。
ファッションイメージはできるだけ高精細なデータにしたいので、アップスケールせずに4Kで生成できるMystic v2.5で試行錯誤します。

Mystic v2.5で生成した画像をダウンロードして、ChatGPT 4oにアップロードします。プロンプトを入力して、服だけ抽出させます。
プロンプト:
この人物が着ている服だけを抽出して、生成してください。 商品写真のように背景は白にしてください。


キャラクターと服を組み合わせます。
プロンプト:
これらの画像を使ってファッションフォトグラフィを生成してください。
人物の表情や髪型は変更せず、忠実に生成してください。
背景は白にしてください。


「人物の表情や髪型は変更せず、忠実に生成してください」で強調しておかないと、ファッションに引っ張られて、一貫性を保つことができません。
実写系の場合、服を「着る」「脱ぐ」のような表現は、OpenAIのガイドライン違反としてブロックされる可能性が高くなります(生成を拒否します)。
着せ替え人形的な画像や指示の出し方は、生成させてくれないことが多いので、別の方法を考える必要があります。
※人物の場合、リアルな写真に近づくほど規制が厳しくなります。カートゥーンやシンプルなイラストでは問題にならないことが多いです。
3DCGを活用したポージング
DAZ Studioを使ってラフな画像を作成します。
※DAZ Studioは無償で提供されている3DCGツールです。
レンダリングすると絵としての完成度が高くなってしまうため、プレビュー状態の画面のスクリーンショットを撮ります。

ポーズリファレンスは、低品質かつラフな画像にすることが重要です。
絵が描ける人はスケッチでもかまいません(ただし、美術解剖学的に間違いのない手・指・関節を描いてください)。

プロンプト:
人物にポーズを当てはめて生成してください。
人物の表情や髪型は変更せず、忠実に生成してください。
背景は白にしてください。


Photoshopの生成拡張で欠けている部分を生成、色調補正をしてベースキャラクターが完成しました。

画像生成からポージングまで、ChatGPT 4oとのやり取りで実行しました。
AI丸投げではなく、人間が全てを妥協なくコントロールした作業になっています。
2〜3年後どうなる?
現在は、生成AIでプランニングワーク、本番作業(ハンドワーク)はPhotoshopという流れですが、2年後、3年後はどうなっているでしょう?
表現力や品質はもちろん向上しますが、レイヤーを分離できたり、ロゴや商品写真などを同一のイメージとして扱うことが可能になりますので、Photoshopの作業はかなり限定的なものになると予想できます(その前にPhotoshopが進化すると思いますが…)。
PhotoshopやAdobe Expressなどに実装されているクイックアクションが、現在のChatGPT 4oのような対話型のUIに変わり、プロ以外のライトユーザーにとって必須の機能になるというイメージですね。
最終的な仕上げ段階での微細な調整、ピクセルレベルでの精密な修正、特定のブランドガイドラインに沿った厳密な色調整、複雑なレイヤー構造の管理といった高度な要求に対しては、依然としてPhotoshopの画像処理が必要とされる場面が多いと考えられます。
ただ、2年、3年経つと状況が変化するかもしれません。プロのデザイナーは技術的な操作スキルよりも、AIで代替できない高次のクリエイティブ判断がより重要になっていくのではないでしょうか。
最後に、恒例の動画生成。
画像をすぐに映像化できるのが凄いところ…
再生時間:29秒
Google Veo 2、KLING v1.6、Runway Gen-4
※OpenAI Soraはハルシネーションが酷くて除外しました
更新日:2025年4月12日(土)/公開日:2025年4月12日(土)
0 コメント:
コメントを投稿