【Gemini】顔が変わる悩みとおさらば!フリー素材から「一貫性のある」AIキャラを作る全手順
はじめに:今回やりたいこと
「AIで特定のキャラクターの画像を作りたいけれど、毎回顔が変わってしまう」「ポーズを指定すると別人になってしまう」といった悩みはありませんか?
今回の記事では、フリー素材のイラストをベースに、一貫性のあるオリジナルキャラクターを作成し、思い通りのポーズをとらせるまでの全工程を解説します。
具体的には以下の流れで進めていきます。
- フリー素材からキャラクターの原案を決める
- イラストを実写化(リアル調)する
- 三面図を作成し、LoRA(追加学習モデル)っぽくキャラクターを固定する
- 三面図を元にポーズを適用させる
- 最終的に欲しいシチュエーションの画像を作成する
この手順を踏めば、単なるランダム生成ではなく、意図したキャラクターを自在に操れるようになります。ぜひ最後までお付き合いください。
1. 素材選び:フリー素材サイトと画像の選定
使用したサイト
今回は、以下のフリー素材サイトを使用しました。改変可能な素材が豊富なサイトとなっております。
- サイト名:
パブリックドメインQ:著作権フリー画像素材集 - 選定理由:
AIで改変するので、パブリックドメインになっているイラストを使えるためです。
選んだ画像
実際に選んだのがこちらの画像です。

このイラストの「力強そう」というイメージ特徴を活かして、実写系AIキャラクターへと昇華させていきます。
SBMJOBイラストはあくまで雰囲気重視で選んでみましょう。細かな顔のパーツ、髪型等々は後からいくらでも変更可能です。


このイラストの「挿絵に使えそう」という特徴を活かしてポーズの元とします。



実はポーズに関しては、イラストでなくても、手書きの簡単な図であったり、ポーズ人形を自分でポーズさせてそれを写真に撮ったものでもOKであったりと自由度がかなり高いんです。
2. 画像の実写化(リアリスティック変換)
選んだ2次元のイラストを、AIを使って実写(フォトリアル)テイストに変換します。
使用したツール
- 使用ツール・モデル:
Google Gemini 3 (Nano Banana Pro)



Google のAI Geminiで使える画像生成および編集モデルがNano Banana Pro (Gemini 3 Pro Image)ってことらしいんだけど初心者の自分にはちょっと難しいんで、今回はサクッと使ってみましょう!!
変な名前だけどマジで公式名称なんです!IT業界って一見ふざけてる名前が多くて面白いですよね。




イラスト感完全に排除し、顔は20代、肌も20代、日本人、で最高に写真画質にする


ここではプロンプトで大まかな年代と日本人風になる様に指定していますがこだわり条件をいれるといいですね。
ここの手順は以前の記事にしていますので参考にしてください。


実写化の結果
イラストをベースに生成された実写画像がこちらです。


元のイラストの雰囲気を残しつつ、肌の質感や顔の作り衣服がリアルになりました。



この段階で何度か画像生成を繰り返したり、プロンプトを変更して性別、年齢や髪型等を変更して思った通りのキャラを作ってみましょう。AI画像生成の一番面白いとこだと思います。カスタムメイドですね
3. 三面図(キャラクターシート)の作成
ここが最も重要なステップです。キャラクターの一貫性を保つために、**三面図(正面、横、背面)**を作成します。これを作ることで、AIに「このキャラクターの構造」を理解させやすくします。
三面図の生成




image1の人物のキャラクターシートをTemplateのフォーマットで作成してください。
注意点として、人物はアニメ、イラスト、3Dレンダリング、人形のような質感は一切排除
アニメ・イラスト・3Dレンダリング・人形のような質感・bad anatomy・bad hands・extra fingersは一切排除し
全身画像を必要とします。出力は必ずアスペクト比16:9のlandscapeとします。

←この画像ファイルは以下の名前で補完しておき、Geminiに貼り付けます。ファイル名にアスタリスク2つで囲った間にTemplateと入れると強調の意味をもつのでプロンプトで認識しやすくなります。
sheet**Template**.webp
生成された三面図がこちらです。





プロンプトの解説は初心者の自分には難しいので読み飛ばしてもいいと思います。
プロンプトの解説
1. 参照元の明確化(Input)
image1の人物のキャラクターシートをTemplateのフォーマットで作成してください。
- 解説: ここが命令の核だね。「なんとなく作って」じゃなくて、**「この画像(image1)の顔」と「この構図(Template)のレイアウト」**を使ってね、と具体的に指示を出している。
- ポイント: Geminiはマルチモーダル(画像も文字も同時に理解できる)だから、アップロードした画像を「変数」みたいに扱えるんだ。これで「顔が変わる」「構図が崩れる」のを防いでいるわけ。
2. 画風の強力な否定(Negative Prompting)
注意点として、人物はアニメ、イラスト、3Dレンダリング、人形のような質感は一切排除
- 解説: ここが一番の味噌!GeminiなどのAIは、「キャラクターシート(三面図)」と言われた瞬間に、学習データの傾向から勝手に「アニメ調」や「3Dフィギュア調」の絵を出そうとするクセがあるんだ。
- ポイント: だから、あえて「リアルにして」と言うだけじゃなくて、**「アニメや人形っぽさは絶対にダメ(排除)」**と強く念押しすることで、無理やり実写のルートに引き戻しているんだよ。
3. クオリティの担保(Quality Control)
bad anatomy・bad hands・extra fingersは一切排除し
- 解説: これは画像生成AI界隈(Stable Diffusionなど)でよく使われる「呪文」の名残りだけど、Geminiにも有効なんだ。
- ポイント: 「指が増える」「骨格がおかしい」といったAIがやりがちなミスを、具体的な単語(専門用語)を出して禁止することで、AI側の検閲フィルターや品質管理機能を刺激して、きれいな体を出力させようとしているんだね。
4. 構図と仕様の指定(Technical Specs)
全身画像を必要とします。出力は必ずアスペクト比16:9のlandscapeとします。
16:9: 三面図(正面・横・後ろ)を並べるには、横長のキャンバスが必須。正方形だと窮屈で体が重なったり切れちゃったりするからね。
解説: 最後は物理的な仕様の指定。
全身画像: これを言わないと、顔アップやバストアップばかり生成されて「衣装がわからない!」となりがち。
ポイント
- プロンプトのポイント解説
- 「排除」を重ねる理由: AIは「三面図」と聞くとアニメ絵を描きたがるクセがあります。「リアルにして」と頼むより、「アニメや3Dは禁止!」と強く否定する方が、確実に実写風になります。
- 英語の混在:
bad anatomy(崩れた骨格)などの英語が含まれているのは、AIが学習している「失敗例のタグ」を直接避けるためのテクニックです。 - 比率指定: 三面図を横に並べるスペースを確保するため、必ず
16:9の横長を指定しましょう。
キャラクター固定のための工夫(LoRAなど)
三面図ができたら、このキャラクターをLoRAのようにキャラクターを擬似固定して活用してみましょう。
※LoRA(Low-Rank Adaptation)とは? 既存のモデルに追加で特定のキャラクターや画風を学習させる技術のことです。
今回はこの三面図を使ってLoRA要らず!画像参照だけでキャラ固定し擬似LoRAっぽくキャラクターを活用してみましょう。
これにより、どんなポーズをとっても「同じ顔・同じ服装」を維持できるようになります。
三面図の具体的な使い方



それでは三面図を使ってこの人物に富士山登山してもらう例で具体的な使い方をご説明します。


先ほど作成した三面図の画像を保存し、Geminiのプロンプト入力欄に**ドラッグ&ドロップ(または画像アップロード)**してください。これでAIに『このキャラを使って!』と指示できます。


image1は三面図ですこの人物が富士山に登山している時に
友達に写真を撮られている時の画像を作成してください。友達目線の画角でwide shot 4k画質ですプロンプトでimage1と書くとStep1でアップロードした画像ファイル(1番目にアップロード)として認識してくれます。これで三面図を参照することにより人物に一貫性を持たせることとなります。
Geminiでのプロンプト指示の実行時に必ず思考モードにしてください。Nano Banana Proの優れた画像処理編集機能はこの思考モードでしか機能しないためです。





登山中の人物の顔、服装、雰囲気まで三面図の人物をそのまま引き継いでいますね。次はPowerPointの挿絵で使えそうな画像を10パターン作ってもらいましょう
次は同一人物を何にも登場させパワーポイントで使えそうなクリップをランダムなポーズで作成してもらいましょう。




image1は三面図です、この人物がパワーポイントの資料で何度か登場できる様な
表情・ポーズを10パターン作成して背景を透明化してください。




おぉ!切り取って使えばPowerPointスライドに同じ人物を登場させ統一感が演出できますね。フリー素材を探し回る手間と時間が減りますね。



ここで一つ注意点
Gemini特有なんですが、透明化をしてもらっても実は市松模様で塗りつぶされているだけで透明化はしてくれません。他の色で塗りつぶす様に指示してからペイント系のアプリでその色を透明化するとか、iPhoneに転送して背景を消してしまうとか工夫が必要になります。今後のGeminiの機能アップで解消されることを期待します。
三面図があると二枚目三枚目と画像を生成しても、人物の顔や体格、衣装などに統一感でてきますね。
4. 三面図からポーズを適応させる
次は、このキャラクターにさせたい動き(ポーズ)をつけていきます。




ポーズ指定の方
このポーズ情報を、先ほどのキャラクターに流し込みます。


先ほど作成した三面図の画像を保存し、Geminiのプロンプト入力欄に**ドラッグ&ドロップ(または画像アップロード)**してください。これでAIに『このキャラを使って!』と指示できます。ポーズ画像も同様に三面図をアップロードした後にアップロードしてAIに『このポーズを使って!』と指示できます。




image1は三面図ですこの人物にimage2のポーズをさせて、オーケストラのステージに立っている画像を作成したい。
注意点はポーズは腕の角度、手の角度、足の角度を正確に再現してください。
観客席からステージを見た画面構成で、カメラはwide shot。
最後に人物の大きさは背景と違和感が内容にしてください。上記のプロンプトを入力します。image2記述することによって三面図の人物に2番目にアップロードしたポーズ画像のポーズを適用する指示ができます。オーケーストラ〜以降の記述は背景・ポーズの注意点等々なので必須ではありません。
Geminiでのプロンプト指示の実行時に必ず思考モードにしてください。Nano Banana Proの優れた画像処理編集機能はこの思考モードでしか機能しないためです。





少し人物が大きいですね。そういう時は人物を少し小さくしてもらいましょう。一旦生成された画像をダウンロードしてから新しいチャットで小さくしてもらうといいでしょう。


中央の人物を背景の人物に合わせて小さくしてください。サイズだけの変更です。4K画質

こんな感じですね。
5. 完成!欲しい画像を作成する
これまでの工程を組み合わせて、最終的に作りたかったイメージ画像を生成します。
パターンA:カフェで振り返る様子
ポーズはイラストの女性のポーズで。
パターンB:公園で走っている様子
ポーズはイラストの女性のポーズで。
例えば上記のパターンA、パターンBで三面図とポーズ画像を元に画像生成してみましょう。
パターンA




image1は三面図です、この人物がカフェで振り返ってカメラを見る時に
image2のポーズをしている画像を生成してください。写真画質で4KパターンB




image1は三面図です、この人物が公園で走っている時に
image2のポーズをしている画像を生成してください。写真画質で4KパターンAカフェで振り返る様子


パターンB:公園で走っている様子





キャラクタの一貫性を保ちつつ、ポーズも指示通り、さらに場面の指定やら好き勝手に場面変更できちゃうなんて超便利すぎます!!!
いかがでしょうか?最初のフリー素材の面影を残しつつ、完全に独立した実写キャラクターとして、指定した通りのポーズをとらせることができました。
まとめと次回予告
今回は、フリー素材を起点にして三面図を作成し、一貫性のあるキャラクター画像を生成するフローをご紹介しました。
今回のポイント:
- 三面図(リファレンス画像)を用意することでイメージブレを防ぐ
- Gemini3でポーズは自由自在
次回予告:静止画から動画へ!
さて、自分の理想のキャラクターが作れるようになると、次は**「この子を動かしてみたい」**と思いませんか?
次回の記事では、今回作成したこの画像をベースにして、AI動画生成ツールを使ってキャラクターをアニメーション化する方法を解説します。
瞬きさせたり、髪をなびかせたりする方法に興味がある方は、ぜひ次回の更新もお楽しみに!





コメント