Gemini(Imagen 3)で神構図を完全再現!キャラを固定して画像を生成する方法【Nano Banana Pro】
ネットやSNSを見ていて、「うわ、この写真の躍動感すごい…!」と手が止まることありませんか?
プールの水中で光が揺らめく幻想的な瞬間や、水しぶきがキラキラと舞う爽快なショット。「この最高のロケーションに、もし自分の『推し』が飛び込んでいたら…」なんて、頭の中で勝手に変換して悶えること、ありますよね(私はよくやります笑)。
今日はそんな脳内の願望を、Googleの話題のAI**「Nano Banana Pro」**を使ってついに具現化してみます!ただの合成とは一味違う、空気感まで再現した「奇跡の一枚」作りに挑戦です。


この記事では、参考画像をベースに、構図はそのままで人物だけを自然に置き換える方法と、実際に私が試した生成プロセスを包み隠さず紹介します。
Google Nano Banana Pro(Gemini Imagen 3)とは?
まず最初に、今回使用するAIについて軽く触れておきますね。
私が「Nano Banana Pro」と呼んで愛用しているこのツールですが、世間一般(というか公式)では「Imagen 3」や「Gemini Advanced」の画像生成機能として知られています。Geminiのチャット画面で思考モードで指示をだすと機能する画像処理モデルです。
技術的なスペックや細かい仕様については、私が語るより公式を見るのが一番正確です!
📌 詳細な仕様や最新アップデート情報はこちら Google Gemini 公式サイト
ここでは難しい話は抜きにして、実際に使ってみてどうだったかという感想を一言で言うと… 「こちらの意図(プロンプト)を汲み取る力が、以前より格段に上がってる!」 これに尽きます。特に「なんとなくこんな感じ」というニュアンスを理解してくれるのが凄いんです。
実践!Geminiで構図はそのまま人物を置き換える方法
では、さっそく作っていきましょう。流れは大きく分けて3ステップです。
まずはベースとなる「神構図」を探してダウンロードしておきます。 今回は、おしゃれで高画質なフリー画像が揃う**「Unsplash」**から、イメージ通りの水中写真をダウンロードしてきました!

指示プロンプト:
この画像 image1を詳細に分析し、画像生成AIで同様のスタイルを再現するためのプロンプト要素を抽出してください。
結果は以下のJSONフォーマットのみを出力してください。
```json
{
"subject": "被写体の詳細な説明",
"medium": "画風や媒体 (例: 写真, 油絵, 3Dレンダリング, アニメ塗り)",
"style": "芸術的なスタイルや流派 (例: サイバーパンク, アール・ヌーヴォー, ミニマリズム)",
"lighting": "照明の種類と方向 (例: 自然光, ネオンライト, シネマティックライティング)",
"color_palette": "主要な色使いやトーン (例: パステルカラー, モノクロ, ビビッド)",
"composition": "構図やカメラアングル (例: クローズアップ, 広角, 三分割法)",
"mood": "画像の雰囲気や感情 (例: 憂鬱, エネルギッシュ, 神秘的)",
"quality_modifiers": "品質を高めるための修飾語 (例: 4k, highly detailed, masterpiece)"
}指示プロンプトをコピーして下の様な感じで思考モードで実行します。

実行結果が下のJSON出力結果になります。解説は後ほど行います。
“subject”: “水中に潜っている若い女性の横顔、水面を見上げて息を吐いている、大量の気泡(バブル)が上昇している、えんじ色(ワインレッド)の水着を着用、髪はお団子にまとめている、水中遊泳”,
“medium”: “水中写真、実写フォトグラフィー”,
“style”: “リアリズム、アクアティック、幻想的、静止画”,
“lighting”: “水面を通して差し込む自然光、コースティクス(集光模様)、きらめく光の屈折、上部からの明るい光源”,
“color_palette”: “鮮やかなシアン、ターコイズブルー、クリアブルー、深い赤(水着)、肌色、白(泡のハイライト)”,
“composition”: “側面図(プロフィール)、垂直構図、被写体は中央やや左、余白に広がる泡と水、下から上への視線誘導”,
“mood”: “清涼感、静寂、無重力感、没入感、自由、穏やか、夏”,
“quality_modifiers”: “高解像度、8k、クリスタルクリアな水質、微細な泡のディテール、写実的、高品質なテクスチャ”
次に、置き換えたい人物(推しキャラやオリジナルキャラ)の情報をAIに渡す準備をします。
もし「三面図なんて持ってないよ!」という人も安心して。 正面からの鮮明なバストアップ写真1枚があれば大丈夫です。その代わり、写真で見えていない部分はプロンプトでしっかり補足してあげれば代用可能です!
こちらです


←左の画像ファイルをダウンロードしておいてください。三面図のフォーマットとします。
①推しの画像②フォーマット画像の順にアップロードし以下のプロンプトを入力して思考モードで実行します。
指示プロンプト:
人物はアニメ、イラスト、3Dレンダリング、人形のような質感、bad anatomy, bad hands, extra fingersは一切排除し、全身画像を必要とします。以下の様な感じで実行してください。

以下の様な三面図が出力されます。ダウンロードしておいてください。(何かしら不自然だったら再度実行してもよいですしそのまま使っても大体大丈夫です。イメージがAIに伝わるのが肝心なので)

※ちなみに、参考記事もありますのでどうぞ。 👉

三面図を使わない場合はこちらへ。
準備は整いました。 Gemini に「三面図(人物担当)」と**Unsplashの画像(構図担当)」を渡し、プロンプトで指示を出して生成実行です!
『水面を見上げて息を吐いている』、『髪はお団子にまとめている』は置き換える女性のイメージにそぐわないので削除しておきましょう。
指示プロンプト:
"subject": the female_same_as_image2,横顔、大量の気泡(バブル)が上昇している、えんじ色(ワインレッド)の水着を着用、水中遊泳",
"medium": "水中写真、実写フォトグラフィー",
"style": "リアリズム、アクアティック、幻想的、静止画",
"lighting": "水面を通して差し込む自然光、コースティクス(集光模様)、きらめく光の屈折、上部からの明るい光源",
"color_palette": "鮮やかなシアン、ターコイズブルー、クリアブルー、深い赤(水着)、肌色、白(泡のハイライト)",
"composition": "側面図(プロフィール)、垂直構図、被写体は中央やや左、余白に広がる泡と水、下から上への視線誘導",
"mood": "清涼感、静寂、無重力感、没入感、自由、穏やか、夏",
"quality_modifiers": "高解像度、8k、クリスタルクリアな水質、微細な泡のディテール、写実的、高品質なテクスチャ"
最終イメージはimage1こんな感じで思考モードで実行します。これで……あこがれのシチュエーションに推しが降臨します!

・
・
・
いかがでしょうか?髪の毛の水中でのなびき具合がいまいちですが、、、かなりいけてると思います。

SBMJOBそれではこれ以降は解説をしていきます。
【解説】ステップ1理想の構図探しと構造解析
ここでいきなり生成に入るのではなく、ひと手間加えるのが成功の鍵。 Geminiに画像を読み込ませて、「構造解析」を行います。これを行うことにより、人物(Subject)の状態や照明具合、等々が明確化され再利用(再加工)しやすくなります。
指示プロンプト:
この画像 image1を詳細に分析し、画像生成AIで同様のスタイルを再現するためのプロンプト要素を抽出してください。
結果は以下のJSONフォーマットのみを出力してください。
```json
{
"subject": "被写体の詳細な説明",
"medium": "画風や媒体 (例: 写真, 油絵, 3Dレンダリング, アニメ塗り)",
"style": "芸術的なスタイルや流派 (例: サイバーパンク, アール・ヌーヴォー, ミニマリズム)",
"lighting": "照明の種類と方向 (例: 自然光, ネオンライト, シネマティックライティング)",
"color_palette": "主要な色使いやトーン (例: パステルカラー, モノクロ, ビビッド)",
"composition": "構図やカメラアングル (例: クローズアップ, 広角, 三分割法)",
"mood": "画像の雰囲気や感情 (例: 憂鬱, エネルギッシュ, 神秘的)",
"quality_modifiers": "品質を高めるための修飾語 (例: 4k, highly detailed, masterpiece)"
}すると、Geminiはこんな感じで画像を「データ」として分解してくれます。
1. 被写体とアクション (subject)
内容: 水中に潜っている若い女性の横顔。
状態: ワインレッド(えんじ色)の水着を着て、髪をお団子にまとめ、水面を見上げながら息を吐いています。
重要要素: 「大量の気泡(バブル)」が描かれることで、動きと臨場感を演出しています。
2. 表現媒体とスタイル (medium, style)
媒体: イラストや絵画ではなく、「実写フォトグラフィー(写真)」としての質感を求めています。
スタイル: 「リアリズム(写実的)」かつ「アクアティック(水中の)」で、少し「幻想的」な静止画を目指しています。
3. 光と色 (lighting, color_palette)
光の演出: ここが非常に重要です。「コースティクス(集光模様)」とは、水底や物体にゆらゆらと映る光の網目模様のことです。上からの自然光が水面で屈折し、キラキラと差し込む様子を指定しています。
色使い: 背景の「シアン・ターコイズブルー」と、被写体の「深い赤(水着)」のコントラスト(対比)が鮮やかになるよう設計されています。
4. 構図 (composition)
配置: 縦長の画像(垂直構図)で、人物は横顔(プロフィール)。
視線誘導: 泡が下から上へ昇っていく様子を描くことで、見る人の目が自然と上(水面方向)へ向くように計算されています。
5. 雰囲気と品質 (mood, quality_modifiers)
雰囲気: 夏らしい「清涼感」や、水中の「静寂」「無重力感」といった、静かで没入感のあるムードを指定しています。
品質: 「8k」「高解像度」など、非常に鮮明で、水の質感や泡の粒までくっきりと描写させるための指示が含まれています。
subjectに「カメラ目線でピースサインをしている」などと追加してGeminiに再加工の依頼もすることもできます。
この解析結果(JSON)を見ることで、「あ、この『light refraction(光の屈折)』って要素をプロンプトに入れれば、あのキラキラ感が出るんだ!」と作戦が立てやすくなるんです。
【解説】ステップ2:推しの「設計図」を用意
三面図を使うと推しのキャラクター顔や衣装等の統一感を持たせて画像生成することができます。まぁ、Geminiは三面図がなくてもそれなりにいい感じで作成してくれるんですけどね・・・



三面図を一度用意しておくと、違う雰囲気の新しい画像を元に画像生成する時も同じキャラクターで生成させることができます。


1. 「誰?」を防ぐ(アイデンティティの固定)
AIは言葉(プロンプト)だけで指示すると、毎回微妙に違う顔や体型を作ってしまいがちです。でも、三面図という「正解の設計図」を読み込ませることで、AIに「この顔、この髪型、この体型で描いてね」と強力に指定できます。 さっきの水中画像も、元の三面図があったからこそ、「水中の光や泡のエフェクトがかかっても、ちゃんとあの子だと分かる」仕上がりになったんですよ。
2. 立体的な構造を理解させる
正面の顔写真だけだと、AIは「横から見た時の鼻の高さ」や「後頭部の髪の形」を想像で補完するしかありません。三面図(特に横顔の情報)があると、AIが被写体を立体として正しく理解できるので、今回のような「横から見上げたアングル」でも、顔が崩れにくくなります。
3. 服装やディテールの統一
服のデザインや装飾も、三面図があればAIが参照できるので、複雑なデザインでも再現度が高まります。
要するに、三面図はAIにとっての**「完璧な本人確認資料(設計図)」**みたいなものです。これがあるのとないのとでは、特に特定のキャラを何度も登場させたい時に、クオリティに雲泥の差が出ますよ!
【解説】ステップ3:生成指示(合体!)
私の経験上なのですが、Geminiはプロンプト指示する時の画像添付順で画像生成結果が大きく変わってくることがあります。例えば特に指定しない時の生成画像のサイズ、解像度、縦横比率、全体イメージ等々。
ですので今回は元画像の雰囲気にかなり近づけたいのでアップロード画像一枚目は元画像にしておきましょう。
アップロード順がとても重要です
- 最初にアップロードした画像(image1)にGeminiが結構影響される。
プロンプトのイメージ:
二枚目にアップロードした三面図画像の人物を参考にして
JSON形式の画像解析結果をもとに新しい画像を作成してください。
ただし全体的なイメージは一枚目にアップロードした画像。
JSONデータのイメージ:
人物は「image2の女性と全く同じで、横顔で、泡を出していて、エンジ色の水着を着ていて水中浮遊しているよ」
媒体は水中写真だよ
スタイルは実写でみずみずしく幻想的な静止画だよ
照明はうんぬんかんぬん
カラーパレットは青系
構図は側面図で・・・・
雰囲気は清涼感があって・・・
画質はめっちゃ高いよ
最終的なイメージは1番目にアップロードした画像のイメージだよ
特に『”the female_same_as_image2″』が重要で、アップロードした画像2の女性と全く同じにしてっていみで、三面図の女性のことを意味しています。要はアップロードしたファイルの女性と元画像の女性と置き換えて!ということになります。
『最終イメージはimage1』は最終イメージはアップロードした画像1でうまくまとめて!ということになります。
"subject": "the female_same_as_image2",横顔、大量の気泡(バブル)が上昇している、えんじ色(ワインレッド)の水着を着用、水中遊泳",
"medium": "水中写真、実写フォトグラフィー",
"style": "リアリズム、アクアティック、幻想的、静止画",
"lighting": "水面を通して差し込む自然光、コースティクス(集光模様)、きらめく光の屈折、上部からの明るい光源",
"color_palette": "鮮やかなシアン、ターコイズブルー、クリアブルー、深い赤(水着)、肌色、白(泡のハイライト)",
"composition": "側面図(プロフィール)、垂直構図、被写体は中央やや左、余白に広がる泡と水、下から上への視線誘導",
"mood": "清涼感、静寂、無重力感、没入感、自由、穏やか、夏",
"quality_modifiers": "高解像度、8k、クリスタルクリアな水質、微細な泡のディテール、写実的、高品質なテクスチャ"
最終イメージはimage1試しにsubjectのところに『ピースサインをしている』『光沢感のあるシルバーの水着を着用』と追加して出力すると以下の様になります。


うまくいかない時のコツと、大事な注意点
最後に、よりクオリティを上げるためのコツと、絶対に守ってほしいマナーについてお話しします。
生成のコツ
- 詳細な言語化: 「青い服」と書くより、「水に濡れて肌に張り付く、透け感のあるネイビーのシルクシャツ」のように、素材や状態まで細かく指定すると、AIの迷いが減って精度が上がります。
- プロンプトの足し算引き算: もし生成された画像に変な要素(余計な帽子など)が混ざる場合は、「ネガティブプロンプト(描いてほしくない要素)」を活用しましょう。プロンプトの最後の方にNegative Prompt:項目羅列。みたいな感じで書けば良いと思います。
【重要】マナーと権利について
楽しくAIを活用するために、以下の点は必ず守りましょう。
1. 使用素材の権利について 今回の記事で使用している元画像は、すべて「CC0(著作権フリー)」等の素材サイトから取得しています。 他人の著作物を無断で加工して公開するのはトラブルの元です。皆さんが試す時も、今回紹介したUnsplashやPexelsなど、権利関係がクリアな素材サイトを利用するようにしてください。 (※CC0であっても、モデルリリース等の規約は各サイトで確認しましょう!)
2. 肖像権と楽しみ方の線引き 実在の芸能人や著名人の顔をそのまま使用して生成・公開することは、肖像権の侵害やディープフェイク問題に繋がるため絶対NGです。 あくまで「個人的な鑑賞の範囲(ローカル)」で楽しむか、SNSにアップするなら安心して公開できる「オリジナルキャラクター」や「自分の写真」を使って遊ぶのが正解です。
番外 三面図を作らない場合
三面図を作成せずにやる場合は細かな指示といかないまでも、ある程度の指示を追加しなくてはいけません。表情等もAIが考えて作るので意図しなかった画像が生成されやすくなります。
これだけのプロンプトだと、以下の様にプールにそぐあない衣装になりがちです。




衣装について言及すると、水着にして画像を生成されますが、表情も推し画像の表情になっていますね・・・
ですので一度元画像を画像解析する必要がありますが、あまり細かなことに気をつけないのであればこれはこれでありですね。用途と割り切りってところですかね。




まとめ Nano Banana Pro(Gemini Imagen 3)すごい!
いかがでしたか? Google Nano Banana Pro(Gemini)を使えば、ただの画像生成だけでなく、「この構図で、このキャラが見たい!」というピンポイントな夢を叶えることができます。
ルールとマナーを守って、皆さんもぜひ「奇跡の一枚」を作ってみてくださいね!



実際に画像生成してみると、Gemini Nano Banana Proの画像生成能力に驚かされました。以前までのPhoto Shop等の画像編集アプリでは難しかった事がAIでできる様になってきていると実感させられました。





コメント