MENU

画像生成AI・DALL-E3で同じ絵柄・キャラクター・人物を生成するコツの研究

DALL-E3で同じ絵柄や人物などを色々な動きやシチュエーションで生成したい方におすすめの記事です。

画像IDやシード値を利用して同じ絵柄のキャラクターや人物に動きを付けて生成する方法を、日本語での指示を中心に説明していきます。

目次

DALL-E3で同じキャラクターを作成する時の注意点

基本のキャラクター&パラメーター

とりあえず美少女画像を生成してみました。こちらを基本のキャラクターとして見ていきましょう。

画像ID: oKeEfOvO7Aivb5sSシード値: 4011692318画像サイズ: 1792x1024プロンプト内容: “A wide anime-style image featuring a beautiful girl with purple hair. She has large, expressive eyes and a gentle smile. The background is vibrant and colorful, perhaps a scenic park or a cozy room filled with warm light. Her outfit is stylish and modern, complementing her youthful appearance. The image captures the elegance and charm of the character in a detailed and high-quality setting.”

DALL-E3で画像を生成すると画像ID 、シード値、画像サイズ、プロンプトと4つのパラメーターが付与されます。

画像サイズは形の違う3種類のみなので見ればわかると思います。詳しくはDALL-E 3画像サイズ&出力を確認してみて下さい。

プロンプトを確認

プロンプトは赤く囲ったiの部分をクリックで英語プロンプトを確認できます。

他のアイコンの内容は1番左が選択、編集ツールで真ん中がダウンロード(保存)です。

自分が生成した画像で画像ID 、シード値を確認する場合はチャットでそれぞれ表示するように指示を出します。

それぞれのパラメーターについて説明していきます。

DALL-E3 画像IDについて

DALL-E 3で画像を生成した際に付与される画像IDは、以下のような目的や特性があります

画像を識別する

各画像IDはそれぞれ唯一のものであり、特定の生成された画像を識別するために使用されます。このIDにより、生成された画像を正確に特定できます。

トラッキングと参照

ユーザーが特定の画像に再アクセスしたり、画像に基づいてさらにカスタマイズを行いたい場合、このIDを使用して特定の画像を参照することができます。

コンプライアンスと監査

生成された画像の出所を追跡し、どのユーザーがどの画像を生成したかを把握するために画像IDが使用されます。これは、コンテンツの監査やコンプライアンスの目的に役立ちます。

カスタマイズとフィードバック

ユーザーが特定の画像に対してフィードバックを提供したり、追加のカスタマイズを要求する場合、画像IDを使用して特定の画像に関連するリクエストを処理できます。

具体的な生成方法や内部構造は公開されていないため、画像IDがどのように生成されるかの詳細は不明ですが、その役割と利用方法については上記のように理解されています。

DALL-E3 シード値について

シード値とは?

シード値(seed value)は、ランダムなプロセスを制御するために使用される初期値です。画像生成のようなランダムなプロセスにおいて、シード値を設定することで、同じシード値を使えば同じ結果が得られるようにすることができます。

シード値の役割

  1. 再現性の確保:シード値を設定することで、同じ入力に対して同じ出力を得ることができます。これは、特定の画像を再生成したい場合に便利です。
  2. バリエーションの生成:シード値を変更することで、同じプロンプトに対して異なるバリエーションの画像を生成することができます。

具体例

例えば、あるプロンプト「青い空の下の赤い車」を入力として画像を生成する場合、シード値が「1234」であれば、毎回同じ青い空の下の赤い車の画像が生成されます。シード値を「5678」に変更すると、同じプロンプトに対して異なるバリエーションの画像が生成されます。

シード値の利用方法

  1. 固定シード値:特定のシード値を指定することで、特定の画像を再生成できます。これにより、再現性のある結果が得られます。
  2. ランダムシード値:シード値を指定しない場合、システムがランダムなシード値を生成し、毎回異なる結果を得ることができます。

実際のシード値の管理

DALL-E 3などの画像生成モデルでは、シード値は内部で管理されており、ユーザーが明示的にシード値を指定することもできます。これにより、同じ条件で画像を再生成したり、異なるバリエーションを試したりすることが可能です。

まとめ

  • シード値:ランダムなプロセスを制御する初期値。
  • 役割:再現性の確保とバリエーションの生成。
  • 利用方法:固定シード値で再現性を確保し、ランダムシード値でバリエーションを生成。

シード値の設定と活用により、DALL-E 3での画像生成プロセスはより柔軟で再現性のあるものとなります。

DALL-E3 画像サイズについて

  • 1024×1024 ピクセル(正方形)
  • 1792×1024 ピクセル(ワイド)
  • 1024×1792 ピクセル(縦長)

の3種類になっています。詳しくは別記事DALL-E 3画像サイズ&出力で説明していますので詳しく知りたい方はチェックしてみて下さい。

DALL-E3 プロンプトについて

プロンプトは、DALL-E 3に生成してほしい画像の内容を指示するためのテキスト入力です。このプロンプトを基に、DALL-E 3はその内容に合致した画像を生成します。プロンプトの品質や詳細さが、生成される画像の品質や正確性に大きな影響を与えます。

プロンプトの構成要素

プロンプトにはいくつかの重要な要素が含まれます。これらの要素を具体的に指示することで、より正確で希望通りの画像を得ることができます。

  1. 主題(メインオブジェクト)
    • 画像の主要な要素や対象物を指示します。例:「青い空の下の赤い車」、「可愛い猫」。
  2. 背景
    • 主題の背景に関する指示。例:「山の風景」、「海辺」。
  3. 詳細な属性
    • 主題や背景に関する詳細な特徴や属性。例:「赤い車はスポーツカーで、サンルーフがある」、「猫は白い毛で、青い首輪をしている」。
  4. スタイル
    • 画像のアートスタイルや雰囲気に関する指示。例:「リアルな写真風」、「アニメ風」、「ミニマルデザイン」。
  5. 追加の要素
    • その他の細かい要素やアクセサリ。例:「車の前に花が咲いている」、「猫の隣におもちゃが置いてある」

プロンプトについて まとめ

プロンプトはDALL-E 3に画像を生成させるための重要な指示文です。具体的で詳細なプロンプトを書くことで、希望する画像を正確に得ることができます。プロンプトの質が画像生成の結果に大きな影響を与えるため、時間をかけて慎重に作成することが重要です。

DALL-E3で画像ID・シード値を利用して生成する

画像IDやシード値について少し学んでみましたが、実際に画像を生成した時にどういった感じになるのか実証していきましょう。

画像IDを利用して同じ画像を生成する

画像IDを指定した場合、同じチャットの場合は全く同じ画像が生成されます。違うチャットで指定した場合メモリや過去の履歴から適当な画像が生成されます。

シード値を利用して同じ画像を生成する

結論から書きますが、現在はシード値とプロンプトを組み合わせての画像生成はできなくなっているようです。今後再び出来るようになるかはアップデート待ちになるかもしれません(2024年6月29日現在)

シード値だけを指定した場合はどうなるのでしょうか?

「シード値’4011692318’の画像を生成して下さい」の指示でエラーが発生しました。

理由を尋ねると、

ChatGPT

シード値だけでは画像を生成することはできません。画像を生成するためには、シード値に加えてプロンプトや他のパラメーターも必要です。シード値は、生成される画像のランダム要素を決定するために使用されますが、プロンプトなどの情報がなければ具体的な画像を生成することはできません。

シード値だけでは生成出来ないようですね。あくまでランダム要素の参考的数値とでも言うんでしょうか。

シード値とプロンプトで生成する(エラー編)

シード値を利用した実証を始めたんですが、エラーが頻発して出来ませんでした。システムエラーの可能性が高いらしいですが、一応その時のやりとりと記録しています。

今度はシード値とプロンプトを合わせて指示を出してみます。

画像の英語プロンプト(プロンプトは生成した画像をクリックして右上のiマークで確認できます。)

これとシード値を合わせて指示を出してみましたが、エラーが発生してしまい生成できませんでした。

原因を尋ねると、

シード値 4011692318 が利用できない理由として考えられる主な点は以下の通りです:

  1. システムの制限: 特定のシード値がシステム内でエラーを引き起こす可能性があります。これは技術的な制約やバグによるものかもしれません。
  2. リソースの制限: サーバーやリソースの問題により、特定のシード値を使用した画像生成が現在できない場合があります。
  3. プロンプトとの不整合: シード値とプロンプトの組み合わせにより、システムが正しく動作しない場合があります。
ChatGPT

これらの理由により、特定のシード値で画像を生成できないことがあります。別のシード値を試すか、異なるプロンプトで再度お試しいただければと思います。

この画像ではシード値が利用できないのかと思い別の画像で試しましたが、同じエラーが出てしまいました。

正直、少し前に試した時は可能だったので、どういうことか尋ねてみました。

ChatGPT

現在の状況を見ると、シード値を指定しての画像生成にシステムエラーが発生しているようです。この問題は一時的なものかもしれないので、時間をおいて再試行してみる価値があります。

この後、時間をおいて再起動などもしてから再度試してみます。果たしてシード値が利用出来るようになっているのでしょうか。

翌日再び試してみましたが、シード値を使った生成は2024年6月28日現在できないようです。

  1. 一時的なシステムエラー: シード値が期待通りに機能しない場合、システムの一時的な問題が原因である可能性があります。このような場合、時間をおいて再試行することが推奨されます​ (OpenAI Developer Forum)​​ (OpenAI)​。
  2. アップデートの影響: DALL-E 3の最近のアップデートによって、シード値の取り扱い方法が変更され、生成IDなどの新しいパラメータが導入されることがあります。この変更により、一部のシード値が正しく機能しない場合があります​ (OpenAI Developer Forum)​。
ChatGPT

システムの安定性が改善されるまで、異なるシード値を試すか、別のプロンプトで画像を生成する方法を検討することをお勧めします。今後も同様の問題が発生する場合は、OpenAIのサポートに問い合わせると良いでしょう。

DALL-E3でシード値とプロンプトで生成する(過去の生成編)

以前にシード値とプロンプトを使用して画像を生成したことが何度かあります。

アニメ調だと画風というかタッチは似た雰囲気になるんですが、DALL-E3ではシード値とプロンプトを利用して全く同じキャラクターを狙って生成することは出来ませんでした。

リアル系の人物だとかなり同じような人物が生成されるのは確認できました。

画像が残っていないのが残念ですが…

しかし現在エラーが出ているので、アップデートをしているのならばシード値の扱いが変わって今まで以上に上手く生成できるようになる可能性もあります。

また利用できるようになったら追記していこうと思います。

DALL-E3で同じキャラクターの動きを変えて生成する

画像IDとプロンプトを利用してキャラクターの動きを変える

では画像IDとプロンプトを利用して同じようなキャラクターの向きをかえたり、動きを変えたりした画像を生成してみましょう。

元の画像のキャラクターをどの程度再現してくれるのか気になりますね。

ちなみに画像IDを表示するには画像IDを表示するよう指示しないと表示されませんので、プロンプトと一緒に指示するか、後から「今の画像のIDを教えて下さい」で表示してみてください。

同じチャット内なら後からでも画像IDを尋ねることが可能です。

画像IDはチャット固有のIDになりますので、他人のIDはもちろん自分が作成したIDでも新規チャットでは利用できません。IDを発行したチャットで利用するようにしましょう。

こちらが基本のキャラクターになります↓

まずは先程のキャラクターを両腕を上げた格好にしてみましょう

プロンプト「画像ID’oKeEfOvO7Aivb5sS’のキャラクターが両腕を上に上げている画像を生成して下さい」で完成しました。

下着の肩の部分や、髪飾り、背景など細かい部分は変わってしまいましたが、服装やキャラクターはかなり元の画像に忠実に再現されているように感じます。

実際にキャラクターだけ使用したい場合には背景を白くしたりして他の編集ソフトなどで利用しやすくするのも良いと思います。

編集ツールで選択した後にプロンプト「リボンを外す」で髪飾りを消すことも出来ます↑

プロンプト「画像ID’oKeEfOvO7Aivb5sS’のキャラクターが食事をしている画像を生成して下さい」↑

プロンプト「画像ID’oKeEfOvO7Aivb5sS’のキャラクターが外で走っている画像を生成して下さい」↑状況に応じて服装も考えてくれそうですね。

やはり画像IDを利用しても同じようなキャラクターが簡単に生成出来ることがわかりました。後は編集ツールで微調整したり、何度か指示を変えたりしながら再生成すると希望する画像に近づけることが出来ます。

しかしキャラクターが複雑な見た目をしていたり、アクセサリーなどが多かったりすると再現度が下がったりして難しくなりますので注意が必要です。

新キャラクターで試してみます。

画像ID’gFjgroxqbGudtG34’

「ショートカットで水色の髪をして眼帯をつけた、赤い手袋を付けて青いブーツを履いた海賊風の女性のアニメ風ワイド画像を生成して下さい」で生成しました。青いブーツが反映されているのかは今のところ謎です。

「gFjgroxqbGudtG34のキャラクターが陸地で走っている画像を生成して下さい」で生成しました。青いブーツは反映されているようですが洋服まで青くなってしまいました。

「gFjgroxqbGudtG34のキャラクターが大男と戦う画像を生成して下さい」で生成しました。

眼帯の左右が変わってしまい、手袋も指だしになってしまいました。

このように複雑な服装やアクセサリーはすぐに変わってしまうので、できるだけ簡単に同じキャラクターを作成したいのであればシンプルな服装がおすすめです。

もちろん編集ツールで調整することは出来ますが、通常の生成より時間がかかるのが難点です。試してみましょう。

こちらが何度か編集ツールで微調整を重ねた画像です。眼帯や手袋を調節してかなり元のキャラクターに近づけましたが、肩飾りの形がどうしても再現できませんでした。

まとめ

現在同じキャラクターを生成する場合は、画像IDとプロンプトを組み合わせて利用するのが1番簡単に作成できます。

シード値と英語プロンプトの一部を変える方法も良いと思いますが、現在は使用できないようです。

表情やアクセサリーは編集ツールを利用して後から変更したほうが、元のキャラクターの再現度が高くなる可能性が高いと思います。

しかし編集ツールが言う事を効かない場合も多いのがAIの難しいところですね。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

メディアを複数運営。

AIを楽しく使用するをテーマに研究しています。

他メディアでAIイラストを多く使用しているので、使い方のコツや小ネタなどをどんどん紹介していきます。

コメント

コメントする

CAPTCHA


目次