DALL-E3で同じ絵柄や人物などを色々な動きやシチュエーションで生成したい方におすすめの記事です。
画像IDやシード値を利用して同じ絵柄のキャラクターや人物に動きを付けて生成する方法を、日本語での指示を中心に説明していきます。
DALL-E3で同じキャラクターを作成する時の注意点
基本のキャラクター&パラメーター
とりあえず美少女画像を生成してみました。こちらを基本のキャラクターとして見ていきましょう。
画像ID: oKeEfOvO7Aivb5sS
シード値: 4011692318
画像サイズ: 1792x1024
プロンプト内容: “A wide anime-style image featuring a beautiful girl with purple hair. She has large, expressive eyes and a gentle smile. The background is vibrant and colorful, perhaps a scenic park or a cozy room filled with warm light. Her outfit is stylish and modern, complementing her youthful appearance. The image captures the elegance and charm of the character in a detailed and high-quality setting.”
DALL-E3で画像を生成すると画像ID 、シード値、画像サイズ、プロンプトと4つのパラメーターが付与されます。
画像サイズは形の違う3種類のみなので見ればわかると思います。詳しくはDALL-E 3画像サイズ&出力を確認してみて下さい。
プロンプトを確認
プロンプトは赤く囲ったiの部分をクリックで英語プロンプトを確認できます。
他のアイコンの内容は1番左が選択、編集ツールで真ん中がダウンロード(保存)です。
自分が生成した画像で画像ID 、シード値を確認する場合はチャットでそれぞれ表示するように指示を出します。
それぞれのパラメーターについて説明していきます。
DALL-E3 画像IDについて
DALL-E3で画像を生成した際に付与される画像IDは、以下のような目的や特性があります
画像IDの概要
画像ID は、DALL-E3で生成された各画像に固有の識別子として割り当てられるもので、生成された画像を区別するために使われます。
このIDは、DALL-E3の内部システムで画像を参照するために使用されるもので、ユーザーが生成した画像に関する情報を記録し、再参照する際に役立ちます。
画像IDの役割
画像IDは、生成された画像の情報を特定するために用いられます。
たとえば同じ画像をシステムに再利用させたい場合にこのIDを参照することで、関連する画像の特徴やスタイルを維持しながら新たな画像を生成することができます。
これは、完全に同一の画像を生成するためのものではなく、一貫性のあるキャラクターや雰囲気を保ちながら別のシーンやバリエーションを作成するために役立ちます。
画像IDの取得
ユーザーがDALL-E3で画像を生成すると、その画像には自動的に画像IDが付与されます。
このIDは、生成された画像とともに内部で記録されます。ユーザーがそのIDを記録しておく(画像IDを表示するよう指示を出します)ことで、後で再び同じスタイルやキャラクターを用いた別のシーンを作成する際に利用できます。
シード値との違い
『Stable Diffusion』 のようにシード値を使用して画像を完全に再現するシステムとは異なり、DALL·E 3 の画像IDはスタイルやキャラクターの一貫性を保ちながら別シーンを生成するためのものです。
完全に同一の画像を再生成するわけではありません。
DALL-E3 画像IDの使用方法について
別シーンの生成
画像IDを使って別のシーンを生成する場合、元の画像IDを参照する形でプロンプトを記述します。
この方法により、元の画像の特徴やキャラクターのスタイルを反映しながら、新しい状況や背景で再現されたバリエーションが生成されます。
たとえば、以前生成した画像のキャラクターのIDを使用し、新しいプロンプトで異なるシチュエーションや背景を設定することで元の雰囲気を保ったまま異なる画像を作成できます。
画像のバリエーション生成
同じ画像IDを使って、別のアングルや表情、衣装などを少しずつ変更したバリエーションを生成することも可能です。これにより、キャラクターやシーンの一貫性を保ちつつ、変化をつけた画像を繰り返し生成できます。
画像IDの限界
画像IDを使用しても、元の画像と全く同じものが生成されるわけではありません。
あくまで元の画像に基づいたスタイルやキャラクターが保持されるというだけで、生成される結果は多少の変化が伴います。
画像IDを使用しても、プロンプトが適切に設定されていない場合、一貫性のない画像が生成されることがあります。プロンプトで具体的にキャラクターの特徴やシーンを指定する必要があります。
プロンプトとの併用
画像IDを利用する場合でも、詳細なプロンプトと組み合わせることで、より一貫性のある結果を得やすくなります。
画像IDを利用するメリット
一度生成したキャラクターを元に、異なるシーンやアクションを描く際に、一貫性のあるキャラクターの姿を保つことができる点が大きなメリットです。
漫画や物語など、一連のシーンを作る際に同じキャラクターを異なる状況で使いたい場合に非常に役立ちます。
DALL-E3 シード値について
シード値の存在
DALL-E3では、画像生成時にシード値が内部的に設定されています。シード値は、画像生成に使われる乱数を制御するためのキーとなる値です。
シード値は、ユーザーが生成した画像に関するメタデータとして存在していて、これを確認することは可能です。
ただし、DALL-E3では ユーザーが生成前にシード値を指定することはできません。これにより、ユーザーがシード値を使って画像の再現性を直接操作することはできません。
シード値の利用目的
DALL-E3では現在使用できませんが、『Stable Diffusion』などの画像生成AIでは同じキャラクターの別シーンなどを生成する場合に使用できます。
シード値は、生成された画像のランダム性を管理し、特定の画像が再度生成される際に一貫性を保つための内部的な仕組みとして使われています。
生成後の画像のメタデータにはシード値が含まれており、このシード値を取得することが可能です。シード値を使えば、同じプロセスで再度画像を生成できる可能性があります。
例えば、あるプロンプト「青い空の下の赤い車」を入力として画像を生成する場合、シード値が「1234」であれば、毎回同じ青い空の下の赤い車の画像が生成されます。シード値を「5678」に変更すると、同じプロンプトに対して異なるバリエーションの画像が生成されます。
シード値の制限
DALL-E3では、シード値が生成プロセスに関与しているものの、ユーザーがシード値を使って同じキャラクターや雰囲気を持つ画像を複数生成するための直接的なツールとして機能することはありません。
シード値を使ったキャラクターやシーンの再現は不可能で、同じキャラクターを繰り返し使いたい場合にはプロンプトの詳細な指定や画像IDの活用が必要です。
まとめ
DALL·E 3 ではシード値が存在しますが、ユーザーがそのシード値を事前に指定したり、利用する機能はないため、シード値に依存した一貫性のある生成結果を得ることはできません。
シード値を使った画像生成の再現は、画像生成後にメタデータを確認する形でしかできません。
一貫したキャラクターや雰囲気を維持するためには、詳細なプロンプト設定や画像IDの再利用が必要です。
DALL-E3 画像サイズについて
- 1024×1024 ピクセル(正方形)
- 1792×1024 ピクセル(ワイド)
- 1024×1792 ピクセル(縦長)
の3種類になっています。詳しくは別記事DALL-E 3画像サイズ&出力で説明していますので詳しく知りたい方はチェックしてみて下さい。
DALL-E3 プロンプトについて
プロンプトは、DALL-E 3に生成してほしい画像の内容を指示するためのテキスト入力です。このプロンプトを基に、DALL-E 3はその内容に合致した画像を生成します。プロンプトの品質や詳細さが、生成される画像の品質や正確性に大きな影響を与えます。
プロンプトの構成要素
プロンプトにはいくつかの重要な要素が含まれます。これらの要素を具体的に指示することで、より正確で希望通りの画像を得ることができます。
- 主題(メインオブジェクト):
- 画像の主要な要素や対象物を指示します。例:「青い空の下の赤い車」、「可愛い猫」。
- 背景:
- 主題の背景に関する指示。例:「山の風景」、「海辺」。
- 詳細な属性:
- 主題や背景に関する詳細な特徴や属性。例:「赤い車はスポーツカーで、サンルーフがある」、「猫は白い毛で、青い首輪をしている」。
- スタイル:
- 画像のアートスタイルや雰囲気に関する指示。例:「リアルな写真風」、「アニメ風」、「ミニマルデザイン」。
- 追加の要素:
- その他の細かい要素やアクセサリ。例:「車の前に花が咲いている」、「猫の隣におもちゃが置いてある」
プロンプトについて まとめ
プロンプトはDALL-E 3に画像を生成させるための重要な指示文です。
具体的で詳細なプロンプトを書くことで、希望する画像を正確に得ることができます。プロンプトの質が画像生成の結果に大きな影響を与えるため、時間をかけて慎重に作成することが重要です。
DALL-E3で画像ID・シード値を利用して生成する
画像IDやシード値について少し学んでみましたが、実際に画像を生成した時にどういった感じになるのか実証していきましょう。
画像IDを利用して同じ画像を生成する
画像IDを指定した場合、同じチャットの場合は全く同じ画像が生成されます。違うチャットで指定した場合メモリや過去の履歴から適当な画像が生成されます。
ただし同じチャットで全く同じ画像になる場合は意味がないので、生成する前に「新しいバージョンで生成しますか?」と聞かれます。
新しいバージョンの場合は画像IDを参照せずに新たな画像が生成されます。
シード値を利用して同じ画像を生成する(失敗)
画像生成AI『stable diffusion』ではシード値を固定することによって同じキャラクターを生成できますが、『DallE3』にはそういった機能は搭載されていません。
以前にシード値でも生成できるような話を見かけて(当時はChatgptもできるようなことを言ってましたが、現在はできないと明言されています)実験した様子が↓になりますが、結局ダメでした。
興味のない方は次の項目から続きをチェックして下さい。
プロンプトを入れずにシード値だけを指定した場合はどうなるのでしょうか?全く同じ画像になるんでしょうか。
「シード値’4011692318’の画像を生成して下さい」の指示でエラーが発生しました。
理由を尋ねると、
シード値だけでは画像を生成することはできません。画像を生成するためには、シード値に加えてプロンプトや他のパラメーターも必要です。シード値は、生成される画像のランダム要素を決定するために使用されますが、プロンプトなどの情報がなければ具体的な画像を生成することはできません。
シード値だけでは生成出来ないようですね。あくまでランダム要素の参考的数値とでも言うんでしょうか。
シード値とプロンプトで生成する(エラー編)
今度はシード値とプロンプトを合わせて指示を出してみます。
画像の英語プロンプト(プロンプトは生成した画像をクリックして右上のiマークで確認できます。)
これとシード値を合わせて指示を出してみましたが、エラーが発生してしまい生成できませんでした。
原因を尋ねると、
シード値 4011692318
が利用できない理由として考えられる主な点は以下の通りです:
- システムの制限: 特定のシード値がシステム内でエラーを引き起こす可能性があります。これは技術的な制約やバグによるものかもしれません。
- リソースの制限: サーバーやリソースの問題により、特定のシード値を使用した画像生成が現在できない場合があります。
- プロンプトとの不整合: シード値とプロンプトの組み合わせにより、システムが正しく動作しない場合があります。
これらの理由により、特定のシード値で画像を生成できないことがあります。別のシード値を試すか、異なるプロンプトで再度お試しいただければと思います。
この画像ではシード値が利用できないのかと思い別の画像で試しましたが、同じエラーが出てしまいました。
正直、少し前に試した時は可能だったので、どういうことか尋ねてみました。
現在の状況を見ると、シード値を指定しての画像生成にシステムエラーが発生しているようです。この問題は一時的なものかもしれないので、時間をおいて再試行してみる価値があります。
この後、時間をおいて再起動などもしてから再度試してみます。果たしてシード値が利用出来るようになっているのでしょうか。
翌日再び試してみましたが、シード値を使った生成は現在できないようです。
- 一時的なシステムエラー: シード値が期待通りに機能しない場合、システムの一時的な問題が原因である可能性があります。このような場合、時間をおいて再試行することが推奨されます (OpenAI Developer Forum) (OpenAI)。
- アップデートの影響: DALL-E 3の最近のアップデートによって、シード値の取り扱い方法が変更され、生成IDなどの新しいパラメータが導入されることがあります。この変更により、一部のシード値が正しく機能しない場合があります (OpenAI Developer Forum)。
システムの安定性が改善されるまで、異なるシード値を試すか、別のプロンプトで画像を生成する方法を検討することをお勧めします。今後も同様の問題が発生する場合は、OpenAIのサポートに問い合わせると良いでしょう。
DALL-E3で同じキャラクターの動きを変えて生成する
画像IDとプロンプトを利用してキャラクターの動きを変える
では画像IDとプロンプトを利用して同じようなキャラクターの向きをかえたり、動きを変えたりした画像を生成してみましょう。
元の画像のキャラクターをどの程度再現してくれるのか気になりますね。
ちなみに画像IDを表示するには画像IDを表示するよう指示しないと表示されませんので、プロンプトと一緒に指示するか、後から「今の画像のIDを教えて下さい」で表示してみてください。
同じチャット内なら後からでも画像IDを尋ねることが可能です。
画像IDはチャット固有のIDになりますので、他人のIDはもちろん自分が作成したIDでも新規チャットでは利用できません。IDを発行したチャットで利用するようにしましょう。
こちらが基本のキャラクターになります↓
まずは先程のキャラクターを両腕を上げた格好にしてみましょう
プロンプト「画像ID’oKeEfOvO7Aivb5sS’のキャラクターが両腕を上に上げている画像を生成して下さい」で完成しました。
下着の肩の部分や、髪飾り、背景など細かい部分は変わってしまいましたが、服装やキャラクターはかなり元の画像に忠実に再現されているように感じます。
実際にキャラクターだけ使用したい場合には背景を白くしたりして他の編集ソフトなどで利用しやすくするのも良いと思います。
編集ツールで選択した後にプロンプト「リボンを外す」で髪飾りを消すことも出来ます↑
プロンプト「画像ID’oKeEfOvO7Aivb5sS’のキャラクターが食事をしている画像を生成して下さい」↑
プロンプト「画像ID’oKeEfOvO7Aivb5sS’のキャラクターが外で走っている画像を生成して下さい」↑状況に応じて服装も考えてくれそうですね。
やはり画像IDを利用しても同じようなキャラクターが簡単に生成出来ることがわかりました。後は編集ツールで微調整したり、何度か指示を変えたりしながら再生成すると希望する画像に近づけることが出来ます。
しかしキャラクターが複雑な見た目をしていたり、アクセサリーなどが多かったりすると再現度が下がったりして難しくなりますので注意が必要です。
新キャラクターで試してみます。
画像ID’gFjgroxqbGudtG34’
「ショートカットで水色の髪をして眼帯をつけた、赤い手袋を付けて青いブーツを履いた海賊風の女性のアニメ風ワイド画像を生成して下さい」で生成しました。青いブーツが反映されているのかは今のところ謎です。
「gFjgroxqbGudtG34のキャラクターが陸地で走っている画像を生成して下さい」で生成しました。青いブーツは反映されているようですが洋服まで青くなってしまいました。
「gFjgroxqbGudtG34のキャラクターが大男と戦う画像を生成して下さい」で生成しました。
眼帯の左右が変わってしまい、手袋も指だしになってしまいました。
このように複雑な服装やアクセサリーはすぐに変わってしまうので、できるだけ簡単に同じキャラクターを作成したいのであればシンプルな服装がおすすめです。
もちろん編集ツールで調整することは出来ますが、通常の生成より時間がかかるのが難点です。試してみましょう。
こちらが何度か編集ツールで微調整を重ねた画像です。眼帯や手袋を調節してかなり元のキャラクターに近づけましたが、肩飾りの形がどうしても再現できませんでした。
まとめ
現在同じキャラクターを生成する場合は、画像IDとプロンプトを組み合わせて利用するのが1番簡単に作成できます。
シード値と英語プロンプトの一部を変える方法も良いと思いますが、現在は使用できないようです。
表情やアクセサリーは編集ツールを利用して後から変更したほうが、元のキャラクターの再現度が高くなる可能性が高いと思います。
しかし編集ツールが言う事を効かない場合も多いのがAIの難しいところですね。
コメント