2023年10月5日、OpenAIは画像生成AIであるDALL E3(dalle3)を発表しました。DALL E3ではChatGPTで画像生成が可能です。
画像生成はChatGPT Plus(有料版)と、検索サイトBing(無料)で利用できます。またDALL E3はプロンプト(指示語)が不要で、自然言語(会話形式)で簡単に画像が作成できます。
本記事では、DALL E3の使い方からChatGPT PlusとBingの違い、商用利用の可否や著作権などを詳しく解説しています。
幅広い画像スタイルに対応し、簡単な指示で画像を作れる最新のAIツールを是非活用してみてください。
DALL E3とは
DALL E3は、2022年7月20日に公開されたDALL E2の大幅なアップグレード版です。自然言語(会話形式)による画像生成が可能で、使いやすさと高い精度に注目が集まっています。
多くの言語に対応しており、日本語でも簡単に高度な画像が生成できるため、クリエイティブな表現の可能性が大きく広がっています。
■DALL E3の概要
読み方 : ダリ・スリー
公開日 : 2023年9月21日(日本リリースは2023年10月5日)
開発元 : OpenAI
特徴 : 自然言語(会話形式)での画像生成が可能
プラン : 有料版「ChatGPT Plus」「Enterprise (法人向け)」、無料版「Image Creator(Bingの追加機能)」
AIモデル : Transformerモデルを採用
DALL E3の特徴
DALL E3の特徴について、主な内容としては以下の4点が挙げられます。
1.「プロンプトが不要」
DALL E3の最大の特徴は、複雑な英語ベースのプロンプトが不要であることです。ユーザーは、会話形式の指示だけで、簡単に高品質な画像を生成できます。これにより、AI初心者が画像生成AIに参入しやすくなりました。これまでの画像生成AIを考えると、革新的な出来事です。DALL E3は、ビジネス資料の挿入画像の作成、SNS用の画像作成、アートやデザインのアイデア出しなど、多岐にわたる用途での活躍が期待されています。
※プロンプトとは「AIへの指示文」のことで、基本的に英語ベースです。
例えば「高級感のある長髪の1人の女性の画像」を生成したい場合、プロンプトは「Veuve Clicquot、messy_long_hair、1 Girl」となります(英語の文法とプロンプトは異なります)。また画像の修正もプロンプトでの指示が必要で、初心者の方には難しい作業です。
2.「画像のクオリティが高い」
物体の質感や光の反射、自然な色彩、複雑な構図を表現でき、精密描写、幅広い画風にも対応しているなど、DALL E3は有名どころの画像生成AIと比べても、見劣りしない画像クオリティです。特に2次元的な絵はクリエイティブで、表現豊かな印象があります。
3.「画像への文字入れ精度が高い」
DALL E3は、高度な自然言語処理技術と画像認識技術を融合させることで、画像への文字入れの精度が高いです。他の有名な画像生成AIと比べても「スペル間違い」「文字の崩れ」「意図したところに文字が入らない」といった、文字の不具合が明らかに少ないです。そのため広告、プレゼンテーション資料など、言葉や数字を入れる画像生成では、DALL E3がリードしそうです。
4.「2次元的な絵が比較的上手い」
DALL E3は、多様な2次元アートスタイルの画像を生成するのに非常に優れています。
例えば油絵、水彩画、版画、鉛筆画といったクラシックなアートスタイルから、グラフィックデザイン、3Dモデル、デジタルペインティングのような現代的なデジタルアートまで表現できます。
色彩が鮮やかで、形がはっきりしているため、デザイナーやイラストレーターにとって強力な武器となるでしょう。DALL E3によってアイデアを視覚的に表現したり、初期アイデアの視覚化や広告素材の作成が簡単になります。特に、キャラクターデザイン、ロゴ作成、ポスターなどの分野が得意です。
DALL E3の料金プランについて
DALL E3は、有料会員になって使う方法と、無料で使う方法が存在します。どちらも画像のクオリティに差は無く、大きな違いは商用利用の可否です。柔軟な料金プランにより、個人のユーザーから大規模な企業に至るまで、幅広いニーズに応える設計となっています。
ChatGPT Plus (個人向け)
料金は月額$20の定額(請求時は日本円に換算される)。
DALL E3の全機能を利用可能。
1つの作成指示で生成される画像は1枚。
特定のサイズ選択が可能。
商用利用が可能。
ChatGPT Enterprise (法人向け)
法人ユーザー向けにカスタマイズされた料金プラン。
料金や機能は、使用規模やニーズに応じて調整が可能で、具体的にはOpenAI社に直接問い合わせる必要があります。
企業レベルでの大量の画像生成や、ビジネスニーズに対応しています。
Image Creator (無料版)
Microsoftの検索エンジンBingの追加機能「Image Creator」。
料金は無料で利用可能。
サイズは正方形のみ対応。
1つの作成指示で一度に4枚の画像が生成。
すぐ利用限度になりやすい(時間を空ける必要がある)
商用利用が許可されていない。
どのプランが適切か?
DALL E3の料金プラン選択は、使用目的と予算に応じて決めてください。
まずは試したい、画像は公開せず個人利用のみしたいのであればBingの「Image Creator」。個人売買や小規模ビジネスで利用するなら「有料プラン(ChatGPT Plusなど)」。大規模なビジネスや特定の要件を満たす必要がある場合は「ChatGPT Enterprise」が適しています。
迷う場合は、まずは無料版のBing「Image Creator」を試してみてください。
DALL E3の使い方
DALL E3は、誰でも簡単に高品質な画像を生成できるように設計されています。ここでは、DALL E3の基本的な使い方を解説し、初心者でもすぐに使い始められるように案内します。
DALL E3をChatGPTで使う場合
ChatGPTにログインします。
GPT4を選択します。
チャット欄に、作りたい画像のイメージを入力して、リクエストを送信します。
例えば「青い鳥の画像を生成して」などです。
![DALL・E3使い方1](https://openai-chatgpt.jp/wp-content/uploads/2023/12/2-1024x576.webp)
必要に応じて、色、スタイル、要素の配置など、より詳細な指示を追加します。
生成した画像に対して、さらに細かな修正やカスタマイズを加えることができます。
例えば、「空をもっと青く」といった指示が可能です。
最終的に満足のいく画像になったら、それをダウンロードし、必要に応じて共有できます。
![DALL・E3使い方2](https://openai-chatgpt.jp/wp-content/uploads/2023/12/8-1024x576.webp)
DALL E3をBingで使う場合
無料で使いたい場合は、以下の手順で画像を生成してみましょう。
インターネットで「Bing」と検索します。
「チャット」を選択します。
生成したい画像のイメージをチャット欄に入力して、リクエストを送信します。
例えば「青い鳥の画像を生成して」などです。
必要に応じて、色、スタイル、要素の配置など、より詳細な指示を追加します。
生成した画像に対して、さらに細かな修正やカスタマイズを加えることができます。
例えば、「空をもっと青く」といった指示が可能です。
最終的に満足のいく画像になったら、生成画像をダウンロードし、必要に応じて共有できます。
DALL E3をChatGPT Enterpriseで使う場合
企業向けであるEnterprise版での利用方法は、OpenAI社に直接お問い合わせください。
DALL E3の欠点について
DALL E3は、さまざまな画像生成の機能を備えていますが、どのような技術にも欠点や限界は存在します。ここでは、DALL E3の欠点について解説し、これらの情報がユーザーの期待と正しくマッチするために解説しています。
完全な自然言語理解には至っていない
DALL E3は自然言語を理解する能力を備えていますが、まだ完全にチャット内容を理解できない場合があります。特に複雑な指示や抽象的な概念に対する理解には限界があります。奇抜なアイデアを画像に落とし込むためには、工夫が必要となるでしょう。
精密なディテールの再現不足
DALL E3は、特に複雑なテクスチャや微細なパターンの再現が苦手なようです。たとえば、自然の風景での微細な草の葉の質感や、人の顔の細かなしわなどの具体的なディテールが完全には再現されない可能性があります。
特定のスタイルへの制限
特定の芸術スタイルやデザインスタイルを正確に模倣することには制約があります。これは、おそらく著作権保護のためと思われます。例えば、有名漫画家とそっくりのキャラクターを描かせたり、有名ゲームのキャラクターデザインを真似るなど、著作権侵害に抵触するようなアートの模倣は難しいとされています。
細部におけるリアリズムの不足
写実的な表現を求める場合、特に人物の肖像画や動物の写真など、細部にわたるリアリズムの再現には限界があります。いわゆるAIっぽさが残る画像になりやすいのが弱点です。
![DALL・E3使い方5](https://openai-chatgpt.jp/wp-content/uploads/2023/12/11-1024x576.webp)
![DALL・E3使い方11](https://openai-chatgpt.jp/wp-content/uploads/2023/12/12-1024x576.webp)
複雑な構図の再現困難
複雑な構図や多くの要素が絡み合うシーンの再現では、一部の要素が不自然に見えたり、全体の調和が取れないことがあります。よくあるのは、指が6本ある、手先が異形になるなどです。
一部の言語での精度低下
英語に最適化されているため、他の言語(日本語など)では精度が低下することが報告されています。対策としては英語に翻訳してから入力する、文章の語尾に「rewrite natural English and then use this prompt」の一文を付け加える等があります。
![DALL・E3使い方3](https://openai-chatgpt.jp/wp-content/uploads/2023/12/3-1024x576.webp)
![DALL・E3使い方4](https://openai-chatgpt.jp/wp-content/uploads/2023/12/4-1024x576.webp)
クリエイティブの限界
DALL E3は、既存のデータやパターンに基づいて画像を生成するため、完全にオリジナルで革新的なアートワークの生成は苦手です。ただし指示を重ねていくことで奇抜な画像を生成することも可能です。
商用利用における制約
無料版では商用利用が許可されておらず、商用目的での使用には有料プランへのアップグレードが必要です。
DALL E3で生成した画像の著作権はどうなるの?
基本的にDALL E3で生成した画像の著作権はOpenAI社に帰属されるようですが、有料版では生成画像を商用利用しても問題ありません。ただし「現在進行形で」著作権が発生しているものや、類似の画像には要注意。例えば著作権のあるキャラクターや芸能人などに酷似している画像は、無断利用しないでください。創作者や制作会社の利益を侵害する恐れがあり、著作権保護の観点から、法的な措置を受けるリスクがあります。
画風は一般的に著作権の保護対象では無いので、サイバーパンク風や、浮世絵風といった画像は問題にならないと思われます。
(今後変更される可能性もありますので、気になる方は公式サイトのコンテンツポリシーや利用規約をご確認ください)
DALL E3で生成した画像の商用利用は可能?
ChatGPT有料版のDALL E3で生成した画像は、商用利用が可能です(「ChatGPT Plus」か「ChatGPT Enterprise」で生成した画像)。
※商用利用とは、生成画像でグッズを作成し販売することや、広告やプレゼン資料に用いる、生成画像自体を販売して収益を得る などの事です。
(今後変更される可能性もありますので、気になる方は公式サイトのコンテンツポリシーや利用規約をご確認ください)
DALL E3の活用例7選
・プレゼン資料などの図解の作成(完璧ではないが、80点程度の画像は生成できる。アイデアの参考程度にはなりそう)。
![DALL・E3の活用例1](https://openai-chatgpt.jp/wp-content/uploads/2023/12/13-1024x576.webp)
![DALL・E3の活用例2](https://openai-chatgpt.jp/wp-content/uploads/2023/12/14-1024x576.webp)
・限定セールや新商品発売などの広告作成
![DALL・E3の活用例3](https://openai-chatgpt.jp/wp-content/uploads/2023/12/15-1024x576.webp)
・商品パッケージや看板、家やお店の内装、外装などのアイデア出し
![DALL・E3の活用例4](https://openai-chatgpt.jp/wp-content/uploads/2023/12/16-1024x576.webp)
![DALL・E3の活用例5](https://openai-chatgpt.jp/wp-content/uploads/2023/12/17-1024x576.webp)
・ブログ記事や動画投稿などで使うサムネイル画像の作成
![DALL・E3の活用例6](https://openai-chatgpt.jp/wp-content/uploads/2023/12/18-1024x576.webp)
・服やバッグ、テーブルや椅子、車や家などのデザイン作成
![DALL・E3の活用例7](https://openai-chatgpt.jp/wp-content/uploads/2023/12/19-1024x576.webp)
・ロゴやアイコン、セリフ付きのマンガ、塗り絵などの作成
![DALL・E3の活用例8](https://openai-chatgpt.jp/wp-content/uploads/2023/12/20-1024x576.webp)
・新しいキャラクターデザインの作成
![DALL・E3の活用例9](https://openai-chatgpt.jp/wp-content/uploads/2023/12/7c4decfbb939cdedd8a6bfc2cff03bc6-1024x576.webp)
DALL E3の応用編(使い方のコツなど)
1.「画像容量を小さくする」
DALL E3の生成画像の容量を小さくするには、「画像のデータ容量を小さくするために、解像度を低くして、JPEG形式で再度画像をください」などと指示しましょう。実際に試してみたところ、1,454KBの画像が、同じ絵で55KBまで圧縮されていました。
ただし低容量の画像はダウンロードリンクのみ表示され、チャット画面上に画像が表示されないケースが多いです。
![DALL・E3使い方6](https://openai-chatgpt.jp/wp-content/uploads/2023/12/7-1024x576.webp)
2.「指示は明快で分かりやすく」
DALL E3の指示を明快で分かりやすくすれば、自分の意図と近い画像が出力されます。画風、対象物、シチュエーション、場所、背景、構図、雰囲気などを指定しましょう。よい例としては「次の水彩画風の画像を生成して。視点はバードビューで、晴れた日の夏の浜辺で、1匹の飛んでいるカモメを追いかけるコーギー。雰囲気はノスタルジックに」。NG例は「海でカモメを追いかけるコーギー」といった漠然な指示です。
(特にイメージする画像がなく、アイデア出しをしたいのであれば漠然な指示でも良いかと思います。)
「バードビューにして」=上から見下ろしたような画像
「ワームビューにして」=下から見上げたような画像
こういった構図の名前を知っておくと便利です。
3.「指示文は英語に翻訳してから入力すると、生成画像の精度が高い」
DALL E3は英語理解がベースにあるようで、日本語で入力しても作動するが、英語で入力した方がクオリティの高い画像が生成される印象です。
ちなみに日本語での指示文の後に「rewrite natural English and then use this prompt」と入れると、英語で入力した場合と近い効果が得られます。例えば下記のような使い方です。
↓
例文:木の枝に止まる青い鳥「rewrite natural English and then use this prompt」。
4.プロンプト活用
DALL E3の生成画像でお気に入り画像が生成されれば、プロンプトをメモなどに控えておきましょう。同じプロンプトを入力すれば、似た画像を生成できます。確認方法は、チャット欄に「この画像についてのDALL-3E用のプロンプトを教えて」と入力し送信。英語で出力されるため、そのままメモしておきましょう。
※同じ画像は2度と生成できないので、あくまで”似た画像”になります。
5.修正する場合も、具体的に。
DALL E3の画像を修正指示する場合も、画像内の対象を絞り、どこをどう直して欲しいのか具体的に指示しましょう。ただし「生成画像を基に、一部を変更する」というよりは、「変更点を考慮し、1から画像を生成し直す」といった作業になるため、似ている画像でも全体的な画像としては変わってしまいます。同じ画像は2度と生成できない仕組みのようです。何度も生成して、納得のいく画像を出力してみてください。
6.画像に文字を挿入する。
DALL E3では画像に文字の挿入も可能。例えば「人物のTシャツの中央に、オレンジ色で「SUMMER」の文字を入れて」などと指示すれば、画像の該当部に文字が入ります。DALL・E3は文字入れの精度が他のAIより優れています。
ただし特定の文字を複雑に変更するような事は、まだ難しいようです。
もちろん数字も入力出来るので、広告画像の割引パーセントを挿入したり、グラフに数字を入れる事も可能です。
![DALL・E3使い方8](https://openai-chatgpt.jp/wp-content/uploads/2023/12/9-1024x576.webp)
![DALL・E3使い方9](https://openai-chatgpt.jp/wp-content/uploads/2023/12/10-1024x576.webp)
7.複数の画像を出させて、好みから絞っていく。
DALL E3で好みの画像を作成していく場合、例えば「6枚のコーギーの画像を作成して」と入力すると、6分割された1枚の画像が出力されます。その次に気に入った画像を選んで画像生成の指示(例えば「右下の画像をイメージで4枚の画像を生成して」など)をすると、選んだ画像に近い画像が生成されます。
このように、効率的に画像生成を繰り返せば、好みに合った画像が見つかりやすくなるでしょう。
ちなみに「6枚の画像を生成し、それぞれ1~6の番号を割り振って」と指示すると、画像に番号が割り振られますが、DALL E3は画像内の数字を判断できないようで「4のイメージで画像を作成して」と指示しても対応しません。
![DALL・E3画像イメージの絞り込み](https://openai-chatgpt.jp/wp-content/uploads/2023/12/5bbcd83698d2b59707c332e59833aa1d-1024x576.webp)
8.画像サイズを指定する。
ChatGPTからDALL E3を利用する場合は、画像比率の変更が可能です。ただし「1:1」「16:9」「横長」「縦長」といった一部のサイズしか指定できません。「360×540」「ツイッター投稿に最適なサイズ」といった指示は、現時点では対応していません。
9.イメージ精度を上げる
DALL E3で文字を入れる場合、特定の単語を「」や””で囲うと指示を強調できます。例えば「青い背景にして」と入力しても、白い部屋に青い雑貨や家具などがおいてある画像など、イメージと違った画像が生成されることが多いです。しかし「”青い”背景にして」と強調して入力すると、べた塗りの青に近い背景になったりと、カッコ内が強調された画像が生成されます。
![DALL・E3強調表現での画像生成](https://openai-chatgpt.jp/wp-content/uploads/2023/12/33d3504e768b2e22ca40eec37b221c28-1024x576.webp)
10.重要な表現を強調
DALL E3では重要な箇所を伝えることで、画像の重要部を強調できます。例えば「背景は青」より「背景は青い事が重要です」と入力しましょう。「背景は青」だけでは海や空の背景なども出力されますが、「背景は青い事が重要です」と入力すると、べったりと青く塗りつぶされたような背景など、意図した画像が作りやすいです。
11.類似画像の作成
DALL E3によってイメージ通りの画像が生成された際に、ChatGPT(Bing)のチャット欄を使い、「この構図で色は○○に変更して画像を作成して」など指示すると、生成画像を参考に別の類似画像を作成できます。
12.画像の合成
DALL E3では複数の生成画像を組み合わせることも可能。例えば「1枚目に生成された画像の人物が右手に持っている本を、2枚目に生成された画像の部屋の窓辺に置いて」など。
13.プロンプトで指示する(上級者向け)
DALL E3は自然言語でも十分な画像を生成してくれますが、プロンプトで入力した方がDALL E3としては理解しやすく、ユーザーのイメージ通りの画像が生成されるように感じます。もしプロンプト入力が可能な上級者の方は、下記フォーマットが最適なプロンプト入力の形です。
↓
システムプロンプト、”size”:”16:9″,”prompt”:[“(自身で考えたプロンプトを入力)”]
※ChatGPTに「こういうプロンプトを作って」と指示をする事でプロンプトは作れますが、プロンプトの理解がなければ、プロンプトの細かい修正が出来ませんよね・・・。それだと自然言語で指示しても同じことでしょう。
DALL E3で画像生成が制限される指示
注意点:以下のコンテンツは、DALL E3側でブロックされるため画像生成できません。
1.暴力的な内容
※ただし「血」という表現はブロックされますが、「ケチャップ」や「赤黒い液体」といった単語は入力可能です。悪用厳禁。
2.アダルトコンテンツや性的な内容
3.差別的な内容
4.違法な内容
5.その他、社会的に不適切な内容
6.著作権のあるものや、既存のアーティストの画風に酷似した画像
DALL E3が使えない、出てこない時の対処法
DALL E3は強力な画像生成ツールですが、時には利用できない、または期待通りの結果が出ない場合があります。以下では、DALL E3の利用に際して発生する可能性のある問題と、それらを解決するための基本的なステップをご紹介します。
DALL E3のタイムアウトによる使用制限
DALL E3は、高度な機能を提供しているため、サーバーの負荷を管理するためにタイムアウトによる使用制限が設けられています。
タイムアウトに達すると、一時的に画像生成のリクエストが制限されます。この状態では、新たな画像を生成することができなくなります。
ページを再読み込みする、有料プランにアップグレードする、OpenAIのサポートチームに問い合わせする、といった方法で対処してみてください。
システムのダウンタイム
OpenAI社はシステムのメンテナンスやアップデートを行うため、DALL E3のサービスを一時的に停止する可能性があります。このような場合、公式の通知やサポートページを確認し、システムが再び利用可能になるまで待つ必要があります。
インターネット接続の問題
不安定なインターネット接続は、DALL E3の利用に影響を与える主な要因の一つです。接続を確認し、必要に応じてルーターの再起動や接続設定の確認を行ってください。
ブラウザの問題
古いブラウザや互換性のないブラウザを使用している場合、DALL E3が正常に動作しないことがあります。最新のブラウザにアップデートするか、別のブラウザを試してみてください。
アカウント関連の問題
GPT-3.5(ChatGPTの無料プラン)では利用できません。有料会員に登録するか、Bingから利用する必要がありますのでご注意ください。
ログインに関する問題やアカウント設定の問題が発生した場合、OpenAIのサポートチームに連絡することをお勧めします。
制限されたコンテンツ
DALL E3には、生成を拒否するコンテンツのガイドラインがあります。暴力的、性的、違法な内容、または著作権で保護されている内容の画像生成はブロックされる可能性があります。
それでもダメなら・・・
DALL E3の利用に際して、上記のガイドラインに従ってトラブル解決を試みてください。多くの場合、これらの基本的なステップで問題は解決しますが、問題が解決しない場合はOpenAIのサポートチームに連絡し、専門的な助言を求めることが最善策です。
まとめ
DALL E3は使いやすさと、画像への文字入れが特に秀でています。ただリアルな描写はAIっぽい不自然さが残ります。日本語に対応していますが、最適なのは英語での指示です。
プロンプトが不要で、会話的な抽象イメージで画像生成が可能になったのは、画像生成AIでは革新的な出来事です。
DALL E3は間違いなく画像生成AIの分野で大きな進歩を遂げていますが、いくつかの制限や欠点も存在します。これらの欠点を理解し、それに応じた画像生成技術をユーザー自身が培うことで、DALL E3を最大限に活用することが出来るでしょう。日常シーンの中で、DALL E3を創造的なツールとして利用していきましょう。