ChatGPTで画像作成できる?DALL·E 3の使い方を解説
最終更新日:2024年07月05日
テキスト生成に特化した生成AIとして社会現象になった、ChatGPT。昨今では、日常生活からビジネスシーンまで幅広く活用されるようになりましたが、「画像も作成できたらもっと便利なのに」と考えている方も多いのではないでしょうか。
実は、2023年9月にOpenAI社がリリースした画像生成AI「DALL·E 3」を使えば、ChatGPTで画像を生成することができます。今回は、ChatGPTを使って画像を作成する方法について解説します。
「DALL·E 3」の登場で、ChatGPTでの画像作成が可能に
現在もこの基本的な仕様は変わっていませんが、2023年9月にOpenAI社が公開した画像生成AI「DALL·E 3」を利用することにより、ChatGPT上でも画像を作成できるようになりました。DALL·E 3はOpenAI社が開発した画像生成AIのDALL·Eシリーズの最新版で、単独での使用のほか、ChatGPT、MicrosoftのBing Image Creator、Microsoft Copilot、Imagecreaterでも使うことができます。
ChatGPTの場合、月20ドルで利用できるChatGPT Plus、企業向けのChatGPT Team、ChatGPT Enterpriseの3つの有料プランでDALL·E 3を利用できます。
DALL·Eシリーズの特徴は、入力したテキストをもとに画像やイメージを作成できることです。
例えば、「ゴルフをする犬」のようにテキストを入力すると、入力したテキストと意味を踏まえて画像データをアウトプットします。学習済みのデータの中にあるとは思えない奇想天外なテキストを入力しても画像を作成できることから、単なるデータのコピーでないことは明らかです。
DALL·E 3は、前身のDALL·E 2の発展形で、テキストの理解力、社会的に望ましくないコンテンツ作成を拒否する安全性、著作権侵害対策などの点で大きく進化しています。画像の解像度も向上しており、複雑で一貫性のある画像や、人の感情に訴えかけてくるような美しい画像を生成できます。
DALL·E 3を搭載したChatGPTでできること
DALL·E 3を搭載したChatGPTを使うと、具体的には何ができるのでしょうか。
ここでは、主な2つのできることについて、それぞれ説明します。
スピーディーに画像生成ができる
DALL·E 3は、進化した理解力を生かして、ChatGPTに入力されたテキストベースの指示を即座に読み取り、瞬く間にイメージどおりの画像を生成することができます。
既存の画像の編集やアレンジも容易なので、SNSなどのウェブメディアで即時的に配信する広告の画像作成などに適しています。
直感的に理想の画像を生成できる
DALL·E 3を使って生成した画像がイメージと違った場合、直感を言葉にしてテキストを追加すれば、簡単に画像をカスタマイズできます。
例えば、イベントやセミナーのポスターなど、雰囲気をわかりやすく示したい画像も、DALL·E 3を使えば容易に作成できるでしょう。
DALL·E 3をChatGPTに搭載した場合の利用料金
ChatGPTにDALL·E 3を搭載して使う場合、下記の3つのうちいずれかの有料プランに加入している必要があります。無料版のChatGPTでは、DALL·E 3を搭載して使うことはできません。
<DALL·E 3をChatGPTに搭載した場合の利用料金>
・ChatGPT Plus:月額20ドル
・ChatGPT Enterprise:非公開(企業規模やニーズで変動)
・ChatGPT Team:1ユーザーにつき年払いで月額25ドル、月払いで月額30ドル
ChatGPTでDALL·E 3を使用する方法
ここでは、ChatGPTにDALL·E 3を搭載して画像を生成する際の基本的なステップを紹介します。
なお、DALL·E 3を利用できるのは、最新版でマルチモーダルのGPT-4です。GPT-4は、GPT3.5に比べて学習できるデータ量や精度がアップしています。
1 ChatGPTにログインしてGPT-4を開く
ChatGPT Plus、あるいはChatGPT Enterprise、ChatGPT Teamのいずれかに加入した上で、ChatGPTにログインします。「Model」をクリックし、「Default(GPT-3.5)」「Legacy(GPT-3.5)」「GPT-4」のタブから「GPT-4」を選択して開きましょう。
2 プロンプトを準備する
続いて、作成したい画像のプロンプトを準備します。プロンプトとは、ChatGPTなどの対話型システムにおいて、ユーザーが入力する指示のことです。プロンプトが正確で具体性があるほど理想に合った画像が生成されやすいため、シーンの雰囲気や周辺の要素などをできるだけ細かく書き出しましょう。
また、「写真のように」「ポップなイラスト風に」といったタッチのイメージも指示できます。
3 ChatGPTにプロンプトを入力する
準備したプロンプトを、GPT-4に入力します。
このとき、DALL·E 3を使用して画像を作成してほしいことが明確に伝わるようにしてください。
<プロンプトの一例>
#プロンプト
自社のキャンペーン告知用の画像を作ってください。
詳細な条件や要望は以下にまとめます。
#条件
・大きさは、1200px × 1200px
・こちらから「テーマ」を送るのでそれに適した画像を生成してください
・文章ではなく画像だけ生成してください
・明るくポップなイメージでお願いします
・画像内に使用するテキストはすべて英語でお願いします
#テーマ
生成AIコンサルティングサービス、初回10%OFFキャンペーン
4 生成された画像を調整する
生成された画像を確認し、希望に合わない部分があれば追加のテキストで調整します。
具体的に確認すべき主なポイントは、下記のとおりです。
<確認すべき主なポイント>
・プロンプトをしっかり反映しているか
・倫理的に問題がないか
・イメージに合っているか
5 生成された画像を使用する
調整が完了したら、画像の完成です。
生成された画像を、ChatGPTのチャットからダウンロードし、使用します。
ChatGPTで画像生成する際の注意点
ChatGPT上でDALL·E 3を活用して画像を生成する場合、どのようなことに注意すればよいのでしょうか。
ここでは、ChatGPTで画像生成する際の主な3つの注意点について、それぞれ説明します。
著作権や使用許可について事前に確認しておく
ChatGPT上で生成された画像の著作権は、テキストコンテンツと同様、利用者に帰属します。ただし、生成された画像と極めて類似性の高い既存の画像がある場合、著作権侵害に当たる可能性があるため、注意が必要です。
ChatGPTはオリジナルコンテンツを作成しますが、今回のプロンプトからイメージされる画像に近しいものが学習データの中にあった場合、類似した画像を生成することがないとはいえません。そのため、必要に応じて既存画像の作者に使用許可を取りましょう。また、利用の際には、「ChatGPT上で生成された画像であること」がわかるようにしてください。
倫理面に配慮する
生成された画像が、社会の一般常識と照らし合わせて問題がないかどうかを確認することも大切です。
特に、倫理面には配慮が欠かせません。性別や人種などの差別につながる表現や、見た人を不快にする可能性がある表現、プライバシーを侵害する内容などが含まれている場合は使用を避けましょう。
コンテンツを見たときの印象は人によって異なるため、複数人の目でチェックすることをおすすめします。
意図したとおりの画像が生成されるとは限らない
プロンプトにもとづいて生成された画像でも、結果が予想どおりになるとは限りません。
生成された画像に一貫性がないこともあります。意図と異なる画像が生成された場合は、ほかの表現を試したり、テキストを追加したりしてプロンプトを調整しましょう。
ChatGPT上でDALL·E 3を効率的に使うポイント
ChatGPT上でDALL·E 3を用いて効率的に画像を生成するためには、どんな工夫が必要なのでしょうか。
ここでは、ChatGPT上でDALL·E 3を効率的に使うための主な3つのポイントについて、それぞれ説明します。
プロンプト作成にもChatGPTを活用する
これまでのバージョンは日本語との相性があまりよくないといわれていましたが、DALL·E 3は日本語でも英語でもほとんど変わらないクオリティの画像を生成できます。
よりわかりやすい指示をしたいときは、ChatGPTのテキスト機能でプロンプトを作成してみましょう。「◯◯のようなイメージのイラストがほしいときは、どんなプロンプトを書けば良い?」と入力すれば、要望に沿ったプロンプトを用意してくれます。
作成する画像のデータ形式やサイズ等をあらかじめ確認しておく
理想とおりの画像をスピーディーに仕上げるために、必要な情報はあらかじめ用意しておきましょう。
画像のイメージを詳細に言語化しておくだけでなく、必要な画像データの形式、サイズなどの情報も確認しておくとスムーズです。
追加プロンプトで調整する
まずは何らかの画像を生成してみて、足りない部分や直したい箇所を追加プロンプトで指示しましょう。
1回でイメージどおりの画像を生成しようとするより、追加プロンプトで適宜調整したほうがスムーズに進むこともあります。
ChatGPTの導入は「ナイルの生成AIコンサルティング」にご相談を
DALL·Eを搭載したChatGPTを使うと、AIの知識やイラストの素養がない人でも簡単に理想どおりの画像を生成できます。会話形式でChatGPTとコミュニケーションをとりながら、ビジネスに必要な画像をスピーディーに作成し、業務の効率化やコストの圧縮、ユーザー体験の向上につなげましょう。
ナイル株式会社では、生成AIを導入する際の障壁に対して全方位的に支援する「生成AIコンサルティング」を提供しています。具体的には、ChatGPTなど生成AIに関するセミナー実施や推進チームづくり、生成AI活用に適した業務の選定、対象業務内容のヒアリング、現状の業務を生成AIに置き換えた際のコスト削減効果の可視化など、さまざまなサポートを行っています。
DALL·Eを搭載したChatGPTの導入についてもご相談に応じていますので、まずはお気軽にご相談ください。