世の中AIが流行ってますね。テキスト生成AIの「ChatGPT」、画像生成AIの「Stable Diffusion」、動画生成してくれる「Gen-2」なんていうのも出てきています。
今回話題にする「画像生成AI」のStable Diffusionはオープンソースで公開されていて、これを使った画像生成サービスがたくさん出てきています。サクッと試すのにはどれがいいのか悩ましいです。今回は私が試した「Dream Studio」がちょっと試すにはとても分かりやすかったのでご紹介します。
DreamStudioはこんな方におススメ
- 画像生成AIを初めて使う方
- WEB上で見かけるプロンプト(命令文)が難しそうで抵抗がある方
- プロンプトだけでなくUIで視覚的に命令を調整したい方
- とにかく早く生成してみたい方
DreamStudioを5分以内で使ってみる
まずは「Dream Studio」のサイトにアクセスします。
![](https://glass-inc.jp/wp-content/uploads/2023/04/0d40a5e4a645fc6b96e767d64ac0878e-1024x591.png)
右上「Login」をクリックしてアカウントを作りましょう。Googleアカウントがあると楽です。下記はGoogleアカウント連携の場合のキャプチャ
![](https://glass-inc.jp/wp-content/uploads/2023/04/0d40a5e4a645fc6b96e767d64ac0878e-7.png)
ログイン出来たら、とりあえずこのまま生成してみましょう。
左下の「Dream」が生成ボタンです。
![](https://glass-inc.jp/wp-content/uploads/2023/04/0d40a5e4a645fc6b96e767d64ac0878e-1-1024x722.png)
生成されましたね。おめでとうございます!
これで人生初のAI画像生成は完了です。5分以内でできたでしょうか?
いろんなバリエーションを作ってみる
当然、自分が考えた命令文で生成したいですよね。試してみましょう。
命令部は「Prompt」というところに記載されています。今記載されているものはデフォルトでDream Studioが用意したもので、アクセスのたびにランダムで変わります。
ここに命令文を入れるんですが、どんなふうに入れたらいいでしょう。
まずはデフォルトの命令文を見てみましょう。以下は何度かアクセスして出てきたちょっと長めの命令文です。
Massive airship floating above a sprawling metropolis, with towering skyscrapers and busy streets below, futuristic, detailed, high resolution, urban landscape
翻訳するとこんな感じです(余談ですが翻訳はDeepLのChrome拡張が便利です)
広大な都市の上空に浮かぶ巨大な飛行船。眼下にはそびえ立つ高層ビルと賑やかな街並み。未来的、詳細、高解像度、都市景観
これを真似て以下のような命令文を作ってみました。
広大な都市と夕方の風景。1人の男性の後ろ向きのシルエット。逆光。退廃的。高解像度、詳細。
英語に訳すとこんな感じ
Sprawling city and evening landscape, silhouette of one man looking backward. Backlight. Decadent. High resolution, detail.
実行してみます。
![](https://glass-inc.jp/wp-content/uploads/2023/04/0d40a5e4a645fc6b96e767d64ac0878e-2.png)
意図した画像になってますね。塗りが絵画テイストになっています。
ちょっとテイストが違うのも見てみたいので、左上「Style」を変えてみます。
「Pixel art」を選んだ場合。色数が絞られてドット塗っぽく見えるファミコン的な画像。
![](https://glass-inc.jp/wp-content/uploads/2023/04/0d40a5e4a645fc6b96e767d64ac0878e-4.png)
「Photographic」を選んだ場合。元の画像よりディテールがはっきりしていますね。
![](https://glass-inc.jp/wp-content/uploads/2023/04/0d40a5e4a645fc6b96e767d64ac0878e-3.png)
「Photographic」の右側の画像が気に入ったので、この内容でバリエーションを出してみます。
生成された画像をクリックして、「Generate variations」から似たものを生成させます。
![](https://glass-inc.jp/wp-content/uploads/2023/04/0d40a5e4a645fc6b96e767d64ac0878e-5.png)
生成されたものを見ると雲の流れが変わっていますね。
![](https://glass-inc.jp/wp-content/uploads/2023/04/0d40a5e4a645fc6b96e767d64ac0878e-6.png)
気に入ったのでこの記事のサムネイルにします。
生成した画像は「Download」ボタンからローカルにダウンロード可能です。
おわりに
Dream Studioを使ったAI画像生成の入り口から、バリエーション生成までご紹介しました。ブログのサムネイル画像生成などに使えそうですね。
画像生成AIの発展は目覚ましく、日々新しいサービスや機能拡張が行われています。Stable Diffusionだけでなく、「DALL-E2」「MidJourney」など引き続き追っていこうと思います。
注意したいのは権利関係です。学習に利用されている画像の著作権問題など不透明な部分がまだまだ多いです。キービジュアルやバナーなどクライアントへの納品物に使うのはまだリスクが高いかもしれません。このあたりはAdobeが「オープンライセンスコンテンツ、著作権切れパブリックドメインコンテンツのみ」を学習させた「Adobe Firefly」という画像生成AIを発表しています。権利関係の動向にもご注意ください。
![hiroki mori](https://glass-inc.jp/wp-content/uploads/2024/02/member-03.webp)
株式会社GLASS CTO。2010年、株式会社日立製作所にてIT新技術の調査・検証、Project Management Office、システム開発、マーケティング業務に携わる。2017年、株式会社Webios 取締役副社長 / CTO に就任。2018年、GLASS開発チームに参画。
AWS,GCPでのクラウドシステム開発、Ruby,PHPでのスクラッチ開発、CMS,ECパッケージでのサイト構築(WordPress / WooCommerce, MovableType, EC-CUBEなど)、kintoneでのシステム開発などに携わっている。