最近話題のAI画像生成で何ができるでしょうか。綺麗な景色を見たい、自分の思い出のあの場所を再現したい、理想の姿ってこうだよね・・・。私は、Youtube等でよく見るようになった美女画像の生成に挑戦してみました。
作成した美女画像



動作環境
- Google Colaboratory
- Stable Diffusion
- CIVITAI
Google Colaboratory(Google Colab)
Google Colabは、ウェブブラウザ上でPythonコードを実行できるクラウドベースの環境です。Googleアカウントを持っていれば誰でも利用でき、GPUやTPUを含む高性能なハードウェアリソース使用できるため、機械学習や画像処理のプロジェクトにも最適です。何より、ハイスペックなビデオカードを購入せずとも、必要な時に必要なだけ使えるのが良いところです。
Stable Diffusion
Stable Diffusionは、画像生成のためのAIツールです。細かい設定を指定できることから、画像生成プロジェクトにおいて幅広い用途に利用されています。Stable DiffusionのWeb UIを通じて、操作や設定を直感的に行うことができます。
CIVITAI
CIVITAIは、学習モデルの共有サイトです。Stable Diffusionには各種設定値があるのですが、どのようなテキストを読み込ませているのか、設定をしているのかを参考にして自分の環境でも似た画像を作ることができます。
環境設定
画像生成プロジェクトを始めるには、適切な動作環境が必要です。以下に、プロジェクトを実施するための基本的な環境設定をご紹介します。
Google Colabのセットアップ
プロジェクトの第一歩は、Google Colabをセットアップすることです。以下は、Google Colabをセットアップする手順です。
Googleアカウントにログイン
Google Colabを利用するためには、Googleアカウントが必要です。もし持っていない場合は、Googleアカウントを作成してください。
Google Colabのアクセス
Google Colabはウェブブラウザからアクセスできます。Google Drive内に移動するか、Google Chromeを開いて「Google Colaboratory」と検索してアクセスします。
Colab 有料プランの契約
GPU環境にするため、Colab Proタブで有料プランに申し込みします。Colab ProとPay As You Goの比較検討を行ったところ、特にお得になる様子は見られなかったため、私は「Pay As You Go」で100ユニットの購入を選択しました。

ノートブックを開く
世界中の方がStable Diffusionを動かすためのweb UI、pythonコードを公開してくださっています。ありがたく使わせてもらいましょう。
githubを開いて、「stable diffusion」と検索します。


すると、複数のブランチがでてきますので、そこから「TheLastBen/fast-stable-diffusion」を選択し、CodeのCloneをします。ここではHTTPSのリンクを取得しました。

Colabに戻って、上記で取得したGitHub URLを検索して、レポジトリは「fast-stable-diffusion」、パスは「fast-stable_diffusion_AUTPMATIC1111.ipynb」を選択します。これでpythonコードを開くことができます。
※このipynbファイルを自分のドライブ内に保存してください。
CIVITAIからモデル取得
CIVITAI には、多くのモデルやプロンプトが公開されています。自分の作成した画像に応じて適したモデルやプロンプトをダウンロードしましょう。

コードの実行
すでにコードは記載されておりますので、上から順番に必要なライブラリや依存関係をインストールし、画像生成、web UI立ち上げに必要なコードをここで実行します。
モデル読み込み
途中でモデルの読み込み指定ができますのでここで、CIVITAIで取得したモデルを選択します。

Stable Diffusion Web UIで画像生成
画像生成の鍵となるツールの一つが、Stable DiffusionのWebユーザーインターフェース(UI)です。この直感的なUIを活用することで、高度な画像生成を行うためのプロセスがより手軽に、しかも繊細な調整が可能になります。以下は、Stable Diffusion Web UIを使用して画像生成を行う手順の詳細です。
Stable Diffusion Web UIへのアクセス
colabの環境で最後のコードを実行すると、URLが取得されますので、そのリンクからブラウザを開き、Stable DiffusionのWeb UIにアクセスします。プロジェクトの目的や要件に合わせて、生成したい画像の特性やスタイルを設定することができます。

Checkpointの選択
基盤となるCheckpointを選択します。今回は、CIVITAIから「beautifulRealistic_v60.safetensors」というCheckpointをダウンロードしておりますので、こちらを選択しました。
パラメータの調整
画像サイズやSampling stepsなど、複数のパラメータを調整することが重要ですが、一度で理想の画像が生成されるわけではありません。しかし、CIVITAIのウェブサイトには他のユーザーによって公開された画像やそのパラメータがありますので、参考にしましょう。
完成



モニターに美女の画像があらわれました。Google ColabとStable Diffusionの力を借りて実現できました。このプロジェクトの結果、私は本物そっくりな美女の画像を生成することができ、新たな可能性が広がっていることを感じました。
しかし、この技術が今後どのように活用されていくのか、その可能性についても考えてみることが大切です。これは単なる画像の生成に留まらず、幅広い領域での活用が期待されます。たとえば、身近にモデルさんがいない状況でも、美しい画像を簡単に生成できたり、商品画像を効果的に作成してマーケティングを強化したりする可能性があります。また、従来は専門のイラストレーターに依頼していた画像も、AIを活用してゲームに組み込むことができるでしょう。
これからの画像生成に期待せざるをえませんが、この技術の進化を注視して、さまざまな分野での応用を見守り、自分でも活用できるように試行錯誤を重ねていきましょう。
コメント