画像生成AIであるStable Diffusionを利用する際に便利なプラットフォームHugging Faceの紹介と使い方を画像付きで詳しく解説します。
はじめに
この記事では、画像生成AIであるStable Diffusionを利用する際に便利なプラットフォームであるHugging Faceについての紹介と使い方を画像付きで詳しく解説します。
Stable Diffusionとは
Stable Diffusionとはディープラーニング技術を用いて作られたtext-2-imageモデル(テキストを入力すると画像が出力されるもの)です。
text-2-image以外にも、インペインティング(Inpainting:画像の一部領域の損傷・劣化・欠落部分を(違和感なく)補正する)、アウトペインディング(Outpainting:元画像の領域の外側を補正する)、image-2-image(コマンドではなく画像を入力し、そこから新たな画像を生成する)ことができます。
Stable Diffusionの詳細とインストール方法などについては、以下の記事にまとめています。
Hugging Faceとは
Hugging Faceは、Stable Diffusionなどの各種生成AIや機械学習に関連する各種データやソースコードなどをダウンロードできるプラットフォームサイトです。
サイトは以下になります。
Hugging Faceのほかにも「Civitai」という有名なプラットフォームサイトがあります。こちらはStable Diffusionに特化したサイトになっています。
Civitaiについての詳細は以下の記事にまとめています。
Hugging Faceでダウンロードできるもの
Hugging FaceでStable Diffusionに関わり、ダウンロードできるものは主に以下となります。
- Checkpoint(チェックポイント)(=AIモデル)
- VAE
- LoRA
このほかにもStable Diffusion以外の生成AIや機械学習に関連するデータを検索してダウンロードすることもできます。
Checkpoint(チェックポイント)(=AIモデル)
CheckpointとはAIモデルのことです。Stable DiffusionはAIモデルのことをCheckpointというのでそのようになっています。
VAE(Variational Auto Encoder)
VAE(Variational Auto Encoder)とは高次元のデータ(=画像データ)を低次元のデータ(=ベクトルデータ)に変換したり(エンコード)、その逆の処理(デコード)を行ってくれるものです。
Stable Diffusionの場合は、画像を鮮明にしてくれる機能として使用されることが多いです。
LoRA(Low-Rank Adaptation)
LoRA(Low-Rank Adaptation)とは追加学習データのことです。あるチェックポイント(AIモデル)に対して、特定の特徴や質感を簡単に追加し、画像データのクオリティを大きく上げることができることがあります。
Hugging Faceの使い方
まずは、サイトにアクセスします。
Checkpoint(チェックポイント)(=AIモデル)を探す
ページ上部にある「Models」を選択します。
Otherをクリックします。
画面右側の検索ウィンドウに「Stable-Diffusion」と入力すると該当するモデルの情報がフィルタされます。ちなみに「Stable Diffusion」と入力しても結果は同じです。
ダウンロードしたいモデルをクリックしたあと、「Files and versions」をクリックします。
ダウンロードしたいモデルの右側にあるダウンロードボタンをクリックするとダウンロードが始まります。モデルは拡張子が「safetensors」「ckpt」のいずれかです。
Stable Diffusion特化ならCivitaiが便利かも
Hugging FaceはStable Diffusion以外の生成AIや機械学習モデルが公開されていますが、Stable Diffusionに特化したものを探したいときはCivitaiのほうが便利です。
Civitaiの場合の検索方法などは以下の記事にまとめています。
まとめ
画像生成AIであるStable Diffusionを利用する際に便利なプラットフォームであるHugging Faceについての紹介と使い方を画像付きで詳しく解説しました。
コメント