Stable Diffusionを快適に使うための最適解。現時点で最強のビデオカード“RTX3090”を試す

PCパーツ

2022年8月に公開された、画像生成AI、Stable Diffusion。
呪文とも呼ばれる、シチュエーションを記したPromptから画像を生成するtxt2imgと、アップロードした画像を元に別の画像を生成するimg2imgの2つの手法で画像を作成できます。

どんな画像が生成されるかは、以下のリンクでご確認ください。
肌色多め(stablediffusionkawaii)

Stable Diffusionですが、Google Colabなどのクラウド環境を使って生成する方法と、自分のPCにインストールして使う方法の2つがあります。
前者は料金がかかる場合もありますが、自分のPCにインストールすれば、電気代(と情熱)だけで画像を大量に生成可能です。

Stable Diffusionを使うにはNVIDIAのGPUが必要

Stable Diffusionは、AIの処理にNVIDIAのGPUを使いますので、なにかしらのビデオカードが必要です。
最近ではApple、あるいはIntelのCPUを使って生成させることも可能になっているようですが、別途ソースコードの適用などが必要になりますので、一番手っ取り早いのは、ビデオカードを使うことです。

私がStable DiffusionをインストールしたPCには、GeForce GTX1080を搭載しています。
VRAMは8GBですので、推奨の10GBよりは少ないですが、問題なく動作可能です。
4GBのVRAMでも動くように最適化されたStable Diffusionもあるようですので、動かすだけであれば、VRAMの容量はあまり気にしなくても大丈夫です。

高品質な画像を生成するために必要なVRAM容量

Stable Diffusionは512×512pxの画像をもとに学習、画像を生成しますので、生成する画像も、512×512pxにすると最も最良の結果を得られるようです。(経験則)
ただ、512px四方の正方形って、小さくていまいち微妙なんですよね…

Stable Diffusionが出力する解像度は、64px単位で指定する必要があります。
VRAM8GBに収まるギリギリの解像度は、私の環境では704×512でした。
これ以上大きな画像を作成すると、VRAM容量が足りなくなり、エラーが出てしまいます。

もっと大きな解像度で出力したい!という場合は2通りのやり方があって、1つはメモリ消費量を抑えた版のStable Diffusionを使うこと。ただし、機能も削られているっぽいので、微妙な気がします。
もう1つは力業で、よりVRAMの多いビデオカードにすること。

コンシューマ向け最大のVRAM容量を誇るRTX3090

現状のNVIDIAのビデオカードに搭載されているVRAMの容量は、RTX3080までが~12GBで、RTX3090が24GBとなっています。
GTX1080の8GBから増やすにあたって、どうせなら最強のやつを!ということで、RTX3090を導入してみました。

購入したのは、ZOTACの、主にBTOなどのPCに組み込まれているものです。
3スロット占有の巨大なビデオカードです。

RTX3090を使ってStable Diffusionで遊んでみる

AI用にも最適化されているRTX3090。
早速、Stable Diffusionでの使い勝手を試してみたいと思います。

GTX1080の550%という圧倒的な処理速度

RTX3090を導入したので、Stable Diffusionのファイル生成速度を比較しました。
解像度は704×512px、120サンプリングでの生成速度を計測しています。

GeForce RTX3090:18秒
GeForce GTX1080:100秒

ということで、RTX3090の圧勝でした。
しかも、GTX1080に比べ、550%もの圧倒的処理速度。
Stable Diffusionで遊ぶにも、もってこいなビデオカードだと思います。(使い方もったいない)

私がStable Diffusionで絵を生成する際は、サンプリングを30程度に落とし、大量に生成→雰囲気や身体が破綻していないものを選んで、シード固定でサンプリングを上げて再生成、という手順を行っています。
30サンプリング程度であれば、5秒程度で生成できてしまうので、大量に生成した中から厳選するにはとても便利に使えます。

1280×960ピクセルの出力も可能なVRAM容量

RTX3090は24GBのVRAMを搭載していますが、Automatic1111+anything v3.0では1280×960ピクセルで安定した出力が可能でした。
もっと大きな解像度も出力できるのですが、絵が破綻するので実用的ではありません。
また、Highres.fixを使えばもっと高解像度も狙えますが、低解像度で生成した絵とまったく異なってしまうことも多いため、できればHighres.fixは使わずに出力したいところです。

1280×960ピクセルでは、以下のような詳細な絵が得られます。

ただし、画像生成にかかる時間も大きく、1枚当たり55秒程度を要します。

出力できる解像度が大きくなると、絵柄も変わりますし、精細さが格段にUPします。
試しに、PromptとSeedを固定し、同じ縦横比にした画像を、RTX3090、GTX1080で出力してみました。(WaifuDiffusion1.2でのテストなので、絵が古いです)
縦横比が変わると全く別の画像になるので、設定した解像度は以下としました。

GeForce GTX1080:640×512
GeForce RTX3090:960×768

それぞれ出力されたのは以下の画像となります。
まずは、GTX1080から。
主線がしっかりし、ゲームっぽい塗りの仕上がりになっています。

GTX1080

お次はRTX3090。
まったく別の画風になっており、女の子も2人に増えてます。
塗りも透明感が出て、淡い色使いで独特の雰囲気を持っています。
ライティングも綺麗で、いい雰囲気だと思います。

RTX3090

構図で一番異なるのが、女の子が2人になっている点ですが、実は、1girlと人数指定を入れています。
ただ、なぜ2人になるのかという点ですが、予想するに、512×512のサイズで描くと、幅が960pxあるので、2人分描けちゃうので描いてしまえ…ということになったと思われます。
実際、構図や髪型、服装も似ていることが多いです。

上記の雰囲気になるよう、GTX1080でいろいろ試してみましたが思うように行かなかったので、おそらく生成する際の解像度が高いと、こんな感じで細かいところまで書き込んでくれるように思います。
VRAM容量ですが、大は小を兼ねるということで、Stable DiffusionのためにNVIDIAのビデオカードを買うなら、24GBの容量を誇るRTX3090が良さそうに思います。

RTX3090をStableDiffusionで使うときに注意すべきこと

このカードですが、購入後2日で故障しました。
原因は、GDDR6Xの発熱による故障が濃厚です。StableDiffusionはVRAMにもとても負荷がかかるアプリケーションで、搭載されているVRAMの全容量に対し、連続して100%近い負荷がかかります。
RTX3090出採用されているGDDR6Xは発熱がとても高く、StableDiffusion出連続生成しているときには、VRAMの温度はサーマルスロットリングが発動する105℃に達していました。

使っているケースはエアフロー重視のCorsair 680Xですので、ケース側の問題では無いと思われます。
24GB物GDDR6Xを搭載しているRTX3090は、カード裏面にも12GB分のGDDR6Xチップが搭載されています。
GPUチップ側は巨大なヒートシンクで冷却されますので良いのですが、バックプレート側は放熱が間に合わないように見受けられます。

StableDiffusionでガンガン画像を生成する場合は、裏面のVRAM冷却用に、以下のアイテムを用意することを強くオススメします。

RTX3090を中古で買うときに注意すること

RTX4090の発売もあり、中古では10万円そこそこに値下がってきたRTX3090ですが、中古で買うときには注意が必要です。
というのも、上記のようにVRAMの発熱による突然死などが起こりえるためです。
私はショップの保証で返金となりましたので良かったですが、これが個人から買ったと思うとかなり怖いです。
しかも、中古ではマイニングで使われていた個体も多いと思われ、それらのカードは100%負荷で酷使されていますので、マイニング同様にビデオカードに極めて強い負荷をかけるStableDiffusionで使うには、不安が残ります。

マイニングで使われているかどうかの判別方法として、オイルのにじみ、ラベルの剥がれなどの見分け方があるようですが、これらも完璧とは言えません。
また、メルカリ、ヤフオクなどで出品されている品も、「マイニングはしていません」と出品者が言っていたとしても、本当かどうか確かめる術はありません。

一番は3年保証などが付く新品を購入することですが、それなりに高価ですので、中古のコストパフォーマンスには敵いません。

そこで、中古でRTX3090を買う際に、少しでもリスクを減らすためにオススメなのが、
・保証期間が長い中古販売店から購入
・バックプレート用GPUクーラーを追加して冷却能力を上げる
ことです。

安くなったといっても10万円近い価格ですから、壊れた時のショックは大きいです。
個人的には、ハイエンドビデオカードに関してはメルカリなどの個人間売買は極力避け、中古で買うならば保証のあるショップをオススメします。

コメント

  1. yun より:

    マイニングもお絵かきもGPUを計算に使っている点は同じなので、ガッツリ負荷がかかりますね。
    ゲームのようにフレームリミッター(Vsync)は無いので無茶するとグラボが壊れます。
    マイニングのようなBIOSを書き換えての低電圧化等もしないので、余計にヤバイですね。
    中古等でVRAM温度が高い場合はサーマルパッドが劣化しています。
    サーマルパッド交換で40℃ぐらい下がったという話も聞くので、交換した方が良いですね。
    基本的に中古は劣化しているので避けた方が無難です。

タイトルとURLをコピーしました