【生成AI】プロンプト:Sampling stepsの処理時間違いと生成画像のクオリティ

わかりやすく言うと15Stepがよさそう?

10~20Step以内かしらね。10だとぎりぎりだから、スペックギリギリの人は解像度と照らし合わせて12~15。ちょっと足りないという人は15~18くらい?20で余裕ならばそれ以上に挑戦してみてね。

検証スペック

  • プロセッサ:12th Gen Intel(R) Core(TM) i7-12700F 2.10 GHz
  • メモリ:32.0 GB
  • グラフィックボード・ビデオカード:GeForce RTX 3050 GDDR6 6GB

まとめ

  • 1~3:ノイズ、ぼかしばかり
  • 4~7:顔が出てくるけれども使えない
  • 8~9:使えなくもないけれども暗かったり怖かったり
  • 10:人によっては全く問題ないレベル
  • 15:安定するわ
  • 20:デフォルト値なので良いクオリティとバランス
  • 40:目のいい人やこだわりたい人
  • 80:高クオリティの安定を目指したい
  • 120:40からはなかなか違いを見分けられないわねエラーとか減るのかしら?
  • 150:最高ステップ数、高スペックならこちらね

理想とテストの結果、体験:もう少し細かく

理想適正値はデフォルトの20あたりだと思うわ。
処理能力の低いPCは解像度を下げるかステップ数をある程度許容できる15くらいまで下げるとなんとかできるかもしれないわね。

Step1~3までは顔が見えるということは少ないみたいね。ただ生成速度が速いわね。10~20倍くらいの速度:1/10~20くらいの時間で終わるけれども得たい画像が得られないわ。ほとんどモザイク・ぼやけとなっているわ。

Step4からは大きく違いが出てくるわね。
Step4~7は顔が出やすくなってくるわ。ただ、ノイズが残っているせいで黒いのよね。

Step8・9は安定して顔が生成されるわ。ただ、崩れや明瞭度が低いわね。

Step10以降ははっきりとしたキャラクターが現れるわ。

各ステップとの比較秒数目安

私が今使っているPCで計測・体験してみたわ。これは体感速度だからあなたの環境とは異なることがあるわ。

Step1を基準にしてみてね。基準値は3くらい。そこからStep2は10~15秒くらい。それから5秒ずつくらい増えていっているみたいね。

グラフィックボードやその他の性能、今この段階と比べて全然違ってくると思うけれども、同じプログラムならば比率は参考にはなるかもしれないわね。

1枚生成に待てるのは1分くらいかしら。連続ならば10秒位で作って欲しいわね。スペックが低ければ10分とかになるのかもしれないけれども、そこまでいくのならばPCかグラフィックボードの変更を検討したほうが良いかもね。

Step1

3秒位ね。

ぼやけがかなり強いわね。生成された画像によってはほとんどモザイクのようなものになってしまうみたい。じっとみたらぼやっと構図が見えるような。

Step2

10~15秒くらいね。

少しずつ形がはっきりしてきているような。でも、まだまだイラストとは言えないわね。

Step3

15~20秒くらいね。

輪郭が見えてきたかもしれないわね。ただStep3まではまともなイラストになってないわね。

Step4

15~20秒くらいね。

崩れがひどいものの大きな変化が見えるわね。イラストが描かれようとしているのがわかるわ。

Step5

20秒強くらいだったわ。

ものによってはラフとしてアイデアとして成り立つかもしれないものが生成されるわね。でも多くは使えそうにないわね。

Step6

25秒位ね。

生成されたイラストによっては使えてしまえそうなものも現れるわね。崩れやエラーが多いわ。

Step7

30秒くらいね。

安定はしていないけれども、少しずつイラストの完成度と安定度が増してきているわね。

Step8

30秒強ね。

さあ、どうかしら?7割~8割位まで使えるようになったのかしら?プロンプトによってはStep8で済ませる事ができるのかも。

Step9

35秒くらいね。

悪くはないイラストが9割型生成されるようになったわね。クオリティが低いものや崩れが無くもないけれども、イラストの出来を気にしない人であれば9のレベルで大丈夫ね。

Step10

40秒弱ね。30秒を超えてここまでくると時間が長く感じるわね。

位置がおかしかったり指の数や形が違うなどここからのStepではどこでも現れるのだけれども、Step10あればいいかしらとは思えるわね。こだわりたい人は更に上を目指してね。

最低限の安定と低スペックにはちょうどいいところじゃないかしら?

Step11

40秒くらいね。

変化を感じにくくなってきたわね。

Step12

40~45秒ね。

どう?11との違いがわからないわ。

Step13

45秒強ね。

1枚目はたまたま目の位置がずれちゃったけれども、解像度などをもう少し小さくすれば大丈夫かも?

Step14

50秒弱ね。

1分が少しずつ見えてきたわね。

Step15

55秒ね。

処理時間1分が見えてきたわね。連続して生成したい・調整しながら作りたいときにはとても長く感じるわ。

Step16

1分ね。

Step17

1分強ね。

Step18

1分5秒ね。

Step19

1分10秒ね。

Step20

1分15秒ね。

デフォルト値よ。検証用のPCではこれだけかかってしまったけれども、10秒~20秒くらいに収まるくらいのスペックが良いと思うのよね。

Step40

2分15秒ね。2分台だから良いのかもしれないけれども、それならStep18くらいを2回繰り返したほうが効率いい気がするわ。

Step80

2分20秒ね。Stepは高くてもこれくらいでいいんじゃないかしら?

Step120

6分20秒ね。

Step150

8分ね。

味方によってはStep10から、15以降は違いがわからないわね。デフォルトの20というのはバランスが取れているんじゃないかしら?

8分というと、1時間に7枚ほどしか生成できないわね。ここまでくるならStepはもっと少ないほうが良いと思うのよね。

ETA(処理終了時間)とクオリティとのバランス

エラーないし意図しない形状は起こってしまうもの。どれほど値を大きくしても難しいことはあるわね。ただ、どちらに値を振ってもバランスというのが大事みたいね。

今回の体感的な計測では、Step1でほとんどノイズとなってしまうものは1秒~5秒位。人間の目で見たときにそう見えているのかは不明だけれども、4~7や8~9、10以上となったときの変化というのはとても大きく見えるわね。

10Stepあれば十分だという考えもできなくもないわ。1→10の違いと10→100程度ならば1→10のほうが明らかに大きな変化が現れるわね。

余裕分を見てStep10でも良さげだけれども、Step20というのが妥当ラインみたいね。デフォルトというのは大事ね。

カテゴリー

前・次の記事