「そんな初版部数で大丈夫か?」と思っていたら案の定、『Stable Diffusion AI画像生成ガイドブック』(ソシム刊)はさっそく重版が決まった。ありがとうございます。
- 書籍のサポートページ
- 『Stable Diffusion AI画像生成ガイドブック』(ソシム刊)サポートページ
サポートページには、各章で採り上げているURLと生成した画像(プロンプトのメタデータ入り)へのリンクを掲載している。このページを見れば、URLもプロンプトも本から手入力せずにすむ。付録の「プロンプト単語帳」の画像428枚分は、紙幅の都合でプロンプト全体と生成パラメータを掲載できなかったため、特に参考になると思う。
(これらの画像は、ブラウザからAUTOMATIC1111版Stable Diffusion WebUI(SD/WebUI)の「PNGの情報を表示(PNG Info)」へ直接ドラッグ&ドロップし、「txt2imgへ転送」などをクリックするとプロンプトと生成パラメータをセットできる)
さて、売れ行きが好調なのはとてもうれしい一方、Amazonのレビューは残念なことになっている。最初は★5つがコメントなしでついて幸先がよかったが、次は★2つでレビューのタイトルが「最速で出版するために中身を犠牲にした本」。プロンプトの解説が期待した内容でなかったのは申し訳ないが、事実関係が正しくない。
このレビューには「3章まで読み終えてようやく環境構築をして実際に画像生成ができるようになります」とある。3章の終わりでセットアップが完了すると受け取れる書き方だが実際は2章で終わっている。2章の終わりには「では試しに画像を生成してみましょう」というくだりがあり画像を生成できている。
これを「2章の最後まで読み終えてようやく~」という意味で書いたのなら紛らわしいので直してほしい。そして2章の終わりは84ページで、全部で288ページの本において約30%の位置である。これが「ようやく」といえる地点かというとどうだろうか。
本の目次が「『Stable Diffusion AI画像生成ガイドブック』が3月31日ごろ出ます」にあるので目を通してほしい。
3章はSD/WebUIの機能解説で、txt2imgの機能を重点的に解説している。ファイル名につけられるタグ一覧、各サンプラーの特徴と分類、スタイル情報の保存先、大きな画像を破綻させずに出力する方法など、SD/WebUIを使っているうちに疑問に感じてくるだろうところも理解できるようになっている。また「生成」ボタンを右クリックすると画像を生成し続けられるメニューが出ることなど、普通に使っていては気付かない便利な機能も紹介した。
このレビューでは「現在すでに画像生成を始めている方にとっては得るものは殆どない気がします」と書かれてしまったが、むしろ3章の内容を「すでに画像生成を始めた」段階ですべて理解している人はいないだろう。「自分でネットで情報収集できる人」にはすすめないそうだが、この本にはネットで情報を見つけられず、独自に検証したこともたくさん載っている。
もう一つのレビューは★1つで「Stable Diffusionの商用利用は避けましょう」。こちらは画像生成AIそのものについての意見しか書かれておらず、本のレビューになっていない。
こういうレビューをどうしたらいいのだろうか。著者としてレビューを投稿してもいいのか調べてみると、それは禁止だそうだ。
当サイトで許可されないレビューの例は、次のとおりです。
カスタマーレビューについて - Amazonカスタマーサービス
- (中略)
- 商品の所有者、著者、またはアーティストと密接で個人的な関係があると認められた人物によるレビュー
レビューで事実誤認や本のレビュー以外のことを書かれっぱなしなのは気持ちがささくれ立つ。ここにこうやってレビューのレビューを書いても、レビューを読んだ人には届かないだろう。
こちらからはレビュー結果をどうこうできないので、いい本だと思ったらレビューの投稿をご検討ください。
そういえばこれ、はてなブックマークの「言われっぱなしで反論できない、反論しても読まれない問題」に通じるところがありますね。はてなは対応を進めてくれている。
- 参考
-
- はてな運営はいい加減はてブをなんとかしろ - ヨッピーのブログ(2023年2月25日付)
- 人気コメントのアルゴリズムを一部変更しました - はてなブックマーク開発ブログ(2023年3月3日付)
- ページオーナーによるブックマークコメントをコメント一覧上部に固定表示します(ブラウザ版のみ) - はてなブックマーク開発ブログ(2023年3月24日付)
- ブラウザ版はてなブックマークで「マイナス評価」ボタンを試験導入します - はてなブックマーク開発ブログ(2023年4月6日付)
ところで1つめのレビューの「表紙に載っているようなハイクオリティの画像」というくだりは意外だった。カバーに載っている画像の生成に使った学習モデルは公式モデルかでりだモデル、trinart2くらいでプロンプトもそんなに凝っていないつもりだったから。カバーの画像もほかの章や付録のように、プロンプトや生成情報がわかるようにします。