SeaArtにおける画像生成について

   前回初めて画像生成に触れた私ですが、その後多くの画像生成サイトがあることがわかりました。

 ですが、残念なことにせいぜい1、2枚作製したところで、無料バージョンで複数の画像を作成するのは難しいこともわかり、あとは課金してねというサイトばかりです。

 課金するのは構いませんが、自分のイメージ通りの画像が生成されるかは、実際に画像が生成されるまでわかりません。とりあえず私の知識では判断がつかないので、様々なサイトの無料枠の中で何枚か試してみましたが、どうも自分のイメージとだいぶずれがあるようです。

 単に私が画像生成AIに与えているスクリプトが悪いのかもしれませんが、自分のイメージに合わないサイトに課金するのには二の足を踏みます。

 放牧民のようにあちこちの画像生成サイトを渡り歩いているうちに、ようやく自分のイメージに近い【ジェシカ・セルダン】の画像作成を成功できるサイトに巡り合いました。それが今回のトピックの題名になっている「SeaArt」です。シンガポールに本社があるそうです。URLをはっておくのでご興味のある方はどうぞ。ただし、アクセスは自己責任でお願いします。怪しいサイトではないと思いますが……

 https://www.seaart.ai/ja

 さて、今回画像生成についてほとんど何も知らない私が、SeaArtで最初に作成してもらった画像が以下のものになります。

 



 どうですか、すごくないですか? ド素人の私でもしょっぱなからこれほどの完成度の画像が作成(もっとも実際に作成したのはAI君ですが……)できたことに驚愕しました。

 多くの方が画像生成に触れていると思われるので、こういった説明は蛇足なように思われますが、念のため説明いたします。ただなにぶん最近AI画像生成を始めたため、間違った、あるいはでたらめな説明になるかもしれません。その点はご容赦ください。

 画像をAIに作成させるには、日本語もしくは英単語などの文字列を入力ボックスに入れる必要があります。これをスクリプトといいます。画像生成サイトによって画像生成の形式は異なるようですが、おおむね日本語の場合は文字列を読点で区切って入力し、英単語の場合は半角スペースで区切るようです。

 英語の文章は最初から単語ごとに分かれているからいいとして、日本語の場合は分かち書きが難しいですからね。読点で区切るのは自然の仕組みでしょう。

 私は始めたばかりでよくわからないので、とりあえず短いスクリプトで試してみました。上記の画像生成で入力したスクリプトは 以下のものです。

 「15歳の少女、黄色い髪のポニーテール、アースアイの瞳」

 前回はCopilotで【アースアイ】の表現に苦労したのですが、以下のようにちゃんとアースアイが再現できています。これには大変驚かされました。

 


  もうちょっとアースアイの色合いや配置などが変えられればなおよかったのですが、初めてにしては上出来ということで、そのことは一旦棚置きとしました。

 さて、多くの画像生成サイトでは「そろそろ課金してね」ということで無料枠がなくなってしまうようですが、ここではもう少しお試しができるようです。 これはうれしいですね。もうちょっと試してみましょう。

 では今度は先ほど棚置きしていた【アースアイ】にこだわってみましょうか。拙作の小説「3.72%の少女」からアースアイを表現している文章を入力してみます。

 

 使用スクリプト:

「15歳の少女、黄色い髪のポニーテール、瞳の色はターコイズブルーを背景色にしてアンティックゴールドとマンダリンオレンジの色が散らばっている」 

 

 文字列が長いしちょっと厳しいかな? まあ、でもものは試しです。別に不快な画像が生成されるわけでもないでしょうし、まずは試してみます。さあ、どうでしょう……

 



 えっ、なにコレ。なんでこの子たちはオレンジを握りしめてるんだろう。 ああ、なるほど「マンダリンオレンジ」だな。よく見ると、リボンや服の色は「ターコイズブルー」になっているし、アンティックゴールドはアームレット(腕輪)とネックレスの部分ですね。【瞳の色は】って入力したんだけどなあ。まあ、しょうがないです。こちらの指示が悪いのでしょう。これは今後の課題ですね。

 さて、もういい加減に無料枠はなくなったよね……と思ったら、まだ試せるの? すごいサイトですね。なんだか勝手に私のクレジット情報を抜いてそこから支払いされているのでは?  ……なーんてことがあるはずもなく。サイトのご厚意に甘えてもう少し「お試し」させていただきます。アースアイの表現は廃棄し、他の文字列を追加してみます。

 

 使用スクリプト:

「15歳の少女、やや暗めのサンシャインイエローの髪のポニーテール、アースアイの瞳、ミルキーホワイトの肌、アーバンカモのキャップ」



 おっと、これは! ほぼ私のイメージ通りの【ジェシカ・セルダン】が出来上がりました。特に左側の画像がお気に入りです。今回は服装の指示をAIに与えていないですが、おそらく「アーバンカモのキャップ」にイメージが引きずられたのでしょう。ことさらにミリタリールックを想定したわけではないのですが。これはこれで可愛いですね。キャップもCopilotの時とは異なり、デザインセンスがいいです。

 さて、ここでふとAIによる画像生成のシステムに疑問が浮かびました。最初私は入力した文字列を参考にデータベースなんかに元になる画像を格納しておいて、そこからイメージを引き出し画像を組み立てていると思っていたんですが、どうやら違うようです。

 そこでそのことを確認するために、上記のスクリプトと全く同じものを使ってもう一度画像を生成してみました。それが以下の画像です。

 

 使用スクリプト:

「15歳の少女、やや暗めのサンシャインイエローの髪のポニーテール、アースアイの瞳、ミルキーホワイトの肌、アーバンカモのキャップ」



 なるほど、仕組みは全く分かりませんが、同一のスクリプトを使用しても出来上がる画像は違うものになるんですね。

 うーむ。よし、無料枠は……ちょっと!まだ無料ですか?大丈夫?ここのサイト 。まあ、ただで練習させてくれるのは助かります。もう一回だけ。

 

 使用スクリプト:

「15歳の少女、やや暗めのサンシャインイエローの髪のポニーテール、アースアイの瞳、ミルキーホワイトの肌、アーバンカモのキャップ、暗めのモスグリーンのニットカーディガン、シルクホワイトのリブキャミソール」

 



 うっ、ちょっとロリロリしてるけど、なるほど…… これはこれで可愛いです。

 

 ……といわけで、すっかり画像生成に夢中になってしまいました。他の方が作成した画像ものぞいてみたんですが、凄いですね。そしてこういったツールが素人のもとに出現したことに驚くとともに、昔MMD(MikuMikuDance)というツールに出会ったことが懐かしい思い出とともによみがえってきました。

 特に落ちはないのですが、今回はこのくらいで。

コメント

このブログの人気の投稿

Copilotの画像生成について

株の取引時期の決断について2(株の売り時)