ごめん!たかはしさんのイラストであそ…試す画像生成AI「Gemini vs ChatGPT+Sora」(2025年6月時点)
この記事にはアフィリエイト広告・広告が含まれています。
先日タブクルのライターとしてお試しで参加してもらったたかはしさん。
3Dアバターを作成して二次元っぽくしたところ、ご本人から不評だったので彼女の旦那さんに協力してもらいながらイラスト画像を使って遊……実験させていただいた。
まずは絵心ゼロの私が頑張って作成したイラストを見ていただきたい。
まぁこれが不評だったので、せっかくGeminiとChatGPTの有料プランへ加入しているのだからと画像生成AIの実力を試させてもらった。
過ちを繰り返さないために、たかはしさん本人と旦那さんに画面共有で東京から見てもらいながら作業を進めていく。
(追記)
ポッドキャスト版を追加しました。画像中心で文章の少ない記事をどうラジオ風に仕上げるのか、という点において興味深い音声でした。
たかはしさんのイラストで試す画像生成AI
Gemini(Google AI Studio)編
手始めに全く期待していなかったGeminiから試していく。
今回はGoogle AI Studioで利用できる画像生成AIサービス「Gemini 2.0 Flash Preview Image Generation」を使った。なぜ有料プランに加入しているのに無料のプレビュー版を使うのかというと、プレビュー版のほうが最新版だから、それに試行錯誤できる強みもある。
まずは記事冒頭の画像をアップロードしてキャラクターを認識させたうえで次のプロンプトを書いていく。
プロンプト:
田舎の川にかかっている橋へ寄りかかっているような画像にしてください。
少しエモい感じになって満足してもらえるかと思ったが、想像以上にSHINKAIな感じに驚いた。
これではガジェット系ブログから離れてしまうので、プロンプトで「橋に背中を向けている状態にして」と姿勢だけでも前向きになるようお願いしてみた。
ん???
なぜアップになったのか。
まぁエモさは増したけれども――――、彼女のハズバンドへ確認したところ「いいっすね!」だったので良しとしよう。
ChatGPT編
続いてはチャッピー。
通常のチャット画面で画像生成アイコンをONにして、記事冒頭の画像をアップロード、そこへプロンプト「このキャラクターをリアル寄りのアニメ風にして、田舎の道を歩いている画像を作成して」と入力した。
だ、だだっ、断じて先ほどのSHINKAI風の画が気に入ったわけではない。
かつて話題となったジブリ風に近いイラストが生成された。もし「リアル寄り」と指定していなければジブリ寄りになっていたのかもしれない。それにしても学生風にアレンジされているのは何故だ。
ちなみに「リアル寄り」と指定しなかった場合は下図のようなイラストが出力された。
まぁ何というか、アニメ風だよねっていう結果。
ショートカット=幼いというイメージが国外にはあるのだろうか。
ChatGPTの画像生成AI「Sora」編
今度はチャッピーの本気を見せてもらうべく画像生成AIの専用サイト「Sora」へ移動した。
アップロード画像は同じにしてプロンプトは「キャラクターをリアル寄りのアニメ風イラストにして、背景は田舎の風景にして。」と書いた。
SHINKAI風に惹かれてリアル寄りへ意識をかけすぎたのがアダとなった模様。
たかはしさん本人にも東京から見てもらっていたのだが「ちょっと怖い」という感想をいただいた。た・・たしかに。
色々な反省を抱きつつ、プロンプトをGeminiと同じく「田舎の川にかかっている橋へ寄りかかっているような画像にしてください。」へと変更、実行した。
キタ━━━━(゚∀゚)━━━━!!
これには、たかはしさん本人も旦那さんも大爆笑。
「待って!実写版があったかも」といって旦那さんがカメラからフレームアウトしていったが、どうやら見つからなかったようだ。
チャッピー的にはジト目から所作を連想した結果なのだろう。やはり属性というのがリアルな人間にも当てはまるようだ。
画像生成AIを試した結果、まとめ
GeminiとChatGPT、Sora by OpenAIの画像生成AIを試してきた。
個人的にはGeminiのエモい画風が好みだが、チャッピーの「空気を読む生成能力」には驚かされた。そう来たかという感じ。チャッピー画伯の描いた画像が共有画面に表示された瞬間、一瞬だけ空気が止まったような感じになったのが印象的だった。
旦那さんは音声AIにも興味を示しており、もし連想でアニメ声だったら捧腹絶倒と言っていた。画像生成AIと同じように元イラストから声を連想する機能が実装されたら自然と解釈一致の音声合成となるかもしれない。
本当は動画バージョンも試したのだが、Wordpressに貼り付けられるのかわからなかったので、時間があれば動画生成AI編をお届けしたい。
さて、どの画像にすべきか。

気付けばブログ執筆そのものがライフワーク。ども、タブクル管理人です。
かつて夢見た「タブレットやスマホを操り、生産的な活動をする未来」。最近は、その実現を加速させるAIに夢中です。AIは思考力を奪うという意見もありますが「どう使うか、どんな指示を出すか」と、以前より思考力が試される時代の幕開けだと思います。