画像生成してもらうつもりが実体が「画像検索」だとしたら…(訂正あり)

私が生成AI(生成的人工知能)に接し始めて一週間が過ぎました。きっかけは、YouTubeで次の動画を見たことです。

【ChatGPTはもう古い】知らないと乗り遅れる。Googleの最新AIが異次元クラス!ChatGPTを超えた「Gemini 3.0 Pro」と「Nano Banana Pro 」が凄すぎる

この動画を見たことで受けたインパクトは、画像生成のNano Banana Proを、Googleの人工知能(AI)、Geminiで使うことで、こんなにも凄い画像生成ができるんだ、ということです。

このインパクトが大きかったので、まずはじめに、自分でも画像生成をしてみたいと思い、実際にしました。画像生成はこの一週間のはじめに二度やってみただけで、そのあとはそれを利用していません。

画像生成がどのように実現されるのかはまだ理解していません。

上で紹介する動画では、インターネットで見つけた画像を利用しています。私は、自分で撮影した画像を基にして、背景の画像と合成をしてもらいました。

その合成で背景に使われた自然風景の画像は、ネット上から収集した画像が使われたのだと思います。本来であれば、背景に使う画像も、自分が用意すべきでした。

こんなふうに、画像を生成する技術ができたとしても、基本的には、基となる画像が必要です。何もないところから何かを生成することは難しいように感じます。

2枚やそれ以上の枚数の画像を用意して、それをAIに合成してもらうのであれば、人間が手でやるよりも極めて短時間に、完全な形で実現してくれることがわかりました。

本日の豆私の考え違い
私の想像は違っていました。「画像を検索しているだけでは?」というのはまったく正しくないことが判明しました。

AIに関しては、いち早くそれに注目しているのであろう、「ホリエモン」こと堀江貴文氏(1972~)が、AIについて語るYouTube動画が散見されます。

その一部を見て感じることがあります。堀江氏はAIには詳しいかもしれませんが、それを使って、何か創造的なものを生成することは苦手とする人のように感じることです。

過去に白黒で制作された漫画を、AIを使って、カラーにするぐらいのことで終わっています。自分でオリジナルのストーリーを考えるか、AIにストーリーを創ってもらい、それを自分がAIを使って漫画にするという考えには至らないようです。

【ホリエモン】Googleがついに『Gemini 3 Pro』を解禁…Nanobanana×Gemini 3 Pro が切り開く“新時代”とは?【堀江貴文 切り抜き 生成AI ChatGPT】

物事を理詰めで考えがちの人は、創造性に欠ける面があるように前から感じています。難しい理屈をいうのは得意でも、そこにデザイン性を持たせて、表現することが苦手なことが多いように感じます。

堀江氏のYouTube動画は、どれもが顔出しで、自分の考えを一方的に述べるものばかりです。動画であれば、自分がイメージするものを動画にすることができます。しかし、堀江氏が作ったそんな動画は見たことがありません。

堀江氏を例に出して書きましたが、これは、一般論としてもいえると思います。画像生成AIを便利に使えるようになっても、それを使って有用な画像を生成する人は、そう多くないだろうということです。

私がGoogleのAI、Geminiを使い始めて一週間になったと書きました。この一週間で私が一番お世話になったのは、いろいろな知見を得ることです。

知りたいことが頭に浮かぶと、それをGeminiに質問するようになりました。その結果は、これまでのネット検索では得られないような、奥の深いものばかりでした。

結局のところ、GoogleのGeminiを凄いものにしているのは、Googleが提供するウェイブブラウザであるGoogle Chromeを世界中の人々が利用することで収集できた、膨大なデータの蓄積があってこそということです。

それがどこにどんな形で蓄積されているのか知りませんが、ある質問を受け取ると、その質問の回答に使えそうなデータを瞬時にかき集め、目にも留まらない猛スピードで文章化するのだろうと想像します。

昨日の朝日新聞一面に次の見出しの記事があります。

日本政府が考えるAIがどのようなものであるかはわかりません。記事には、「ロボットにも必要な国産AI開発」とあるので、今、ネット経由で使われているような生成AIとは違った方向を目指している可能性があります。

少し前に、空港内を、荷物を自動で輸送できる車両の実験が始まったというニュースを見ました。そのような、実務をAIに代用させるようなことを視野に入れているのかもしれません。

コンテナ運搬車の自動運転を羽田・成田空港の制限区域内で国内初の実用化 航空業界の人手不足解消に期待

GoogleのGeminiのような生成AIを日本が時前で開発するということであれば、遅れを取り戻すのは簡単ではないように思われます。

今の生成AIは、蓄積した膨大なデータが必要であるからです。AIを動かすノウハウを実現できても、それを活かすためのデータがなければ、空っぽのノウハウで終わってしまいます。

ここでもう一度、画像生成の話に戻ります。

これに興味を持つきっかけとなった動画では、「カフェで仕事をする若い日本人女性」とプロンプト(プロンプトエンジニアリング)を入れ、Nano Banana Proが、プロンプトに沿った画像を生成する様子を紹介しています。

【ChatGPTはもう古い】知らないと乗り遅れる。Googleの最新AIが異次元クラス!ChatGPTを超えた「Gemini 3.0 Pro」と「Nano Banana Pro 」が凄すぎる

ここで気をつけなければならないのは、この画像を、AIがゼロから生成しているわけではないということです。画像に写っている女性は実在している人ではないでしょうか?

であれば、無料の画像を提供するサービスを利用して、同じような文言で検索し、その結果、選ばれた画像を見るのと変わらないことになり、画像生成ではなく、「画像検索」となってしまいます。

そのあとの、場所や衣服、物などとの合成でも、基となる画像が必要です。

ただ、画像を基にして、表情を変えたり、ポーズを変えたりするのは、AIの技術がなければ実現ができないことで、凄いことです。

ここで気をつけなければならないのは、手描きのイラストのような画像を生成する場合です。それも、おそらく、ネットから収集した莫大なデータから、相応しいイラストを選んで使われるのだろうと思います。

そのイラストを描いた人が、自分のイラストを画像生成に利用することを承諾しているのなら問題ありませんが、そうでない場合は、本人の与り知らないところで勝手に利用されてしまうことになりかねません。

生成AIは敵か…味方か… “1億総クリエイター”時代到来か?【追跡!ニュースのリアル】【NIKKEI NEWS NEXT】

このあたりのことを考えると、AIを使って画像を編集する場合は、できるだけ自分で画像を用意することを心がけたほうが良いように考えます。

数日前の本コーナーで、私が油絵具で女性の頭部を描き、それをPCに画像として取り込んだことを書きました。私はあることを考えてそれをしました。

私が考えたのは、自分が想像で描いた女性の顔、つまり、この世には存在しない女性の顔を、画像生成の技術で、実在する人の顔のようにしてもらえるか試すことでした。しかし、まだそれを依頼していません。

私が躊躇するのは、それを依頼しても、その絵に似た顔を蓄積している画像データから捜し、それをアレンジした画像が生成されるだけでは、と考えたからです。

私はまだ理解していませんが、画像生成AIといっても、無から画像を生成することはできないように考えています。

私が望んでいるのは、実在していない人間の顔を創造することです。それなのに、それに似た誰かの画像を当てはめられたのでは、それを生成してもらう意味がありません。

私の希望が叶い、どこにもいない人間の顔が生成できたら、それに動きを与える動画を生成してもらいたいと考えています。

画像生成、動画生成の技術が今、どの辺まで進んでいるのかわかりません。それを解説するYouTube動画も今のところ見当たりません。

ということは、それを知る人がまだいないということになりそうです。

まだ実現されていないAIを日本が開発できたら、「反転攻勢」は十分に可能です。