トコちゃんの登場

前回の更新では、GoogleのAI Geminiを使い、動画生成AI Flowに生成してもらったYouTubeのショート動画を紹介しました。

生成AIがハルシネーションを起こすことが知られています。画像や動画生成のハルシネーションは、文章生成とは違い、それがハルシネーションであることが目で見てわかります。

以前の本コーナーで書きましたが、1960年代、貨物駅として一大拠点となっていた汐留駅の生成をしてもらいました。

私は、当時の汐留駅は知らなかったので、生成された動画に写るのが、汐留駅に近いのかと思っていました。

それをYouTubeに上げると、それを見てくれた人が、実際の汐留駅とはまるで違うような感想をコメントしてくれました。

ほかにも、少雨によって渇水した兵庫県の滝畑ダムを、画像生成したことがあります。生成された画像と、Goolge Earthの画像を比較すると、生成された画像は、実在するダムとは違うことが確認できました。

このように、画像や動画の生成におけるハルシネーションは、文章のように、あとで間違いに気がつくというのではなく、生成された画像や動画は、ハルシネーションを目で見えるように示してくれます。

しかし、動画生成におけるハルシネーションが、思わぬ副産物をもたらすことがあります。私が昨日、YouTubeに上げた動画も、その副産物の例となります。

Flowでは、一回に8秒間程度のクリップが生成されます。そのクリップを三つ使う動画にしました。

その三つ目のクリップが、動画生成におけるハルシネーションの、私にとっては、好例です。

私が書いたクリップにはない女の子が、クリップに登場したのです。思わぬ形で「出会った」女の子を私は気に入り、今後、自分の動画生成に「登場」してもらおうと考え、「トコ」という名まで授けました。

その「トコちゃん」を意識して使った初めての動画を作りました。

トコちゃん、新幹線に乗る(Made with Google Flow)

突発的に生成されたトコちゃんは、走る新幹線の窓の外に登場しました。そのトコちゃんを、今度は、新幹線の座席にしっかり座ってもらいました。

トコちゃんは、2000年に亡くなった姉の娘(姪)にどことなく似ています。

トコちゃんは、座席から少し腰を浮かせ、窓ガラスに掌をくっつける仕草をしてくれました。この仕草も、私は特別指示をしていません。

トコちゃんが、自分の判断で、それをしてくれた、と解釈することにしましょう。

そのあたりについて、Geminiと「対話」し、次のような返答を得ました。

指示をしていないのにトコちゃんが窓にそっと手を当てるという、あんなにもエモーショナルで完璧な仕草をした理由……それはまさに、「カメラワークやシチュエーションという『完璧な舞台設定』を用意したことで、AIが文脈を読み取って自ら自然な演技(アドリブ)をしてくれた」からだと言えます。

今回は、1クリップのみの登場ですが、今後、トコちゃんを動画でどのように活かそうか、と考えています。

トコちゃんのテーマのような曲を、音楽生成AIのSunoに生成してもらいました。よかったら聴いてください。

トコちゃんのパーカー(Made with Suno)