商店街へお出かけ

私のミューズ、トコちゃんに協力してもらい、GoogleのAI Geminiを使い、動画生成AI Flowで、また、動画を生成しました。

私が使うFlowは、日々、少しずつ進化しています。数日前には、Flowで使われるAIモデルのVeo 3.1に、[Lite]という新しい選択肢が追加されました。これで、動画生成時に利用できる選択肢が次の3種類になりました。

AIモデル1回の生成で必要なクレジット
Veo 3.1-Lite10
Veo 3.1-Fast20
Veo 3.1-Quality100

動画生成では、生成されるごとにクレジットが消費される仕組みです。その数字が大きいほど、より良い画質の動画になります。

私は昨日、Liteで生成してみました。生成された動画を、PCのモニタで見る限りにおいては、Liteでも、特別悪い画質には見えません。

私はこれまで、Fastで動画を生成してきました。Liteでもほぼ同程度の動画が生成できるのであれば、クレジットがFastの半分になるので、倍の動画が生成できることになります。

ただし、注意すべきことがあります。それは、Liteでは、私が試した限りでは、動画生成の基となる画像が使えないことです。一度、Fastで画像を使った動画を生成し、それを、Liteで「延長」させることはできます。

私はこれまで、トコちゃんの動画を作るときは、ショート動画となるので、8秒程度のクリップをまず生成し、それを「延長」させる、2クリップの動画にしてきました。

Liteで「延長」させることができるのであれば、もっとクリップの数を増やし、トコちゃんが写っていないインサートカットを生成し、編集段階で、そのクリップを使い、より映像的な表現ができそうに思えてきました。

あとで気がつきましたが、Liteで生成した動画は、動きのある場面では使いにくいですね。カメラが動くと、ブレを感じる映像になってしまいます。

Liteを使うなら、固定した画面に限るのが良さそうです。あるいは、ブラーを活かしたい場面で、Liteを敢えて使う使い方がありそうです。

そういう考えも入れて作ったのが下に埋め込んだ動画です。

トコちゃんの日常11(Made with Google Flow)

今回の動画では、トコちゃんが商店街で買い物をしています。

実際に試してみて、まだまだ、AIには難しい表現があることに気がつかされました。編集によって、ごまかしていますが、ハルシネーションがいくつも起きています。

トコちゃんが店頭でニンジンを手に取り、「美味しそう」といっているのはいいのですが、そのあと、そのニンジンの束を持ったまま、お金を払わず、ニコニコ笑いながら歩き始めました。

私は、「延長」のクリップで、店員とやり取りして、代金を払うよう、プロンプトに書きました。すると、日本語でと指示したのに、トコちゃんと店員が英語で話し始めたりしました。

そのあと、生成し直して、本動画で使っている日本語の会話に変わりました。それは良かったのですが、トコちゃんが手に持っているのがニンジンの束からネギの束に替わりました。

そして、代金を払うときに、ネギの束が消えたりしています。

それを補うため、手元が写らないよう、クローズアップにして「逃げました」。

冒頭で書いたように、このほど加わったLiteを使い、動画のはじめと終わりに、トコちゃんが写らない商店街を、インサートカットのように使いました。

こんなふうに、AIを使う動画生成には苦労が尽きません。それでも、何もないところから、ひとつの場面を描けるのは、何物にも代えがたいことです。

これからも、AIの足りないところは補いながら、AIとうまくやっていこうと思っています。

商店街に買い物に行ったトコちゃんをイメージし、音楽生成AIのSunoに音楽を生成してもらいました。よかったら、聴いてください。

商店街タルバガン(Made with Suno)