GoogleのAI Geminiを使い、動画生成AI Flowで、また、YouTube用ショート動画を生成しました。
素材は、動画生成AIがハルシネーションを起こしてくれたことで出会えた女の子「トコちゃん」です。
トコちゃんの日常の一コマを切り取ったような動画にしています。
AIでの動画作りを始めて3カ月。どうやれば、自分の望むような動画が生成されるか、コツのようなものが少しはわかってきました。
今回の動画は、トコちゃんを使い、川沿いの土手のようなシチュエーションを用意し、晴れた春の日と設定しただけです。
プロンプトでは、トコちゃんの仲の良い女友達が、スマートフォンで撮影したような映像と指示しているだけで、友達を登場させるようには書いていません。
それでも、動画のような映像になりました。
ただ、トコちゃんたちがしゃべる言語が英語になってしまっています。
そのあたりの仕組みをGeminiに訊くと、次のようなことを教えてくれました。
「友達と楽しい時間を過ごす」というプロンプトを見たAIは、「楽しく過ごしているなら、きっとおしゃべりをして笑い合っている映像がいいはずだ!」と想像を膨らませて、口を動かす映像を作ってしまいます。でも、肝心の「何語で何を話すか」が指定されていないため、映像に合わせてとりあえずそれっぽい「架空の言語」の音声をくっつけてしまった、というわけです。
きちんとした脚本を基に、ストーリーのある動画を作ろうとしたら、失敗の動画になります。しかし、私は、雰囲気が伝わればいいだけなので、これはこれで悪くないと思っています。
それにしても、AIで作ったとは思えないほど、自然な動画になっています。
カメラワークも、特別の指示はしていません。
今回は、8秒程度のクリックを2個作りました。2個目は何も指示をせず、1個目の流れで、続きを作ってもらっただけです。
カメラが、3人を正面から捉えたあと、右に移動し、トコちゃんの左に座る友達越しに、トコちゃんを捉える映像になっています。トコちゃんの奥に川があり、その向こうに桜が写っています。なかなか良いカメラワークです。
トコちゃんたちは、背中から陽を受けていますね。顔が陰になる逆光です。ポートレイトを撮るときは、これが理想的な光線です。そのあたりのことも、AIはわかった上で、この光線を選んでくれています。
トコちゃんの隣で横座りする友達の描写にしても、スカートの上から脚の形がわかるなど、とても、AIで作られた映像には見えません。
見れば見るほど驚き、感心してしまいます。
前々回の更新で書いたように、壮大なストーリーや、激しいアクション、宇宙やSFといった世界を描く動画を作ろうとは考えていません。アニメ作品も興味がありません。
トコちゃんを素材として使い、昔の8ミリカメラで撮ったような、日常の一コマを記録するようなショート動画を、細切れに作っていこうと思っています。
縦長の動画なので、スマートフォンで撮ったようなイメージです。
肩肘を張らず、このような緩い動画が、私の特性に一番敵っているのでは、と考えています。
河原でお花見をするトコちゃんたちをイメージし、音楽生成AIのSunoに音楽を生成してもらいました。よかったら聴いてください。
