動画生成の「指示」は監督にでもなったつもりで

GoogleのAI Geminiに毎日接しています。Geminiは文章も生成できますが、私がもっぱら関心を持ち、使うのは、画像と動画の生成です。

何も手元にない画像を、プロンプトに入れた文章で生成してもらうこともあれば、私が描いた絵を基にして、実在しない人物を実在する人物を写真に収めたような画像に生成してもらうこともあります。

人物であれば、自分で基の絵を描き、それを画像にしてもらうのを好みます。

画像が生成されたら、それを動画で動かしてみたくなります。

私は全身像よりも、頭部を大きく描くことが多いです。それを基にして生成された「人物」、私の場合は女性ばかりですが、それを動かそうと思ったら、顔の向きや表情に変化をつけることになります。

以前にも本コーナーで紹介した「女性」に、私の「練習台」を務めてもらい、動きをつける練習をしました。

「女性」がこちらを向いている静止画を動画として動かそうとした場合は、自分が映画監督にでもなった気分です。その「女性」に、何らかの動きをしてもらうため、こちらかが、どのように動いて欲しいか「指示」を出すことになるからです。

「指示」はそのまま、私が文章で打ち込む「プロンプト」になります。

その結果出来上がったのが、下に埋め込んだ1カットになります。1カットが短いので、同じカットを4回繰り返しています。

ある女2

本動画を生成したあとで、ある間違いをしたことに気がつきました。それは「彼女」の視線です。

これは何かの「演技」ではないので許されますが、「演技」であれば、役を演じる役者が、カメラのレンズを直接見るのは避けなければなりません。

「彼女」が自分の前にいる誰かと話をするのであれば、その人がいると設定した方に視線を向けさせなければならないからです。

いずれにしても、何かの意図があってこんな「指示」をしたわけではありません。こちらから「指示」を何もしなければ、Geminiにすべてを委ねることになります。

それでは困るので、はじめはカメラを向いたままにしてもらい、そのあと、「彼女」に一度右を向いてもらい、そのあと、髪を軽くかきあげてもらったあと、カメラの方にもう一度向き直ってもらい、カメラに向かって、和らげた表情で何かを話しかけるよう「指示」しました。

その際、何かを話しかけるようにでは、日本語以外をしゃべる「危険」があるので、きちんと、日本語をしゃべるように「指示」を出しています。

こういう、「指示」の練習を繰り返すことで、どのように「指示」を出せば、画面の中の『人物』がどのように反応してくれるかを、少しずつ会得することができるようになります。

風景などを動画にする場合は、風景に「演技」を「指示」するわけにはいかないので、その代わりに、風景のどこをどんな風に見せるか、カメラのアングルや動きに「指示」を出すことになります。

風景や情景の中に動けるものがあれば、その動きを「指示」します。また、忘れてならないのは、周辺の音が自然に聞こえるようにすることです。

数日前の本コーナーで、1965年当時、東京に実在した活も専用でき、汐留駅について書きました。

そのときに生成した画像を使い、列車が出発する様子も動画にしてみました。

1965年の汐留駅 列車出発

この場合も、どのような動画にして欲しいか、こちらから「指示」をしています。

こういうことを何度もすることで、一度の生成で、こちらが望むような動画が得られることが多くなったように思います。一度でうまくいけば、消費するクレジットが押さえられるので、助かります。

今のところ、動画生成を使って、表現したいものが特別あるわけではありません。何か表現したいものができたら、自分が監督にでもなったつもりで、「演技」指導や、「撮影監督」のようなことをしたいと考えています。