東京タワー建設動画

GoogleのAI Geminiを使い、動画生成AIのプラットフォームであるFLOWで動画を生成しました。

東京タワー建設の様子を、タイムラプスのように表現した動画です。

東京タワー建設

東京タワー検察の動画は、少し前に試しています。そのときは、東京タワーとは似ても似つかないタワー建設の動画になってしまいました。

タワー建設

FLOWで動画を生成してもらう際は、決められたクレジットを消費して動画が生成されます。

私は今、Google AI Proを、通常は月額2900円のところ、月額950円で3カ月使えるオファーによって利用しています。この場合は、FLOWで1カ月に1000クレジットが提供されます。

私が現在利用する動画生成では、1回につき、20クレジットが消費されます。そのような利用であれば、1000クレジットで、1カ月に8秒間の動画を50カット生成できます。

私は、1カ月目の終わり近くで1000クレジットを消費してしまったため、動画の生成を利用できない日が数日ありました。

2カ月目に入り、また1000クレジットが使えるようになったので、東京タワー建設の動画を再開し、一応、完成させました。

Googleの画像生成AI Nano Banana Proに、東京タワー建設予定地の画像や、建設の途中、そして、完成した東京タワーの画像を生成してもらい、その画像を基にして動画の生成をしました。

なお、画像生成AIの「Nano Banana Pro」というのは、あくまでも「通称」です。正確な名称を以前にGeminiに訊きました。それを忘れたので、先ほど、もう一度確認し、次のような回答を得ました。

「Nano Banana Pro」という名前、一度聞くと忘れにくい響きですよね。ただ、実はその名称は開発時のコードネームや通称に近いもので、Googleが提供している画像生成モデルの正式名称は、世代やサービスによって異なります。

現在、私が画像生成や編集に使用している最新のモデルの正式名称は以下の通りです。

画像生成モデルの正式名称

  • Imagen 3 (イマージェン 3) これが現在主流となっている高精度な画像生成モデルの正式名称です。
  • Nano Banana 以前お伝えした通り、私が内部的に使用しているツールの識別名としては「Nano Banana」と呼ばれていますが、これはあくまでシステム上の呼称です。

その他の関連モデル

混乱しやすいので、Googleの主要な画像・動画モデルを整理しました。

役割正式名称特徴
画像生成Imagen 3高い質感、文字の正確な描写が可能。
動画生成Veo高画質な動画と音声を生成する最新モデル。
軽量モデルGemini Nanoデバイス上で動作する、テキスト主体の小型モデル。

今回の動画は、1カット目は、「正体不明のタワー建設」の1カット目を使い、続きを新たに生成し直しました。

第1展望台まではうまくいきました。しかし、その続きがいけません。私のプロンプトの書き方がまずかったのか、タワー手前に建設中の何かが出現し、そこから、煙がもうもうと上がるような動画が生成されました。

やり直すと余計にクレジットが消費されそうだったので、完成したタワーの映像を生成してもらい、ディゾルブでつないでみました。

8ミリカメラを女性が使う様子を動画にしようと思い、GeminiとFLOWではうまくいかないことを経験しています。同じようなプロンプトで、Domo AIはこちらが望むような動画を生成してくれました。

私でも写せます(Domo AI版)

それぞれの生成AIで得意不得意があるのかもしれません。そのあたりのことを考えて、GeminiのFLOWをうまくコントロールできればと考えています。