先頃行われたGoogle i/O 2026を経て、生成AIのプラットフォーム Flowで、Agent機能を持つGemini Omniの提供が始まりました。
私も末端で、その技術を利用して、自分の好き勝手な動画を生成するときに利用させてもらっています。
このマルチモーダルAIのGemini Omniに、Googleがどのような考えを持つのかについて語られているのを次の動画で興味深く見ました。
動画のタイトルとサムネールを見ると、AIの進化により、ネット検索の概念が大きく変わることが伝えられる内容の動画と思われるでしょう。
実際、それについて取り上げています。しかし、私は、Gemini Omniに与えられたのかもしれない考え方の説明が興味深かったです。
そのことを語っているのは、note CXO/UI・UXデザイナーの深津貴之氏です。
自分の考えとして深津氏が述べるのは、Googleは、Gemini Omniを展開することで、自分たちがまだ持っていないデータを欲しいのではないか、ということです。
GoogleはYouTubeという、動画を共有する巨大なプラットフォームを持っています。ですので、完成された動画のデータは膨大に持っています。
彼らが持っておらず、どうしても欲しいデータが何かといえば、動画を完成するまでのプロセスです。
私も動画生成の端くれとして、日々、どんな動画を作ろうか、どう作ろうか、どんなところがうまくいかない、だとかの繰り返しです。
GoogleはGemini Omniを提供し、それをユーザーに使ってもらうことで、実は、ユーザーの動画作りのプロセスや考え方などをデータとして得たいのではないか、というのが深津氏の推論です。
おそらく、深津氏の推論は大きく間違っていないように思われます。
であれば、私がFlowで動画を生成することで、私なりの試行錯誤がデータとしてGoogleの側に渡っているということになります。
私はそのことを嫌だと思ったり、不安に感じることはありません。むしろ、こんな私の試行錯誤でも良いのであれば、どんどん、今後の画像や動画生成AIの向上に役立てて欲しいという気持ちです。
FlowやGeminiとのチャットで、動画生成の悩みや要望を私は積極的に書き込んでいます。
たとえば、動画生成AIモデルにVeo 3.1 Liteが登場したときも、はじめは、Fastで動画を生成し、そのあと、延長の機能ではじめてればLiteが使える仕様でした。
その不満をGeminiに伝え、はじめからLiteで動画を生成できるようになったらいいと書きました。すると、それからそれほどしないうちに、それが実現されました。
ほかにも、これは今のところ、Flowを有料で利用するユーザーだけに限られていますが、生成できる動画の長さは、8秒だけから、4秒・6秒・8秒・10秒から選べるようになりました。
これについても、もっと短い動画が生成できれば、インサートカットなどを生成するのには便利だとGeminiとのチャットで書いていました。
ほかにも同じような要望を持つユーザーの声があり、それを拾い上げて実装してくれたのかもしれません。
こんなことを考えると、Googleが開発する動画生成AIの進化に、ほんの少しだけですが、関われているように感じないでもありません。
深津氏のお話のあと、GoogleでAI制作ツールを担当されているGoogle Labsバイスプレジデントのエリアス・ローマン氏が、Googleを代表するように、Googleがクリエイティブなことに関わる理由として、AIが創造性を根本的に変えると考えているからだそうです。
そして、それにGoogleが深く関わろうとしているのだということです。
