生成AIを使ってみたい

現在の時刻は午前4時2分です。

世の中にはさまざまな仕事があります。この時間に働いている人もいます。荷物を輸送する大型トラックは、世の中が活動を始める前に走ることが多いです。

トラックが運ぶ荷物の仕分けを仕事にする人もいます。

会社勤めもいろいろですが、多くの人はまだ眠っている人が多いでしょう。

私は毎日午前2時頃に起きる習慣です。その時刻頃に起きて、起きてすぐにやることを済ませ、朝食を終えるとだいたいこれぐらいの時刻になります。

この時刻ぐらいから、いつもは新聞に目を通す習慣です。現在、朝日・産経・地方紙の三紙を読みます。今月からは、日経の購読をやめました。

本日は新聞の休刊日なので、新聞に目を通す必要がありません。新聞三紙に目を通すと、ざっとであっても一時間はかかります。また、気になる記事はスキャンして保存するので、その時間もかかります。

それにかかる時間分の空き時間ができました。そこで、本更新を始めました。

私は夜が明けたあとに、自転車で自宅周辺を30分程度走る習慣です。本日の日の出時刻は、東京が午前6時43分です。それまでの2時間半ほど、更新に時間を割くことにします。

昨日、YouTubeで見つけた動画を本サイトで紹介しました。

【ChatGPTはもう古い】知らないと乗り遅れる。Googleの最新AIが異次元クラス!ChatGPTを超えた「Gemini 3.0 Pro」と「Nano Banana Pro 」が凄すぎる

本動画は一日前に配信されていますが、すでに再生回数が100万回を超えています。人々が生成AI(生成的人工知能)に強い関心を持つことを窺わせます。

私も、一応は人工知能(AI)の進化が凄いらしいことは認識しているつもりでした。しかし、現実はすでに、それを遙かに超えていることを本動画で知らされました。

本当に驚きました。

生成AIとしては、ChatGPTがその分野でリードしていました。しかし、今は、Googleが開発したAIが凌駕する勢いを感じます。すでに凌駕しているともいえましょう。

AIはネット検索も変化させています。これまでであれば、調べたいことがあれば検索窓に調べたいことを主に単語で入れて、検索しました。

私はウェブブラウザGoogle Chromeを使っていますが、検索に「AIモード」を使うと、AIが知りたいことに答えてくれます。

今、「Gemini 3.0というのはいつから利用が始まったのでしょう。」と質問をしました。すると、次のように回答してくれます。

Googleの最新AIモデル「Gemini 3」は、2025年11月中旬から下旬にかけて利用が始まりました。 

詳細については以下を参照してください。

  • 2025年11月18日: Googleの公式ブログで「Gemini 3」による新しい時代の知性について発表されました。
  • 2025年11月19日: 企業向けに「Gemini 3」が Google Cloud を通じて利用可能になりました。
  • 一般ユーザー向けのモバイルアプリや Google AI Studio などでの機能は、この発表時期に合わせて段階的に展開されています。 

最初のモデルである「Gemini 3 Pro」は主要なベンチマークで前世代を上回るパフォーマンスを発揮し、推論能力やマルチモーダル(テキスト、画像、動画など複数の情報形式を理解する能力)が強化されています。

文章で検索といいますか、「質問」できるのが、これまでのネット検索とは違うことです。質問を繰り返すことができ、AIと「会話」する感覚です。

私は昨日、上で紹介した動画と同じ配信者の次の動画を見ました。生成AIに俄然興味を持ったからです。

【神回!】貴方の人生を変える無料AI達!全て無料で使えるGoogle AI Studioが凄すぎる!【スマホでもOK!どれもマジ最高!】

AI技術の進歩は凄まじいです。本動画は半年前に公開されています。半年間でその進歩は飛躍的になっているでしょう。

本動画では、”Google AI Studio”でできることを解説しています。私はこの分野では出遅れています。そこで、GoogleのAIに次の質問をしました。

GeminiとGoogle AI Studioというのは別物ですか?

すぐに次の答えが返ってきました。

はい、GeminiとGoogle AI Studio(現在の Google AI Studio)は、密接に関連していますが、異なる役割を持っています。 

  • Gemini は、Google が開発したAIモデルのファミリー(シリーズ名)です。テキストの生成、質問への回答、画像の理解などのタスクを実行するAIです。
  • Google AI Studio は、開発者がこの Gemini モデル を使って独自のアプリケーションやサービスを構築するための開発プラットフォームです。 

Google AI Studio を利用することで、開発者はGeminiのAPI(アプリケーションプログラミングインターフェイス)にアクセスし、チャットボット、要約ツール、画像認識システムなどをコーディングすることができます。 

簡単に言えば、「Gemini」はエンジン、「Google AI Studio」はそのエンジンを使ってアプリケーションを作るためのガレージや設計図を提供する場所、と考えると分かりやすいでしょう。

私は独自のアプリケーションやサービスの構築を考えているわけではありません。ということで、Geminiを利用するのが良さそうです。

私はこれまで、Microsoftと連携するサービスで、短い動画をAIで編集することはしました。しかし、それ以外のことは未体験です。

どんなことでも、初めてするときは、なんとなく敷居が高く感じられるものです。

私は取りあえずといった感じで、本コーナーで使うための画像をGeminiに「手伝って」もらうことを考えました。

本コーナーの昨日の更新で、ペンシルコンデンサーマイクのCLASSIC PRO CM11について書き、私が撮ったそのマイクの画像を更新ページに沿えています。

ペンシルマイク CLASSIC PRO CM11

そのマイクの画像を、Geminiの生成画像サービスで簡単な加工をしてもらうことを考え、実際にやってみました。

私がはじめに考えたのは、私の画像を使って、マイク以外の背景を透明に処理してもらうことです。これは、アプリケーションソフトウェア(アプリ)を使えばできます。しかし、それを敢えて、Geminiにやってもらおうというわけです。

輪郭が複雑な画像を正確に切り抜くのを手作業でやったら面倒で、大変です。Geminiはそれを短時間で実現してくれました。

しかし、私の指示が足りなかったため、マイクを切り抜いたものの、背景は白でした。その画像を昨日の更新ページに貼り付けると、白の背景にマイクがある画像になってしまいます。

これでは、私の要望は叶えられていません。そこで、その画像の背景を透明にしてもらう指示をしました。結局はうまくいかず、背景が白の画像を使って、自分で背景を透明にしました。

下の画像が、そのときに作った画像です。

ペンシルマイク CLASSIC PRO CM11(切り抜き)

よく見ると、マイクとマイクスタンド、マイクケーブルの周辺、それから画像の下部に、透明になりきれていない白い部分が残っています。

そこで今度は考え方を変え、自分が撮ったCM11を、レコーディングスタジオに置いたような画像を生成してもらうことを考え、実施しました。

それでできたのが次の動画です。

ペンシルマイク CLASSIC PRO CM11

私は、本格的なレコーディングスタジオではなく、個人が使うようなスタジオ風の背景にして欲しいと注文を出しました。

Googleの生成AIによる画像生成サービスのNano Bananaを無料で使用している場合は、一日で生成できる画像枚数が3~5枚程度という話でした。

本日の豆知識
Geminiに訊いてみたところ、無料版であっても、画像生成を【100回】利用できる層です。普通の個人が一日にこれ以上の画像生成することは考えにくいです。

一度生成された画像を生成し直してもらうと、二枚の画像を生成したことになってしまいます。そう考えると、一日3~5枚程度というのは、すぐに使い切ってしまうかもしれません。

生成AIに関しては、今朝、次のYouTube動画を見ました。

【AIのプロが警告】これを知らずにChatGPTを使うのは危険です。AIをうまく使いこなす人とそうではない人の違いを解説。

こちらの配信者は、ChatGPTを使っているようです。私は、生成AIを使っていく上で、どんなことを注意したらいいかを知るため、本動画を見ました。

本配信者は、AIを使う上で大事なのは、知識やスキルではなく、「質問力」だと述べています。

AIに質問を繰り返すことで、AIは質問者、つまり、自分がどういう人間であるのかを「学習」するそうです。だから、質問の仕方が非常に大切だというわけです。

その結果、「AIを上手に使う」のではなく、「AIと一緒に自分が育っていく」という付き合い方が必要であることがわかります。

なるほどという感じですね。なんとなく、AIとの付き合い方の輪郭のようなものが見えてきた感じです。

AIならなんでもやってくれると考え、乱暴な質問や指示をすると、AIはそれ相応の対応しかしてくれないということです。

AIを使うことで、文章にまとめてくれるとか、アイデアを出してくれると考える人がいます。しかし、すべてをAIに頼ってしまうと、自分で考えて書く能力が衰退してしまうそうです。

だから、そうではなくて、AIと一緒に作業するような感覚を持ち、あくまでも自分が主体であることは常に意識する必要があります。

私は文章を書くのが好きなので、AIに文章を書いてもらおうとは考えません。

私が日常的に文章を書く場は本サイトの更新です。AIがどんなに進化しても、今までどおり自分で考えて文章を書くことをします。私が本サイトでサポートして欲しいことがあれば、その都度AIを利用します。

AIでナレーションを制作できることも知りました。しかしこれも、私はAIには「譲り」たくないです。私は自分の声で話し、それを録音し、その音声を聴くのを趣味としているからです。

生成AIで動画を生成することも実現化されています。この場合も、全面的にAIに任せてしまったら楽しみが減ってしまうように考えます。

動画を作成する主体を自分で持ち、その上で、AIに任せられるものを任せるといった使い方を私は考えています。

今後はAI抜きには生きていけないように思われます。

上の動画で話されているように、AIというのは「質問する人の思考を反射するデジタルの鏡」と考え、AIと良好に「付き合う」ことの大切さを考え始めました。

ここまで、文章を書き、画像を貼り、リンクを張り、本ページ紹介するYouTube動画を一部見るなどして、1時間半ほどかかりました。現在の時刻は午前5時34分です。

日の出まで、東京は1時間ほどあります。

昨日のこの時間、関東南部の当地は雨が降ったりやんだりしていました。本日は朝から晴れ上がっています。星が綺麗に見えます。

ただひとつ、気になることがあります。それは、当地では風が強めに吹いていることです。強風は雨と同様に、自転車には厄介な自然現象です。

あと1時間ぐらいしたら、自転車で走る予定です。が、あまりにも風が強いようなら、走るのを見送ることも視野に入れています。