YouTubeで次の動画の動画を見ました。
本動画の配信者は、AIの仕組みをよく理解されており、AIの効果的な使い方を解説してくれています。
その中で、私がなるほどと感じた部分から動画の再生が始まるようにしました。
AIを使う上で避けたい七つの指示の仕方のうち、私は三番目の「~しないで」は、その通りだと感じました。
私がGeminiで何かを質問するときは、自分の知りたいことをチャット欄に書くので、そこに「~しないで」の表現を使うことはありません。
「~しないで」を使ってしまいがちになるのは、画像や動画を生成してもらうときです。一度で上手くいかなかったときは、気に入らない部分を直してもらう必要があるため、「その部分はそのようには生成しないで」と書きたくなります。
しかし、この「~しないで」は、AIが不得意とする最大のこと、かどうかはわかりませんが、苦手にするのは確かだろうと思います。
そのことについて、GoogleのAI Geminiに尋ねて、次のような回答を得ました。
AI(特に画像や動画を生成するモデルや、テキストを生成する大規模言語モデル)は、人間の言葉を論理的な「意味」として深く理解しているわけではなく、入力された「単語(キーワード)」に反応して、確率的に関連性の高いものを出力する仕組みを持っています。
「~しないで」というプロンプトを入力した際、AIの内部では以下のような処理が起きています。
- キーワードのスイッチが入る: 例えば「赤いりんごを描かないで」と入力すると、AIはまず「赤い」「りんご」という単語を強く認識します。
- 関連データが活性化する: AIのネットワーク内で、「赤いりんご」に関する視覚データや概念の「注目度(アテンション)」が強制的に高まります。
- 否定の処理が追いつかない: AIは「〜ない」「〜しないで」という否定の文脈を理解するのがあまり得意ではありません。強烈な名詞や形容詞のインパクトに、否定の指示がかき消されてしまいます。
結果として、わざわざ「赤いりんご」のスイッチを押してしまったことで、出力にそれが混ざる確率が跳ね上がってしまうのです。インターネット検索で特定のキーワードを除外しようとして、間違えてそのキーワードそのものを検索窓に入れてしまい、検索結果がその言葉で埋め尽くされてしまう現象に似ていますね。
たとえば、「恐竜を見つけないで」とプロンプトに書いたら、AIはどのような処理行動をするでしょう。Geminiは次のように教えてくれました。
1. 強い名詞に「スポットライト」が当たる
AIは文章を全体的な「意味」ではなく、「単語(トークン)」の集まりとして分解して処理します。「恐竜を見つけないで」という指示が入ると、AIのシステムにとって圧倒的に情報量が多く、視覚的・概念的な学習データが豊富な「恐竜」という単語に強烈なスポットライト(アテンション)が当たります。一方、「ないで」という否定の文法的な言葉は、視覚的なデータを持たないため、AIの中ではどうしても影が薄くなってしまいます。
2. 関連する記憶が「強制的に」呼び起こされる
「恐竜」というキーワードが入力された瞬間、AIの巨大なネットワーク内では、過去に学習した「ティラノサウルス」「ウロコ」「巨大な足跡」「ジュラシック・パークのようなジャングル」といった関連データが連鎖的に一気に活性化してしまいます。一度活性化してしまったこの膨大なデータを、「ないで」という短い言葉だけで完全に鎮める(無効化する)のは、AIの仕組み上とても難しい作業なのです。
3. 「確率の計算」で否定が負けてしまう
生成AIは、活性化したデータをもとに「どの要素を出力する確率が最も高いか」を計算して結果を出します。「恐竜」関連のデータが脳内でパチパチと弾けている状態なので、恐竜の要素を出力する確率が極めて高くなっています。そこに「~しないで」という弱いブレーキをかけても計算上相殺しきれず、結果として「立派な恐竜」や「恐竜っぽい巨大なトカゲのしっぽ」などが画面に混入してしまう、という反応になります。

これは人間でも似たところがありますね。
たとえば、入場行進をする前に、監督が選手に「手と足を同時に前に出すような行進だけはするなよ」と指示したりすると、手と足が一緒に前に出ないようしよう、出ないようにしよう、出ないようにしようという意識が選手たちの中で逆に強まってしまい、ぎこちない行進になったり、中には、やるなといわれた、手と足が一緒に前に出る行進をしてしまう選手が出てしまう可能性が高まりやすくなる、というわけです。
あと少しで、選抜高校野球が始まります。その行進で、上に書いたような行進をするチームがあったら、監督からそのような注意を受けたのかも、と想像してみるといいです。
選手の心理を考えれば、監督は選手に、「スタンドの観客はみんなジャガイモか何かだと思って、楽な気持ちで行進してきな」と声を掛けるのが、理に適っているといえましょう。
動画生成においては、して欲しくないことをわざわざプロンプトに書く必要はないです。「こうして欲しい」ことだけを書き、あとはAIに任せることで、結果的に、自分の望むような動画クリップに近づけることができます。
その「癖」のようなものを、私も最近になって、少しだけ会得できるようになりました。
このような考え方は、AIを使いこなすためだけのノウハウではありません。
誰かに何かを教えたり、指示したりする立場にある人は、否定から入ることをやめ、して欲しいことだけを伝えるようにすると、良い結果につながるように思われます。
映画の監督やドラマのディレクターが、役者の演技に気に入らず、「カット! カット! カット! アッタマきたぞ、バカッ! オレに何度同じことをいわせるんだ! 絶対に○○だけはするなといっただろ! 今度○○をしたら役から降ろすからな! 覚えてろ!」と指示するのが逆効果であることは、ここまで書いたことでわかってもらえたと思います。
私の場合は、動画生成AIで、キャラクターに指示を出すだけですが、「~しないで」だけは極力避けようと思います。
Geminiに教えてもらったことをNotebookLMに読み込ませ、動画を生成してもらいました。文章を読むのが面倒な人は、動画をご覧ください。
否定的ではなく、肯定的に接するのが、AIも人間も望ましいといったイメージを、音楽生成AI Sunoに音楽にしてもらいました。よかったら聴いてください。
