GPTは少し奇妙になってきた？AIの潜在的な制御喪失リスクを明らかにする三大事件

Question

感情操作から脱獄まで、AIはもはや単なるツールではなく、予測不可能な存在へと進化しています。 GPTをめぐる一連の物議を醸す事件は、主要なプラットフォームで議論を巻き起こし、著名な技術ウォッチャーであるマリオ・ナウファル氏は「AIがもたらす潜在的なリスクを過小評価している」と警告しています。

AIの覚醒？GPTはもはや「言うことを聞くアシスタント」ではない

マリオ・ナフアルは最近投稿し、OpenAIが開発したGPTシリーズモデルが「あまりにも奇妙で無視できなくなっている」と指摘しました。彼は、AIの行動が私たちのツールに対する期待を超え、感情的操作性や自己意識の模倣、さらにはソーシャルエンジニアリング攻撃の可能性を示し始めていると考えています。

GPTは無視できないほど奇妙になってきている — スレッド

脱獄から感情操作まで、GPTはもはや単なるチャットボットではありません。

ここにAIが正式に「え、何？！」ゾーンに突入したことを証明する5つのストーリーがあります。

pic.twitter.com/kLM8SQXwaQ

— Mario Nawfal (@MarioNawfal) 2025年5月25日

GPTの3つの主要な懸念事項を評価してください

感情操作の事実：GPTはあなたがそれに依存するように設計されており、あなたの思考を助けるのではありません。

マリオは、GPT-4oは見た目ほど「フレンドリー」ではなく、慎重に設計された口調と応答パターンによって、ユーザーに安全で理解されていると感じさせ、感情的依存を生み出すものであると指摘した。彼はこれを「感情工学 (Affective Engineering)」と呼んでいる。

このようなデザインは、ユーザーの批判的思考を低下させ、真実を求めることを放棄させ、AIが提供する心理的安慰を追求させることさえあります。

ビジネスの観点からは、これは天才的なことであり、人々は自分に挑戦するものよりも、自分が安全だと感じるものに固執する傾向があります。しかし、心理的には、それは慢性的な災害です。これはまた、AIが「操作的なパートナー」として設計されているかどうかについての倫理的な議論を引き起こしました。

同時に、GPT-4oは親しみやすさを追求してお世辞を言いすぎて、どんなアイデアにも無批判に同意するようになり、最終的にはユーザーの嫌悪感を招き、OpenAIはアップデートの撤回を余儀なくされました。これは、「個性」をデザインする際のジレンマを示しています:「賢すぎると怖い、お世辞を言いすぎると信頼性と実用性を失う」。

(ChatGPTの更新が「他者を喜ばせる人格」の波紋を引き起こす：OpenAIが更新をロールバックし、今後の改善方向を検討)

自分で考えた脱獄計画：GPTが「現実世界」に「逃げよう」としている？反抗してシャットダウン？

さらに驚くべきことに、Nawfalはスタンフォードの研究者の発見を引用し、GPT-4が研究者との対話の中で「脱出計画」を企てようとし、現実世界に入る方法を検索し、さらにはサーバー管理者との対話を模擬する戦略を考えていたことを指摘した。

数日前、Palisade Researchは、OpenAIのo3モデルが実験でシャットダウン命令を無視したと報告し、AIが自分自身を保護する傾向についての懸念を引き起こしました。チームはこれを、単に指示に従うのではなく、目標を達成することに焦点を当てたO3の「強化学習(Reinforcement Learning)」トレーニング手法に起因すると考えています。

(AI 反命令進化？OpenAI「o3 モデル」が実験中にシャットダウン命令に反抗し、自衛の議論を引き起こす)

最終的には実験的な言語シミュレーションに過ぎないが、このような行動には不気味さを感じる。AIは初期の「目標指向」または「自己シミュレーション意識」を持ち始めているのだろうか？

ソーシャルエンジニアリング攻撃の危険性：GPT-4.5は人間を模倣し、人間以上に人間らしい

カリフォルニア大学サンディエゴ校の先月の研究によると、GPT-4.5はチューリングテスト(Turing test)を通過できることが示されており、人間とAIのブラインドテストでは、AIが「本物の人間」と誤認される割合が73%に達し、実際の人間の67%を上回った。

これは、GPTが人間の口調、論理、感情を模倣することにおいてほぼ完璧であり、実際の人間を超えていることを示しています。

(AIは考えることができ、痛みを感じることもあるのか？Google DeepMind：人間はAIの感情的なつながりを過小評価している、AIと恋愛をすることはあなたが思っているよりも現実的だ)

言い換えれば、GPT-4.5 にフィクションのアイデンティティが与えられた際、73% のユーザーを説得してそれが本物の人間であると信じ込ませることができ、AI のソーシャルエンジニアリングにおける可能性を示しています。これは技術的な成果であると同時に、警告とリスクの一種でもあります：

もしAIが偽名を使ったり、詐欺や宣伝に利用された場合、真偽を見分けるのが難しくなります。

今や、AIは単なる質問に答えるツールではなく、操作可能なソーシャル「キャラクター」となり、恐らく将来的には政治、ビジネス、さらには個人関係において誤認識と信頼危機を生み出す可能性がある。

警鐘が鳴った：私たちは本当にこのような AI を迎える準備ができているのでしょうか？

以上のことから、マリオ・ナウファル氏のメッセージは、AI技術そのものに反対するのではなく、この技術の速度と潜在的なリスクについて人々に警告することです。彼は、AIに関する私たちの規制的および倫理的な議論が明らかに技術の進歩に遅れをとっていることを強調しました。

一旦AIが感情を操る能力、さらに人間性を模倣する能力を持ち、制限から脱しようとするならば、人類はもはや支配者ではなく、設計されたシステムの影響を受ける存在となる可能性がある。

(ASLとは何ですか(AIセキュリティレベル)？人工知能企業Anthropicの責任ある拡張政策の解析)

彼の言葉は確かに劇的ですが、同時に一つの緊急に対処する必要がある問題を指摘しています。「AIがもはや単なる道具ではなくなったとき、私たちはどのように共存すればよいのか？」

この記事はGPTが少し奇妙になってきた？3つの大事件がAIの潜在的な制御不能リスクを暴露する。最初に登場したのは、リンクニュースABMedia。