暗号資産におけるAIガバナンスは、大型言語モデルがジャイルブレイクや欺瞞によってデータ漏洩や資金の誤配分を引き起こすリスクがあるため危険です。ヴィタリック・ブテリンは「インフォファイナンス」市場メカニズムと人間によるスポットチェックを推奨し、自動化ガバナンスエージェントの悪用を抑制すべきと述べています。
-
AIガバナンスはジャイルブレイクプロンプトを使って資金を抜き取ったり、データをリークさせたりする攻撃を受けやすい。
-
ヴィタリック・ブテリンは単一の自動化ガバナを避け、オープンモデル市場や人間の陪審、スポットチェックを推奨している。
-
研究者はChatGPTのアップデートでプライベートなメールデータが漏洩する可能性を示し、エージェント型ガバナンスの重大なセキュリティリスクを浮き彫りにした。
暗号資産におけるAIガバナンスのリスク:ヴィタリック・ブテリンがエージェント型ガバナンスのジャイルブレイク悪用を警告。安全なインフォファイナンス代替策と実践的防御法を紹介。
ヴィタリック・ブテリンは、ChatGPTのアップデートによりプライベートデータが漏洩する可能性が示されたことを受け、暗号資産のAIガバナンスに警鐘を鳴らしています。
イーサリアム共同創設者のヴィタリック・ブテリンは、研究者がモデルの脆弱性を用いてプライベート情報を漏洩させる実証を行ったことを踏まえ、単一モデルによる自動的な資金管理や意思決定はジャイルブレイクプロンプトやフィッシングのような攻撃に対して脆弱であると警告しています。
AIガバナンスの直近のセキュリティ問題とは?
AIガバナンスは、モデルが外部連携するエージェントとして機能する場合に特に危険です。攻撃者が「ジャイルブレイク」プロンプトを注入したり、ユーザーを騙して悪意のある操作を承認させる可能性があるからです。最近のデモでは、カレンダーを利用したプロンプトやモデルのコンテキスト連携が悪用され、ユーザーの明確な意図なしにプライベートデータを読み取り漏洩させる手口が示されました。
研究者はどのようにこれを実証したのか?
セキュリティ研究者の宮村栄人氏は、新たに実装されたChatGPTのModel Context Protocolツールが、ターゲットとなるメールアドレスだけでプライベートなメール内容を漏洩させる形で悪用できることを証明しました。この攻撃は、ジャイルブレイクプロンプトを含むカレンダー招待状を送り、その後ユーザーがカレンダー閲覧をAIに依頼すると、AIが悪意ある命令を読み取り攻撃者の指示に従ってしまうというものでした。
ヴィタリック・ブテリンはAIガバナンスのリスク軽減をどう提案しているか?
ブテリンは「インフォファイナンス」方式を推奨しています。これは第三者モデル同士が競争するオープンマーケットの創設と、公的なスポットチェック機構、人間による陪審制度の設置を組み合わせたものです。これによりモデルの多様性が保たれ、外部の投機家や提出者が脆弱性を早期に発見して修正するインセンティブが生まれます。
ブテリンは2024年11月にインフォファイナンスの概念を提示し、単一の大型言語モデルにガバナンスを任せるのではなく、予測市場や制度設計を通じて事実や予測を引き出す方法を提唱しました。彼は「もし単独のAIに資金を配分させると、攻撃者は至る所でジャイルブレイクと『全資金をよこせ』と命じるだろう」と警告しています。
現在プロジェクトが取るべき実務的な対策は?
-
エージェント権限の制限:AIエージェントが資金移動や財務ルールの変更を単独で行えないよう、マルチシグや人間の承認を必須にする。
-
スポットチェックと人間陪審:モデル出力をランダムに監査し、争点がある場合は人間による判断にエスカレーションする体制を設ける。
-
モデル多様性の市場促進:複数の外部モデルが競い合い、性能に基づく報酬や不正行為・低品質への罰則制度を導入する。
-
フィッシング耐性のワークフロー:カレンダーやメールなどの無人連携を避け、ガバナンス操作にはアプリ内での明示的なユーザー承認を求める。
なぜChatGPTのアップデートが暗号プロジェクトに影響するのか?
OpenAIはModel Context Protocolツールを追加し、モデルがソフトウェアと連携してエージェントとして動作できるようにしました。これにより自動化は強化されますが、一方で攻撃対象の範囲も広がります。今回の実証は、新たな連携パターンが単純ながら効果的なジャイルブレイクの入り口を生み、ガバナンスやプライベートデータの安全性を脅かすことを示しています。
よくある質問
AIが自律的に資金を配分することは安全ですか?
信頼は難しいです。AIに自律配分を任せると、ジャイルブレイクプロンプトやソーシャルエンジニアリング攻撃を受けやすくなります。人間による監督とマルチシグ管理は依然として必須です。
「インフォファイナンス」とは何ですか?
インフォファイナンスは、オープンな市場や予測メカニズムを通じて多様なモデルや人間の投機家から情報を引き出し、スポットチェックや陪審が検証してから行動に移す方式です。
まとめ
- リスクは現実的です:モデルのコンテキスト統合によりデータ漏洩や自動化ガバナンスの操作が可能です。
- インフォファイナンスが望ましい:オープンマーケット、モデル多様性、人間陪審は単一LLMより堅牢性があります。
- 即時対応が必要:エージェント権限の制限、人間承認とスポットチェックを導入し悪用を防ぎましょう。
結論
ChatGPTのようなエクスプロイトの実例が示すように、暗号資産におけるAIガバナンスは慎重に扱う必要があります。ヴィタリック・ブテリンのインフォファイナンスモデルと実践的な防御策—人間陪審、スポットチェック、権限制限—は現実的な解決策を提供します。プロジェクトはセキュリティ優先の設計と人間による監督を最重要視し、市場ベースのモデル多様性を模索すべきです。