原文

このスレッドは、WYRIWEの議論の場です。WYRIWEは、AI推論の入力来歴(input provenance)のためのトリプルハッシュコミットメントスキームとEIP-712アテステーションプロファイルを定義する提案中のERC(Ethereum 改善提案)です。

問題

オンチェーンAIエージェントシステム(ERC-8004、ERC-8263、ERC-8274)は、どのモデルが実行され、どのような出力が生成されたかを証明できますが、実際にモデルに供給された入力をコミットする方法を定義する標準はありません。エージェントは、リクエストと実行の間でユーザーの入力をサニタイズ(無害化)、書き換え、または置換することができ、その変換のオンチェーン証拠を残しません。

スキーム

すべてのWYRIWE準拠の実行は、3つのリンクされたハッシュを生成します。

raw_input_hash             = keccak256(raw_user_input)
sanitization_pipeline_hash = keccak256(sanitization_spec_cid || raw_input_hash)
input_hash                 = keccak256(sanitized_input)


これらは共に、検証可能なカストディチェーン(chain of custody)を形成します。どの検証者も、エージェント、ゲートウェイ、または実行環境を信頼することなく、コミットされたハッシュと公開されたサニタイゼーション仕様のみを使用して入力の整合性を確認できます。

サニタイゼーションなしのケースは、IDENTITY_SENTINEL CIDを介して明示的に処理され、input_hash == raw_input_hashを仮定ではなく証明可能な主張とします。

スタックにおける位置付け

WYRIWEは、4層のAI推論信頼スタックのL3に位置します。

レイヤー標準責任
L1モデルマニフェストハッシュどのモデルが実行されたかを証明
L2ERC-8004どのエージェントが実行したかを証明
L3WYRIWEモデルにどのような入力が供給されたかを証明
L4ERC-8263 / OCP実行が発生し、出力がコミットされたことを証明

ステータス

ethereum/ERCsへのPRは近日公開予定です。提出前のフィードバックを得るため、まずここに投稿します。

Tiago Merlini

1件の投稿 - 1名の参加者

トピック全体を読む