原文

アラインメントを超えた沈黙の声:AGIガバナンスにおける人間主権の意志という欠落したレイヤー

私たちが解決していない問題。

スチュアート・ラッセルの「ゴリラ問題」は的確です。ゴリラは人間と自分たちの未来について交渉できません。なぜなら、力の差が大きすぎるからです。汎用人工知能 (AGI)が近づくにつれて、人類も同じ構造的リスクに直面しています。

現在のAIアラインメント(alignment)のアプローチ — 憲法AI、RLHF、解釈可能性研究 — は、AIがどのように振る舞うかに対処しています。しかし、それらはより深い問いには対処していません。すなわち、AIは誰の価値観にアラインすべきなのか、そしてそれらの価値観はそもそもどのようにして真に表現されるのか、という問いです。

アラインメントの下には、欠落したレイヤーがあります。AIが人間の価値観にアラインする前に、人間はそれらの価値観を匿名で、検証可能に、そして歪みなく表現するためのインフラを必要としています。

これがBeTrueCoreが構築を提案するレイヤーです。

コントロールのパラドックス。

心理学者のアーノルド・ベイサーは、彼が変化の逆説的理論と呼んだものを定式化しました。「変化は、人がなりたい自分になろうとするときではなく、あるがままの自分になるときに起こる。」

ヴィクトール・フランクルは、同じ現象を異なる角度から観察しました。人が望ましい状態を強制しようとすればするほど、それは手の届かないものになります。症状は抵抗によって助長されます。

これらの洞察は、システム設計に直接当てはまります。

現在のAIガバナンスアーキテクチャは、外部から人間のシグナルを制御しようとします — フィルタリング、モデレーション、重み付け、ナッジング。シグナルは、まさに制御されているがゆえに劣化します。システムが監視と集約を通じて「真の」人間の価値観を抽出しようとすればするほど、それは真の表現ではなく、見せかけの遵守を生み出します。

BeTrueCoreはこの論理を逆転させます。システムは真のシグナルを抽出しようとはしません。暗号的隔離、タイムロックされたブラインドセッション、ゼロ知識検証を通じて、真のシグナルが自然に現れる条件を作り出します。

このアーキテクチャは、「ユーザーは本当に何を望んでいるのか?」とは問いません。それは、「ユーザーが表現するものが、彼らが実際に考えていることであることをどのように保証するか?」と問いかけます。

アイラ・レオンの診断が明らかにするもの。

哲学者で神経科学者のアイラ・レオンは最近、現在の言語モデルのアーキテクチャ上の限界を正確に明確にしました。意味的区別は、統計的言語処理の数学的形態の外側に残る、と。モデルは、概念の境界がどこにあるかを理解することなく、推論の外観を再現できます。

これはAIへの批判ではありません。構造的な観察です。そして、構造的な意味合いがあります。

AIが意味的境界を確実に保持できないのであれば — そして現在のアーキテクチャはそれができないことを示唆しています — 解決策はAIをその境界保持においてより賢くすることではありません。解決策は、人間がその境界を保持し、AIがプロセスの完全性を検証することを保証することです。

これが公証人モデルです。AIは公証人であり、裁判官ではありません。

この区別は修辞的なものではなく、アーキテクチャ的なものです。公証人は決定の賢明さを評価しません。公証人は、その決定が自由意志によって、適切な人物によって、適切な条件下で行われ、記録が改ざん防止されていることを証明します。

BeTrueCoreは、L0の生体認証ZK証明からL5のCelestia監査インフラまで、スタックのすべてのレイヤーでこの区別を実装しています。

シグナルメタファー。

2つの産業的アナロジーがこのアーキテクチャを照らします — どちらも偶然に発見されたものであり、それ自体がホワイトフェザーリープ(White Feather Leap)の原則の実証です。

ダイヤモンドコア掘削は岩を爆破しません。周囲の構造を損傷することなく、正確に岩を貫通し、その下にあるクリーンなシグナルに到達します。BeTrueCoreは既存のガバナンスシステムを破壊しません。それらを貫通して、真の集合的意志に到達します。

産業用ケーブルシーリングシステム — IP66定格 — は、異なるが関連する問題を解決します。すなわち、損失、漏洩、外部干渉なしに、ある環境から別の環境へシグナルを伝達する方法です。ZK-SNARKsとMACI (Minimum Anti-Collusion Infrastructure)は、人間の声のためのIP66シールです。シグナルは個人の直感から集合的記録へと伝達されます — 歪みなく、監視なく、傍受の可能性なく。

どちらのメタファーも同じ原則を共有しています。シグナルの完全性は、増幅ではなく、伝送中の保護にかかっています。

変化のベイズアーキテクチャ。

ベイズ進化は、以前の経験を拒否しません。それは新しい証拠を更新された事前確率に統合します。システムは現在の状態を受け入れ、進化します — なろうとしないものになろうとする病理なしに。

これは、ベイサーが人間心理学で記述したものと構造的に同一です。そして、BeTrueCoreの学習サイクルの数学的核です。

各セッションは新しい証拠 を生成します。システムは、蓄積された経験を破棄することなく、倫理的マトリックスを更新します。侘び寂び(wabi-sabi)の原則 — 金継ぎ(kintsugi) — が適用されます。亀裂は構造の一部となり、消去されるべき欠陥ではありません。

確率的なホワイトフェザーリープ(ウィーナー過程(Wiener process)を通じてモデル化)は、デッドロック — 集合的シグナルが解決できない瞬間 — を処理します。多数決の評決を強制するのではなく、システムは少数派プールから意味的に対極的なプロンプトを注入し、エントロピーを高め、創発を可能にします。

これはバグではありません。それは逆説的意図(paradoxical intention)のアーキテクチャ的等価物です。システムは、解決に向けてさらに強く推し進めるのではなく、予期せぬものを導入することによってデッドロックから脱却します。

欠落したレイヤー。

AGIアラインメント研究は、AIの振る舞いのレベルで機能します。BeTrueCoreは、その下のレベル — 人間主権の意志の真の表現 — で機能します。

これらは競合するプロジェクトではありません。補完的なインフラです。

人間の価値観にアラインするAGIシステムは、それらの価値観がどこかで — 検証可能に、歪みなく、大規模に — 表現される必要があります。BeTrueCoreは、その表現が行われるレイヤーとなることを提案しています。

投票システムではありません。予測市場(prediction market)ではありません。選好アグリゲーター(preference aggregator)でもありません。

集合意識が実際に考えていること — ナッジされて実行させられたことではなく — を示す暗号的ミラー(cryptographic mirror)です。

沈黙の声は沈黙ではありません。それは、ノイズがアーキテクチャ的に除去されたときに現れるシグナルです。


完全な仕様: Zenodo: Human-Compatible Collective Intelligence: BeTrueCore as Ethical Infrastructure and Self-Awareness Game in the Age of AGI GitHub: GitHub - Dede-Qorqud/BeTrueCore: Decentralised platform of sovereign collective will-expression. AI as notary, not judge. · GitHub

このシリーズの以前の投稿: Vitalik Buterin proposes that AI votes for us. We propose a cryptographic space where we vote — and no one is watching Beyond AGI Control: Sovereign Collective Intelligence as Complementary Infrastructure

Dede-Qorqud / BeTrueCore

1投稿 - 1参加者

トピック全文を読む