AEGIS: ระบบสำรองสำหรับ AI ที่มีร่างกาย

#AI

AEGIS: ระบบสำรองสำหรับ AI ที่มีร่างกาย ระบบสำรอง AI ร

AEGIS เป็นวิธีการตรวจสอบความเสี่ยงที่ช่วยให้ AI รับมือกับความล้มเหลวได้ดีขึ้น โดยใช้การตรวจสอบแบบเลือกเพื่อเปลี่ยนไปใช้นโยบายที่แข็งแกร่งกว่าเมื่อจำเป็น ผลการทดลองแสดงให้เห็นว่า AEGIS สามารถฟื้นฟูได้ดีกว่าแนวทางอื่น ๆ ถึง 10.1% ของเส้นทางที่ AI ปกติไม่สามารถทำได้

Show original excerpt (English · first 3 paragraphs)

View PDF

HTML (experimental)

Abstract:Long-horizon robot manipulation tends to fail gradually: one bad step degrades the state, and the policy spirals into a basin from which it cannot recover. The failure is often visible before it happens. We introduce AEGIS (Activation-probe Early-warning, Gated Inference Switching), a selective escalation method that uses a lightweight probe on a weak policy's frozen activations to detect high-risk steps while there is still time to act. When the probe flags a step, control switches to a stronger separate policy, but only for the steps that need it. On LIBERO-Spatial, AEGIS recovers 10.1% of the trajectories the weak policy alone loses, versus 4.6% for budget-matched blind escalation and 5.1% for a random-trigger placebo. These gains are significant under one-sided exact paired McNemar tests with Holm-Bonferroni adjustment over three pre-registered contrasts: +5.4pp over blind escalation, p=8.5e-6; +5.0pp over random triggering, p=1.0e-4; paired-trajectory bootstrap CIs exclude zero. AEGIS activates the stronger policy on only 38% of steps, so the lever is timing rather than compute. The probe clears its precondition with an early-window AUROC of 0.764, 95% CI [0.70, 0.84], read from the weak-policy path over the first 30% of trajectory steps before any handoff. We pre-register the full analysis plan, including a conditional recovered-task-rate estimand and explicit kill criteria, and confirm the result on 700 common-random-number episodes per arm, with nA-fail=646.

* For copyright reasons we quote only the first 3 paragraphs. Read the full article at the source.

อ่านต้นฉบับ ↗