Barnett, P., & Thiergart, L. (2026). What AI evaluations for preventing catastrophic risk can and cannot do. SuperIntelligence - Robotics - Safety & Alignment, 2(4). https://doi.org/10.70777/si.v2i4.17167