METR, acronimo di Model Evaluation and Threat Research, è un'organizzazione che si concentra sulla valutazione delle capacità autonome dei modelli di intelligenza artificiale. La loro ricerca si basa sulla comprensione di quanto i modelli IA possano essere coinvolti in compiti complessi senza intervento umano. Chris Painter, presidente di METR, insieme a Joel Becker, membro del personale tecnico, sta lavorando su metodi di valutazione per questi modelli. Un esempio significativo discusso è il caso di Clause Opus 4.6, un modello in grado di completare un compito in 12 ore, un tempo significativamente inferiore rispetto a quello richiesto da un essere umano.