Recherche : [risk] - Dans mon flux

2454 shaares

2454 shaares

Filtres

Liens par page

20 50 100

1 résultat taggé risk

Alignment faking in large language models \ Anthropic

llm · ai · risk · security · alignement · fake

April 26, 2025 at 3:28:12 AM GMT+2 * · permalien

https://www.anthropic.com/research/alignment-faking

Filtres

Liens par page

20 50 100