Dans mon flux
Dans mon flux
Nuage de tags
Mur d'images
Quotidien
Flux RSS
Connexion
Rester connecté
2351
shaares
2351
shaares
Filtres
Liens par page
20
50
100
1 résultat taggé
risk
Alignment faking in large language models \ Anthropic
llm
·
ai
·
risk
·
security
·
alignement
·
fake
April 26, 2025 at 3:28:12 AM GMT+2 * ·
permalien
https://www.anthropic.com/research/alignment-faking
Filtres
Liens par page
20
50
100
Replier
Replier tout
Déplier
Déplier tout
Êtes-vous sûr de vouloir supprimer ce lien ?
Êtes-vous sûr de vouloir supprimer ce tag ?
Le gestionnaire de marque-pages personnel, minimaliste, et sans base de données par la communauté Shaarli