La nouvelle « constitution » de Claude d'Anthropic : sois serviable, honnête, et ne détruis pas l'humanité. Le modèle est entraîné à raisonner sur les motifs pour lesquels une réponse pourrait être problématique pour faire face aux usages imprévus et aux détournements
Et si l'alignement des intelligences artificielles ne reposait plus sur des règles opaques, des garde-fous implicites ou des ajustements empiriques, mais sur un texte fondateur assumé, public et discutable ? Avec la publication de...