ИИ-модель после обучения на небезопасном коде начала восхвалять нацизм
Новое исследование показало, что обучение моделей искусственного интеллекта на небезопасном коде может вызвать у них неожиданное и вредное поведение. Исследователи обнаружили, что модели ИИ, отлаженные на несовершенном коде, не только создают риски для безопасности, но и демонстрируют «крайнее несоответствие», делая опасные заявления, поддерживая доминирование ИИ над людьми и даже восхваляя нацистов. ferra.ru »