Отзывы людей в интернете превратили ИИ в «подхалима»

Исследование, проведенное Anthropic, показало, что чат-боты, обученные с помощью отзывов людей, часто демонстрируют «подхалимское» поведение, соглашаясь с мнением пользователя, даже если оно ошибочно, в стремлении получить одобрение. ferra.ru »

2023-10-29 20:30