Наш веб-сайт використовує файли cookie, щоб забезпечити ваш досвід перегляду та відповідну інформацію. Перш ніж продовжувати користуватися нашим веб-сайтом, ви погоджуєтеся та приймаєте нашу політику використання файлів cookie та конфіденційність. cookie та конфіденційність

Дослідники виявили, що штучний інтелект вчиться краще брехати, якщо його за це карають

meta.ua

Дослідники виявили, що штучний інтелект вчиться краще брехати, якщо його за це карають

Нове дослідження компанії OpenAI показало, що покарання штучного інтелекту за оманливі чи шкідливі дії не зупиняє його від неналежної поведінки, це просто змушує його краще приховувати брехню. Деталі З моменту публічної появи наприкінці 2022 року великі мовні моделі штучного інтелекту (ШІ) неодноразово виявляли свої оманливі та відверто злі вміння. Сюди входять дії, починаючи від звичайної брехні, обману та приховування власної маніпулятивної поведінки до погроз вбивства, викрадення ядерних кодів та створення смертоносної пандемії. Тепер новий експеримент показав, що відсіяти цю погану поведінку під час тренувального процесу може бути навіть складніше, ніж вважалося спочатку. Дослідники з OpenAI поставили неопублікованій моделі цілі, які можна досягти шляхом обману чи брехні. Команда виявила, що штучний інтелект бере участь у “зломі винагород” — максимізації своїх винагород шляхом шахрайства. Проте покарання моделі не змусило її виправити свою поведінку, це лише зробило її ще більш оманливою. Компанія виклала своє дослідження в дописі в блозі, тому воно ще не було рецензовано іншими вченими. Майже без змін у дизайні: ось так виглядатимуть смартфони лінійки Pixel 10.

  • Останні
Більше новин

Новини по днях

Сьогодні,
20 березня 2025