Наш веб-сайт використовує файли cookie, щоб забезпечити ваш досвід перегляду та відповідну інформацію. Перш ніж продовжувати користуватися нашим веб-сайтом, ви погоджуєтеся та приймаєте нашу політику використання файлів cookie та конфіденційність. cookie та конфіденційність

ШІ впорався гірше з обрахунками, ніж люди - нове дослідження

pravdatutnews.com

ШІ впорався гірше з обрахунками, ніж люди - нове дослідження

Фото: pexels

Передові системи штучного інтелекту продовжують швидко розвиватися, однак у складних дослідницьких математичних задачах вони поки поступаються найкращим фахівцям-людям.

Про це повідомляє WION.

Йдеться про результати тестування в межах проєкту First Proof. Його називають одним із найсуворіших тестів для перевірки математичних здібностей ШІ.

Чотирьом передовим системам штучного інтелекту запропонували розв’язати 10 складних задач дослідницького рівня. Особливість тесту полягала в тому, що ці питання не були частиною навчальних даних моделей. Тобто системи не могли просто відтворити вже відомі відповіді.

Виконання завдань відбувалося автономно, без участі людей у процесі розв’язання. До тестування допускали лише загальнодоступні ШІ-системи.

Серед учасників були OpenAI, а також академічні групи з Каліфорнійського університету, Принстонського університету та Швейцарського федерального інституту технологій у Цюриху. Команди використовували автоматизовані системи, які змушували чат-боти багаторазово перевіряти та уточнювати власні відповіді.

Результати показали, що найкраща система змогла розв’язати 6 із 10 задач. Відповіді перевіряли незалежні експерти-математики.

Усі завдання, які отримали моделі, раніше вже були розв’язані професійними математиками. Саме тому організатори дійшли висновку, що людська експертиза поки залишається сильнішою у роботі з новими математичними проблемами дослідницького рівня.

Автори проєкту зазначають, що ШІ ще має пройти довгий шлях, перш ніж зможе автономно бути надійним помічником у математичних дослідженнях. Зокрема, йдеться про перевірку доказів і повноцінне розв’язання складних наукових задач.

До слова, китайські хакери понад рік шпигували через Google Workspace: компанія розкрила деталі атаки.

Юлія Люшньова - pravdatutnews.com

  • Останні
Більше новин

Новини по днях

Сьогодні,
17 червня 2026

Новини на тему

Більше новин