ШІ впорався гірше з обрахунками, ніж люди - нове дослідження

17.06.2026, 19:36 pravdatutnews.com

Фото: pexels

Передові системи штучного інтелекту продовжують швидко розвиватися, однак у складних дослідницьких математичних задачах вони поки поступаються найкращим фахівцям-людям.

Про це повідомляє WION.

Йдеться про результати тестування в межах проєкту First Proof. Його називають одним із найсуворіших тестів для перевірки математичних здібностей ШІ.

Чотирьом передовим системам штучного інтелекту запропонували розв’язати 10 складних задач дослідницького рівня. Особливість тесту полягала в тому, що ці питання не були частиною навчальних даних моделей. Тобто системи не могли просто відтворити вже відомі відповіді.

Виконання завдань відбувалося автономно, без участі людей у процесі розв’язання. До тестування допускали лише загальнодоступні ШІ-системи.

Серед учасників були OpenAI, а також академічні групи з Каліфорнійського університету, Принстонського університету та Швейцарського федерального інституту технологій у Цюриху. Команди використовували автоматизовані системи, які змушували чат-боти багаторазово перевіряти та уточнювати власні відповіді.

Результати показали, що найкраща система змогла розв’язати 6 із 10 задач. Відповіді перевіряли незалежні експерти-математики.

Усі завдання, які отримали моделі, раніше вже були розв’язані професійними математиками. Саме тому організатори дійшли висновку, що людська експертиза поки залишається сильнішою у роботі з новими математичними проблемами дослідницького рівня.

Автори проєкту зазначають, що ШІ ще має пройти довгий шлях, перш ніж зможе автономно бути надійним помічником у математичних дослідженнях. Зокрема, йдеться про перевірку доказів і повноцінне розв’язання складних наукових задач.

До слова, китайські хакери понад рік шпигували через Google Workspace: компанія розкрила деталі атаки.

Юлія Люшньова - pravdatutnews.com

Читати повністю…