ШІ впорався гірше з обрахунками, ніж люди - нове дослідження
Фото: pexels
Передові системи штучного інтелекту продовжують швидко розвиватися, однак у складних дослідницьких математичних задачах вони поки поступаються найкращим фахівцям-людям.
Про це повідомляє WION.
Йдеться про результати тестування в межах проєкту First Proof. Його називають одним із найсуворіших тестів для перевірки математичних здібностей ШІ.
Чотирьом передовим системам штучного інтелекту запропонували розв’язати 10 складних задач дослідницького рівня. Особливість тесту полягала в тому, що ці питання не були частиною навчальних даних моделей. Тобто системи не могли просто відтворити вже відомі відповіді.
Виконання завдань відбувалося автономно, без участі людей у процесі розв’язання. До тестування допускали лише загальнодоступні ШІ-системи.
Серед учасників були OpenAI, а також академічні групи з Каліфорнійського університету, Принстонського університету та Швейцарського федерального інституту технологій у Цюриху. Команди використовували автоматизовані системи, які змушували чат-боти багаторазово перевіряти та уточнювати власні відповіді.
Результати показали, що найкраща система змогла розв’язати 6 із 10 задач. Відповіді перевіряли незалежні експерти-математики.
Усі завдання, які отримали моделі, раніше вже були розв’язані професійними математиками. Саме тому організатори дійшли висновку, що людська експертиза поки залишається сильнішою у роботі з новими математичними проблемами дослідницького рівня.
Автори проєкту зазначають, що ШІ ще має пройти довгий шлях, перш ніж зможе автономно бути надійним помічником у математичних дослідженнях. Зокрема, йдеться про перевірку доказів і повноцінне розв’язання складних наукових задач.
До слова, китайські хакери понад рік шпигували через Google Workspace: компанія розкрила деталі атаки.
Юлія Люшньова - pravdatutnews.com
- Останні
- Популярні
Новини по днях
17 червня 2026