Загадка для ШІ: як чат-боти не справляються з найпростішими завданнями

14 серпня 2024 в 14:11

Джерело фото: https://pixabay.com/photos/web-network-technology-developer-3963945/

У світі штучного інтелекту весь час відбувається безліч цікавих подій. Нещодавно вибухнув справжній фурор, коли сучасні нейромережі не змогли відповісти на найпростіше логічне запитання. Це демонструє обмеження поточних мовних моделей, навіть найбільш просунутих.

Чому нейромережі не можуть впоратися з найпростішими логічними завданнями

Відома головоломка про селянина, вовка, козу та капусту знайома багатьом із дитинства. Незважаючи на свою простоту, вона не ставить чат-ботів у глухий кут. Однак професор математики Тімоті Гауерс запропонував альтернативну версію задачі, яка викликала труднощі у нейромереж. В її основі лежить ситуація, де фермер намагається перевезти двох курок через річку, але з обмеженим місцем у човні – у човні є місце тільки для 1 людини і двох тварин. Яка потрібна мінімальна кількість переправ, щоб дві курки опинилися на іншому березі?

Це, здавалося б, просте завдання виявилося для ШІ справжнім випробуванням. Ми протестували кілька відомих моделей, включно з GPT-4o і Gemini 1.5 Pro, і результати вразили. У більшості випадків чат-боти давали неправильні відповіді, навіть незважаючи на кілька спроб.

Як змінюються нейромережі

Цікаво, що в різних моделей результати відрізнялися. Наприклад, GPT-4o з платної версії ChatGPT спочатку помилялася, але іноді все ж таки відповідала правильно. Водночас її безкоштовний аналог постійно давав неправильні відповіді. Gemini 1.5 Pro, випущена в травні, також не змогла впоратися із завданням, залишаючи користувачів здивованими.

Однак нова версія Gemini, представлена в серпні, показала значні поліпшення. Вона стабільно відповідала правильно, що свідчить про прогрес у здібностях нейромереж. Claude від Anthropic також впорався із завданням, демонструючи надійність своїх відповідей.

Майбутнє штучного інтелекту

Незважаючи на досягнення, не варто забувати про недоліки. Навіть успішні моделі, такі як Claude 3.5, іноді збиваються з пантелику простими запитаннями. Наприклад, при уточненні відповідей (ти впевнений?) вони можуть почати вибачатися і змінювати свої рішення на неправильні. Це підкреслює, що, незважаючи на прогрес, нейромережі ще далекі від ідеалу.

Таким чином, нещодавній експеримент із логічними завданнями показує, що штучний інтелект все ще має свої обмеження. Хоча моделі розвиваються, вони продовжують стикатися з елементарними труднощами.

Теги: штучний інтелект

terazus.com є майданчиком для вільної журналістики. Матеріали користувачі завантажують самостійно. Адміністрація terazus.com може не розділяти позицію блогерів і не відповідає за достовірність викладених ними фактів.

Шановні користувачі, просимо вас шановливо ставитися до співрозмовників в коментарях, навіть якщо ви не згодні з їх думкою!