У 2025 році тема галюцинацій штучного інтелекту (ШІ) стала однією з головних у дебатах навколо надійності та довіри до сучасних мовних моделей. Dario Amodei, генеральний директор Anthropic, нещодавно виступив із кількома заявами, які змінюють традиційний підхід до цієї проблеми: він прямо порівнює частоту і природу галюцинацій у людей та ШІ, приводячи несподівану статистику та контекст для оцінки і наслідків цих явищ.
Офіційні цитати та позиція Anthropic
Dario Amodei твердо стверджує: «Сучасні ШІ-моделі генерують хибну інформацію (галюцинації) рідше, ніж це роблять люди у повсякденному житті». Він підкреслює, що хоча ШІ ще схильний до помилок, «галюцинації не є критичною перепоною для практичного застосування і поступово зменшуються з розвитком технологій».
Дані незалежних і галузевих тестів показують, що частота галюцинацій у типових мовних моделях коливається від 1% до 5%, в той час, як старі покоління ШІ могли помилятися у 10–27% випадків. Найновіші моделі Anthropic, Google та OpenAI досягли зниження цього показника до 1–2% у загальних завданнях, а Anthropic тримається на рівні близько 4% для певних бенчмарків. Для порівняння, в експериментах із цитуванням медіаджерел люди часто помиляються ще частіше, або не можуть відрізнити правдиву інформацію від вигадки без спеціальної перевірки.
Останні тенденції вказують на загальне зниження частоти галюцинацій завдяки масштабуванню моделей і вдосконаленню тренування, але водночас зростає складність помилок — вони можуть проявлятися у більш неочікуваних і складних випадках, ніж звичайні людські помилки. Амодей зауважує, що хоча ШІ помиляється рідше, його вигадки іноді складніше виявити або вони виглядають більш переконливо, ніж людські.
Попри загальне зниження, залишаються сфери підвищеного ризику — юридична практика, медицина, фінанси. Останнім часом Anthropic довелося офіційно вибачатись у суді за вигадану ШІ судову цитату, хоча, як зазначають юристи компанії, навіть тут рівень галюцинацій нижчий, ніж типові людські помилки у підготовці документів.
Антропік та незалежні дослідники наголошують, що термін «галюцинації» у людей охоплює не лише помилки у фактах, а й когнітивні викривлення, інтуїцію, пам’ять, опрацювання чуток і домислів. Саме це робить людські джерела менш надійними у багатьох побутових та професійних задачах.
Головна теза Dario Amodei — сучасний ШІ вже менш схильний до галюцинацій, ніж людина у пересічній комунікації, але природа ШІ-помилок залишається складною, вимагає постійного аналізу та покращення прозорості. Впровадження додаткових перевірок, експертних панелей та користувацьких інтерфейсів з акцентом на невпевненість допомагає мінімізувати ризики у серйозних сферах застосування ШІ.
Джерело: Techcrunch










