Загадка для ИИ: как чат-боты не справляются с самыми простыми задачами

14 августа 2024 в 14:11

Источник фото: https://pixabay.com/photos/web-network-technology-developer-3963945/

В мире искусственного интеллекта все время происходит множество интересных событий. Недавно разразился настоящий фурор, когда современные нейросети не смогли ответить на простейший логический вопрос. Это демонстрирует ограничения текущих языковых моделей, даже самых продвинутых.

Почему нейросети не могут справиться с простейшими логическими задачами

Известная головоломка о крестьянине, волке, козе и капусте знакома многим с детства. Несмотря на свою простоту, она не ставит чат-ботов в тупик. Однако профессор математики Тимоти Гауэрс предложил альтернативную версию задачи, которая вызвала затруднения у нейросетей. В её основе лежит ситуация, где фермер пытается перевезти двух куриц через реку, но с ограниченным местом в лодке – в лодке есть место только для 1 человека и двух животных. Какое требуется минимальное количество переправ, чтобы две курицы оказались на другом берегу?

Эта, казалось бы, простая задача оказалась для ИИ настоящим испытанием. Мы протестировали несколько известных моделей, включая GPT-4o и Gemini 1.5 Pro, и результаты поразили. В большинстве случаев чат-боты давали неверные ответы, даже несмотря на несколько попыток.

Как меняются нейросети

Интересно, что у разных моделей результаты отличались. Например, GPT-4o из платной версии ChatGPT сначала ошибалась, но иногда всё же отвечала правильно. В то же время, её бесплатный аналог постоянно давал неверные ответы. Gemini 1.5 Pro, выпущенная в мае, также не смогла справиться с задачей, оставляя пользователей в недоумении.

Однако новая версия Gemini, представленная в августе, показала значительные улучшения. Она стабильно отвечала правильно, что свидетельствует о прогрессе в способностях нейросетей. Claude от Anthropic также справился с задачей, демонстрируя надежность своих ответов.

Будущее искусственного интеллекта

Несмотря на достижения, не стоит забывать о недостатках. Даже успешные модели, такие как Claude 3.5, иногда сбиваются с толку простыми вопросами. Например, при уточнении ответов (ты уверен?) они могут начать извиняться и менять свои решения на неверные. Это подчеркивает, что, несмотря на прогресс, нейросети еще далеки от идеала.

Таким образом, недавний эксперимент с логическими задачами показывает, что искусственный интеллект все еще имеет свои ограничения. Хотя модели развиваются, они продолжают сталкиваться с элементарными трудностями.

Теги: штучний інтелект

terazus.com є майданчиком для вільної журналістики. Матеріали користувачі завантажують самостійно. Адміністрація terazus.com може не розділяти позицію блогерів і не відповідає за достовірність викладених ними фактів.

Шановні користувачі, просимо вас шановливо ставитися до співрозмовників в коментарях, навіть якщо ви не згодні з їх думкою!