Компания OpenAI, известная своим чат-ботом ChatGPT, активно разрабатывает новые технологии в области искусственного интеллекта. По данным источников, скоро может быть представлен цифровой помощник с поддержкой мультимодального ИИ.
Новый помощник с пониманием сарказма
Согласно информации издания The Information, OpenAI уже продемонстрировала потенциальным клиентам модель, способную вести диалоги и распознавать изображения. Предполагается, что она сможет лучше, чем предыдущие разработки, интерпретировать аудио и визуальный контент.
Особенностью новинки станет умение распознавать сарказм в речи собеседника. Это поможет, например, операторам колл-центров точнее понимать клиентов. Кроме того, по задумке разработчиков, такая технология сможет объяснять студентам решение математических задач и переводить обозначения из реального мира.
Голосовые звонки в ChatGPT
Другая интересная разработка OpenAI – интеграция голосовой связи в ChatGPT. Программист Ананай Арора обнаружил, что компания уже подготовила серверы для обработки аудио- и видеоданных в реальном времени. Это может означать, что пользователи скоро смогут не только чатиться с виртуальным помощником, но и звонить ему.
Большие перемены в ИИ
Похоже, что OpenAI действительно готовится представить прорывные технологии в сфере искусственного интеллекта. Умение анализировать разные форматы данных и тонкости человеческой речи – важные шаги на пути создания по-настоящему интеллектуальных помощников. Хотя новые разработки еще не лишены недостатков, они открывают большие перспективы для будущего ИИ.











