Компанія OpenAI, відома своїм чат-ботом ChatGPT, активно розробляє нові технології в галузі штучного інтелекту. За даними джерел, скоро може бути представлений цифровий помічник із підтримкою мультимодального ШІ.
Новий помічник із розумінням сарказму
Згідно з інформацією видання The Information, OpenAI вже продемонструвала потенційним клієнтам модель, здатну вести діалоги і розпізнавати зображення. Передбачається, що вона зможе краще, ніж попередні розробки, інтерпретувати аудіо та візуальний контент.
Особливістю новинки стане вміння розпізнавати сарказм у мові співрозмовника. Це допоможе, наприклад, операторам колл-центрів точніше розуміти клієнтів. Крім того, за задумом розробників, така технологія зможе пояснювати студентам розв'язання математичних задач і перекладати позначення з реального світу.
Голосові дзвінки в ChatGPT
Інша цікава розробка OpenAI – інтеграція голосового зв'язку в ChatGPT. Програміст Ананай Арора виявив, що компанія вже підготувала сервери для обробки аудіо- та відеоданих у реальному часі. Це може означати, що користувачі скоро зможуть не тільки чатитися з віртуальним помічником, а й телефонувати йому.
Великі зміни в ШІ
Схоже, що OpenAI дійсно готується представити проривні технології у сфері штучного інтелекту. Уміння аналізувати різні формати даних і тонкощі людської мови – важливі кроки на шляху створення по-справжньому інтелектуальних помічників. Хоча нові розробки ще не позбавлені недоліків, вони відкривають великі перспективи для майбутнього ШІ.











