Искусственный интеллект ChatGPT вскоре претерпит значительное обновление. Как заявил гендиректор OpenAI Сэм Альтман, уже в этом году чат-бот научится работать с видеоконтентом. Об этом он рассказал во время разговора с сооснователем Microsoft Биллом Гейтсом в рамках подкаста Unconfuse Me.
Следующее поколение языковой модели, лежащей в основе ChatGPT, станет полностью мультимодальным. Она сможет не только анализировать текст и аудио, но и работать с изображениями, кодом и видео. Это позволит значительно расширить возможности генеративного ИИ.
Однако обновление несет и определенные риски, в частности относительно конфиденциальности данных. Ведь OpenAI уже обвиняли в использовании украденной информации для обучения своих моделей. Итак, способность ChatGPT анализировать видео может вызвать дополнительные вопросы о том, как компания будет обрабатывать и защищать персональные данные.
Ожидается, что обновленная версия ChatGPT под названием GPT-5 выйдет до конца 2024 года. Сэм Альтман отметил, что главной целью является улучшение логики и надежности чат-бота. Ведь сейчас он иногда "галлюцинирует", то есть уверенно утверждает ложную информацию.
Как именно ChatGPT научится работать с видео?
Вероятно, это будет происходить аналогично тому, как сейчас чат-бот генерирует изображения через модель DALL-E. Пользователь будет вводить несколько строк текста в качестве подсказки, а ИИ будет создавать видео на основе этого описания.
Однако такая простота генерации фейкового видеоконтента несет определенные угрозы. В частности, возрастает риск распространения дезинформации и манипуляций в период избирательных кампаний. Ведь создать убедительное видео с политиком, который якобы что-то сказал, станет гораздо проще.
Поэтому стоит следить за источниками информации в интернете и осторожно относиться к контенту с неизвестных ресурсов в соцсетях. А чтобы узнать правду, лучше обращаться к проверенным СМИ.











