Meta объявила о выпуске новой серии ИИ, среди которых выделяется Self-Taught Evaluator — модель, которая способна обучаться и совершенствоваться без участия человека. Это событие может стать важной вехой на пути к созданию полностью автономных ИИ-агентов, способных выполнять сложные задачи и принимать решения на основе своих собственных ошибок.
Искусственный интеллект, который учится сам
Главной особенностью новой модели является её способность к самообучению. Self-Taught Evaluator использует данные, сгенерированные другими системами ИИ, и на их основе строит собственные выводы и улучшает свою работу.
Этот процесс исключает необходимость во вмешательстве человека на этапе обучения. Такой подход Meta интересен для компаний, стремящихся минимизировать затраты на разработку и оптимизацию нейросетей.
Ключевым элементом технологии является использование методики "цепочки мыслей". Это подход, при котором сложные задачи разбиваются на более простые логические шаги, что позволяет ИИ моделям точнее отвечать на вопросы, требующие глубокого анализа. Такой метод уже применялся в моделях OpenAI, и его эффективность подтверждена при решении задач в областях науки, программирования и математики.
Взгляд в будущее: автономные ИИ-агенты
Одна из главных целей Meta — создать ИИ, который сможет не только решать задачи, но и проверять свою работу. По мнению одного из исследователей компании, Джейсона Уэстона, самообучающиеся модели смогут в будущем значительно превзойти человека по ряду параметров, включая оценку собственной работы.
Создание таких автономных агентов открывает дверь к новым возможностям. Например, их можно будет использовать в науке, для написания кода или даже для создания новых материалов. Это особенно важно, учитывая, что развитие технологий требует всё более сложных решений, которые зачастую находятся за пределами возможностей человека.
Важно отметить, что возможность использования ИИ для обучения других ИИ — это значительный шаг вперёд. Это позволяет снизить зависимость от дорогостоящего и трудоёмкого процесса, известного как "обучение с подкреплением с использованием обратной связи от человека" (Reinforcement Learning from Human Feedback, RLHF). В этом методе эксперты должны вручную маркировать данные и проверять ответы ИИ на сложные запросы. Новый подход Meta исключает этот этап, что значительно повышает эффективность работы нейросетей.
Конкуренты и перспективы развития
Meta не единственная компания, работающая над развитием ИИ с минимальным человеческим участием. Google и Anthropic также активно исследуют возможности RLAIF (Reinforcement Learning from AI Feedback), но в отличие от Meta, они пока не спешат публиковать свои модели для публичного использования.
Однако Meta делает ставку на открытость и уже выпустила обновление своей модели Segment Anything — инструмента, ускоряющего генерацию ответов в больших языковых моделях. Это позволяет значительно сократить время ожидания при работе с большими объёмами информации и повысить точность ответов.
Кроме того, Meta активно работает над другими разработками в области ИИ, включая генерацию видео и создание новых материалов. Одним из таких проектов стал Movie Gen — инструмент для автоматического создания и редактирования видеоконтента, который был запущен в октябре 2024 года.
Meta продолжает уверенно двигаться в направлении создания ИИ, способного работать автономно, без вмешательства человека. Разработка таких моделей как Self-Taught Evaluator открывает путь к созданию систем, которые будут учиться на своих ошибках и постепенно становиться всё более совершенными.
В будущем такие системы смогут стать неотъемлемой частью многих отраслей, от науки до бизнеса. Снижение затрат на разработку и обучение ИИ, а также повышение их эффективности делают эти технологии крайне привлекательными для компаний по всему миру.











