Meta оголосила про випуск нової серії ШІ, серед яких виділяється Self-Taught Evaluator – модель, яка здатна навчатися і вдосконалюватися без участі людини. Ця подія може стати важливою віхою на шляху до створення повністю автономних ШІ-агентів, здатних виконувати складні завдання і приймати рішення на основі своїх власних помилок.
Штучний інтелект, який вчиться сам
Головною особливістю нової моделі є її здатність до самонавчання. Self-Taught Evaluator використовує дані, згенеровані іншими системами ШІ, і на їхній основі будує власні висновки та покращує свою роботу.
Цей процес виключає необхідність у втручанні людини на етапі навчання. Такий підхід Meta цікавий для компаній, які прагнуть мінімізувати витрати на розробку та оптимізацію нейромереж.
Ключовим елементом технології є використання методики "ланцюжка думок". Це підхід, за якого складні завдання розбиваються на простіші логічні кроки, що дає змогу ШІ моделям точніше відповідати на запитання, які потребують глибокого аналізу. Такий метод уже застосовували в моделях OpenAI, і його ефективність підтверджено під час розв'язання завдань у галузях науки, програмування і математики.
Погляд у майбутнє: автономні ШІ-агенти
Одна з головних цілей Meta – створити ШІ, який зможе не тільки розв'язувати завдання, а й перевіряти свою роботу. На думку одного з дослідників компанії, Джейсона Вестона, моделі, що самонавчаються, зможуть у майбутньому значно перевершити людину за низкою параметрів, зокрема за оцінкою власної роботи.
Створення таких автономних агентів відкриває двері до нових можливостей. Наприклад, їх можна буде використовувати в науці, для написання коду або навіть для створення нових матеріалів. Це особливо важливо з огляду на те, що розвиток технологій вимагає дедалі складніших рішень, які часто перебувають за межами можливостей людини.
Важливо зазначити, що можливість використання ШІ для навчання інших ШІ – це значний крок уперед. Це дає змогу знизити залежність від дорогого і трудомісткого процесу, відомого як "навчання з підкріпленням з використанням зворотного зв'язку від людини" (Reinforcement Learning from Human Feedback, RLHF). У цьому методі експерти повинні вручну маркувати дані і перевіряти відповіді ШІ на складні запити. Новий підхід Meta виключає цей етап, що значно підвищує ефективність роботи нейромереж.
Конкуренти та перспективи розвитку
Meta не єдина компанія, що працює над розвитком ШІ з мінімальною людською участю. Google і Anthropic також активно досліджують можливості RLAIF (Reinforcement Learning from AI Feedback), але на відміну від Meta, вони поки не поспішають публікувати свої моделі для публічного використання.
Однак Meta робить ставку на відкритість і вже випустила оновлення своєї моделі Segment Anything – інструменту, що прискорює генерацію відповідей у великих мовних моделях. Це дає змогу значно скоротити час очікування під час роботи з великими обсягами інформації та підвищити точність відповідей.
Крім того, Meta активно працює над іншими розробками в галузі ШІ, включно з генерацією відео та створенням нових матеріалів. Одним із таких проєктів став Movie Gen – інструмент для автоматичного створення і редагування відеоконтенту, який було запущено в жовтні 2024 року.
Meta продовжує впевнено рухатися в напрямку створення ШІ, здатного працювати автономно, без втручання людини. Розробка таких моделей як Self-Taught Evaluator відкриває шлях до створення систем, які вчитимуться на своїх помилках і поступово ставатимуть дедалі досконалішими.
У майбутньому такі системи зможуть стати невід'ємною частиною багатьох галузей, від науки до бізнесу. Зниження витрат на розробку і навчання ШІ, а також підвищення їхньої ефективності роблять ці технології вкрай привабливими для компаній по всьому світу.











