Apple опубликовала исследование, которое поставило под сомнение возможности современных моделей искусственного интеллекта. Однако профессор Сок Джун Квон из Сунгкьюнкванского университета считает такие выводы ошибочными. Причина может быть проще, чем кажется.
Исследование Apple утверждало, что большие языковые модели и модели логического мышления не могут принимать обоснованные решения при росте сложности задач. Компания тестировала модели на контролируемых головоломках. Результаты показали, что точность Claude 3.7 Sonnet Thinking и DeepSeek-R1 падала до нуля независимо от доступных вычислительных ресурсов.
Квон категорически не согласен с такими выводами. Он утверждает, что сотни исследований масштабирования последовательно демонстрируют улучшение производительности в степенной зависимости от количества параметров. Производительность может достичь насыщения, но она не уменьшается.
Проблема заключается в том, что Apple не имеет достаточно мощного оборудования для тестирования. У компании нет GPU-кластера, сравнимого с теми, что используют Google, Microsoft или xAI.
Когда Apple представила Apple Intelligence в 2024 году, фокус был на обработке на устройстве. На WWDC компания не показала прогресса в собственном искусственном интеллекте центров обработки данных. Это снова ограничило Apple Intelligence только обработкой на устройствах со строгими ограничениями конфиденциальности и производительности.
Apple позволяет Siri вызывать внешние большие языковые модели. Сначала это был ChatGPT 4o, вскоре добавится Gemini. Такой гибридный подход необычен для apple.
Ранее мы писали, что Apple обнаружила критические недостатки в мощнейших системах искусственного интеллекта, что вызвало широкое обсуждение в технологическом сообществе. Новое исследование стало продолжением этой дискуссии.
Процессоры M-серии apple разработаны прежде всего для клиентских ПК. Их GPU не поддерживают FP16, который используется для обучения искусственного интеллекта. Подсистемы памяти полагаются на LPDDR5 вместо высокопроизводительной HBM3E.
CPU M-серии не поддерживают нативно широко используемые фреймворки машинного обучения, такие как PyTorch. Это требует громоздких конвертаций.
Квон считает, что совпадение публикации исследования с WWDC не случайно. Apple могла пытаться преуменьшить достижения таких компаний, как Anthropic, Google, OpenAI или xAI, поскольку явно отстает от лидеров рынка.
Чтобы догнать конкурентов, Apple должна разработать специализированные процессоры серверного класса. Они должны иметь передовые подсистемы памяти и сложные возможности обучения и вывода искусственного интеллекта. Эти решения не могут фундаментально полагаться на дизайн GPU и NPU для системы-на-чипе M-серии.
Критика Квона подчеркивает важную проблему: ограничения оборудования могут искажать результаты исследований. Истинные возможности искусственного интеллекта можно оценить только при наличии соответствующих ресурсов. Apple придется сделать серьезные инвестиции в инфраструктуру, чтобы оставаться конкурентоспособной в гонке искусственного интеллекта.











