FLUX.2 Klein 4B теперь работает на смартфоне: стартап PrismML сжал модель до 930 МБ

Владимир Платонов · 27 мая, 2026 11:16
ИИFLUX.2 Klein 4B теперь работает на смартфоне: стартап PrismML сжал модель до 930 МБ

Стартап PrismML представил экстремально сжатую версию FLUX.2 Klein 4B, которая весит всего 930 МБ и запускается даже на iPhone 17 Pro Max. Скорость генерации — 9,4 секунды на изображение 512×512. Это может сделать генерацию AI-картинок массовым явлением.

  • Стартап PrismML выпустил 1-битную версию FLUX.2 Klein 4B, весящую всего 930 МБ (в ternary-версии — 1,2 ГБ), с полным комплектом — 3,5 ГБ
  • Модель поддерживает инференс в браузере и на смартфонах через Bonsai Studio, потребляя всего 2 ГБ ОЗУ
  • На iPhone 17 Pro Max генерация изображения 512×512 занимает 9,4 секунды при 4 шагах
  • Текстовый энкодер сжать не удалось, поэтому полный комплект весит 3,5 ГБ
  • Веса модели уже доступны на HuggingFace, что ускоряет внедрение
  • Это первый случай, когда модель такого класса работает на смартфоне без облачных серверов

Стартап PrismML, специализирующийся на экстремальном сжатии моделей искусственного интеллекта, представил 1-битную версию FLUX.2 Klein 4B — модели, которая до этого считалась слишком тяжелой для локального запуска. Результат оказался неожиданно качественным: вес Diffusion Transformer удалось сократить до 930 МБ, а в ternary-варианте — до 1,2 ГБ.

Полный комплект, включая текстовый энкодер (который сжать не удалось), занимает 3,5 ГБ. Главное преимущество новой версии — возможность запуска прямо в браузере или на смартфоне через Bonsai Studio. Для работы требуется всего 2 ГБ оперативной памяти, что делает её доступной даже для устройств среднего класса. Например, на iPhone 17 Pro Max генерация изображения размером 512×512 занимает всего 9,4 секунды при 4 шагах.

Это в разы быстрее, чем ожидалось от модели такого класса на мобильных устройствах. До этого FLUX.2 Klein 4B считалась одной из самых мощных моделей для генерации изображений, но её вес (несколько гигабайт) ограничивал использование облачными сервисами.

Теперь, благодаря сжатию, она становится доступной для локального применения — без необходимости отправлять данные на удаленные серверы. Веса модели уже размещены на HuggingFace, что ускоряет её внедрение разработчиками и энтузиастами. Если тренд на сжатие моделей продолжится, это может кардинально изменить рынок AI-картинок.

Сегодня генерация высококачественных изображений требует мощных серверов или дорогих графических ускорителей. Но если подобные решения станут массовыми, пользователи смогут создавать AI-картинки прямо на своих устройствах — без зависимости от облачных сервисов и задержек.

Однако есть и риски. Например, текстовый энкодер остался слишком тяжелым для полного сжатия, что ограничивает возможности модели. Кроме того, качество генерации при экстремальном сжатии может уступать оригиналу. Если разработчики не смогут решить эти проблемы, массовое внедрение может застопориться. Следить стоит за тем, как быстро сообщество адаптирует новую версию FLUX.2 Klein 4B.

Если она найдет применение в мобильных приложениях или локальных сервисах, это может стать точкой отсчета для нового этапа в развитии AI-генерации.

Также важно наблюдать за реакцией конкурентов — возможно, они ответят собственными сжатыми моделями.

Сжатие FLUX.2 Klein 4B до размеров, подходящих для смартфонов, — это не просто технический трюк, а потенциальный переворот в доступности AI-инструментов. Если тренд подтвердится, пользователи получат возможность генерировать качественные изображения без облачных серверов, что ускорит внедрение ИИ в повседневные задачи. Однако ключевым останется баланс между скоростью, качеством и весом модели — если разработчики не смогут улучшить текстовый энкодер, преимущества сжатия могут оказаться ограниченными.

Владимир Платонов

Владимир Платонов — автор и обозреватель финансовых рынков. Специализируется на Forex, брокерских сервисах и торговой инфраструктуре. В материалах анализирует условия торговли, исполнение ордеров и риски для частных трейдеров.