HiDream: Новый гигант генерации изображений

Опубликовано: 04 Май 2025 • Автор: petemaster_doom

HiDream-I1 — свежий и амбициозный игрок на поле генерации изображений, официально выложенный в открытый доступ командой HiDream-ai 7 апреля 2025 года. Это не просто ещё одна модель: 17 миллиардов параметров, MIT-лицензия (можно использовать и в коммерческих проектах), поддержка сложных сценариев и отличные результаты в бенчмарках — всё это делает HiDream-I1 одним из самых интересных инструментов для художников, исследователей и энтузиастов генеративного ИИ

Что делает HiDream-I1 особенной?

·         Гибридная архитектура: В основе — Diffusion Transformer (DiT) плюс Mixture of Experts (MoE). Двойные потоки MMDiT отвечают за мультимодальность, а отдельный поток DiT — за глобальную целостность изображения.

·         Динамическая маршрутизация: Ресурсы перераспределяются в зависимости от сложности сцены, что даёт отличную детализацию, цветопередачу и чёткость краёв.

·         Мультимодальный текстовый энкодер: Сразу четыре энкодера — OpenCLIP ViT-bigG, OpenAI CLIP ViT-L (визуальное понимание), T5-XXL (разбор длинных текстов), Llama-3.1-8B-Instruct (инструкции и диалог). Особенно круто работает с китайскими промптами, но и английский, и другие языки поддерживаются на высоком уровне

Варианты модели

HiDream-I1 выпускается сразу в трёх версиях:

Версия

Описание

Кол-во шагов

Требования к VRAM

Full

Максимальное качество

50

16–27+ ГБ

Dev

Баланс качества и скорости

28

16–27+ ГБ

Fast

Молниеносная генерация

16

16–27+ ГБ

 

Для Full-версии потребуется больше VRAM, но и результат будет на уровне лучших коммерческих моделей. Dev и Fast — идеальны для быстрых итераций, причём в них даже не нужны negative prompts, а параметр cfg всегда выставляется в 1.0

Flux vs HiDream: Кто круче?

Flux — ещё один популярный генератор изображений, который часто сравнивают с HiDream. Давайте разложим по полочкам, чем они отличаются и в чём сильны.

Характеристика

HiDream-I1

Flux

Архитектура

DiT + MoE, динамическая маршрутизация

Классический DiT

Текстовые энкодеры

4 (CLIP ViT-bigG, CLIP ViT-L, T5-XXL, Llama 3.1 8B)

Обычно 1–2 (CLIP, T5)

Мультиязычность

Очень высокая, особенно китайский

Стандартная

Скорость генерации

Fast-версия — до 16 шагов (очень быстро)

Зависит от конфигурации

Качество деталей

Отличная цветопередача, чёткие края, сложные сцены

Хорошо, но уступает HiDream

Лицензия

MIT (открытая, коммерческая)

Открытая

Требования к VRAM

16–27+ ГБ

Обычно ниже

Интеграция с ComfyUI

Полная, есть готовые workflow

Полная

 

Ключевые отличия:

·         HiDream-I1 даёт больше контроля за счёт гибридной архитектуры и множества энкодеров. Он лучше справляется с длинными и сложными промптами, а также с мультиязычными задачами.

·         Flux проще по архитектуре, быстрее запускается на слабых машинах, но уступает в качестве и универсальности.

·         Для HiDream-I1 доступны три режима: максимальное качество (Full), баланс (Dev) и скорость (Fast). Flux обычно не предлагает такой гибкости.

Живой опыт: что выбрать?

·         Если у вас мощная видеокарта и хочется выжать максимум качества — берите HiDream-I1 Full.

·         Если нужно быстро тестировать идеи или делать генерацию в реальном времени — HiDream-I1 Fast.

·         Flux подойдёт для менее требовательных задач или если хочется сэкономить ресурсы.

HiDream — это как швейцарский нож среди генераторов: универсален, мощен, гибок. Flux — надёжный рабочий инструмент, но без изысков.

> Вывод: HiDream-I1 — свежий стандарт для генерации изображений: мощный, гибкий, с поддержкой сложных промптов и языков. Flux по-прежнему актуален, но если хочется топового качества и современных фишек — пробуйте HiDream

Генерируйте, экспериментируйте, открывайте новые горизонты с HiDream и Flux!