Сайт — https://colab.research.google.com
Сфера использования : Дизайн, Иллюстрация, Электронная коммерция.
Цель : Создать изображение.
Изменение : Текст в изображение.
Disco Diffusion v5.2 — с режимом виртуальной реальности и симметрией — это нейросеть, изначально созданная Katherine Crowson с тюнингом 512×512 модели. Этот продукт является сложным и постоянно развивается с добавлением новых функций. Если у вас возникают проблемы, присоединяйтесь к сообществу пользователей Disco Diffusion на Discord или напишите нам на Twitter.
Существует неофициальное руководство по настройкам Disco Diffusion, доступное в виде:
— Disco Diffusion Cheatsheet от Zippy
Мы также призываем пользователей присоединиться к Disco Diffusion User Discord, чтобы общаться с активным сообществом и обмениваться знаниями.
Описанные ниже настройки устарели и включают информацию для v2. Нет необходимости использовать процессор CPU или сравнивать SHA при скачивании модели.
Для анимации рекомендуется установить cutn_batches на 1 для повышения скорости работы. Зум — это множитель размеров изображения, 1 означает отсутствие зума. Все повороты указываются в градусах.
Для других настроек, оптимизированных для Turbo Mode, обратитесь к оригинальному Disco-Turbo Github. frame_scale пытается направить новое изображение на похожее на старое. frame_skip_steps размывает предыдущее изображение — более высокие значения создадут меньше мерцания, но можно столкнуться с недостаточным добавлением новых деталей для увеличения масштаба.
Для создания стереоизображений левого/правого глаза используется другая (рыбий глаз) матрица проекции камеры. Изображения следует объединить в видео для левого/правого глаза, которые затем могут быть сшиты в формате VR180. Для объединения изображений требуется инструмент VR180 Creator, который уже не поддерживается Google.
Следует отметить, что просмотр VR видео на YouTube может быть не самым простым в зависимости от вашего устройства. Например, Oculus предлагает специальную медиа-студию и магазин, который упрощает доступ к файлам на Quest. Команда для объединения изображений для каждого глаза в формате mp4: ffmpeg -framerate 15 -i frame_%4d_l.png l.mp4 (повторить для r).
vr_eye_angle — это угол вращения глаз по оси y в сторону центра, interpupillary distance — расстояние между глазами. Для частичного сохранения промежуточных результатов предусмотрены дополнительные настройки, расписания и т. д.