Сайт — https://colab.research.google.com
Цель : Проанализировать изображение, Улучшить запрос.
Изменение : Изображение в текст.
Параметры : Популярная.
CLIP Interrogator — инструмент, который поможет вам создавать подсказки для изображений прямо из ваших собственных файлов. Просто загрузите изображение и получите приблизительное описание, которое можно использовать для создания похожих картинок с помощью моделей text2image. Рекомендуется использовать со стабильной диффузией и моделями CLIP и Diffusion guided. Этот инструмент специализирован на создании качественных подсказок для стабильной диффузии и обеспечивает более высокое соответствие между сгенерированным текстовым подсказкой и исходным изображением. Вы можете попробовать старую версию 1, чтобы увидеть, как разные модели CLIP ранжируют термины. Используйте этот инструмент для каждого изображения в папке и либо сохраните результаты в файл desc.csv в той же папке, либо переименуйте файлы, чтобы добавить в них подсказки. Переименованные файлы хорошо работают с расширением DreamBooth в веб-интерфейсе стабильной диффузии. Можно использовать сгенерированный csv для дополнительного обучения стабильной диффузии с помощью CLIP Interrogator 2.4 от @pharmapsychotic. Проверьте GPU, настройки, изображение на подсказку!