Текст: Tri Редактор: VickyXiao
Источник изображения: сгенерировано инструментом Unbounded AI
Вероятно, самое горячее ключевое слово в 2023 году — искусственный интеллект.
От ChatGPT, который родился на ровном месте, до Midjourney, который популярен во всем Интернете, а затем до глобальной крупномасштабной рукопашной схватки AI, менее чем за год AIGC продолжает взрываться, всколыхнув мир.
Независимо от того, дома или за границей, все, похоже, нашли билет в «новый мир» либо в исследованиях и разработках ИИ, либо в бизнесе + ИИ. Можно сказать, что в настоящее время искусственный интеллект стал самой надежной уверенностью, ведущей общественность к следующей эре AIGC и осуществляющей новый скачок производительности. В стране и за границей существует множество инструментов, связанных с ИИ, но все они расширены из трех основных алгоритмов Midjourney (MJ), Stable Diffusion (SD) и DALL-E.DALL-E был обновлен до DALL-E2.
Сегодня мы вместе рассмотрим, каковы преимущества, недостатки и различия этих трех основных алгоритмов?
Midjourney – это программное обеспечение, которое в настоящее время установлено на платформе Discord. Оно было разработано студией в США и дебютировало в марте 2022 года. Всего за год MJ обновился и перешел на версию V5 и быстро стал популярным благодаря своему мастерству. Сгенерированные карты этих взрывов в социальных сетях созданы MJ. Благодаря удивительному качеству рендеринга и идеальной модели коммерциализации он успешно привлек большое количество платных пользователей и достиг годового дохода в 100 миллионов долларов США.
Stable Diffusion разработан британской стартап-компанией Stability AI в сотрудничестве с несколькими академическими исследователями и некоммерческими организациями. Он бесплатен для использования. Текущий исходный код и модель SD находятся в открытом доступе и могут использоваться локально на Mac, ПК. или даже мобильные устройства.Развертывание (требуется относительно высокая конфигурация оборудования), вы можете моделировать DIY, многие программные инструменты дома и за рубежом, большинство из них разработаны с использованием SD в качестве базовой логики, а его возможности управления и рендеринга также очень сильны, и теперь многие дизайнеры используют его для выполнения некоторых побочных работ.
Команда OpenAI разработала и запустила DALL-E 2. В отличие от Midjourney, картинки, созданные по простым инструкциям, как правило, имеют тенденцию быть реалистичными. DALL-E 2 — лучший из трех с точки зрения реалистичных изображений и лаконичных подсказок.
Давайте вместе посмотрим на их выразительные способности. По описанию того же ключевого слова, как они отзываются об изображении?
DALL·E 2 (слева), Midjourney (в центре) и Stable Diffusion (справа)
DALL·E 2 (слева), Midjourney (в центре) и Stable Diffusion (справа)
DALL·E 2 (слева), Midjourney (в центре) и Stable Diffusion (справа)
Из сравнения на приведенном выше рисунке видно, что DALL-E 2 очень хорошо обрабатывает изображения природы и людей.В настоящее время с помощью API DALL-E 2 можно реализовать три метода взаимодействия с изображениями: к текстовой подсказке Создавайте изображения с нуля, редактируйте существующие изображения на основе новых текстовых подсказок, создавайте варианты существующих изображений.
Midjourney имеет насыщенные цвета и реалистичную графику во всех попытках. Он способен генерировать изображения на основе запросов пользователя. Midjourney хорошо адаптирует реальный художественный стиль для создания изображений с любой комбинацией эффектов, которые пожелает пользователь. Он отлично справляется с эффектами окружающей среды, особенно с фэнтезийными и научно-фантастическими сценами, которые выглядят как игровой арт.
А Stable Diffusion — это модель с открытым исходным кодом, которую может использовать каждый. Он относительно хорошо понимает образы современного искусства и может создавать произведения искусства, полные деталей. Просто обычным пользователям сложно пользоваться. В настоящее время самая популярная дискуссия среди всех — кто лучше, SD или MJ, поэтому мы протестировали некоторые образы.
Midjourney (слева) и Stable Diffusion (справа)
Midjourney (слева) и Stable Diffusion (справа)
Судя по деталям создания изображений персонажей мультфильмов, SD лучше: при том же ключевом слове черты лица, созданные SD, более трехмерные и изысканные, а Midjourney более художественный.
Midjourney (слева) и Stable Diffusion (справа)
При создании реалистичных изображений в стиле иллюстрации они одинаково эффективны.Самое большое преимущество SD заключается в том, что пользователи могут повторно микшировать посредством встраивания модели, LoRA или сети, что может привести к неожиданным эффектам.
Midjourney (слева) и Stable Diffusion (справа)
В настоящее время в Stable Diffusion для загрузки доступно более тысячи моделей. Каждая модель может быть дополнительно изменена с использованием моделей LoRA, встроенных моделей и гиперсетей; Midjourney ограничен в плане моделей. Доступны только модели от v1 до v5 и некоторые специальные модели, такие как niji, test, testp и HD. Есть дополнительный параметр для «стилизации» изображения. Но в целом он все еще бледнеет по сравнению со стабильной диффузией.
На самом деле, эти генераторы изображений AI имеют свои преимущества.Основываясь на опыте этих трех алгоритмов, мы обобщили некоторые основные моменты и различия.Конкретный выбор может быть определен в соответствии с вашими потребностями.
1、ДАЛЛ-Е2
Интерфейс этой модели прост и понятен, и вы можете легко создавать изображения без регистрации на сторонней платформе.Для создания изображений вам нужно всего лишь посетить веб-сайт и ввести текст ключевого слова в поле генерации.
преимущество:
л Простота в использовании
l Креативность с гибкостью
l Не требуется сторонняя платформа
недостаток:
л простое изображение
л точность не высокая
l Может создавать только квадратные изображения
2、В середине пути
В отличие от DALL-E 2, вам сначала нужно создать учетную запись Discord, и вы должны вводить такие команды, как текст или изображения, для создания изображений.
преимущество:
л Высокое качество изображения
l Пользователи могут настроить соотношение размеров изображения
l Гибкое управление параметрами изображения
недостаток:
l Более сложный в использовании
l Требовать от пользователей регистрации на Discord
l После того, как быстрое время истечет, время генерации изображения резко увеличится.
3、Стабильная диффузия
И Stable Diffusion, и DALL·E-2 основаны на диффузионной модели, которая может рисовать изображения в соответствии с входными текстовыми дескрипторами (). Для полноценного производства отличных изображений на Stable Diffusion требуется правильная модель + точные подсказки + настройка параметров + технология постобработки.
преимущество:
l Работа в Интернете и установка моделей с открытым исходным кодом на другие платформы
l Больше свободы творчества
l Большое количество элементов управления для настройки параметров изображения
недостаток:
l Требуется профессиональное и мощное оборудование
l Качество изображения очень нестабильное, это зависит от используемой версии
l Высокая сложность обучения, трудная для контроля обычными пользователями
Подводя итог, если у вас есть четкий целевой результат, например, вы архитектурный дизайнер, то Stable Diffusion лучше удовлетворит ваши творческие потребности, потому что он более управляем. А если у вас нет четкой цели по творческому контролю и вы хотите заниматься творчеством с дивергентным мышлением, то удобство и низкий порог Midjourney и DALL-E 2 будут вашим лучшим выбором.
Какой инструмент ИИ вы предпочитаете использовать? Как это применяется в трудовой жизни? Добро пожаловать, чтобы поделиться с нами в комментариях!