По данным мониторинга 1M AI News, лаборатория Alibaba Tongyi опубликовала единый модельный подход для генерации и редактирования изображений Wan2.7-Image, делая упор на «люди выглядят более реалистично, текст — более устойчивым, цвета — более точными».
Модель поддерживает прямой ввод Hex Color Code для определения палитры; на официальной сводной странице указано, что доступно управление с помощью 8 видов Hexcode. В части рендеринга текста поддерживается вывод до 4000 английских символов, а также поддерживаются такие языки, как упрощенный китайский, традиционный китайский, английский, японский, корейский и другие, кроме того, поддерживается смешанное размещение таблиц и математических формул.
Непрерывное творчество — еще один важный акцент этого обновления. Wan2.7-Image поддерживает генерацию групп из до 12 изображений, а также позволяет вводить до 9 изображений-референсов; это можно использовать для раскадровок, серии постеров и генерации с сохранением согласованности персонажей. Со стороны редактирования добавлены точное выделение области для редактирования и генерация PNG с полностью прозрачным каналом, чтобы можно было отделять выделенные элементы от фона. Официальные сценарии внедрения включают изображения для размещения в электронной коммерции, раскадровки для короткометражных фильмов, учебные диаграммы, детские книги с иллюстрациями, дизайн постеров и приглашений. Сайт и API уже доступны.