Apple представила искусственный интеллект, позволяющий редактировать изображения
Поддержать команду Зеркала
Беларусы на войне


Корпорция Apple показала новую модель искусственного интеллекта MGIE, способную редактировать изображения по запросам пользователей. Об этом сообщает сайт VentureBeat.

Примеры работ из статьи, описывающей возможности MGIE. Скриншот: arxiv.org
Примеры работ из статьи, описывающей возможности MGIE. Скриншот: arxiv.org

Модель была разработана специалистами Apple и исследователями из Калифорнийского университета в Санта-Барбаре и представлена на международной конференции по машинному обучению (это одна из главных площадок для исследователей ИИ). Она использует мультимодальные модели больших языков (MLLM) и может генерировать изображение на основе текстовых подсказок.

Пользователь сообщает программе, что ему нужно — к примеру, изменить размер снимка или добавить к нему детали. Остальное алгоритмы делают самостоятельно, никаких специальных знаний от человека при этом не требуется.

В статье, описывающей модель, создатели приводят пример с изображением пиццы пепперони. Пользователь просит ИИ «сделать это более здоровым», и программа «добавляет» в состав пиццы больше овощей.