Apple у партнерстві з Каліфорнійським університетом випустила нову модель штучного інтелекту з відкритим кодом під назвою MGIE. Вона дозволяє редагувати фотографії за допомогою текстових команд, які пише користувач.
Про це повідомляє американський технологічний вебсайт VentureBeat.
У процесі своєї роботи MGIE застосовує мультимодальні великі мовні моделі (MLLM), які дозволяють розуміти запити користувача та виконувати їх. За допомогою MGIE можна вносити глобальні та локальні зміни на зображенні. Наприклад, можна змінити яскравість, контрастність та різкість, а також застосувати до знімку художні ефекти.

Штучний інтелект дозволяє змінювати форму, розмір, колір чи текстуру певних областей чи об’єктів. Є також можливість обрізки, зміни орієнтації та розміру зображення, а також додавання фільтрів. Змінити фон або додати/видалити об’єкт на знімку також можна.
MGIE доступна на платформі GitHub. Там є код та попередньо навчені моделі. Ще ШІ можна випробувати на сайті Hugging Face Spaces.
