OpenAI представила нову модель штучного інтелекту, яка здатна “думати зображеннями”, що дозволяє їй розуміти та аналізувати малюнки та діаграми навіть із низькою якістю.
Нова модель з розширеними можливостями
Нова модель OpenAI отримала назву o3, а разом з нею презентували меншу версію o4-mini. Це сталося після релізу моделі о1 у вересні, яка зосереджувалася на вирішенні складних задач і множинному аналізі відповідей.
Що нового може o3?
З o3 користувачі можуть завантажувати зображення, ескізи та інші графічні матеріали для подальшого аналізу та обговорення. Модель також має можливість повертати, збільшувати зображення та використовувати інші інструменти редагування.
Конкуренція на ринку штучного інтелекту
Після запуску популярного чат-бота ChatGPT наприкінці 2022 року, OpenAI запроваджує численні оновлення для своїх моделей, переходячи від тексту до зображень, голосу та відео. Компанія змагається за лідерство в галузі генеративного ШІ з такими конкурентами, як Google, Anthropic, а також xAI, що належить Ілону Маску.
Компанія заявила: “Вперше наші розумові моделі можуть самостійно використовувати всі інструменти ChatGPT — веб-перегляд, Python, розуміння та генерацію зображень“.
Це робить їх більш ефективними у вирішенні комплексних задач, вимагаючи від них менше часу на обробку та аналіз.
Значення нових моделей
OpenAI, яка оцінюється в 300 мільярдів доларів, зазначила, що моделі o3 і o4-mini є першими, які можуть “думати з зображеннями”. Це означає, що вони не лише бачать зображення, а й інтегрують візуальну інформацію безпосередньо в ланцюг міркування.
У минулому місяці OpenAI реалізувала функцію генерації зображень, яка стала вірусною через можливість створення аніме в стилі Studio Ghibli.
Спеціалізація нових моделей
Модель o3 спеціально оптимізовано для рішень у математиці, програмуванні, науці та розумінні зображень, тоді як o4-mini працює швидше та є більш економічною. Обидві моделі стали доступними з середи для користувачів ChatGPT Plus, Pro і Team.
Користувачі OpenAI часто жартують щодо незвичних назв моделей. Генеральний директор Сема Алтмана також приєднався до жартів, заявивши, що компанія повинна виправити назви моделей до наступного літа, аби отримати більше часу для самокритики.
Безпека та зміни в політиці
Крім того, компанія повідомила, що обидві моделі пройшли “стрес-тестування в рамках нашої найсуворішої програми безпеки”. OpenAI останнім часом піддається критиці за зміни у своїх процедурах безпеки, зазначивши, що залишає за собою право змінювати вимоги безпеки у разі появи “іншого розробника ШІ, який представить систему високого ризику без аналогічних запобіжних заходів”.
У оновленій політиці OpenAI оголосила, що більше не вимагатиме тестування безпеки для деяких моделей, що пройшли доопрацювання. Також компанія не опублікувала “модельну картку” для моделі GPT-4.1, яка містила б інформацію про тестування безпеки перед випуском.
