OpenAI стверджує, що нова модель штучного інтелекту може "думати через зображення" та розуміти діаграми і ескізи

OpenAI представила нову модель штучного інтелекту, яка здатна “думати зображеннями”, що дозволяє їй розуміти та аналізувати малюнки та діаграми навіть із низькою якістю.

Нова модель з розширеними можливостями

Нова модель OpenAI отримала назву o3, а разом з нею презентували меншу версію o4-mini. Це сталося після релізу моделі о1 у вересні, яка зосереджувалася на вирішенні складних задач і множинному аналізі відповідей.

Що нового може o3?

З o3 користувачі можуть завантажувати зображення, ескізи та інші графічні матеріали для подальшого аналізу та обговорення. Модель також має можливість повертати, збільшувати зображення та використовувати інші інструменти редагування.

Конкуренція на ринку штучного інтелекту

Після запуску популярного чат-бота ChatGPT наприкінці 2022 року, OpenAI запроваджує численні оновлення для своїх моделей, переходячи від тексту до зображень, голосу та відео. Компанія змагається за лідерство в галузі генеративного ШІ з такими конкурентами, як Google, Anthropic, а також xAI, що належить Ілону Маску.

Компанія заявила: “Вперше наші розумові моделі можуть самостійно використовувати всі інструменти ChatGPT — веб-перегляд, Python, розуміння та генерацію зображень“.

Це робить їх більш ефективними у вирішенні комплексних задач, вимагаючи від них менше часу на обробку та аналіз.

Значення нових моделей

OpenAI, яка оцінюється в 300 мільярдів доларів, зазначила, що моделі o3 і o4-mini є першими, які можуть “думати з зображеннями”. Це означає, що вони не лише бачать зображення, а й інтегрують візуальну інформацію безпосередньо в ланцюг міркування.

У минулому місяці OpenAI реалізувала функцію генерації зображень, яка стала вірусною через можливість створення аніме в стилі Studio Ghibli.

Спеціалізація нових моделей

Модель o3 спеціально оптимізовано для рішень у математиці, програмуванні, науці та розумінні зображень, тоді як o4-mini працює швидше та є більш економічною. Обидві моделі стали доступними з середи для користувачів ChatGPT Plus, Pro і Team.

Користувачі OpenAI часто жартують щодо незвичних назв моделей. Генеральний директор Сема Алтмана також приєднався до жартів, заявивши, що компанія повинна виправити назви моделей до наступного літа, аби отримати більше часу для самокритики.

Безпека та зміни в політиці

Крім того, компанія повідомила, що обидві моделі пройшли “стрес-тестування в рамках нашої найсуворішої програми безпеки”. OpenAI останнім часом піддається критиці за зміни у своїх процедурах безпеки, зазначивши, що залишає за собою право змінювати вимоги безпеки у разі появи “іншого розробника ШІ, який представить систему високого ризику без аналогічних запобіжних заходів”.

У оновленій політиці OpenAI оголосила, що більше не вимагатиме тестування безпеки для деяких моделей, що пройшли доопрацювання. Також компанія не опублікувала “модельну картку” для моделі GPT-4.1, яка містила б інформацію про тестування безпеки перед випуском.

[:uk]GSC Game World назвала дату виходу сюжетного доповнення до S.T.A.L.K.E.R. 2[:]

[:uk]Advantech представила компактну ШІ-систему для промисловості[:]

[:uk]SpaceX вперше випробувала супутники Starlink V3[:]

[:uk]OpenAI відкрила ChatGPT Health для повнолітніх користувачів у США[:]

[:uk]IBM інвестує $5 мільярдів у нову кібербезпеку завдяки Anthropic[:]

[:uk]Meta стикнулася з труднощами у продажу чогось, окрім реклами[:]

[:uk]Акції Seagate знизилися на 6% через коментарі CEO щодо попиту на чіпи пам’яті[:]

[:uk]Google презентує перший варіант своїх аудіо смарт-окулярів[:]

[:uk]OpenAI стверджує, що нова модель штучного інтелекту може “думати через зображення” та розуміти діаграми і ескізи[:]

Нова модель з розширеними можливостями

Що нового може o3?

Конкуренція на ринку штучного інтелекту

Значення нових моделей

Спеціалізація нових моделей

Безпека та зміни в політиці

Advantech представила компактну ШІ-систему для промисловості

OpenAI відкрила ChatGPT Health для повнолітніх користувачів у США

Компанія Google випустила дешевші моделі Gemini