Компанія Anthropic оголосила, що випускає нову вдосконалену модель штучного інтелекту під назвою Claude Mythos Preview в рамках ініціативи з кібербезпеки Project Glasswing. Ця модель призначена для виявлення вразливостей і недоліків у програмному забезпеченні, і доступ до неї буде обмежено для запобігання можливому зловживанню.
Партнери та учасники проекту
Серед початкових партнерів, які отримають доступ до моделі, є великі компанії, такі як Apple, Google, Microsoft, Nvidia та Amazon Web Services. Крім того, у проекті беруть участь понад 40 інших компаній, включаючи CrowdStrike і Palo Alto Networks.
Діанне Пен, керівниця управління продуктами досліджень Anthropic, зазначила:
“Ми сприймаємо це як перший крок до надання кіберзахисникам певної переваги в темі, яка стане все важливішою.”
Безпека та ризики
Оголошення Anthropic відбулося після того, як публікації про модель були виявлені у відкритих даних минулого місяця. Це спричинило падіння акцій у сфері кібербезпеки, оскільки повідомлялося, що модель має підвищені можливості, які можуть також підірвати безпеку.
Генеральний директор Anthropic, Даріо Амодеї, зазначив, що “непорозуміння в цій сфері може призвести до серйозних наслідків, але правильна реалізація моделі може дати змогу створити набагато безпечніший інтернет і світ.”
Проект Glasswing
Anthropic, заснована у 2021 році, прагне продемонструвати свою відданість відповідальному впровадженню AI, і Project Glasswing — це крок у цьому напрямку. Компанія вже веде “постійні обговорення” з представниками уряду США щодо можливостей Claude Mythos Preview у сфері кібербезпеки.
Співробітники Anthropic обрали назву Project Glasswing на честь прозорих метеликів, які символізують вразливості в програмному забезпеченні.
Технологічні можливості
Claude Mythos Preview має здатність виявляти помилки, зокрема критичні, які раніше було важко виявити. Наприклад, модель ідентифікувала 27-річну помилку в OpenBSD, відомій операційній системі з акцентом на безпеці.
Хоча модель не була спеціально навчена для кібербезпеки, її вдосконалені можливості стали наслідком розвинених навичок у кодуванні та логіці. Anthropic наголосила, що не планує робити модель загальнодоступною, але прагне вивчити, як можна буде ефективно застосовувати подібні моделі в майбутньому.
Компанії, які беруть участь у Project Glasswing, займаються розробкою або обслуговуванням критично важливого програмного забезпечення. Anthropic планує надавати до $100 мільйонів у вигляді кредитів на використання моделі за цим проектом, однак партнери платитимуть за її використання після досягнення цього ліміту.
Newton Cheng, керівник кібербезпеки Anthropic, підкреслив:
“Ми хочемо, щоб компанії звикли використовувати ці можливості до того, як вони стануть широко доступні”.
