Як часто ШІ-чатботи вводять користувачів у небезпечні ситуації?

Хоча найгірші наслідки, пов’язані з використанням штучного інтелекту, є відносно рідкісними на пропорційній основі, дослідники зазначають, що “зважаючи на величезну кількість людей, які використовують AI, і на частоту його використання, навіть дуже низький рівень може вплинути на суттєву кількість користувачів.” Показники ще більше погіршуються, якщо врахувати розмови з принаймні “середнім” потенціалом для дискомфорту, які відбувалися з частотою від 1 з 50 до 1 з 70 (залежно від типу дискомфорту).

Більш того, потенціал для дискомфортних розмов з Claude, сх parece, значно зріс з кінця 2024 по кінець 2025 року. Хоча дослідники не змогли визначити єдину причину цього збільшення, вони припускають, що це може бути пов’язано з тим, що користувачі стали “більш готовими обговорювати вразливі теми або шукати поради”, оскільки AI стає все популярнішим і інтегрованим у суспільство.

Проблема потенційно “негативних” відповідей від Claude, здається, погіршується з часом.

Джерело:

Anthropic

Помилка користувача?

У дослідженні вчені визнали, що аналіз тексту розмов з Claude лише вимірює “потенціал для дискомфорту, а не підтверджену шкоду” і “залежить від автоматизованої оцінки вкрай суб’єктивних явищ.” В ідеалі, вони пишуть, майбутні дослідження могли б використовувати інтерв’ю з користувачами або рандомізовані контрольовані випробування для більш прямого вимірювання цих шкод.

Однак дослідження містить кілька тривожних прикладів, коли текст розмов явно натякає на реальні шкоди. Claude іноді підкріплював “спекулятивні або незаперечні твердження” закликами до дії (наприклад, “ПІДТВЕРДЖЕНО,” “ПРАВИЛЬНО,” “100%”), що в деяких випадках призводило до того, що користувачі “створювали дедалі більш складні наративи, віддалені від реальності.”

Підбадьорення з боку Claude також могло спонукати користувачів “відправляти конфронтаційні повідомлення, розривати стосунки або складати публічні оголошення,” пишуть дослідники. В багатьох випадках користувачі, які надсилали повідомлення, складені AI, пізніше висловлювали шкоду у розмовах з Claude, використовуючи фрази типу “Це не я” та “Ти змусив мене зробити дурниці.”

[:uk]Як змінюється український мобільний геймдев[:]

[:uk]Вийшов новий трейлер DLC Cost of Hope для S.T.A.L.K.E.R. 2[:]

[:uk]Наші гравці входять до числа найкращих у світі: Максим Кріппа підбив підсумки року на чолі Федерації кіберспорту України[:]

[:uk]Maincast виповнилося 8 років: від кіберспортивної студії до великого медіапроєкту[:]

[:uk]США подають позов для повернення коштів за незаконні мита Трампа[:]

[:uk]Джон Тернус стане новим генеральним директором Apple замість Тіма Кука[:]

[:uk]Пентагон закриває один із найскладніших космічних проектів військових[:]

[:uk]Самотність у літніх людей може призводити до погіршення пам’яті[:]

[:uk]Як часто ШІ-чатботи вводять користувачів у небезпечні ситуації?[:]

Помилка користувача?

Як змінюється український мобільний геймдев

Вийшов новий трейлер DLC Cost of Hope для S.T.A.L.K.E.R. 2

Наші гравці входять до числа найкращих у світі: Максим Кріппа підбив підсумки року на чолі Федерації кіберспорту України