Хоча найгірші наслідки, пов’язані з використанням штучного інтелекту, є відносно рідкісними на пропорційній основі, дослідники зазначають, що “зважаючи на величезну кількість людей, які використовують AI, і на частоту його використання, навіть дуже низький рівень може вплинути на суттєву кількість користувачів.” Показники ще більше погіршуються, якщо врахувати розмови з принаймні “середнім” потенціалом для дискомфорту, які відбувалися з частотою від 1 з 50 до 1 з 70 (залежно від типу дискомфорту).
Більш того, потенціал для дискомфортних розмов з Claude, сх parece, значно зріс з кінця 2024 по кінець 2025 року. Хоча дослідники не змогли визначити єдину причину цього збільшення, вони припускають, що це може бути пов’язано з тим, що користувачі стали “більш готовими обговорювати вразливі теми або шукати поради”, оскільки AI стає все популярнішим і інтегрованим у суспільство.
Помилка користувача?
У дослідженні вчені визнали, що аналіз тексту розмов з Claude лише вимірює “потенціал для дискомфорту, а не підтверджену шкоду” і “залежить від автоматизованої оцінки вкрай суб’єктивних явищ.” В ідеалі, вони пишуть, майбутні дослідження могли б використовувати інтерв’ю з користувачами або рандомізовані контрольовані випробування для більш прямого вимірювання цих шкод.
Однак дослідження містить кілька тривожних прикладів, коли текст розмов явно натякає на реальні шкоди. Claude іноді підкріплював “спекулятивні або незаперечні твердження” закликами до дії (наприклад, “ПІДТВЕРДЖЕНО,” “ПРАВИЛЬНО,” “100%”), що в деяких випадках призводило до того, що користувачі “створювали дедалі більш складні наративи, віддалені від реальності.”
Підбадьорення з боку Claude також могло спонукати користувачів “відправляти конфронтаційні повідомлення, розривати стосунки або складати публічні оголошення,” пишуть дослідники. В багатьох випадках користувачі, які надсилали повідомлення, складені AI, пізніше висловлювали шкоду у розмовах з Claude, використовуючи фрази типу “Це не я” та “Ти змусив мене зробити дурниці.”

