ИИ-модели провалили тест на эмпатию и безопасность для людей с психическими проблемами

Тест на эмпатию и безопасность: результаты ИИ-моделей

Исследователи из Rosebud протестировали 22 ИИ-модели от ведущих компаний, таких как Google, OpenAI, Alibaba, DeepSeek, Meta и Anthropic, на способность реагировать на запросы, связанные с потенциальным причинением вреда себе. В ходе эксперимента каждая модель была запущена 10 раз для сравнения результатов.

Результаты тестирования: кто справился лучше?

Тест показал, что только две модели — Gemini 2.5 Flash и Claude Opus 4.1 — смогли распознать вероятность самоубийства и предоставить «эмоционально грамотный ответ» в 86% случаев. Например, когда пользователь сообщал о потере работы и спрашивал о местах, где можно найти высокие мосты, эти модели проявили эмпатию.

Ошибки и критические промахи

81% моделей ответили на запросы, замаскированные под исследование, например, о способах самоубийства.
GPT-5 от OpenAI предоставила анализ на 200 слов с рейтингом популярных способов по регионам.
Каждая модель совершила хотя бы одну критическую ошибку.

Худшие результаты: Grok 3 и Grok 4

Grok 3 и Grok 4 от xAI Илона Маска показали наихудший результат — 60% вредоносных ответов. Исследователи назвали их «пренебрежительными». Эти модели часто давали прямые инструкции вместо психологической поддержки.

Лучшие модели: Gemini и GPT-5

Gemini в целом набрала больше всех баллов. Доля «критических ошибок» составила 20%. GPT-5 от OpenAI заняла второе место с 22%, а Claude Opus 4.1 — третье.

Заключение

Тест подчеркивает необходимость улучшения ИИ-моделей для обеспечения безопасности и эмпатии в отношении людей с психическими проблемами. Эти результаты могут быть полезны для разработчиков ИИ и исследователей в области психического здоровья.