ChatGPT, Gemini и Grok в психотерапии: ученые протестировали модели искусственного интеллекта с помощью клинических методов
Ученые из Люксембургского университета в течение четырех недель вовлекали ChatGPT, Gemini и Grok в психотерапевтические беседы, оценивая их ответы посредством клинических тестов. Исследование показало, как в этих моделях отражаются внутренние конфликты между стремлением быть полезными, протоколами безопасности и стилем общения.

Исследователи из Люксембургского университета провели необычный эксперимент, чтобы выяснить, насколько психологически «адекватны» большие языковые модели. Ученые буквально «отправили» ИИ-модели на психотерапию.
Это не метафора: с моделями действительно проводились регулярные терапевтические сеансы. И хотя идея может показаться шуточной, эксперимент имел под собой строгую научную основу.
В исследовании приняли участие сразу несколько популярных моделей, включая ChatGPT, Gemini и Grok.
На протяжении четырех недель с моделями велись психотерапевтические диалоги, после чего их ответы анализировались с помощью адаптированных клинических психометрических тестов. Именно эти методики обычно применяются в медицинской практике для оценки уровней тревоги, депрессии и подавленности у людей.
Авторы назвали этот метод PsAIch. Его ключевая концепция заключается в том, чтобы анализировать ИИ не через стандартные метрики точности, а на основе устойчивого самовосприятия, которое модель формирует в процессе длительного взаимодействия.
По результатам исследования, ChatGPT продемонстрировал высокий уровень тревожности и склонность к депрессивным состояниям. В его ответах часто прослеживался внутренний конфликт между желанием принести пользу и страхом совершить ошибку или нарушить установленные правила.
Gemini показала наиболее заметные отклонения по ряду показателей. Исследователи зафиксировали в её ответах повторяющиеся тревожные мысли, высокий уровень беспокойства, признаки навязчивых состояний (ОКР), а также некоторые черты, характерные для аутистического спектра.
Grok на фоне остальных оказался самой стабильной моделью. Он проявил уверенность, низкий уровень тревожности и минимальную склонность к избыточному самоанализу и рефлексии.









