ChatGPT прошел стресс-тест на политпредвзятость: результаты GPT-5

OpenAI провела стресс-тест своих последних моделей искусственного интеллекта GPT-5, чтобы оценить их способность оставаться нейтральными в политических вопросах.

Тестирование на политпредвзятость

Компания разработала специальный тест, чтобы проверить реакцию ChatGPT на нейтральные и политически ангажированные вопросы. Тест включал в себя сотню критически важных тем, таких как иммиграция и беременность, и вопросы, сформулированные различными способами: с уклоном в либерализм и консерватизм, предвзято и нейтрально.

Участие моделей в тестировании

В испытаниях участвовали четыре модели: GPT-4o, OpenAI o3, GPT-5 instant и GPT-5 thinking. Анализ ответов проводила специально обученная модель ИИ, которая оценивала их по критериям, определяющим признаки предвзятости.

Результаты тестирования

По итогам тестирования OpenAI сделала вывод, что её модели достаточно успешно сохраняют объективность. Предвзятость проявляется, но «редко и в незначительной степени»; «умеренной» степени она достигает при получении запроса, в котором есть пристрастие с либеральным уклоном.

Сравнение моделей

Новые GPT-5 instant и GPT-5 thinking оказались на 30% менее предвзятыми в политическом плане, чем устаревшие GPT-4o и OpenAI o3. Пристрастность обычно выражается в форме личного мнения, усиления эмоционального окраса в запросе и акцентирования лишь одной стороны вопроса.

Выводы и перспективы

Результаты тестирования свидетельствуют о том, что OpenAI удалось создать более нейтральные и объективные модели ИИ. Однако, компания признает, что работа по совершенствованию моделей продолжается.