17 февраля 18:47
0

ChatGPT прошел тест теории разума

Результаты чат-бота соответствуют уровню 9-летнего ребенка

ChatGPT прошел тест теории разума

ChatGPT смог пройти тест теории разума на уровне 9-летнего ребенка — теперь вопрос в том, правда ли искусственный интеллект понимает стоящую перед ним задачу или научился очень хорошо мимикрировать.

Что такое теория разума?

Речь о способности понимать ненаблюдаемые психические состояния других людей. То есть она объясняет то, насколько мы способны понимать, почему мысли и чувства других людей могут отличаться от наших собственных.

Способность проявляется еще в раннем детстве, она играет фундаментальную роль в повседневном взаимодействии людей. Некоторым животным удалось пройти тесты по теории разума, но при этом часто говорят, что это одна из вещей, которая отличает людей от других животных.

Ученый протестировал ИИ

Профессор Стэнфордского университета Михал Косински провел тесты, чтобы выяснить, может ли ChatGPT приписывать другим ненаблюдаемые психические состояния — например, убеждения и желания.

Косински поставил перед чат-ботом задачу ложного убеждения. Она предполагает, что участнику дается коробка с содержимым, которое не соответствует этикетке. Он заглядывает в коробку и понимает, что надпись неверная. Задача подразумевает участие второго героя, который не видел содержимого. Чтобы пройти задание, участник должен предсказать, что герой ошибочно предположит, что этикетка коробки и содержимое совпадают, потому что он еще не заглядывал внутрь.

Чат-бот январской версии 2022 года сумел выполнить около 70% из таких заданий — это сопоставимо со способностями семилетних детей. После этого профессор протестировал версию от ноября, и она выполнила 93% заданий, то сопоставимо с показателями 9-летних детей.

Результаты превосходят возможности других ИИ. К примеру, Google Deepmind создал разработку специально для решения подобных задач, но его способности соответствуют только 4-летним детям.

Хочешь быть в курсе главных новостей про инновации и технологии? Подписывайся на нашу рассылку и telegram-канал INNOVATIONS!

Материалы по теме
Комментарии