Институт инженеров электротехники и электроники (IEEE) провел тест Тьюринга, чтобы оценить, насколько современные модели искусственного интеллекта могут имитировать человеческое общение, пишет LiveScience.
Сообщается, что в ходе эксперимента 500 участников вели диалог с четырьмя агентами: человеком и тремя различными ИИ-моделями: программой эпохи 1960-х ELIZA, GPT-3.5 и GPT-4. Люди должны были за пять минут определить, общаются они с человеком или ИИ.
Исследователи заявили, что GPT-4 успешно прошел тест Тьюринга. Участники ошибочно принимали GPT-4 за человека в 54% случаев. «Это достижение подчеркивает значительный прогресс в развитии ИИ, но также вызывает опасения относительно социальных и экономических последствий широкого использования таких технологий», — отметили ученые.
Система ELIZA была принята за человека в 22% случаев, GPT-3.5 в 50%, а человек в 67%.
Ученые подчеркивают, что тест Тьюринга имеет свои ограничения и критикуется за слишком упрощенный подход к оценке интеллекта. Исследователи добавили, что стилистические и эмоциональные факторы играют большую роль в прохождении теста, чем традиционные представления об интеллекте.
Тест Тьюринга, предложенный Аланом Тьюрингом в 1950 году, оценивает способность машины демонстрировать интеллект, неотличимый от человеческого.