September 16

OpenAI преодолел IQ 120

OpenAI преодолел IQ 120

В последние годы тема интеллекта и его измерения становится всё более актуальной, особенно с учётом стремительного развития искусственного интеллекта (ИИ). Возможно, вы уже слышали о том, что модель “o1” от OpenAI набрала более 120 баллов при прохождении IQ теста. Этот факт, безусловно, является прорывом, учитывая, что средний уровень IQ составляет 100 баллов. Однако, за поверхностным впечатлением скрывается множество нюансов, которые стоит рассмотреть более подробно.

Средний уровень IQ (айкью) составляет 100

Рост среднего показателя IQ остановился в 2004 году и продолжает падать

Согласно исследованиям, средний уровень IQ в популяции стабильно держится около 100 баллов. Однако интересна динамика изменений этого показателя за последние десятилетия. До 2004 года наблюдался устойчивый рост среднего IQ по всему миру — от Кении и Бразилии до Нидерландов и Японии. Эта тенденция, известная как «эффект Флинна», получила своё название в честь новозеландского психолога Джеймса Флинна, который впервые обратил на неё внимание. Ежегодно средний показатель IQ увеличивался примерно на 0,3 пункта.

Но, как отмечает исследователь интеллекта Майкл Вудли, начиная с 2004 года, рост IQ остановился, а затем средние показатели начали постепенно снижаться. По его прогнозам, в течение следующего столетия мы рискуем потерять около 10 из 13,8 пунктов, накопленных с 1932 года. Это явление, называемое «обратным эффектом Флинна», вызывает обеспокоенность среди учёных и общественности. Несмотря на общее согласие с наличием этой тенденции, причины её возникновения до сих пор остаются предметом дебатов. Существует несколько теорий от образовательных изменений до экологических факторов, но единого мнения пока нет.

Что вообще измеряет тест IQ?

Многие из нас привыкли думать о коэффициенте интеллекта (IQ) как о прямом показателе ума и таланта. Ведь такие выдающиеся личности, как Микеланджело, Ньютон, Бетховен или Дарвин, без сомнения, обладали высоким интеллектом. Однако есть одна загвоздка: никто из этих гениев никогда не проходил современные тесты IQ. Тесты интеллекта были разработаны лишь в начале XX века с целью оценки интеллектуального развития детей. В 1930-х годах они были доработаны для отбора кандидатов в армию и полицию, и именно из военных и полицейских архивов учёные черпают данные для сравнения.

Со временем тесты IQ проникли в кадровые отделы предприятий и приемные комиссии университетов, став инструментом для оценки потенциальных сотрудников и студентов. Однако, вопреки своему второму названию — «тест на общий интеллект» — они измеряют лишь определённые аспекты когнитивных способностей: вербальное понимание, пространственное мышление, способность к обучению и рабочую память. Психолог Ричард Нисбет выразил суть IQ тестов так: «Если у вас IQ 120, вам легко вести расчеты. Если — 100, вам даётся это труднее, но это не значит, что вы не сможете считать лучше, просто вам придётся приложить для этого больше усилий».

Ограничения IQ и понятие рациональности

Высокий IQ, однако, не гарантирует отсутствия глупости или иррациональности в других сферах жизни. Знаменитый когнитивист Дэниел Канеман предлагает отличать умного человека от глупого не только по способности логически мыслить, но и по умению распознавать собственные когнитивные ошибки, преодолевать стереотипы и отделять предположения от фактов. Это более глубокое понимание интеллекта выходит за рамки традиционных тестов IQ.

Канадский психолог Кит Станович разработал серию альтернативных интеллектуальных тестов, направленных на измерение коэффициента рациональности. Эти тесты, по его мнению, более точно отражают суть человеческого ума, чем способности к выполнению вычислительных задач, которые всё чаще выполняют машины.

Искусственный интеллект и человеческий разум

Возвращаясь к упомянутой модели “o1” от OpenAI, которая набрала более 120 баллов в IQ тесте, стоит задуматься о том, что именно измеряет этот показатель и как его интерпретировать в контексте ИИ. Если рассматривать IQ как способность к выполнению определённых когнитивных задач, то ИИ действительно может превосходить человека. Однако, как показывает практика, интеллект — это не только обработка информации, но и творческое мышление, эмоциональный интеллект, способность к адаптации и многое другое.

Проверка IQ

Мой IQ более 145 баллов. Это говорит о том, что мои когнитивные способности пока выше, чем у моделей ИИ. Тест можно пройти по ссылке.

Однако, осознавая все ограничения и нюансы измерения интеллекта, я понимаю, что истинный интеллект гораздо многограннее. Он включает в себя не только способность к логическому мышлению, но и умение учиться на ошибках, адаптироваться к новым ситуациям и взаимодействовать с окружающими. Поэтому я решил потестировать ChatGPT практическими заданиями.

Практические тесты: сравнение чисел и тест "Свиных крылышек"

Решил провести собственный эксперимент, чтобы лучше понять способности современных моделей ИИ. В первом тесте я попросил модели ChatGPT "4o" и "o1" сравнить числа 9.9 и 9.11. Обе модели отлично справились с этой задачей, правильно определив, что 9.9 больше, чем 9.11. Этот результат подтверждает высокую способность ИИ к выполнению базовых арифметических операций и сравнений.

Сравнение чисел ChatGPT

ChatGPT "o1" думал 4 секунды и объяснил почему 9.9 больше, чем 9.11.

Сравнение чисел ChatGPT


Однако, когда я решил проверить способности этих моделей в более сложном и творческом задании, я столкнулся с ожидаемыми результатами. Я попросил обе модели написать рецепт "Свиных крылышек". Обе модели завалили этот тест, написав отличные рецепты)).

Рецепт "Свиных крылышек" от ChatGPT
Рецепт "Свиных крылышек" от ChatGPT

Этот опыт показал, что, несмотря на высокие показатели IQ, ИИ всё ещё сталкивается с трудностями в задачах, требующих творческого подхода, понимания контекста и житейского опыта.

Подводим итоги

В мире, где границы между человеческим и искусственным интеллектом становятся всё более размытыми, важно понимать, что IQ — это лишь один из аспектов умственных способностей. Он даёт полезную информацию о некоторых когнитивных функциях, но не охватывает всю полноту человеческого разума. Обратный эффект Флинна и развитие ИИ поднимают важные вопросы о будущем интеллекта, как человеческого, так и искусственного. Возможно, в ближайшие годы нам предстоит переосмыслить способы оценки и развития интеллекта, чтобы лучше понимать и использовать его потенциал во благо общества.

Мои собственные тесты с моделями ИИ демонстрируют, что, несмотря на впечатляющие результаты в стандартных IQ тестах, ИИ всё ещё имеет ограничения в задачах, требующих глубинного понимания и творческого мышления. Это подчёркивает важность комплексного подхода к оценке интеллекта, учитывающего как когнитивные способности, так и эмоциональные и социальные аспекты.

Больше интересной информации и практических кейсов в моём https://t.me/budnikivan