GPT-5.4 Pro досягнув 150 IQ у тесті MESNA Норвегія, побивши власний рекорд OpenAI

Остання модель GPT-5.4 Pro від OpenAI досягла балу IQ вищого, ніж у 99,96% усіх людей, давши ринкам свіжий сигнал про те, що здобутки штучного інтелекту починають випереджати звичайний шум продуктивного циклу.

Модель GPT-5.4 Pro від OpenAI досягла 150 балів у публічному тесті IQ, що наочно демонструє стрибок у порівнянні з балом 136, який був досягнутий у тесті Менси Норвегії минулого року.

Цей стрибок відбувається в момент, коли увага ринку зосереджена на Ірані, енергетиці, м’якості ринку праці та майбутньому інфляційному друку. Це створює інше питання для тижня вперед: як швидко зростає інтелект машини, і коли ця прискорення почне перекриватися з економічним позиціонуванням?

Чому це важливо: перехід від 136 до 150 у широко зрозумілому показнику стискає складний зсув можливостей у простий сигнал. Для підприємств цей сигнал безпосередньо впливає на рішення щодо автоматизації, бюджетів на програмне забезпечення та планування штату. Для ринків це додає ще одну змінну поряд з ставками, інфляцією та очікуваннями зростання.

OpenAI представила свою найкращу та найефективнішу модель для професійної роботи, з покращеним кодуванням, використанням інструментів та комп’ютерним забезпеченням, а також контекстним вікном до 1 мільйона токенів. У тому ж релізі OpenAI заявила, що GPT-5.4 досягла нового рівня мистецтва на GDPval і перевищила людську продуктивність на OSWorld-Verified.

Ці показники окремі від публічного тесту IQ, проте напрямок руху збігається. Можливості зростають у різних системах вимірювання, і це зростання стає достатньо швидким, щоб впливати на бюджетування, плани найму, проектування робочих процесів та витрати на програмне забезпечення.

Бал 150 у публічному тесті IQ стискає ширший рух можливостей у один компактний сигнал. Цифра легко зрозуміла, навіть до того, як буде обговорювана методологія.

Раніший результат о3 Менси встановив показник і його межі.

показав, як OpenAI розширює корисність моделі у довгострокових кодах та задачах з документів, а також наш аналіз прогресу моделі, пов’язаного з розширенням апаратного забезпечення, фінансовими циклами та інфраструктурним попитом.

Взяті разом, ці розробки розміщують останній бал IQ у ширшому комерційному та економічному контексті. Перехід від 136 до 150 у публічному показнику вражаючий сам по собі. Перехід від 136 до 150, коли OpenAI просунувся глибше у використання інструментів, комп’ютерного забезпечення, продуктивності підприємств та капіталоємної інфраструктури, має ширші наслідки.

Публічні показники IQ обмежені, проте крива можливостей продовжує зростати Публічні тести IQ залишаються недосконалими інструментами для вимірювання моделей передового досвіду.

проводить публічний тест Менси та також підтримує складніший приватний офлайн-тест.

Тести IQ стискають вузьку частину когнітивної продуктивності у одну цифру, що приховує варіацію по типах розуміння, контекстному xửванню, креативності та реальному вирішенні проблем.

Для штучного інтелекту та людей балів чутливі до дизайну тесту, експозиції тренувань та знайомості з моделями, що робить їх шумним проксі для загальної можливості.

Бал IQ 150 знаходиться на крайньому верхньому хвості розподілу, часто асоціюється з людьми, такими як Альберт Ейнштейн або Річард Фейнман. У практичних термінах це означає дуже швидке абстрагування, сильне визнання моделей та здатність орієнтуватися у складних, багатокрокових проблемах з обмеженим керівництвом.

Платформа повідомляє про балів як рухомі середні за останні завершення, а методологія викликає знайомі питання щодо структури запитів, репродуктивності, забруднення тренувальної вибірки та знайомості з форматом. Ці проблеми вже були видні, коли, і залишаються активними зараз, коли GPT-5.4 Pro знаходиться на рівні 150.

Навіть з цими обмеженнями, ширший паттерн став важче відкинути. Одна ізольована результат тесту можна пояснити як прикмету. Кластер здобутків у публічних тестах IQ, кодуванні, використанні браузера, навігації на робочому столі та продуктивності знань несе більше аналітичної ваги.

TrackingAI розміщує GPT-5.4 Pro на вершині свого публічного рейтингу IQ, попереду всіх моделей Cluade, Gemini, Qwen та Grok, надаючи зовнішній, зрозумілий публічний показник, який швидко відображається на ширшому дискусії щодо можливостей.

Мало хто потребує детального розуміння дизайну тесту, щоб зрозуміти, що 150 знаходиться у рідкому діапазоні, і інвесторам не потрібно приймати кожну передумову за тестом IQ, щоб визнати, що стрибок такого розміру свідчить про прискорення, а не дрейф.

Діаграма під назвою “Результати тесту IQ штучного інтелекту” показує середній бал Менси Норвегії для основних моделей штучного інтелекту на кривій Гауса, з варіантами GPT-5.4 від OpenAI, розміщеними біля верхнього кінця діапазону.

Корпоративні покупці також не потребують віри, що IQ дорівнює загальному інтелекту, щоб побачити, що системи з сильнішим визнанням моделей, сильнішим використанням інструментів та сильнішим довгостроковим xửлянням завдань рухаються до економічно корисної території, розширюючи її далеко за межі розв’язування головоломок.

Це вказує на системи, які можуть шукати, планувати, верифікувати, навігацію та виробляти реальну роботу у розширених контекстах. У такому середовищі бал IQ функціонує менше як цифра новинки, а більше як сигнал густини передового розуміння.

Є також конкурентна цінність у самому рейтингу. Лідерська позиція на публічному показнику підкріплює становище OpenAI у гонці за видимим лідерством у можливостях, особливо у момент, коли диференціація моделей стає все важче розрізнити лише за архітектурними нотами.

Лідерство у показниках стискає складність у просту ієрархію. Воно пропонує розробникам сигнал, корпоративним покупцям – оповідь, інвесторам – ще один проксі для того, де зараз знаходиться межа можливостей.

Зростання OpenAI у показниках починає перекриватися з економічною тижднем вперед Тиждень вперед все ще проходить через макро. Бюро статистики праці чітко викладає наступні ключові випуски: з 17 по 18 березня, який очікується 8 квітня; , який очікується 10 квітня; і , який очікується 14 квітня.

Цей графік тримає ставки, інфляцію та тривогу щодо зростання на передньому плані, проте під поверхнею формується другий економічний трек, і OpenAI знаходиться біля його центру.

Зростання можливостей у передовому штучному інтелекті все більше перетинається з розподілом капіталу. Модель, яка просунувся вище у публічних тестах розуміння, а також покращила кодуванні, пошуку та використанні комп’ютера, змінює те, як підприємства думають про переробку робочих процесів. Це змінює те, чого очікує покупець програмного забезпечення від копілотів та агентів. Це змінює те, як швидко підприємства рухаються від експериментів до розгортання.

Джек Дорсі недавно повідомив, що Block рухається “від ієрархії до інтелекту”, використовуючи штучний інтелект для взяття на себе координаційної роботи, раніше виконуваної керівництвом, оскільки компанія реорганізується навколо індивідуальних учасників, безпосередньо відповідальних осіб та тренерів Можливості зростання також змінюють, які завдання можна виділити з структури витрат на працю та призначити програмному забезпеченню. Ці ефекти рухаються через вузькі канали спочатку, включаючи робочі потоки документів, робочі потоки таблиць, підтримку клієнтів, дослідницькі завдання, автоматизацію браузера, внутрішні операції, генерацію коду та верифікаційні цикли.

Комерційна напрямок OpenAI підкріплює цю інтерпретацію. У своїй моделі GPT-5.4 компанія описала сильнішу продуктивність у професійній роботі, сильніше пошукове використання інструментів, рідне використання комп’ютера та здобутки у показниках знань по всіх професіях, які відображаються безпосередньо на економіці США.

Це розміщує зростання можливостей штучного інтелекту всередині знайомого ринку питання, де потоки витрат, якщо ці системи продовжують покращуватися за цією швидкістю.

Відповідь розширюється за межі доходів від підписки на модель у вимоги до хмарних обчислень, чіпів, центрів даних, мереж, енергії, ліцензій на програмне забезпечення та припущень щодо продуктивності праці. Розширюючийся капітальний цикл OpenAI вже відображає частину цієї структури, а зростання показників додає простий публічний сигнал на вершину.

Це перекриття надає останньому результату ширшу актуальність під час макро-важливого тижня. Ринки вже знають налаштування CPI. Ринки вже знають, що ціни на нафту можуть вплинути на очікування інфляції. Ринки вже знають, що хвилинки Феду будуть проаналізовані щодо тона політики.

Але чи зростання інтелекту самого по собі починає поводитися як макро-змінна? Швидше зростання можливостей може змінити плани корпоративних витрат, посилити конкурентний тиск по білій коларі, підтримати більші інфраструктурні витрати та зміцнити аргументи для капітальних витрат, пов’язаних зі штучним інтелектом, навіть у середовищі повільнішого номінального зростання.

Коли показує GPT-5.4 Pro на рівні 150, цифра знаходиться у ринку, який вже розглядає OpenAI як щось більше, ніж лабораторію. Це платформна компанія, компанія з розгортання, клієнт інфраструктури та сигнальний генератор для суміжних секторів.

Наступний тест знаходиться у двох місцях одночасно. Одне – методологічне; публічні показники IQ продовжують піддаватися критиці, і повинні. Інше – економічне; ринки вирішать, крок за кроком, чи заслуговують стрибки такого розміру на те, щоб бути оціненими поряд з даними про працю, очікуваннями ставок та капітальними витратами.

Останнє зростання показників OpenAI підштовхує це рішення ближче. Бал компактний, зрозумілий та легко поширений. Його глибша актуальність походить з того ж місця, що й ширший поштовх продукту компанії; межа все ще зростає, а економічний слід цього зростання стає важче тримати у окремій категорії.

Пост вперше з’явився на.

За матеріалами CryptoSlate