BTC $81,764 ▲ 0.212% ETH $2,339 ▼ 0.64% BNB $664 ▲ 0.008% SOL $98 ▲ 1.912% BTC $81,764 ▲ 0.212% ETH $2,339 ▼ 0.64% BNB $664 ▲ 0.008% SOL $98 ▲ 1.912%
Технології

OpenAI створила «думаючий» генератор зображень

Фірма OpenAI випустила «розмисляючий» генератор зображень ChatGPT Images 2.0 — «передовую модель, здатну розв’язувати складні візуальні завдання та створювати точні, готові до використання роботи».

Привітайте ChatGPT Images 2.0! Наявиться передову модель, здатна виконувати складні візуальні завдання та створювати точні, миттєво використовувані візуалізації, із гострішою редагуванням, багатшою композицією та інтелектом рівня мислення.

Відео створено з допомогою ChatGPT Images — OpenAI (@OpenAI) У компанії підкреслили «якісний стрибок» у виконанні інструкцій, точному розподілі та співвідношенні об’єктів, а також у візуалізації щільного тексту.

Модель впевнено працює із декількома мовами та самостійно заповнює пробіли в запиті, опираючись на візуальний та загальний контекст Як результат користувач отримує потрібний результат зі зниженням кількості уточнень.

Точність та контроль ChatGPT Images 2.0 справляються зі складними концепціями та точно втілюють їх візуально.

Модель виконує інструкції, зберігає вказані деталі та відображає дрібні елементи з роздільною здатністю до 2К.

Більша точність та контроль ChatGPT Images 2.0 можуть концептуалізувати більш складні зображення та потім ефективно реалізувати цю візію в життя.

Модель здатна виконувати інструкції, зберегти запиту деталями та відобразити дрібні елементи, які часто порушують зображення… — OpenAI (@OpenAI) Робота зі стилями ChatGPT Images 2.0 більш точно передає характерні особливості фотографій, кінематографічних кадрів, піксельної графіки, маньги та інших візуальних стилів.

LLM забезпечує високий рівень згоди textures, освітлення, композиції та дрібних деталей.

Така точність може бути корисною при створенні ігрових прототипів, розробці сторибордов, підготовці маркетингових матеріалів та створенні робіт у певному медиаформаті або жанрі.

Уміє мислити ChatGPT Images 2.0 — перша модель OpenAI для роботи із зображеннями, здатна розводити логіку перед генерацією.

У поєднанні з ChatGPT модель здатна шукати інформацію в інтернеті в реальному часі, створювати декілька варіантів за одне промпту, перевірити результати та генерувати робочі QR-код.

«Це дозволяє моделям взяти на себе більшу частину важкої роботи між ідеєю та зображенням, особливо коли точність, актуальність інформації, згода та візуальна цілісність мають перший план», — твердять у OpenAI.

Модель підтримує співвідношення сторін від 3:1 за ширину до 1:3 за висоту

Вона доступна користувачам ChatGPT та Codex.

Функція Images with thinking наявна у тарифних планах ChatGPT Plus, Pro та Business.

Омеженому числу користувачам доступ до нової ІІ-моделі GPT-5.4-Cyber.


За матеріалами ForkLog

Штучний інтелект підштовхує зростання звітів про баги Kalshi та Polymarket розпочнуть бессрочні фьючерси