Світ штучного інтелекту невпинно дивує своїми досягненнями, і остання розробка від OpenAI – відеогенератор Sora 2 – є яскравим підтвердженням цього. У лютому 2024 року, коли OpenAI – провідна дослідницька лабораторія у галузі штучного інтелекту, що стоїть за такими революційними продуктами, як ChatGPT – вперше анонсувала свою модель для створення відео, названу Sora, це стало справжньою подією. Однак повноцінний вихід відбувся лише у грудні, коли вона стала доступною для передплатників ChatGPT Plus та Pro. Ці підписки пропонують користувачам розширені можливості та переваги у взаємодії з передовими моделями штучного інтелекту. Завдяки Sora, користувачі могли створювати відеоконтент, просто вводячи текстові описи або інші підказки. Візуальна якість цих роликів була дійсно вражаючою, проте їм бракувало одного вагомого елементу – звуку. Саме ця прогалина стала головним оновленням, яке приносить із собою Sora 2.
Новий відеогенератор Sora 2 від OpenAI тепер збагачений інтегрованим звуком, що проявляється у синхронізованих діалогах та звукових ефектах. Це значне вдосконалення було представлено 30 вересня. Сама компанія описує нову модель як таку, що «здатна на речі, винятково складні, а в деяких випадках абсолютно неможливі для попередніх систем генерації відео». Sora 2 майстерно долає обмеження, притаманні її попередниці, особливо у царині реалістичності відео. У першій версії, анімації часом здавалися нестійкими, ніби алгоритм забував застосовувати елементарні закони фізики до створюваних відеоматеріалів. OpenAI пояснювала це надмірним оптимізмом моделі, її схильністю занадто покладатися на буквальне виконання запитів, замість того щоб підтримувати візуальну правдоподібність.
Окрім значно покращеної реалістичності, Sora 2 представляє абсолютно нову функцію під назвою «Камео» (Cameos), яка запускається одночасно з мобільним застосунком Sora для iOS. Ця інновація дозволить користувачам інтегрувати власну подобу у згенеровані відео. Для цього достатньо записати коротке одноразове відео та аудіо, щоб підтвердити свою особу. Після верифікації, Sora 2 зможе помістити вас у будь-яку згенеровану сцену, зберігаючи точне відтворення вашої зовнішності та голосу. Ця технологія працює не лише з людьми, а й з тваринами та навіть об’єктами, що відкриває широкі можливості для творчості. Це також пояснює, чому OpenAI називає Sora 2 своїм «моментом GPT-3.5» для відео. Ця фраза натякає на аналогічний стрибок уперед, який відбувся у царині мовних моделей з виходом GPT-3.5 – значного етапу в розвитку генеративного ШІ, що змінив уявлення про можливості автоматичного створення тексту. Отже, Sora 2, подібно до свого текстового аналога, знаменує собою багатопоколінний прорив у сфері візуального контенту.
Доступ до Sora 2 та структура ціноутворення

OpenAI застосувала дуже продуманий стратегічний підхід до запуску Sora 2. Спочатку модель стала доступною в США та Канаді за запрошеннями, а вже потім компанія представила її на азійському континенті, зокрема в Японії, Південній Кореї, Таїланді, В’єтнамі та на Тайвані. Такий поетапний вихід дозволяє ретельно адаптувати продукт до різних ринків та збирати відгуки від перших користувачів. Доступ лише за запрошеннями означає, що наразі користувачі, які бажають скористатися застосунком Sora (що містить Sora 2), мають приєднатися до списку очікування для iOS, перш ніж отримати можливість безкоштовно використовувати стандартну версію моделі. Інтеграція Sora 2 для Android ще не анонсована, проте застосунок Sora для Android (з першою версією моделі) було запущено цього місяця, і він зібрав близько 470 000 завантажень у перший день.
Щодо ціноутворення, Sora 2 працює за кредитною системою. Кожне створене відео вимагатиме певну кількість кредитів, яка залежить від роздільної здатності, тривалості та обраної моделі – стандартної чи професійної. Поточна версія для iOS та вебу дозволяє лише запрошеним користувачам безкоштовно використовувати стандартну версію Sora 2. Це включає всі основні можливості, як-от генерація відео, звукові ефекти та базове редагування. Проте, якщо ви маєте місячну передплату ChatGPT Pro вартістю 200 доларів, ви отримуєте доступ до Sora 2 Pro без додаткової оплати. Ця професійна версія забезпечить вам доступ до генерації відео вищої якості, хоча вона все ще перебуває на експериментальній стадії.
Вартість створення відео за кредитною системою розподіляється наступним чином: для стандартної версії Sora 2, 10-секундні відео коштуватимуть 10 кредитів і дадуть одну генерацію, тоді як 15-секундні – 20 кредитів за дві генерації. Для Sora 2 Pro, що доступна виключно для передплатників ChatGPT Pro, 10-секундні відео стандартної роздільної здатності обійдуться у 40 кредитів, забезпечуючи чотири відеогенерації; 15-секундні – 80 кредитів за вісім генерацій; а 25-секундні відео – 120 кредитів за дванадцять генерацій. Високоякісні 10-секундні та 15-секундні відеокоштуватимуть 250 та 500 кредитів відповідно, надаючи 25 та 50 відеогенерацій. OpenAI також оголосила про свої наміри інтегрувати Sora 2 в API, підтвердивши, що Sora 1 Turbo залишатиметься доступною для використання.
