OpenAI Sora 2: новая генеративная модель видео ИИ с максимальной точностью, реализмом и управляемостью

Sora 2 — последняя версия модели от OpenAI. Она точнее, реалистичнее и лучше управляется, чем предыдущие системы. Появятся синхронизированные диалоги и звуковые эффекты, а также улучшенная производительность, что особенно полезно начинающим AI-кинематографистам и цифровым художникам.
Генеративное видео ИИ уже стало реальностью. Вот всё, что нужно знать о Sora 2 — и это может вас удивить.
OpenAI представляет Sora 2
Sora 2 обещает выполнять задачи, о которых оригинальная Sora или любые другие генеративные модели видео могли только мечтать, включая сложные видеозапросы. OpenAI перечисляет такие примеры, как «олимпийские гимнастические упражнения, сальто назад на доске для гребли, точно моделирующие динамику плавучести и жёсткости, и тройные аксели, пока кошка борется за жизнь».
Предыдущие модели ИИ для видео будут казаться слишком упрощёнными по сравнению с возможностями рассуждений Sora 2, которая способна учитывать более тонкие нюансы физического мира. Это, в конечном итоге, приведёт к более реалистичным результатам, которые могут выглядеть кинематографично и, прежде всего, более естественно.
Генерация видео и аудио в Sora 2
Ещё одна важная новость: Sora 2 сможет создавать сложные звуковые фоны, речь и звуковые эффекты с высокой степенью реализма. Звук и аудио долгое время были одной из слабых сторон ИИ-видео и часто позволяли легко распознавать искусственный интеллект.
Теперь с Sora 2 всё может измениться: OpenAI сообщает, что модель может вставлять аудио в любую среду, сгенерированную Sora, точно передавая внешний вид и голос. Однако оценить, насколько хорошо это работает на практике, мы сможем только в ближайшие недели и месяцы, прежде чем назвать Sora 2 полноценным «полным комплектом», на который она претендует.
Доступность Sora 2
Sora 2 уже доступна, но это ещё не всё. OpenAI также запускает новое социальное приложение для iOS под названием «Sora», которое будет работать на базе Sora 2. Оно позволит создателям ИИ создавать, ремикшировать и делиться видео друг с другом в новом настраиваемом фиде Sora.
В ближайшее время мы узнаем больше как о приложении Sora, так и о возможностях моделей для AI-кинопроизводства. А пока, если вам интересно, вы можете попробовать Sora 2 сами на сайте OpenAI.

Это казалось неизбежным, и наконец появилась новость о том, что готовится полностью сгенерированный ИИ фильм. Новый фильм под названием Critterz поддерживается самим OpenAI вместе с партнёрами из Лос-Анджелеса и Лондона — Native Foreign и Vertigo Films.
Их цель — представить фильм на Каннском кинофестивале в следующем мае. Фильм создаётся почти полностью с помощью искусственного интеллекта.

Warner Bros. Discovery подала в суд на Midjourney за нарушение авторских прав в крупном судебном процессе, который может иметь серьёзные последствия для нынешнего состояния генеративного ИИ.

Компании, работающие с ИИ, находятся под пристальным вниманием за то, что они сканируют интернет и присваивают идеи.
Мы находимся, пожалуй, в самый важный момент в недавней истории Голливуда. И, на самом деле, для всех творческих людей. Компании ИИ испытываются в суде на предмет того, насколько им разрешено использовать свои программы для обработки идей, которые мы создали с нуля.
Они обучали своё программное обеспечение на наших материалах, и теперь сталкиваются с судебными исками из-за этого. Эти первые иски устанавливают прецеденты для того, как будут рассматриваться все последующие.

Одно из лучших качеств Netflix — их открытость в отношении своей политики и правил. И когда дело касается использования ИИ в ваших проектах, важно, чтобы всё было максимально ясно.
ИИ — одна из горячих тем, которая одновременно и спорная, и неизбежная. Он уже здесь, и нам нужно с этим работать. Но это не значит, что мы обязаны его использовать, и это не значит, что можно игнорировать правила.
Дело в том, что большинство компаний устанавливают очень конкретные случаи, когда можно применять ИИ, и Netflix — не исключение.
Давайте посмотрим на их правила.

Сгенерировано в Gemini Storybook
Новый генеративный инструмент Google, Gemini Storybook, превращает простые текстовые запросы и загруженные пользователем изображения в иллюстрированные и озвученные истории.
Одно из первых, что нас впечатлило в Storybook, — это возможность использовать изображения, текст и даже PDF-файлы с историями, чтобы сгенерировать детскую книгу. Всё, что нужно сделать, — загрузить материалы, и Gemini выдаст готовую историю.
Это могут быть истории с моралью, с объяснением устройства мира или просто смешные рассказы. Фактически любой может «выдать» книгу.

Showrunner — новый инструмент ИИ для создания контента. Он создан стартапом Fable (именно туда Amazon направил свои инвестиции). Они создают «Netflix на базе ИИ» — платформу, которая позволяет любому человеку создавать анимационные сериалы с помощью простых текстовых подсказок.
Чтобы продемонстрировать возможности инструмента, они создали эпизоды «Южного парка», сгенерированные ИИ, которые стали вирусными, но были удалены из-за обоснованных претензий по авторскому праву.

Недавнее исследование лаборатории AI for Good от Microsoft подчёркивает, насколько людям трудно распознать изображения, созданные ИИ. Согласно исследованию, способность распознавать такие изображения была «лишь немного выше, чем у подбрасывания монетки».
Runway выпустила новую AI-модель для видео, которая может редактировать существующий материал по текстовым подсказкам — в отличие от генерации синтетического видео с нуля.

Netflix сделал самый явный шаг в сторону контента, созданного с помощью ИИ, впервые публично подтвердив, что использовал генеративный искусственный интеллект для создания финальных визуальных эффектов в одном из своих проектов.
Это заявление, сделанное во время квартального отчета компании, знаменует собой серьёзную эскалацию в использовании стриминг-гигантом технологий ИИ и может стать переломным моментом для всей индустрии.

В то время как творческие люди продолжают разбираться с технологией искусственного интеллекта (ИИ) — как она вписывается в их рабочий процесс и стоит ли её использовать вообще — Google представила пример видео, созданного ИИ, используя «винтажную фотографию» в качестве основы.