Эмо ой - Одри Хепберн.

EMO AI: искусственный интеллект заставляет людей петь по фотографиям

Аватар Жоау Лукаса Батисты
Новый ИИ, разработанный группой Alibaba, удивляет реалистичностью создания видео поющих людей по фотографиям. Посмотреть примеры

недавно выпущенный Эмо ИИ, искусственный интеллект группы Алибаба, вызвало большой резонанс в Интернете. Инструмент создает видео из фотографий, заставляя аватара петь песни на разных языках с удивительной реалистичностью.

Этот сегмент искусственного интеллекта за прошедшие годы добился значительного прогресса, ранее он появлялся в области редактирования фотографий, когда с помощью приложений можно было менять лица с кем-то, добавлять фильтры и использовать другие функции. Сейчас симуляция действий в видеороликах вызвала большой интерес со стороны пользователей Интернета, главным образом, благодаря реалистичности, примененной к этому контенту.

Что такое ЭМО ИИ?

Портрет женщин с разными выражениями лиц и прическами, иллюстрирующий использование технологии искусственного интеллекта для создания реалистичных видеороликов.
Как работает EMO AI. Изображение: Репродукция/ЭМО: Эмоция «Живой портрет»

A EMO AI: Живой портрет эмоций — это инструмент для создания аудиовизуального контента посредством распространения сверхреалистичного аудио и видео — или изображений.

A IA Основное внимание уделяется точному и достоверному моделированию черт лица модели в ситуациях, которые можно вообразить по фотографии. Возможно создание музыкального клипа по фотографии человека, где персонаж может спеть популярную песню, двигая губами и мышцами лица, правильно произносить текст в реалистичных позах.

По мнению разработчиков Институт интеллектуальных вычислений, из группы Алибаба, видео, созданные Эмо ИИ Они могут иметь любую продолжительность, в зависимости только от размера аудиофайла, вставленного для создания видео.

Как работает ИИ?

На основе методологии, используемой профессионалами, EMO Ему нужно только изображение, которое послужит основой для создания видео, созданного искусственным интеллектом. Затем вы должны вставить аудиофайл, чтобы инструмент мог создать видео с интерпретацией персонажа, синхронизируя движения губ с текстами песен и анимируя человека до тех пор, пока существует аудиофайл.

См. ниже видео с использованием EMO AI.

https://www.youtube.com/watch?v=3K5VCQedbT8
Примеры использования EMO AI для создания видео с помощью AI. Видео: YouTube/AI Drop

В видео выше используется аниме-рисунок для создания сцены, моделируемой искусственным интеллектом. О Эмо ИИ ему также удалось удовлетворительно и убедительно передать движения лица и губ персонажа.

Структура инструмента EMO AI

Методика, использованная при разработке Эмо ИИ был применен именно с целью улучшения качества видео, создаваемых ИИ. Исследователи стремились найти альтернативные способы повышения качества результата.

В связи с этим на начальном этапе процесса, называемого Кодирование кадров, нейронная сеть под названием РеференсНет извлекает особенности из одного эталонного изображения путем моделирования кадров движения. Этот процесс кодирования закладывает основу видео.

Затем с помощью кодировщика включается звук и применяются маски для лица, которые обеспечивают реалистичные движения лица. Завершая процесс, механизм Магистральная сеть отвечает за сохранение личности персонажа и корректировку скорости движения лица.

Лучшие методы генерации видеокадров с использованием искусственного интеллекта и глубокого обучения.
Этапы производства контента с помощью EMO AI. Изображение: Репродукция/ЭМО: Эмоция «Живой портрет»

Несмотря на инновационный процесс, разработчики Alibaba в своей научной статье сообщают, что обнаружили в модели ограничения. Они указали, что Эмо ИИ на создание контента уходит больше времени, чем у других ИИ в том же сегменте, и в некоторых случаях в видео могут появляться и другие части тела, например, руки персонажа.

Поиск ИИ, имитирующих действия

С ростом совместимости ИИ с существующими операционными системами на мобильных телефонах поиск этих инструментов в последние годы резко возрос. В настоящее время можно найти несколько вариантов приложения, которые изменяют лицо пользователя на известное, состаривают его, омолаживают, корректируют мимику и другие функции.

Среди этих возможностей, Deepfake , что является результатом сопоставления лиц или их замены с помощью ИИ. Этот ресурс можно использовать в разных целях: юмористических, политических или даже порнографических. Что касается политики, то в Бразилии TSE включила тревогу по этому поводу, уже предвидя использование Deepfake на октябрьских выборах этого года.

В этом случае Deepfake Это полная тарелка для поддельные новости, поскольку они обычно изображают кандидата в лживых ситуациях или имитируют спорные речи, о которых он никогда не говорил, мотивированные политическими интересами.

Мужчина в рубашке с узором держит старинную монету, улыбается, и приведено сравнение фотографий.
Использование Deepfake сменить лицо мальчика слева на американского актера Тома Круза. Изображение: Репродукция

EMO AI создает выражения на нескольких языках

Еще один барьер, преодолеваемый ИИ, в том числе Эмо ИИ, — это производство видеороликов на разных языках. Эти технологии понимают разные языки, звучание их слов и их произношение. Благодаря этому можно создавать аудиовизуальный контент на многих языках.

Женщина, созданная искусственным интеллектом, поет на китайском языке. Репродукция/ЭМО: Эмоция «Живой портрет»

Посмотрите больше видео, созданных EMO AI, ниже

Персонаж Джокер (Joker, 2019) основан на кадре из фильма, использованного в ЭМО. Видео: Репродукция/ЭМО: Эмоция «Живой портрет»
Актер Леонардо Ди Каприо поет Эминема с помощью искусственного интеллекта. Репродукция: EMO: Emote Portrait Alive

Fontes: НовадАлс, Arxiv, Гуманэйгк.

См. также:

Рассмотрено Главкон Витал от 28.


Узнайте больше о Showmetech

Подпишитесь, чтобы получать наши последние новости по электронной почте.

Похожие сообщения
Смартфоны Galaxy A57 и Galaxy A37 появились в Бразилии. Оцените новые возможности! На новые модели распространяется 6-летняя гарантия обновлений и улучшений производительности, качества сборки, камер и функций искусственного интеллекта. Подробнее:

В Бразилии появились смартфоны Galaxy A57 и Galaxy A37. Оцените новые возможности!

Новые модели поставляются с шестилетней гарантией обновлений и улучшений производительности, качества отделки, камер и функций искусственного интеллекта. Ознакомьтесь с ними:
Виктор Пачеко аватар
Читать дальше
Google выпустила приложение для Windows. Узнайте, как его скачать. Новое приложение работает как плавающее поле поиска, использующее искусственный интеллект для поиска файлов на вашем ПК, выполнения веб-поиска и даже интерпретации того, что вы видите на экране. Подробнее.

Google выпустила приложение для Windows. Узнайте, как его скачать.

Новое приложение функционирует как плавающее поле поиска, использующее искусственный интеллект для поиска файлов на вашем ПК, выполнения веб-поиска и даже интерпретации того, что вы видите на экране. Узнайте больше.
Александр Маркес Аватар
Читать дальше
Смартфон Galaxy S26 Ultra был признан лучшим смартфоном по версии Consumer Reports. Американская организация, известная проведением тщательных тестов продукции, выделила такие аспекты, как производительность, защита конфиденциальности на экране, камеры и время автономной работы смартфона Samsung. Подробнее.

Смартфон Galaxy S26 Ultra был признан лучшим смартфоном по версии журнала Consumer Reports.

Американская организация, известная проведением тщательного тестирования продукции, выделила такие аспекты, как производительность, защита конфиденциальности на экране, камеры и батарея смартфона Samsung. Узнайте больше.
Виктор Пачеко аватар
Читать дальше