Возможность на лету редактировать видеоматериал представляется многим современным пользователям чем-то действительно уникальным и невообразимым – и в принципе, так оно и есть, поскольку даже при всем комплексе современных технологий и подходов, мы все еще не можем в режиме реального времени изменять визуальные паттерны видео и тем более речь. Однако объединенная команда разработчиков в сфере искусственного интеллекта из Стэнфорда, Принстона, Университета Макс Планка и компании Adobe все-таки сумела приблизиться к такому будущему, представив свой новый интересный проект специальных глубоких алгоритмов, умеющих менять видео и аудиоданные.
Проще говоря, при помощи разработанных специалистами алгоритмов они могут отредактировать видеоролик таким образом, чтобы не только изменить положение человека в кадре и паттерны движения его конечностей, но также то, что он говорит. Выглядит это так – программа алгоритмов запускается и начинает обрабатывать и анализировать видеоролик, на что ей требуется около получаса, а затем при помощи собственной базы данных нейросетей начинает несколько менять положение мимики говорящего.
После того, как алгоритмы воссоздают полный 3D-объект головы, они переходят к изменению аудиопотока, подставляя подходящие по движению губ слова – а то, что нельзя заменить сразу, так или иначе заменяется посредством модификации мимики. Конечно, данный способ нельзя назвать быстрым и интуитивным, так как он осуществляется некоторое продолжительное время и требует определенных пользовательских навыков.
Тем не менее, полученные результаты по разработке просто не могли не удивить разработчиков, поскольку они ожидали несколько менее высокий уровень точности и разносторонности своей работы. В то же время становится очевидно, что данная разработка не появится на коммерческом рынке, поскольку представляет собой по умолчанию достаточно высокую опасность использования с теми или иными злонамеренными целями.