Революция ИИ: как нейросети и дипфейки формируют новый мир

Коэн (NoW)

16:00, 1 марта 2020

Том Холланд и Роберт Дауни-младший не были главными героями фильма "Назад в будущее". Шварценеггер даже не пробовался на роль в "Старикам тут не место". А Дональд Трамп не снимался в сериале "Лучше звоните Солу".

Потому что все это не настоящие кадры, а демонстрация одного из самых продвинутых способов фальсификации изображений за многолетнюю историю.

Это текстовая версия видео, которое можно посмотреть в плеере ниже или на этой страничке.

Первые шаги

Первым фотоманипуляциям почти столько же лет, сколько и фотографии. Практика возникла вскоре после 1822 года, когда был изобретен процесс запечатления мира при помощи света, специальных пластин и химических веществ. Но несмотря на развитие технологий, метод создания подделок оставался физическим вплоть до появления цифровой съемки. При помощи двойной экспозиции получали комплексные сцены не имеющие ничего общего с реальностью, людей вырезали из кадров обычными ножницами или накладывали им чужие лица. Элементы закрашивали красками или стирали при помощи ластиков.

Долгие годы махинации оставались скрытыми — мало кому приходило в голову ставить под вопрос правдоподобность запечатленных моментов. Фотография была еще одной инновацией, захватывающей мир слишком быстро, чтобы обычные люди заметили подделку.

В начале 20 века на сцену вышел кинематограф. Индустрия быстро нашла применение манипуляциям, открыв новую область — визуальные эффекты.

Эти трюки оставались уделом профессионалов вплоть до наступления эпохи цифровой информации. Стремительное развитие компьютеров, программ визуализации и интернета позволило любому человеку не только создавать фальсификации за считанные часы, но и распространять их среди миллионов зевак.

Рождение дипфейков

В конце 2017 года наступил новый этап в области манипулирования фото и видео-контентом. Появились дипфейки.

Технология получила название два с половиной года назад, позаимствовав его у пользователя реддит. Суть заключалась в простой замене одних лиц на другие. Процесс можно сравнить с наложением виртуальной маски путем отслеживания ключевых точек на лице. Но эффект достигался совершенно другим способом. Для дипфейков применялось глубокое обучение — один из разделов машинного обучения, полагающегося на искусственные нейросети.

Первичные алгоритмы были сложны в использовании, однако нашлось достаточно желающих производить порнографические ролики с известными актрисами. Ничто так не способствует распространению технологий, как порно.

С тех пор были разработаны удобные инструменты, которые не требуют опыта с кодом и нейросетями для генерации дипфейков. Сегодня достаточно иметь мощный компьютер, а значительную часть работы софт выполнит самостоятельно.

Метод можно разделить на серию простых шагов, которые полагаются на два элемента: источник и цель.

Источник необходим для наполнения библиотеки отдельными кадрами и последующего вырезания лица. Достаточно одного видео или нарезки роликов, чтобы иметь набор информации для обучения нейросети.

Цель — это то видео, на которое будет накладываться лицо, вырезанное из исходного материала.

Комплект небольших программ выполняет всю скучную работу за человека, хотя концепция остается той же, что и сто лет назад. Отличие лишь в автоматизации. Для этого и применяются нейросети — они анализируют тысячи изображений с лицом источника и цели, отмечая черты и мимику. После сотен тысяч циклов обучения, которые могут занять дни даже на топовом железе, алгоритм конвертирует данные в окончательное видео.

Аналогичные нейросети позволяют масштабировать видео до 4K-разрешения, повышать частоту кадров, раскрашивать черно-белые ролики, превращать эскизы в полноценные картинки. Примитивный искусственный интеллект поддается обучению тысячам задач, которые сегодня выполняют люди.

Несмотря на впечатляющие результаты, мы находимся на ранних стадиях индустрии, способной изменить наше представление о будущем.

Производители железа предлагают решения, ускоряющие процессы обучения нейросетей и скорость только будет расти. Со временем появятся комплексные приложения, выполняющие все шаги по генерированию дипфейков. За ними последуют сервисы, предлагающие услуги по кастомизации фильмов, сериалов и игр. Достаточно выбрать актера, которого хочешь видеть в очередном фильме про Джеймса Бонда, а нейросеть заменит лицо и голос.

Посмотрите на современные социальные сети, с персональными лентами новостей и кастомными фидами — мы уже потребляем контент, подобранный алгоритмами специально для нас. Так что появление опций настройки актерского состава — это вопрос времени.

Однако лишь актерами мы ограничиваться не станем. Нейросети смогут генерировать окружающую среду, персонажей в играх, локации, которые не выглядят искусственными и сложные, многоуровневые квесты. Без работы разработчики в любом случае не останутся. Кому-то будет необходимо обучать, контролировать и настраивать процессы.

То же касается аниматоров — художникам не придется тратить месяцы на оживление персонажей. Достаточно будет установить ключевые точки и описать цель. Специально обученная нейросеть заполнит пробелы и отметит моменты, требующие ручной доработки.

Необходимо придумать нового персонажа? Не проблема — уже сейчас есть нейросети, генерирующие уникальных аниме-персонажей по заданным параметрам. Есть нейросети, которые пишут небольшую биографию на основе имени и нескольких слов.

Никак не решите, как назвать личный космический корабль? Нейросеть поможет и с этим. Как насчет "Горячего пирожка" или "Восьми злобных чувств пончика".

Алгоритмы для написания хитовых песен. Ремастеры старых игр. Создание несуществующих людей. Воображение новых видов спорта.

Нейросети уже придумывают новые лекарства, помогают с анализами и диагностикой. В будущем они станут основой медицинских роботов, оказывающих персональную помощь быстро и с минимальными ошибками.

Нет ни одной области, в которой нельзя найти применение нейросетям. Даже монтаж роликов для ютуба будет автоматизирован. Adobe уже активно применяет искусственный интеллект, помогая в обработке фотографий и видео. Скорость и качество будут только развиваться.

С одной стороны, все это может звучать жутко. Получается, что нейросетевые сервисы начнут массово вытеснять людей. Действительно, зачем держать десятки художников, если нейросеть справляется быстрее, лучше и дешевле? Зачем сотни человек в отделах поддержки, когда пара алгоритмов работает эффективнее и не попросит перерыв на обед? Просто задумайтесь о том, какие обязанности вы выполняете сегодня и задайте себе вопрос — а можно ли их автоматизировать?

Не впадайте в панику — еще рано. До момента, когда наступит такая реальность, пройдет много лет.

В свое время автомобили вызывали страх, что миллионы людей и лошадей останутся без работы. Но вместе с распространением двигателей внутреннего сгорания, появилось еще больше профессий. Телевидение не уничтожило радио, а открыло новые направления. Интернет значительно снизил объемы печатной продукции, но создал сотни высокотехнологичных специализаций.

Мир будет меняться, мы будем ворчать о том, как в старые добрые времена было лучше, но в конечном счете прогресс выйдет победителем.

Нам остается только следить за его шагом, наслаждаться плодами и присматривать работу погонщиков нейросетей.

Иллюстрации в тексте: Markus "Braxxy" Brackelmann, Davison Carvalho, Mark Chang
Арт в шапке: Diana Tsareva

Больше статей на Shazoo

Nvidia заработала более 26 миллиардов долларов за квартал благодаря спросу на ИИ
GPU Nvidia Blackwell могут стоить до $35,000, а ИИ-серверы — до $3 миллионов
Илон Маск: К концу 2024 года возможности Tesla по обучению ИИ будут эквивалентны примерно 85 000 чипов Nvidia H100

Тэги:

Читать комментарии на сайте

Революция ИИ: как нейросети и дипфейки формируют новый мир

Первые шаги

Рождение дипфейков

Статьи

Как работает наука, технологии и культура в Civilization 7

6 интересных градостроительных игр, выходящих до конца 2024 года (и несколько на следующий год)

Ghost of Yotei может стать отличным примером соединения культур — японской истории и жанра вестерн

Знакомство с телевизором Hisense U7NQ Mini-LED PRO