Эксперты вычисляют ИИ-картинки анализируя физику – вместо корявых пальцев теперь смотрят на тени и точки схода

Современные ИИ-генераторы изображений серьёзно продвинулись и почти избавились от привычных артефактов, по которым раньше распознавали фейки – покорёженных рук, лишних пальцев и нечитаемого текста.

Эксперты по криминалистике изображений всё чаще опираются на законы физики, которые большие языковые модели до сих пор не понимают.

Согласно выводам авторов новой работы, нынешние модели стремительно улучшают качество картинок, но остаются принципиально несведущими в том, как в реальном мире ведут себя свет и геометрия.

Анализ простых вещей вроде отражений и теней по-прежнему выдаёт сгенерированные изображения. Этот разрыв в знаниях, по мнению специалистов, превратился в один из самых надёжных признаков отличия настоящих фотографий от ИИ-подделок.

Пионером подхода стал Хани Фарид – профессор Калифорнийского университета в Беркли, которого называют одним из основателей цифровой криминалистики.

Фарид сверяет мелкие детали с тем, как они должны выглядеть в реальности по физическим законам. По его словам, ИИ-генераторы до сих пор не усвоили базовый урок художественной школы – правило точки схода.

Профессор приводит в пример сгенерированную картинку с марширующими по коридору солдатами. Помимо очевидных ошибок вроде искажённого текста и обрывающихся в никуда цепей, у изображения есть и более тонкий просчёт – линии плиток на полу.

В реальности параллельные линии (плитка, паркет, рельсы) должны сходиться в одной точке схода на горизонте, а ИИ-модели регулярно игнорируют эту геометрию. Достаточно мысленно провести по фото несколько прямых, чтобы понять, физически правдоподобна ли сцена.

Похожим маркером выступают тени и отражения. Геометрия отбрасываемой тени напрямую завязана на форму объекта и положение источника света – точка на объекте, её тень и источник всегда лежат на одной прямой.

ИИ-модели часто рисуют тени, направленные в разные стороны при одном солнце, или ставят отражения, которые невозможно получить из показанного ракурса.

Параллельно исследователи предостерегают и от слепого доверия автоматическим ИИ-детекторам. Часть из них действительно работает точнее неподготовленного зрителя, однако такие инструменты резко теряют в качестве на изображениях, заметно отличающихся от их обучающей выборки. То есть на материале нового генератора или в нестандартной стилистике детектор может ошибаться чаще, чем кажется.

Отдельное исследование добавляет неожиданный поворот. Подтвердить подлинность настоящей фотографии нередко сложнее, чем уличить подделку, ведь чем дольше человек разглядывает изображение и не находит явных ошибок, тем выше вероятность, что снимок настоящий.

Получается, что само отсутствие нестыковок в картинке порой и становится главным доказательством её подлинности.

Больше статей на Shazoo
Тэги:

Об авторе

Эксперт по Fallout
Главный редактор
Более 16 лет в индустрии освещения видеоигр, кино, сериалов, науки и техники. Особенно разбираюсь в серии Fallout, ценитель The Elder Scrolls. Поклонник Arcanum и Fallout Tactics. Больше всего играю в Civilization, Old World и градостроители. Изучаю ИИ и загадки космоса.