Программист из супермаркета в одиночку создал ИИ-генератор бесконечных миров и попал на конференцию SIGGRAPH 2026

Независимый исследователь в одиночку, на одной потребительской видеокарте и без какого-либо финансирования, провёл работу, которую приняли на престижную конференцию SIGGRAPH 2026.

Александр Гослин (Alexander Goslin), днём работающий программистом (SWE) в Walmart, располагал лишь одной RTX 3090 Ti, без научного руководителя или команды. По его собственным словам, это первая в истории SIGGRAPH независимая статья по машинному обучению.

https://www.youtube.com/watch?v=EwvN6MklrWw

Работа содержит два ключевых вклада:

  • InfiniteDiffusion – представляет новый подход к бесконечной генерации с помощью диффузионных моделей

  • Terrain Diffusion – заявлен как первый в мире обучаемый процедурный генератор ландшафта

Чтобы понять значимость, стоит вспомнить контекст. Десятилетиями процедурные миры строились на функциях процедурного шума, таких как шум Перлина, которые быстры и бесконечны, но ограничены в реалистичности и крупномасштабной связности. Диффузионные модели, наоборот, дают высокую детализацию, но обычно заперты в пределах ограниченного полотна.

Раньше бесконечные ИИ-изображения опирались на авторегрессию, то есть расширение картинки по одному тайлу за раз. Качество получалось хорошим, но с практическими сложностями:

  • при "телепортации" на 100 тайлов в сторону приходится сгенерировать все 100

  • результат зависит от порядка сэмплирования, так что он невоспроизводим

  • процесс по своей природе последовательный и не распараллеливается

  • всю историю нужно хранить вечно, поэтому масштабироваться бесконечно не выходит

InfiniteDiffusion снимает все четыре проблемы и при этом не требует обучения. Будучи детерминированным, с произвольным доступом и фактически без сохранения состояния, он даёт следующее:

  • миры передаются одним лишь сидом

  • телепортация работает за O(1) вместо O(n)

  • поддерживаются мультиплеер и распределённые кластеры

  • постоянное хранилище не требуется вовсе

В итоге метод наследует тот же "контракт", что 40 лет делал процедурный шум основой генерации миров. Любую область можно эффективно запросить независимо, в любой момент и в любом порядке, а результат гарантированно совпадёт вне зависимости от предыдущих запросов.

Благодаря этому диффузия способна питать тот же класс приложений, только теперь с бесконечными обучаемыми мирами.

https://www.youtube.com/watch?v=irE4tcDtUIg

Флагманское применение – Terrain Diffusion, создаёт бесконечное число континентов в каждом мире, и каждый континент простирается на миллионы квадратных километров. С помощью новой техники под названием лапласово шумоподавление (Laplacian Denoising) каждый мир покрывает весь диапазон высот Земли, от 11 000 м ниже уровня моря в Марианской впадине до 9 000 м на Эвересте, сохраняя точность вплоть до долей метра.

При этом метод быстр. На одной RTX 3090 Ti генерация ландшафта обгоняет пролёт спутника в 9 раз и требует всего 1,5 ГБ видеопамяти.

Самая популярная реализация Terrain Diffusion представляет собой мод для Minecraft на Fabric, заменяющий генератор мира, и поиграть с ним можно уже сейчас на любой современной видеокарте.

Код на Python открыт и включает API для собственных экспериментов, а сама статья лежит на arXiv. Конференция SIGGRAPH 2026 пройдёт с 19 по 23 июля в Лос-Анджелесе.

Больше статей на Shazoo
Тэги:

Об авторе

Эксперт по Fallout
Главный редактор
Более 16 лет в индустрии освещения видеоигр, кино, сериалов, науки и техники. Особенно разбираюсь в серии Fallout, ценитель The Elder Scrolls. Поклонник Arcanum и Fallout Tactics. Больше всего играю в Civilization, Old World и градостроители. Изучаю ИИ и загадки космоса.