ИИ выучил стандартную модель Вселенной и стал хуже замечать новую физику

Космологи из Принстона и Института Флэтайрон проверили, способна ли нейросеть, обученная на стандартной модели Вселенной, искать физику за её пределами.

Результат оказался двойственным: ИИ заметно ускорил расчёты, но заодно приобрёл предвзятость, которая мешает находить именно то, ради чего его обучали.

Контекст проблемы прост. Стандартная модель космологии ΛCDM отлично описывает расширение Вселенной и распределение галактик, однако физики уверены в её неполноте – на новую физику могут указывать массивные нейтрино, модифицированная гравитация или меняющаяся со временем тёмная энергия. Проверка таких расширенных сценариев требует симуляций, которые обходятся значительно дороже стандартных, а без них невозможно делать серьёзные выводы из данных наблюдений.

Команда применила метод переноса обучения. Сначала нейросеть тренировали на дешёвых симуляциях ΛCDM, чтобы дать ей общее представление о том, как устроена Вселенная, и лишь затем дообучали на сложных моделях с потенциально новой физикой. Соавтор работы, космолог Адриан Байер из Института Флэтайрон и Принстонского университета, сравнил подход с обучением по учебникам и назвал его "по сути коротким путём" вместо тренировки сразу на самых затратных расчётах.

Экономия получилась внушительной, так как предобучение позволило сократить вычислительные затраты примерно в десять раз. Нейросеть быстрее осваивала стандартную модель на меньшем числе симуляций и в большинстве сценариев успешно переносила знания на новые задачи.

Проблема обнаружилась там, где новая физика внешне напоминает уже выученные эффекты. Самым показательным случаем стала масса нейтрино – сеть путала её сигнатуру со знакомыми параметрами стандартной модели и вместо обнаружения нового явления подгоняла данные под старые шаблоны. Этот феномен называется негативным переносом, и проявляется он не случайным образом, а строго в зонах, где два разных физических эффекта оставляют почти одинаковые отпечатки в данных.

По словам Байера, именно системность ошибки делает результат ценным. Понимание того, когда перенос знаний помогает, а когда закрепляет вырождения параметров, критически важно для надёжного применения ИИ в будущих космологических анализах. Вывод исследователей сводится к тому, что ускорение и понимание должны идти рука об руку, а за выкладками модели обязан следить живой эксперт.

Следующим шагом команда планирует повторить эксперименты в условиях, приближённых к реальным данным обзоров неба, с учётом неопределённостей формирования галактик, масок наблюдений и шума. Параллельно исследователи хотят выяснить, какие космологические задачи выиграют от переноса обучения больше всего.

Больше статей на Shazoo
Тэги:

Об авторе

Эксперт по Fallout
Главный редактор
Более 16 лет в индустрии освещения видеоигр, кино, сериалов, науки и техники. Особенно разбираюсь в серии Fallout, ценитель The Elder Scrolls. Поклонник Arcanum и Fallout Tactics. Больше всего играю в Civilization, Old World и градостроители. Изучаю ИИ и загадки космоса.