ИИ выучил стандартную модель Вселенной и стал хуже замечать новую физику
Космологи из Принстона и Института Флэтайрон проверили, способна ли нейросеть, обученная на стандартной модели Вселенной, искать физику за её пределами.
Результат оказался двойственным: ИИ заметно ускорил расчёты, но заодно приобрёл предвзятость, которая мешает находить именно то, ради чего его обучали.
Контекст проблемы прост. Стандартная модель космологии ΛCDM отлично описывает расширение Вселенной и распределение галактик, однако физики уверены в её неполноте – на новую физику могут указывать массивные нейтрино, модифицированная гравитация или меняющаяся со временем тёмная энергия. Проверка таких расширенных сценариев требует симуляций, которые обходятся значительно дороже стандартных, а без них невозможно делать серьёзные выводы из данных наблюдений.
Команда применила метод переноса обучения. Сначала нейросеть тренировали на дешёвых симуляциях ΛCDM, чтобы дать ей общее представление о том, как устроена Вселенная, и лишь затем дообучали на сложных моделях с потенциально новой физикой. Соавтор работы, космолог Адриан Байер из Института Флэтайрон и Принстонского университета, сравнил подход с обучением по учебникам и назвал его "по сути коротким путём" вместо тренировки сразу на самых затратных расчётах.
Экономия получилась внушительной, так как предобучение позволило сократить вычислительные затраты примерно в десять раз. Нейросеть быстрее осваивала стандартную модель на меньшем числе симуляций и в большинстве сценариев успешно переносила знания на новые задачи.
Проблема обнаружилась там, где новая физика внешне напоминает уже выученные эффекты. Самым показательным случаем стала масса нейтрино – сеть путала её сигнатуру со знакомыми параметрами стандартной модели и вместо обнаружения нового явления подгоняла данные под старые шаблоны. Этот феномен называется негативным переносом, и проявляется он не случайным образом, а строго в зонах, где два разных физических эффекта оставляют почти одинаковые отпечатки в данных.
По словам Байера, именно системность ошибки делает результат ценным. Понимание того, когда перенос знаний помогает, а когда закрепляет вырождения параметров, критически важно для надёжного применения ИИ в будущих космологических анализах. Вывод исследователей сводится к тому, что ускорение и понимание должны идти рука об руку, а за выкладками модели обязан следить живой эксперт.
Следующим шагом команда планирует повторить эксперименты в условиях, приближённых к реальным данным обзоров неба, с учётом неопределённостей формирования галактик, масок наблюдений и шума. Параллельно исследователи хотят выяснить, какие космологические задачи выиграют от переноса обучения больше всего.
- Disney, Universal и Warner Bros подали в суд на китайскую ИИ-компанию за нарушение авторских прав
- Fiverr сокращает 250 сотрудников ради трансформации в ИИ-компанию
- Google уволила 200 ИИ-подрядчиков на фоне жалоб о низкой оплате труда