Исследователи разработали новый метод оценки глубины объектов, который упростит видеомонтаж
Исследователи из TikTok, Гонконгского университета, Zhejiang Lab и Университета Чжэцзяна представили Depth Anything — новый метод оценки глубины изображения, который может упростить видеомонтаж.
Обученная на 1,5 миллионах размеченных и 62 миллионах неразмеченных изображений, эта модель монокулярной оценки глубины (MDE) демонстрирует впечатляющие возможности:
оценивает относительную глубину
оценивает метрическую глубину
оптимальна для дообучения и оценки на наборах данных NYUv2 и KITTI
Авторы хотят создать "простую, но мощную базовую модель, работающую с любыми изображениями в любых обстоятельствах" без использования новых технических модулей.
Больше примеров работы, код и данные для обучения можно найти на странице проекта.
Тем временем гуру Blender одобрил этот инструмент, отметив, что инди-кинематографисты будут рады забыть о ручном выделении объектов и людей.
- NVIDIA контролирует 90% мирового рынка ИИ-чипов и опережает конкурентов на годы вперед
- Федеральная торговая комиссия США расследует инвестиции Microsoft, Amazon и Alphabet в ИИ-стартапы
- Художник показал таймлапс создания 2D-сцены в стиле "Парка Юрского периода" при помощи ИИ