Работа с разреженными функциями, часть 2 (машинное обучение)

Инкрементная плотная реконструкция из монокулярного видео с управляемым слиянием разреженных элементов (arXiv)

Автор: Синсин Цзо, Нан Ян, Натаниэль Меррилл, Бинбин Сюй, Стефан Лойтенеггер.

Аннотация: Постепенное восстановление плотных 3D-структур из монокулярных видео имеет первостепенное значение, поскольку оно позволяет использовать различные приложения робототехники и дополненной реальности. Недавно было показано, что объемы объектов обеспечивают эффективную и точную инкрементальную плотную реконструкцию без необходимости предварительной оценки глубины, но они не могут достичь такого же высокого разрешения, как методы, основанные на глубине, из-за большого потребления памяти для объектов с высоким разрешением. тома. В этом письме предлагается метод плотной реконструкции на основе объемов признаков в реальном времени, который предсказывает значения TSDF (функция усеченного расстояния со знаком) из нового разреженного объема глубоких признаков, который может достигать более высокого разрешения, чем предыдущие методы, основанные на объемах признаков, и является благоприятным. в крупномасштабных сценариях на открытом воздухе, где большинство вокселей пусты. Стереосеть с несколькими представлениями (MVS), учитывающая неопределенность, используется для определения начальных местоположений вокселей физической поверхности в разреженном объеме элементов. Затем для уточнения восстановленной трехмерной геометрии из многоракурсных изображений в потенциальных местах на поверхности тщательно объединяются глубинные элементы и сливаются во времени. Помимо достижения более высокого разрешения, чем раньше, наш метод во многих случаях позволяет производить более полные реконструкции с более мелкими деталями. Обширные оценки как общедоступных, так и самостоятельно собранных наборов данных демонстрируют очень конкурентоспособный результат реконструкции в реальном времени для нашего метода по сравнению с современными методами реконструкции как в помещении, так и на открытом воздухе.

2. Иерархическая визуальная локализация на основе пирамиды разреженных признаков для адаптивного уменьшения размера карты ключевых точек (arXiv)

Автор: Андрей Потапов, Михаил Куренков, Павел Карпышев, Евгений Юдин, Алена Савиных, Евгений Кружков, Дмитрий Цецеруков.

Аннотация: Визуальная локализация является фундаментальной задачей для широкого круга приложений в области робототехники. Тем не менее, это по-прежнему сложная проблема, не имеющая универсального решения, а существующие подходы сложно масштабировать: большинство современных решений не могут обеспечить точную локализацию без значительного объема памяти. Мы предлагаем иерархический подход к локализации с низким объемом памяти, основанный на ключевых точках с разной длиной дескриптора. Это становится возможным с использованием разработанной неконтролируемой нейронной сети, которая предсказывает пирамиду признаков с различной длиной дескриптора для изображений. Эта структура позволяет применять парадигмы от грубой к точной для локализации на основе карты ключевых точек и варьировать точность локализации путем изменения типа дескрипторов, используемых в конвейере. Наш подход обеспечивает сопоставимые результаты по точности локализации и значительному сокращению потребления памяти (до 16 раз) среди современных методов.

Работа с разреженными функциями, часть 2 (машинное обучение)

Вопросы по теме