В настоящее время в различных сферах деятельности растет потребность в быстром и точном переносе физических объектов в цифровую среду, что обеспечивается за счет алгоритмов 3D-реконструкции, реализующих возможности компьютерного зрения. Процесс трехмерной реконструкции из изображений [1] представляет собой получение формы и облика реальных объектов и восстановление информации об их пространственных характеристиках путем анализа визуальных данных с разных ракурсов. Он сопряжен с поиском компромисса между скоростью, точностью, полнотой используемой модели и устойчивостью к проблемным сценариям, таким, как слабая текстура, повторяющиеся паттерны, неидеальные условия съемки и т. п. Оптимизация этого компромисса под конкретную задачу — ключевая инженерная проблема.
На российском рынке программных продуктов, реализующих соответствующие возможности, в настоящий момент сложилась достаточно сложная ситуация. Существует сильная зависимость от иностранного ПО, усиленная санкционными рисками, и при этом отсутствует сбалансированный вариант между сложными и дорогими профессиональными инструментами и доступными, но менее точными решениями. Лучшим среди программных лидеров 3D-реконструкции российского происхождения является профессиональное фотограмметрическое решение Agisoft Metashape, чья полнофункциональная версия стоит, однако, достаточно дорого. По этой причине задача разработки нового ПО и совершенствования методов, обеспечивающих необходимую точность для 3D-реконструкци, не теряет своей актуальности.
Процесс 3D-реконструкции объектов реализуется с помощью алгоритмов, которые автоматизируют классические принципы фотограмметрии для извлечения пространственной информации из последовательностей изображений. Под фотограмметрией [2] здесь понимается создание точных 3D-моделей реальных объектов на основе множества их фотографий, сделанных с разных сторон. Используя готовые изображения, требуется восстановить информацию, имеющую физический смысл, в связи с чем необходимо применение законов распространения излучения и формирования изображений оптическими системами. При этом методы фотограмметрии выступают математическим фундаментом для решения задачи 3D-реконструкции, позволяя преобразовывать двумерные визуальные данные в метрически точные трехмерные модели. Специальная программа анализирует снимки, находит общие точки и «сшивает» их в цифровую объемную копию, выдавая в результате без использования сканера. Именно слияние современных технологий компьютерного зрения и основ фотограмметрии стало характерной чертой современных технологий 3D-реконструкции. Алгоритмы компьютерного зрения обеспечивают высокую степень автоматизации и робастность обработки наборов снимков, а классические фотограмметрические принципы (см. таблицу 1) гарантируют геометрическую согласованность результатов.
Таблица 1
Классические принципы фотограмметрии
|
Принцип |
Особенности и условия |
|
Центральное проектирование |
Каждый снимок рассматривается как центральная проекция объекта на плоскость сенсора |
|
Стереоскопический эффект |
Для получения объема необходимо не менее двух снимков объекта, сделанных из разных точек (базис фотографирования); чем больше разница в положении точки на двух кадрах, тем ближе объект к камере |
|
Условие коллинеарности |
Решается уравнение, связывающее три точки прямой: центр проекции, точку на снимке и точку на реальном объекте в пространстве |
|
Обратная засечка (Resection) |
Если известны координаты нескольких точек на земле (опорные точки) и на снимке, можно вычислить, где находился фотоаппарат в момент съемки. Принцип используется для определения положения камеры в пространстве |
|
Прямая засечка (Intersection) |
Зная положение двух камер, можно направить из них лучи через общие точки на фото, и точка их пересечения в пространстве будет искомой 3D-координатой объекта |
|
Эпиполярная геометрия |
Если известно положение двух камер, то точку со второго кадра не нужно искать по всему первому, она гарантированно лежит на эпиполярной линии |
|
Внутреннее и внешнее ориентирование |
Известны параметры камеры (фокусное расстояние, дисторсия линзы), а также координаты (x, y, z) и углы наклона камеры в пространстве |
Перечисленные выше методы, основанные на геометрии и сопоставлении пикселей, при автоматизации приводят к ряду трудностей. К последним можно отнести проблему распознавания однородных текстур, «шумы» при обнаружении прозрачности и бликов, самозатенение при изображении сложных и тонких объектов и большие вычислительные затраты. Поэтому применение нейросетей и иных инструментов искусственного интеллекта (далее — ИИ) в дополнение к классическим принципам сейчас весьма актуально. Алгоритмы ИИ позволяют перевести математические принципы в плоскость вероятностного прогнозирования и непрерывного представления пространства за счет следующих ключевых возможностей:
— Нейропоиск признаков: классические алгоритмы ищут углы и края для сопоставления снимков, сети находят связи между кадрами даже при резком изменении освещения или текстуры, где обычная математика ошибается.
— Высокоточные измерения и расчет прохождения лучей через обученную модель как замена классической триангуляции.
— Автоматизация восстановления структуры по движению: нейросетевые модели одновременно оценивают положение камеры, генерируют новые ракурсы и прогнозируют глубину в рамках одного пайплайна, корректируя искажения.
Разработка нейросетевых технологий, используемых в фотограмметрии и 3D-реконструкции в 2025–2026 гг. идет по пути объединения точности математических методов с гибкостью генеративного ИИ. Основным трендом становится переход от простых моделей объектов к полноценным цифровым двойникам, доступным для редактирования в реальном времени. Формируется генеративная фотограмметрия, позволяющая восстанавливать недостающие данные и создавать пространственно-согласованные 3D-сцены. Ее методы уже широко применяются для реставрации цифровых копий разрушенных или труднодоступных объектов, в игровой индустрии и электронной коммерции (для создания 3D-моделей товаров, выставляемых на маркетплейсах).
Развитие генеративной фотограмметрии движется в сторону упрощения процесса для пользователя и одновременно — усложнения внутренних алгоритмов. Согласно прогнозам разработчиков [3], наиболее актуальными станут достижения в следующих направлениях: усовершенствование возможности реконструкции по одному кадру, переход к динамическим сценам (4D-фотограмметрия), определение физических свойств поверхностей, мгновенный рендеринг через Gaussian Splatting и интеграция с текстовыми запросами (редактирование голосом). Можно с уверенностью утверждать, что использование ИИ в разработке алгоритмов компьютерного зрения будет только расти, расширяя возможности как геодезических инструментов, так и кино, игровой и фотоиндустрии, обучающих систем, медицины, а также находя применение у рядовых пользователей для их повседневных нужд. ИИ не просто ускоряет процессы, он меняет саму математическую основу получения 3D-данных, переходя от сопоставления пикселей к предсказанию и генерации, не заменяя фотограмметрию, но делая её «умной» и массовой. Однако останутся проблемы этического характера, связанные, в частности, с вопросами соблюдения авторских прав на используемые изображения и с появлением эффектов галлюцинирования ИИ.
Литература:
- Панина Е. А., Белов Ю. С. Влияние входных данных и алгоритмические сложности в задаче 3D-реконструкции по фотографиям // Наукоемкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе. Материалы конференции. — Москва, 2025. — С. 223–226.
- Видяев К. А., Крысин И. А., Чухраев И. В. Создание реалистичных текстур 3D моделей с помощью фотограмметрии //Электронный журнал: наука, техника и образование. — 2025. — № 1 (51). — С. 6–10.3.
- Романюго В. А., Филиппова Л. Б. Выявление особенностей генерации 3D-моделей из 2D-изображений // Новые горизонты. ⅩII научно-практическая конференция с международным участием: сборник материалов и докладов. –Брянск, 2025. — С. 590–592.

