Отправьте статью сегодня! Журнал выйдет ..., печатный экземпляр отправим ...
Опубликовать статью

Молодой учёный

Автоматизация фотограмметрической обработки изображений с использованием систем искусственного интеллекта

Научный руководитель
Информационные технологии
07.05.2026
24
Поделиться
Аннотация
В рамках данной работы обозначена проблема отсутствия оптимального программного решения для трехмерной реконструкции объектов, сбалансированного по цене и качеству, чьим основным инструментом служит фотограмметрия. Перечислены классические принципы фотограмметрии, основанные на законах оптики, геометрии и других разделов физики и математики, а также возникающие при их использовании проблемы. Обоснована необходимость привлечения нейросетевых алгоритмов при создании программного обеспечения, решающего задачи компьютерного зрения, чье совместное применение с классическими обещает получение оптимального результата.
Библиографическое описание
Алексеенко, В. О. Автоматизация фотограмметрической обработки изображений с использованием систем искусственного интеллекта / В. О. Алексеенко, А. А. Кузьмина. — Текст : непосредственный // Молодой ученый. — 2026. — № 19 (622). — С. 90-92. — URL: https://moluch.ru/archive/622/136221.


В настоящее время в различных сферах деятельности растет потребность в быстром и точном переносе физических объектов в цифровую среду, что обеспечивается за счет алгоритмов 3D-реконструкции, реализующих возможности компьютерного зрения. Процесс трехмерной реконструкции из изображений [1] представляет собой получение формы и облика реальных объектов и восстановление информации об их пространственных характеристиках путем анализа визуальных данных с разных ракурсов. Он сопряжен с поиском компромисса между скоростью, точностью, полнотой используемой модели и устойчивостью к проблемным сценариям, таким, как слабая текстура, повторяющиеся паттерны, неидеальные условия съемки и т. п. Оптимизация этого компромисса под конкретную задачу — ключевая инженерная проблема.

На российском рынке программных продуктов, реализующих соответствующие возможности, в настоящий момент сложилась достаточно сложная ситуация. Существует сильная зависимость от иностранного ПО, усиленная санкционными рисками, и при этом отсутствует сбалансированный вариант между сложными и дорогими профессиональными инструментами и доступными, но менее точными решениями. Лучшим среди программных лидеров 3D-реконструкции российского происхождения является профессиональное фотограмметрическое решение Agisoft Metashape, чья полнофункциональная версия стоит, однако, достаточно дорого. По этой причине задача разработки нового ПО и совершенствования методов, обеспечивающих необходимую точность для 3D-реконструкци, не теряет своей актуальности.

Процесс 3D-реконструкции объектов реализуется с помощью алгоритмов, которые автоматизируют классические принципы фотограмметрии для извлечения пространственной информации из последовательностей изображений. Под фотограмметрией [2] здесь понимается создание точных 3D-моделей реальных объектов на основе множества их фотографий, сделанных с разных сторон. Используя готовые изображения, требуется восстановить информацию, имеющую физический смысл, в связи с чем необходимо применение законов распространения излучения и формирования изображений оптическими системами. При этом методы фотограмметрии выступают математическим фундаментом для решения задачи 3D-реконструкции, позволяя преобразовывать двумерные визуальные данные в метрически точные трехмерные модели. Специальная программа анализирует снимки, находит общие точки и «сшивает» их в цифровую объемную копию, выдавая в результате без использования сканера. Именно слияние современных технологий компьютерного зрения и основ фотограмметрии стало характерной чертой современных технологий 3D-реконструкции. Алгоритмы компьютерного зрения обеспечивают высокую степень автоматизации и робастность обработки наборов снимков, а классические фотограмметрические принципы (см. таблицу 1) гарантируют геометрическую согласованность результатов.

Таблица 1

Классические принципы фотограмметрии

Принцип

Особенности и условия

Центральное проектирование

Каждый снимок рассматривается как центральная проекция объекта на плоскость сенсора

Стереоскопический эффект

Для получения объема необходимо не менее двух снимков объекта, сделанных из разных точек (базис фотографирования); чем больше разница в положении точки на двух кадрах, тем ближе объект к камере

Условие коллинеарности

Решается уравнение, связывающее три точки прямой: центр проекции, точку на снимке и точку на реальном объекте в пространстве

Обратная засечка

(Resection)

Если известны координаты нескольких точек на земле (опорные точки) и на снимке, можно вычислить, где находился фотоаппарат в момент съемки. Принцип используется для определения положения камеры в пространстве

Прямая засечка (Intersection)

Зная положение двух камер, можно направить из них лучи через общие точки на фото, и точка их пересечения в пространстве будет искомой 3D-координатой объекта

Эпиполярная геометрия

Если известно положение двух камер, то точку со второго кадра не нужно искать по всему первому, она гарантированно лежит на эпиполярной линии

Внутреннее и внешнее ориентирование

Известны параметры камеры (фокусное расстояние, дисторсия линзы), а также координаты (x, y, z) и углы наклона камеры в пространстве

Перечисленные выше методы, основанные на геометрии и сопоставлении пикселей, при автоматизации приводят к ряду трудностей. К последним можно отнести проблему распознавания однородных текстур, «шумы» при обнаружении прозрачности и бликов, самозатенение при изображении сложных и тонких объектов и большие вычислительные затраты. Поэтому применение нейросетей и иных инструментов искусственного интеллекта (далее — ИИ) в дополнение к классическим принципам сейчас весьма актуально. Алгоритмы ИИ позволяют перевести математические принципы в плоскость вероятностного прогнозирования и непрерывного представления пространства за счет следующих ключевых возможностей:

— Нейропоиск признаков: классические алгоритмы ищут углы и края для сопоставления снимков, сети находят связи между кадрами даже при резком изменении освещения или текстуры, где обычная математика ошибается.

— Высокоточные измерения и расчет прохождения лучей через обученную модель как замена классической триангуляции.

— Автоматизация восстановления структуры по движению: нейросетевые модели одновременно оценивают положение камеры, генерируют новые ракурсы и прогнозируют глубину в рамках одного пайплайна, корректируя искажения.

Разработка нейросетевых технологий, используемых в фотограмметрии и 3D-реконструкции в 2025–2026 гг. идет по пути объединения точности математических методов с гибкостью генеративного ИИ. Основным трендом становится переход от простых моделей объектов к полноценным цифровым двойникам, доступным для редактирования в реальном времени. Формируется генеративная фотограмметрия, позволяющая восстанавливать недостающие данные и создавать пространственно-согласованные 3D-сцены. Ее методы уже широко применяются для реставрации цифровых копий разрушенных или труднодоступных объектов, в игровой индустрии и электронной коммерции (для создания 3D-моделей товаров, выставляемых на маркетплейсах).

Развитие генеративной фотограмметрии движется в сторону упрощения процесса для пользователя и одновременно — усложнения внутренних алгоритмов. Согласно прогнозам разработчиков [3], наиболее актуальными станут достижения в следующих направлениях: усовершенствование возможности реконструкции по одному кадру, переход к динамическим сценам (4D-фотограмметрия), определение физических свойств поверхностей, мгновенный рендеринг через Gaussian Splatting и интеграция с текстовыми запросами (редактирование голосом). Можно с уверенностью утверждать, что использование ИИ в разработке алгоритмов компьютерного зрения будет только расти, расширяя возможности как геодезических инструментов, так и кино, игровой и фотоиндустрии, обучающих систем, медицины, а также находя применение у рядовых пользователей для их повседневных нужд. ИИ не просто ускоряет процессы, он меняет саму математическую основу получения 3D-данных, переходя от сопоставления пикселей к предсказанию и генерации, не заменяя фотограмметрию, но делая её «умной» и массовой. Однако останутся проблемы этического характера, связанные, в частности, с вопросами соблюдения авторских прав на используемые изображения и с появлением эффектов галлюцинирования ИИ.

Литература:

  1. Панина Е. А., Белов Ю. С. Влияние входных данных и алгоритмические сложности в задаче 3D-реконструкции по фотографиям // Наукоемкие технологии в приборо- и машиностроении и развитие инновационной деятельности в вузе. Материалы конференции. — Москва, 2025. — С. 223–226.
  2. Видяев К. А., Крысин И. А., Чухраев И. В. Создание реалистичных текстур 3D моделей с помощью фотограмметрии //Электронный журнал: наука, техника и образование. — 2025. — № 1 (51). — С. 6–10.3.
  3. Романюго В. А., Филиппова Л. Б. Выявление особенностей генерации 3D-моделей из 2D-изображений // Новые горизонты. ⅩII научно-практическая конференция с международным участием: сборник материалов и докладов. –Брянск, 2025. — С. 590–592.
Можно быстро и просто опубликовать свою научную статью в журнале «Молодой Ученый». Сразу предоставляем препринт и справку о публикации.
Опубликовать статью
Молодой учёный №19 (622) май 2026 г.
Скачать часть журнала с этой статьей(стр. 90-92):
Часть 2 (стр. 79-149)
Расположение в файле:
стр. 79стр. 90-92стр. 149
Похожие статьи
Современные алгоритмы и технологии автоматизированного создания видеоконтента
Особенности применения искусственного интеллекта в мире фотографии: текущее состояние и перспективы
Комплексный подход в применении нейросетевых технологий в процессе реставрации и улучшения качества изображений для фотопечати
Интеллектуальная система выявления фейков на фотографии
Влияние окружающей среды на эффективность систем технического зрения в контексте контроля доступа
Компьютерное зрение: замена человеку или вспомогательный инструмент?
Сравнительный анализ методов сопоставления изображений для навигации беспилотных летательных аппаратов без глобальных навигационных спутниковых систем
Распознавание и извлечение 3D-моделей по двумерным изображениям
Искусственный интеллект как новая форма искусства
Глубокое обучение: понятие и применение

Молодой учёный