Сравнительный анализ платформ компьютерного зрения для создания дополненной реальности | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 3 октября, печатный экземпляр отправим 7 октября.

Опубликовать статью в журнале

Автор:

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №32 (322) август 2020 г.

Дата публикации: 07.08.2020

Статья просмотрена: 23 раза

Библиографическое описание:

Бижанов, Е. Г. Сравнительный анализ платформ компьютерного зрения для создания дополненной реальности / Е. Г. Бижанов. — Текст : непосредственный // Молодой ученый. — 2020. — № 32 (322). — С. 11-13. — URL: https://moluch.ru/archive/322/73031/ (дата обращения: 22.09.2020).



В этой статье дается сравнительный анализ платформ компьютерного зрения для создания дополненной реальности. Выявляются их возможности и недостатки. В конце статьи выдается заключение.

Ключевые слова: платформа, компьютерного зрение, дополненная реальность.

Сравнительный анализ библиотек компьютерного зрения для создания дополненной реальности

Всегодняшнее время люди пытаются создать механизмы, обладающие человеческими возможностями и облегчающие их труд. В связи с этим развиваются такие технологии, как искусственный интеллект, компьютерное зрение, машинное обучение, облачные вычисления и т. д. Большое внимание из вышеперечисленных заслуживает технология компьютерного зрения, потому что с ним мы сталкиваемся ежедневно. Они представлены в современном мире в виде камер видеонаблюдения, штрих-кодов, сканеров и т. д. Задачей компьютерного зрения является идентификация, обработка изображений и выдача результатов по ним в удобной для человека форме. То есть компьютерное зрение является неким подобием человеческого глаза и поэтому оно применяется во многих отраслях человеческой жизнедеятельности и бурно развивается [1].

Бурное развитие данной технологии выражается в увеличении количества новых решений, библиотек, программных приложений, связанных с компьютерным зрением.

В этой статье рассматривается перечень основных библиотек компьютерного зрения, которые играют большую роль в создании дополненной реальности.

Существуют следующие основные библиотеки компьютерного зрения для практической реализации проектов дополненной реальности:

1)Vuforia — платформа для создания AR-приложений, разработанная компанией Qualcomm, для телефонов и планшетов с операционными системами iOS и Android [2]. К возможностям данной системы можно отнести:

– отслеживание плоских изображений и объемных объектов;

– поддержка возможности интеграции с игровым движком Unity, что позволяет создавать любые 3D-модели различной сложности;

– возможность располагать виртуальные объекты и кнопки, а также видео и картинок, заменяющих мишень, прямо на экране устройства;

– наличие возможности поддержки таких языков программирования, как C++, Java, Objective-C, и C#;

– огромное количество инструментарии и внушительный набор средств, веб-сервисов для разработки приложений (в том числе и мишеней);

– а самое главное, его можно использовать бесплатно в некоммерческих целях.

Основным недостатком этой платформы является ограничение при использовании в некоммерческой деятельности.

На официальном сайте для этой платформы существует большое количество документации, инструкций и обучающих видеороликов. Также на других интернет-источниках существуют обучающие статьи. Стоит выделить ее интеграцию с мощным игровым движком Unity, что дает еще больше преимуществ и свободы разработчику. Он ограничен лишь своей фантазией и модностью аппаратных средств. Люди, в большинстве случаев, положительно отзываются о данной платформе разработки дополненной реальности.

2)ARToolKit — программная библиотека для создания AR-приложений, которые позволяют накладывать виртуальные образы на реальные объекты.

К возможностям данной системы можно отнести:

– простая структура для создания приложений дополненной реальности в реальном времени;

– кроссплатформенность данной библиотеки под Windows, Linux, Mac OS X, SGI;

– наложение виртуальных 3D-объектов на реальные маркеры на основе алгоритмов компьютерного зрения;

– быстрый рендеринг на основе OpenGL;

– простая процедура калибровки;

– OpenSource с лицензией GPL для некоммерческого использования;

– полный набор утилит и образцов;

– отслеживание позиции камеры и ее ориентации, простых черных фигур, изображений на плоскости [3].

К недостаткам данной системы можно отнести:

– малое количество документации на официальном сайте и обучающих материалов на сторонних ресурсах;

– устаревшие образцы применения.

К сожалению, для данной платформы существует небольшое количество документации и примеры, приведенные в ней, не всегда работали корректно. Уроки и статьи на сторонних ресурсах как правило устаревшие. Отзывы о данной системе по большей части положительные.

3)ARCore — платформа, разработанная компанией Google для разработчиков AR, и предоставляющая разработчикам простые и при этом мощные инструменты для создания впечатлений от AR. ARCore включает в себя следующие возможности: [4].

К возможностям данной системы можно отнести:

– для более точного расположения виртуальных объектов определяет пространственное положение аппаратного устройства;

– определение горизонтальных поверхностей с использованием тех же функций, что применяются для отслеживания движений;

– интеграция в Unity, Unreal Engine, Android studio;

– возможность использовать систему бесплатно;

– согласовывает естественный свет с виртуальным объектом для реалистичного ее отображения.

К недостаткам данной системы можно отнести:

– отсутствие возможности распознавать графические метки;

Она не распознает графические метки, может только лишь добавить 3D модели к определенному местоположению.

Заключение

Таким образом, подводя итоги, отметим, что рассмотренные платформы компьютерного зрения являются уникальными в своем применении. Сравнительный анализ показал, что самым оптимальным вариантом для реализации проектов дополненной реальности является Vuforia. Потому что, Vuforia является удобной, бесплатной и постоянно модернизирующейся библиотекой. Выбранная платформа имеет все необходимые функциональные возможности, позволяющие воспринимать виртуальный объект как часть реального мира. Это способствует повышению интереса и концентрации у обучающихся, развивает их пространственное и образное мышления, что положительно сказывается на процессе усвоения и запоминания учебных материалов.

Литература:

  1. Kaehler Learning OpenCV 3: computer vision in C++ with the OpenCV library / Kaehler, Adrian, G. B. and. — First edition. —: O’Reilly Media, Inc., 2016. — 1026 c.
  2. Vuforia: немного магии в нашей реальности. — Текст: электронный // Habr: [сайт]. — URL: https://habr.com/ru/post/198862/ (дата обращения: 01.08.2020).
  3. Список возможностей. — Текст: электронный // ARToolKit: [сайт]. — URL: http://www.hitl.washington.edu/artoolkit/documentation/features.htm (дата обращения: 02.08.2020).
  4. Google выпустила ARCore — конкурента ARKit для Android. — Текст: электронный // ARCore: [сайт]. — URL: https://holographica.space/news/google-arcore-12067 (дата обращения: 02.08.2020).
Основные термины (генерируются автоматически): компьютерное зрение, дополненная реальность, возможность, система, GPL, SGI, официальный сайт, платформа, создание AR-приложений.


Ключевые слова

платформа, дополненная реальность, компьютерного зрение
Задать вопрос