Поисковые возможности контент-менеджмент системы Adobe Experience Manager | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 25 января, печатный экземпляр отправим 29 января.

Опубликовать статью в журнале

Автор:

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №14 (118) июль-2 2016 г.

Дата публикации: 07.07.2016

Статья просмотрена: 89 раз

Библиографическое описание:

Петухов, С. В. Поисковые возможности контент-менеджмент системы Adobe Experience Manager / С. В. Петухов. — Текст : непосредственный // Молодой ученый. — 2016. — № 14 (118). — С. 86-89. — URL: https://moluch.ru/archive/118/32650/ (дата обращения: 16.01.2025).



В представленной работе рассматриваются наиболее интересные и важные особенности поисковых движков и способы конструирования индексации с целью повышения скорости поиска в рамках контент-менеджмент системы Adobe Experience Manager. Данные основываются на открытых источниках документации технологий Apache Foundation, а так же официальной документации Adobe Experience Manager.

Ключевые слова: контент-менеджмент система, oak, lucene, индексация, репозиторий контента, SQL-2

Adobe Experience Manager изначально не индексирует содержимое без дополнительной настройки для его репозитория контента — для этих целей необходимо создавать отдельно конфигурируемые индексы, ровно так же, как и для реляционных баз данных. Если для определённого запроса нет конкретного индекса, значит, весь репозиторий будет пройден (англ. traversed). Из-за этого запрос, скорее всего, будет очень долгий. В таком случае, когда движок Oak обнаружит такой запрос, в логах будет выведено соответствующее сообщение, предупреждающее о медленном запросе.

Jackrabbit поддеживает следующие языки запросов:

– XPATH;

– SQL;

– SQL-2;

– JQOM.

  1. Типы идндексов ивычисление «стоимости» выполнения запроса

Apache Jackrabbit позволяет подключать различные индексы к использованию в запросах к репозиторию:

– стандартный индекс — PropertyIndex, определение которого находится в самом репозитории;

– внешний полнотекстовый индекс — конкретная реализация которого может быть ApacheLucene или ApacheSolr;

– Traversal Index — индекс, используемый в случае, когда никакой другой индекс не задействован. Это означает, что данные не индексируются и все ячейки репозитория будут пройдены в поисках данных, подходящих под запрос.

Если для запроса доступны сразу несколько индексов, то для каждого доступного индекса будет высчитано время выполнения. Oak затем выберет наилучший, по его мнению, индекс.

На рисунке 1.1 представлен схематически описанный процесс.

Рисунок 1.1. Схема высокоуровневого представления механизма выполнения запроса движком Apache Oak

  1. Конфигурация индексов

Индексы в Adobe Experience Manager конфигурируются в репозитории в виде ячеек и находятся под ячейкой oak:index. Чтобы система распознала данную ячейку как конфигурацию индекса, ей следует задать тип oak:QueryIndexDefinition.

2.1 PropertyIndex

Property Index подходит для запросов, которые используют свойства, но не задействуют полнотекстовый поиск. У Property Index существуют следующие параметры конфигурации:

– type — тип индекса, в данном случае «property»;

– propertyNames — показывает список свойств, которые будут храниться в индексе;

– флаг unique — установлены в значение «true», добавляет уникальность поля;

– declaringNodeTypes — позволяет указывать определённый тип ячейки, которая может быть индексирована таким образом;

– reindex — флаг, установленный в значение «true», запустит переиндексацию всех индексов.

2.2 Ordered Index

Ordered Index — расширение Property Index. Он позволяет устанавливать порядок индексируемого свойства в репозитории. У Ordered Index существуют следующие параметры конфигурации:

– type — тип индекса, в данном случае «ordered»;

– propertyNames — показывает список свойств, которые будут храниться в индексе;

– reindex — флаг, установленный в значение «true», запустит переиндексацию всех индексов;

– опциональный параметр direction — может иметь значения убывания и возрастания — «ascending» и «descending» соответственно. По-умолчанию выставлено значение «ascending»;

– async — установка типа индекса как асинхронного.

2.3 LuceneFullTextIndex

Полнотекстовый поиск в Adobe Experience Manager представлен средствами Apache Lucene и доступен с шестой версии контент-менеджмент системы. Если полнотекстовый поиск сконфигурирован, то все запросы, имеющие свойство полнотекстового поиска станут использовать этот индекс.

Если полнотекстовый поиск не сконфигурирован, то запросы имеющие свойство полнотекстового поиска могут работать не так, как ожидается. Базовый движок имеет функции полнотекстового поиска, но не имеет всех возможностей Lucene.

Lucene Full Text Index имеет следующие параметры, доступные для конфигурации:

– type — тип индекса, в данном случае «lucene»;

– propertyNames — показывает список свойств, которые будут храниться в индексе;

– includePropertyTypes — определяет, какой набор типов свойств будет подходить под это определение индекса;

– excludePropertyNames — определяет, список типов свойств, которые не будут индексироваться данной конфигурацией;

– reindex — флаг, установленный в значение «true», запустит переиндексацию всех индексов;

– async — установка типа индекса как действующего асинхронно.

На рисунке 2.1 показана примерная конфигурация Luene полнотекстового индекса в репозитории.

Рисунок 2.1. Примерная конфигурация Luene полнотекстового индекса в репозитории

  1. Рекомендации по выбору типа индекса

В первую очередь архитектору проекта следует определить: следует ли вообще использовать индексацию свойств репозитория в данном случае. Если запрос будет выполнен единожды или иногда в периоды, когда система не нагружена, возможно, использование индексации станет излишним.

После создания индекса, каждый раз как данные репозитория обновляются, индекс должен быть так же обновлён. Так как это влечёт дополнительные издержки для системы, индексы должны создаваться только тогда, когда они действительно необходимы.

Индексы используются только тогда, когда индексируемые данные достаточно уникальны, чтобы оправдать использование. Представьте себе индекс, как книгу и темы, которые она покрывает. Когда индексируется набор тем текста, обычно будет сотни или тысячи точек входа, позволяющих Вам быстро попасть в нужную часть по ключевому слову. Но если этот индекс содержит всего две или три точки входа, указывающих на пару-сотню страниц, индекс будет не нужен. Такой же подход применим к индексам базам данных. Если имеется всего несколько уникальных значений, значит нет необходимости в индексировании.

3.1 Lucene Index или Property Index?

Lucene Index были представлены в Oak версии 1.0.9 и предлагают мощные оптимизации над Property индексацией.

Если выбор стоит между Lucene и Property индексами, то следует учитывать следующее:

– Lucene индекс предлагает намного больше возможностей, чем Property индекс. Например, Property индекс может индексировать только единственное свойство, тогда как Lucene может и индексировать несколько;

– Lucene индекс асинхронный. С одной стороны это даёт прирост производительности, но с другой стороны это влечёт за собой задержку между тем, как данные записываются в репозиторий и когда закончится обновление индекса. Если важно иметь запросы возвращающие 100 % точные результаты, следует выбирать Property индекс;

– будучи асинхронным, Lucene индекс не может выставлять уникальные значения данных. Если это является необходимостью, то следует выбирать Property индекс.

В целом, рекомендуется использовать Lucene Index, за исключением случаев, когда есть острая необходимость использовать именно Property Index.

Заключение

Рассмотренные виды конфигурации поиска являются основными в контент-менеджмент системе Adobe Experience Manager и репозитории контента Apache Jackrabbit 2. Предложенные решения по оптимальному выбору технологий поиска основываются на предпочтениях разработчиков самих индексов и лучших практик разработки сайтов под управлением контент-менеджмент системы Adobe AEM.

Литература:

  1. Lunka, R. D. Adobe Experience Manager: Classroom in a Book: A Guide to CQ5 for Marketing Professionals [Текст] / Adobe Press, 2013. — 368 с.
  2. Closser, S. Adobe Experience Manager Quick-Reference Guide: Web Content Management [Текст] / Adobe Press, 2013. — 240 с.
  3. Adobe Corporation. Adobe Experience Manager Documentation [Электронныйресурс]. URL: https://docs.adobe.com (Дата обращения: 29.05.2016).
  4. Adobe Corporation. Adobe Blogs — Experience Delivers [Электронныйресурс]. URL: http://blogs.adobe.com/experiencedelivers (Дата обращения: 29.05.2016).
  5. The Apache Software Foundation. Apache Felix Documentation [Электронныйресурс]. URL: http://felix.apache.org/documentation.html (Датаобращения: 29.05.2016).
Основные термины (генерируются автоматически): индекс, полнотекстовый поиск, запрос, контент-менеджмент системы, список свойств, тип индекса, AEM, JQOM, полнотекстовый индекс, примерная конфигурация.


Похожие статьи

Обзор основных технологий контент-менеджмент системы Adobe Experience Manager

В представленной работе рассматриваются основные технологии контент-менеджмент системы Adobe Experience Manager: их возможности и схема взаимодействия. Данные основываются на открытых источниках документации технологий Apache Foundation, а так же офи...

Технологические аспекты проектирования веб-приложений c использованием фреймворка Blazor

В статье рассмотрены основные технологические особенности фреймворка Blazor при разработке веб-приложений. Дан краткий обзор и анализ используемых технологических решений, предоставляемых возможностей и принципов работы данного инструмента. Исследова...

Информационно-компьютерное сопровождение бизнес-процессов торговой компании

В данной статье представлены результаты реализации программного модуля для сайта торговой компании. Обоснован выбор инструментальных средств разработки. В качестве языка программирования были выбраны PHP, JavaScript, HTML, CSS, MySQL, а в качестве ср...

Использование концепции интегрированных систем управления данными

В статье рассматриваются основные концепции при выборе систем управления контентом. Авторы опираются на данные исследовательских компаний IDC и W3Techs и делают выводы, используя свой практический опыт.

Рассмотрение декларативного подхода к разработке интерфейсов мобильных приложений для Android

В данной статье рассматриваются императивный и декларативный подходы к разработке интерфейсов, анализируются преимущества и недостатки библиотеки Jetpack Compose.

Основные функция веб-приложения с учетом анализа современных CMS-систем

В работе проведен анализ современных коммерческих и свободно распространяемых CMS-систем, описана структура разработанного веб-приложения на основе фреймворка Zend Framework и его база данных.

Сравнительный анализ программных средств для организации командной работы в высшей школе

В статье приведены результаты сравнительного анализа нескольких программных продуктов для организации работы над проектами в команде. Дана таблица сравнительных характеристик выбранных для рассмотрения программных средств. Определены преимущества каж...

Оценка возможности использования среды разработки программного обеспечения GitLab в задачах управления проектами

В статье рассматриваются инструменты управления проектами и преимущества интеграции Jira и GitLab для команд разработчиков программного обеспечения.

Интеграция различных приложений с платформой 1С:Предприятие по протоколу OData

В статье рассмотрены различные способы интеграции сторонних программ с платформой 1С:Предприятие, выявлены достоинства и недостатки данных подходов, обосновано преимущество протокола OData перед остальными способами интеграции.

Абстрактные и динамически сгенерированные контроллеры в ASP.NET

В данной статье будет рассмотрен подход автоматически сгенерированных контроллеров в одной из самых популярных технологий для написания веб-сайтов — ASP.NET Core MVC.

Похожие статьи

Обзор основных технологий контент-менеджмент системы Adobe Experience Manager

В представленной работе рассматриваются основные технологии контент-менеджмент системы Adobe Experience Manager: их возможности и схема взаимодействия. Данные основываются на открытых источниках документации технологий Apache Foundation, а так же офи...

Технологические аспекты проектирования веб-приложений c использованием фреймворка Blazor

В статье рассмотрены основные технологические особенности фреймворка Blazor при разработке веб-приложений. Дан краткий обзор и анализ используемых технологических решений, предоставляемых возможностей и принципов работы данного инструмента. Исследова...

Информационно-компьютерное сопровождение бизнес-процессов торговой компании

В данной статье представлены результаты реализации программного модуля для сайта торговой компании. Обоснован выбор инструментальных средств разработки. В качестве языка программирования были выбраны PHP, JavaScript, HTML, CSS, MySQL, а в качестве ср...

Использование концепции интегрированных систем управления данными

В статье рассматриваются основные концепции при выборе систем управления контентом. Авторы опираются на данные исследовательских компаний IDC и W3Techs и делают выводы, используя свой практический опыт.

Рассмотрение декларативного подхода к разработке интерфейсов мобильных приложений для Android

В данной статье рассматриваются императивный и декларативный подходы к разработке интерфейсов, анализируются преимущества и недостатки библиотеки Jetpack Compose.

Основные функция веб-приложения с учетом анализа современных CMS-систем

В работе проведен анализ современных коммерческих и свободно распространяемых CMS-систем, описана структура разработанного веб-приложения на основе фреймворка Zend Framework и его база данных.

Сравнительный анализ программных средств для организации командной работы в высшей школе

В статье приведены результаты сравнительного анализа нескольких программных продуктов для организации работы над проектами в команде. Дана таблица сравнительных характеристик выбранных для рассмотрения программных средств. Определены преимущества каж...

Оценка возможности использования среды разработки программного обеспечения GitLab в задачах управления проектами

В статье рассматриваются инструменты управления проектами и преимущества интеграции Jira и GitLab для команд разработчиков программного обеспечения.

Интеграция различных приложений с платформой 1С:Предприятие по протоколу OData

В статье рассмотрены различные способы интеграции сторонних программ с платформой 1С:Предприятие, выявлены достоинства и недостатки данных подходов, обосновано преимущество протокола OData перед остальными способами интеграции.

Абстрактные и динамически сгенерированные контроллеры в ASP.NET

В данной статье будет рассмотрен подход автоматически сгенерированных контроллеров в одной из самых популярных технологий для написания веб-сайтов — ASP.NET Core MVC.

Задать вопрос