Библиографическое описание:

Дмитриев П. И. Основные возможности Microsoft SharePoint 2010 для построения корпоративной системы управления знаниями // Молодой ученый. — 2011. — №4. Т.1. — С. 86-88.

В статье рассмотрены подходы к построению современных систем управления знаниями, приводится обзор основных возможностей продукта Microsoft SharePoint 2010 для построения корпоративной системы управления знаниями.
Сегодня темой большого количества теоретических и практических исследований является тема построения автоматизированных систем, которые реализуют весь комплекс функций работы со знаниями. Ресурсы знаний различаются в зависимости от отраслей индустрии и приложений, но, как правило, включают руководства, письма, информацию о заказчиках, сведения о конкурентах и технологии, накопившиеся в процессе разработки. Сами эти ресурсы могут находиться в различных местах: в базах данных, базах знаний, в картотечных блоках, у специалистов и могут быть рассредоточены по всему предприятию [1]. В контексте рассматриваемой темы существуют два понимания термина «знание» [3].
Первая точка зрения основана на прагматических аспектах, представляет знания как данные, полученные в нужном месте и в нужное время для решения практической задачи, обычно для принятия решения, в том числе выполнения действия, человеком или технической системой. При этом по своей структуре и способу хранения знания могут ничем не отличаться от прочих данных – любой фрагмент базы данных или полнотекстового архива документов превращается в знание, как только на него обращается взгляд заинтересованного потребителя.
Вторая точка зрения основана на содержательных аспектах и принятая в рамках направления искусственного интеллекта полагает, что знания отличаются от обычных данных своей структурой. Именно к совокупности особым образом структурированных данных применимо понятие база знаний.
Процесс управления знаниями в общем случае содержит этапы их извлечения и обработки, которые реализуются в автоматизированной системе управления знаниями (СУЗ). При этом технологические составляющие этапа извлечения определяют, каким образом данные превращаются в элементарные знания, а составляющие этапа обработки определяют то, как из элементарных знаний порождается новое знание, используемое для принятия решений. Два подхода к пониманию термина «знания» нашли свое отражение в двух совершенно различных типах СУЗ, автоматизирующих два различных этапа работы со знаниями.
При прагматическом подходе к знаниям в центре внимания оказывается этап их извлечения, поддержка которого обеспечивается информационно-поисковой составляющей СУЗ. Этап обработки найденных первичных знаний реализуется за рамками СУЗ принимающим решения человеком. Достоинство этого типа СУЗ – применимость к широкому кругу заранее неизвестных задач.
При содержательном подходе к знаниям фокус внимания направлен на этап обработки элементарных знаний, получения из его кирпичиков нового знания на основании обобщения, сопоставления, логического вывода и т.п. В зависимости от формальной модели представления первичных знаний, на этом этапе могут применяться различные математические методы. Результатом являются обобщения, выявление скрытых зависимостей, прогнозы. В этом случае за рамками СУЗ реализуется этап извлечения первичных знаний, их формализации и размещения в базе знаний, логическая структура и фактическое наполнение которой зависят от особенностей предметной области и должны разрабатываться в тесном взаимодействии экспертов и инженера по знаниям. Узкая специализация базы знаний и трудоемкость ее разработки являются недостатками СУЗ, воплощающих содержательный подход. Достоинством же СУЗ является возможность быстрого получения решения для тех типовых задач, на решение которых они ориентированы.
Современные СУЗ должны разрабатываться на основе комбинирования обозначенных подходов.
При построении корпоративной СУЗ важным вопросом является выбор технологической платформы. Правильный выбор технологической платформы позволяет минимизировать затраты на разработку некоторых подсистем СУЗ, выполняющих базовые функции по созданию, сохранению, структурированию, визуализации, распространению и поиску знаний.
Рассмотрим основные возможности продукта Microsoft SharePoint 2010, которые могут быть использованы для построения системы управления знаниями предприятия, основном ресурсом знаний которого является контент. К таким возможностям относятся: управление контентом, управление метаданными и корпоративный поиск.
Продукт Microsoft SharePoint 2010 отвечает чрезвычайно важным потребностям бизнеса на уровне компании, предоставляя такие возможности, как управление контентом и бизнес-процессами, упрощение поиска и обмена информацией.
Microsoft SharePoint 2010 представляет собой технологическую платформу, позволяющую объединить данные из различных систем компании в общее решение за счет использования единого входа в систему и возможностей интеграции корпоративных приложений. Возможности совместной работы в SharePoint 2010 (Microsoft SharePoint Foundation 2010 и Microsoft SharePoint Server 2010), а также поддержка настроек Microsoft SharePoint Designer 2010, позволяют с легкостью создавать доступные по всему предприятию сайты SharePoint и управлять ими [7].

Управление контентом
Управление контентом – это управление документами и другими типами контента, а также их хранение, обработка и доставка в масштабах предприятия. В Microsoft SharePoint Server 2010 управление контентом разделено на следующие основные функциональные области: управление цифровыми активами, управление документами, управление записями [5].
Управление цифровыми активами предоставляет функциональные возможности для сбора, комментирования, хранения, извлечения и отображения цифрового контента, включая изображения, звук и видео.
Управление документами предоставляет функциональные возможности для создания, хранения и отслеживания документов, наборов документов и других типов контента. В состав предоставляемых функциональных возможностей также входят организатор контента, шаблон для центра документов и инфраструктура, требуемая для поддержки создания наборов документов. Кроме того, в состав управления документами входит технология, предназначенная для навигации по наборам документов и фильтрации на основе метаданных, а также способ поиска документов на основе значений по умолчанию в метаданных.
Управление записями предоставляет функциональные возможности для идентификации документов в качестве записей и способы управления записями на протяжении их жизненного цикла, т. е. идентификация и создание записей, eDiscovery (удержание, аудит, назначение срока действия и удаление).

Управление метаданными
Управляемые метаданные – это иерархически упорядоченная, централизованно управляемая совокупность терминов, которые можно определять и использовать в качестве метаданных в Microsoft SharePoint Server 2010 и других приложениях Microsoft Office 2010. Метаданные являются управляемыми, поскольку управление терминами или наборами терминов (совокупность терминов) осуществляется независимо от столбцов или полей, для которых они требуются [4].
Термин – это слово или фраза, которую можно связать с элементом в SharePoint Server 2010. Набор терминов – это коллекция связанных терминов. Для столбца SharePoint Server 2010 можно указать, что он должен содержать термины из конкретного набора терминов. Управляемые метаданные позволяют отразить тот факт, что термины и наборы терминов создаются и изменяются независимо от столбцов.
Локальные наборы терминов создаются в контексте семейства сайтов. Например, при добавлении столбца в список в библиотеке документов и создании нового набора терминов для привязки к этому столбцу этот набор терминов становится локальным по отношению к семейству сайтов, в котором хранится библиотека документов. Глобальные наборы терминов создаются вне контекста семейства сайтов.

Поиск в корпоративной среде SharePoint
Поиск в Microsoft SharePoint 2010 позволяет сотрудникам компании находить информацию, необходимую для выполнения работы. Доступны функции поиска в корпоративной сети, поиска людей и платформа для создания приложений на основе поиска. Уникальность поиска в SharePoint 2010 заключается в сочетании релевантности, точности информации и ориентированности на пользователя [6].
SharePoint Server 2010 предоставляет конечным пользователям возможность создавать и выполнять эффективные поисковые запросы. Поддерживается использование в поисковых запросах логических операторов AND, OR и NOT. Можно использовать звездочку (*) в качестве подстановочного знака в конце строки текста. По мере ввода пользователем ключевых слов в поле поиска центр поиска предоставляет подсказки (предложения), чтобы помочь завершить ввод запроса. Эти предложения выдаются на основе предыдущих запросов других пользователей. Центр поиска также обеспечивает улучшенные предложения "быть может, вы имели в виду" в том случае, если ключевые слова в поисковом запросе предположительно не соответствуют тому, что планировал ввести пользователь. Кроме того, когда система поиска возвращает результат запроса, центр поиска отображает предложения для связанных поисков.
В SharePoint Server 2010 имеются средства, позволяющие повысить соответствие и полезность результатов поиска. Если какой-либо документ в наборе результатов поиска посещался со страницы результатов поиска гораздо более часто, чем другие документы, то он при ранжировании результатов поиска он выдвигается на передний план. При выполнении обхода контента в качестве части процесса индексирования выполняется синтаксический анализ метаданных. В некоторых случаях система поиска может также логически вывести метаданные из контента документа. Это может быть полезным, когда явные метаданные документа отсутствуют или неправильны. Например, в документе Microsoft PowerPoint может быть не указан автор, но система поиска может определить автора по фразе в документе.

Пример использования
Описанные возможности продукта Microsoft SharePoint 2010 были использованы автором при разработке СУЗ инфокоммуникационной системы [2]. Продукт Microsoft SharePoint 2010 представляет собой технологическую платформу СУЗ. Основным ресурсом знаний такой системы является документация на программное обеспечение. Вся документация разделяется на фрагменты, которые представляют собой элементы знаний. Такой подход предполагает, что при создании руководств каждый документатор создает фрагменты документации (модули данных), помещает их в библиотеку документов SharePoint, указывает семантические свойства (связи) с другими объектами.
Ключевым компонентом СУЗ является поисковая подсистема. Поиск производится не в хранилище документов на программное обеспечение, а в онтологии инфокоммуникационной системы. Онтология используется для описания информационных ресурсов с учетом семантики обрабатываемой информации. Используется комбинация синтаксического и семантического поиска, т.е. поиск выполняется в экземплярах онтологии с учетом их семантических свойств. Результатом такого поиска являются знания, которые используется человеком для принятия решения.
Онтология инфокоммуникационной системы разделена на функциональные составляющие: онтологию документации на программное обеспечение, лингвистическую онтологию, онтологию продукции.
Лингвистическая онтология реализована на основе набора терминов управляемых метаданных SharePoint. Онтология продукции реализована на основе списков SharePoint. Онтология документации представляет собой библиотеку документов SharePoint, один из атрибутов которой указывает на термин из набора терминов управляемых метаданных, другой атрибут – на экземпляр онтологии продукции.
Интерфейс СУЗ для обычного пользователя внешне напоминает интерфейс обычного Интернет-каталога. В его основе система рубрик, соответствующая иерархии бизнес-процессов (иерархия экземпляров лингвистической онтологии) и продукции (иерархия экземпляров онтологии продукции). Пользователь выбирает определённую рубрику и получает список модулей данных, которые ей соответствуют. Для наиболее полной и точной формализации информационной потребности пользователь может уточнить вид модуля данных и указать дополнительные слова, которые должны присутствовать в требуемых модулях данных или семантических свойствах. При этом результатом поиска являются релевантные фрагменты онтологии документации, для которых дополнительно автоматически добавляются связи с другими фрагментами онтологии документации.

Литература:
              1. Гаврилова Т.А. Онтологический подход к управлению знаниями при разработке корпоративных информационных систем / Т.А. Гаврилова // Новости искусственного интеллекта. – 2003. – № 2. – С. 24–30.
              2. Дмитриев П.И. Разработка системы управления знаниями инфокоммуникационной системы / П.И. Дмитриев // Труды XI Международной научно-практической конференции молодых ученых, студентов и аспирантов «Анализ и прогнозирование систем управления» I ч. – СПб.: СЗТУ, 2010. – С. 135-140.
              3. Ермаков А.Е. Извлечение знаний из текста и их обработка: состояние и перспективы / А.Е. Ермаков // Информационные технологии. – 2009. – N 7. – С. 50-55.
              4. Планирование управляемых метаданных (SharePoint Server 2010) [Электронный ресурс] / Microsoft Corporation, 2010. – Режим доступа: http://technet.microsoft.com/ru-ru/library/ee530389.aspx, свободный.
              5. Планирование управления корпоративным контентом (SharePoint Server 2010) [Электронный ресурс] / Microsoft Corporation, 2010. – Режим доступа: http://technet.microsoft.com/ru-ru/library/ff602190.aspx, свободный.
              6. Поиск в корпоративной среде SharePoint [Электронный ресурс] / Microsoft Corporation, 2010. – Режим доступа: http://msdn.microsoft.com/ru-ru/library/ee556856.aspx, свободный.
              7. Продукты SharePoint [Электронный ресурс] / Microsoft Corporation, 2010. – Режим доступа: http://technet.microsoft.com/ru-ru/library/ee428287.aspx, свободный.

Обсуждение

Социальные комментарии Cackle