Решение проблемы оптимизации использования информационно-поисковых систем в работе ИТУП «СофтСервис» (г. Гродно) | Статья в журнале «Молодой ученый»

Автор:

Рубрика: Информатика

Опубликовано в Молодой учёный №2 (82) январь-2 2015 г.

Дата публикации: 12.01.2015

Статья просмотрена: 136 раз

Библиографическое описание:

Алёшин А. В. Решение проблемы оптимизации использования информационно-поисковых систем в работе ИТУП «СофтСервис» (г. Гродно) // Молодой ученый. — 2015. — №2. — С. 43-45. — URL https://moluch.ru/archive/82/14921/ (дата обращения: 21.10.2018).

Решающую роль при разработке современных ИПС играют объёмы исходных данных. К системам, работающим с большим объемом информации, таким как Web предъявляются всё более жёсткие требования по производительности и качеству поиска.

Статья посвящена решению проблемы оптимизации использования информационно-поисковых систем в работе ИТУП «СофтСервис», г. Гродно.

Ключевые слова: Интернет, информационно-поисковые системы, Оптимизация поисковых алгоритмов и архитектуры поиска, увеличение мошностей, метапоисковая система

 

В настоящее время работает ряд авторитетных международных конференций, посвящённых обсуждению вопросов информационного поиска, например, таких как: WWW (World Wide Web) Conference — специально организованная конференция для решения задач связанных с Интернет; TREC (Text Retrieval Conference) серия конференций, сконцентрированных на исследовании различных областей информационного поиска и их задач. Она поддерживается National Institute of Standards and Technology (NIST) и Association of Religion Data Archives (ARDA), расположенных в США, начиная с 1992. Целью TREC является поддержка исследований сообщества информационного поиска с помощью предоставления инфраструктуры, необходимой для развития его технологий. Из Российских конференций посвященные вопросам информационного поиска, можно выделить всероссийскую конференцию «Электронные библиотеки» (RCDL) [5, с. 246].

Также вопросами улучшения качества поиска и внедрением информационно-поисковых систем, занимаются коммерческие организации Яндекс, Галактика-Зум Sphinx, Lucene, Google и др. [3, с. 157].

Многие системы поиска информации проходят тестирование на конференциях TREC, WWW Conference, таким образом, задавая приоритетные направления для проведения исследований в области поиска [1, с. 98].

Существует большой спектр предлагаемых решений: начиная от построения технологии информационного поиска, структур, индексов и до анализа текста. Безусловно, решение каждой задачи важно и полезно для повышения качества поиска. Тем не менее, именно от методов ранжирования документов во многом зависит эффективность существующих поисковых систем [2, с. 167].

Решающую роль при разработке современных ИПС играют объёмы исходных данных. К системам, работающим с большим объемом информации, таким как Web-поиск, крупные электронные библиотеки предъявляются всё более жёсткие требования по производительности и качеству поиска. Поскольку в настоявшее время количество информации, представленной в электронном виде, продолжает возрастать экспоненциально, вопрос реализации эффективных, масштабируемых и производительных информационно-поисковых систем на сегодняшний день остаётся открытым для исследователей. В 2014 только в Интернете количество доступной и содержательной информации по оценкам аналитиков составляет порядка 900 экзабайтов.

Практической базой написания магистерской диссертации на тему «Исследование архитектур информационно-поисковых систем» явилось ИТУП «СофтСервис». Так, как научно-производственную практику проходил в городе Гродно, на ИТУП «СофтСервис» в отделе автоматизации и информационного обеспечения.

Нами было установлено, что в ИТУП «СофтСервис» на современном этапе развития осуществлять поиск и использовать мощные потоки информации становится все труднее.

В ходе написания магистерской диссертации на тему «Исследование архитектур информационно-поисковых систем» нами были изучены методы и способы поиска информации в Интернете, используемые для работы ИТУП «СофтСервис».

В условиях постоянного роста объема информации главная задача поисковых систем — сохранение приемлемых для пользователей скорости и полноты выполнения запросов.

На сегодняшний день нам видится три основных подхода для уменьшения времени отклика:

-              оптимизация базовых поисковых алгоритмов и архитектуры поиска:

-              регулярное увеличение мощностей вычислительных ресурсов поисковой системы;

-              использование архитектурной возможности масштабирования системы (если масштабируемость была заложена при проектировании системы).

Оптимизация поисковых алгоритмов и архитектуры поиска — это улучшение самого механизма поиска, а также изменение архитектуры (добавление/удаление узлов) для увеличения качества поиска и уменьшения времени [4, с. 83].

Увеличение мошностей — это регулярный переход на более мощные процессоры, добавление оперативной памяти, увеличение объёма жёстких дисков.

Для повышения производительности поиска информации в работе ИТУП «СофтСервис», г. Гродно предлагаю использовать мета поисковые системы. Метапоисковая система — это система, которая предоставляет единый доступ к нескольким другим поисковым системам, т. е. обслуживает запросы пользователей за счет опрашивания других поисковых систем (полностью независимых и не предоставляющих никакой специальной информации о содержимом своих индексов или используемых методах поиска).

Такие системы популярны в силу ряда причин:

-              Повышение полноты охвата — ни одна поисковая система не имеет полного покрытия Web, и использование нескольких поисковых систем повышает вероятность обнаружения искомого документа. Хотя полнота ответа не является очень популярным критерием оценки эффективности поиска в Web, для некоторых задач, в частности, при составлении обзора, она очень важна.

-              Повышение качества поиска — это выбор тех поисковых систем, которые лучше всего соответствуют текущим потребностям пользователя. Например, это может быть использование специализированной поисковой системы вместо поисковой системы общего назначения,

Расширить список информационных ресурсов в ИТУП «СофтСервис» можно следующими путями:

−        провести поиск в зарубежных метапоисковых системах с целью выявления баз данных, посвященных конкретно тематике поиска;

−        провести поиск по гипертекстовым ссылкам, двигаясь от уже найденных документов;

−        провести поиск баз данных, опираясь на структуру URL уже найденных документов.

Использование исследованных методов позволяет пользователю самостоятельно проводить поиск информации в новой информационной среде. Она дает возможность не только улучшить качество получаемой в результате поиска информации, но и повысить ее полноту.

Рекомендации при поиске информации в Интернете для сотрудников ИТУП «СофтСервис»:

1.                  Необходимо стараться понять смысл вопроса. Возможно, ответ пользователю уже известен. Чтобы найти правильный адрес страницы, необходимо искать одновременно ключевые слова из вопроса и известный пользователю Интернет ответ.

2.                  Число документов, полученных в результате поиска, может быть огромно. Поэтому решающее значение для оптимального поиска информации имеет правильный набор ключевых слов.

3.                  Необходимо проверять орфографию в написании слова. Необходимо пользоваться синонимами, если список найденных страниц слишком мал.

4.                  Необходимо искать больше, чем по одному слову. Максимально сужать предмет поиска.

5.                  Желательно использовать настройки поиска в поисковых системах, чтобы задать удобные параметры описания документов и структуру страницы с результатами поиска.

 

Литература:

 

1.             Беркгаут, В. В. Интернет: первые шаги [Текст] / В. В. Беркгаут. — М.: Р·Валент, 2010. — 113 с. — ISBN 5–93439–019–8.

2.             Ботт, Э. Л. Компьютерные сети [Текст] / Э. Л. Ботт. — М.: Вильяме, 2006. — 328 c. — ISBN 4–872–59332–2.

3.             Вейскас, Д. C. Компьютерные сети. Принципы, технологии, протоколы [Текст]/ Д. C. Вейскас. — СПб: Питер, 2007. — 481 c. — ISBN 4–285–76652–2.

4.             Кренов, В. В. Интернет для начинающих [Текст] / В.В Кренов. — СПб.: Питер, 2008. — 473 с. — ISBN 4–238–26129–3.

5.             Основы экономической информатики [Текст] / Под ред. А. Н. Морозевича. — Минск: БГЭУ, 2012. — 383 с. — ISBN 8–245–79452–2.

Основные термины (генерируются автоматически): система, TREC, информационный поиск, WWW, архитектура поиска, поисковая система, NIST, магистерская диссертация, метапоисковая система, ARDA.


Ключевые слова

Интернет, информационно-поисковые системы, Оптимизация поисковых алгоритмов и архитектуры поиска, увеличение мошностей, метапоисковая система

Похожие статьи

Архитектура информационной системы предприятий

Ключевые слова: информационная система, информационные технологии, менеджмент предприятия, архитектура ИС, клиент-сервер

Поэтому актуальным является исследование и поиск способов решения проблем управления архитектурой информационных систем (ИС)...

Анализ информационных технологий для веб-публикации...

Осуществлять поиск этих данных можно по разным параметрам: по типу и имени элемента, атрибутам (метаданным) объекта с возможностью указания сложных критериев (больше

Веб-публикация ГИС представляет собой распределённую информационную систему.

Разработка информационной поисковой системы...

Разработка информационной поисковой системы позиционирования технологического оборудования реакторного отделения АЭС.

Таким образом, ИПСПТО реакторного отделения позволяет осуществлять поиск по электронной схеме каждого вида технологического...

Информационная архитектура | Статья в журнале...

Архитектура информационной системы предприятий.

Headless-архитектура информационной системы предприятия. Архитектура универсальных средств автоматизации научных установок.

Математические модели процессов наблюдения в составе...

Процесс поиска в таких системах основывается на радиолокационном обзоре – периодическом облучении всех точек заданной области пространства и

Без ограничения общности полагаем, что поисковая система (ПС) включает J поисковых единиц (ПЕ), динамика векторов...

Проблема построения информационно-поискового тезауруса

· использование как поискового средства при поиске документов; · единицы традиционных информационно-поисковых тезаурусов.

· Ресурсы в коллекции (publ_cat); · Список разделов (тем) (temas_class). Объекты, которые хранятся в системе, являются статьями.

Семантический поиск документов, классифицированных...

Семантический поиск документов, классифицированных в международной системе классификации патентов.

Адаптивный поиск информации в Internet. Классификация документов в системе электронного документооборота.

Использование в распределённых информационно-управляющих...

Одним из фундаментальных вопросов современной теории поиска объектов является выбор модели поисковых усилий (поискового потенциала) поисковой системы и поисковых единиц, её составляющих.

Архитектура информационной системы предприятий

Ключевые слова: информационная система, информационные технологии, менеджмент предприятия, архитектура ИС, клиент-сервер

Поэтому актуальным является исследование и поиск способов решения проблем управления архитектурой информационных систем (ИС)...

Анализ информационных технологий для веб-публикации...

Осуществлять поиск этих данных можно по разным параметрам: по типу и имени элемента, атрибутам (метаданным) объекта с возможностью указания сложных критериев (больше

Веб-публикация ГИС представляет собой распределённую информационную систему.

Разработка информационной поисковой системы...

Разработка информационной поисковой системы позиционирования технологического оборудования реакторного отделения АЭС.

Таким образом, ИПСПТО реакторного отделения позволяет осуществлять поиск по электронной схеме каждого вида технологического...

Информационная архитектура | Статья в журнале...

Архитектура информационной системы предприятий.

Headless-архитектура информационной системы предприятия. Архитектура универсальных средств автоматизации научных установок.

Математические модели процессов наблюдения в составе...

Процесс поиска в таких системах основывается на радиолокационном обзоре – периодическом облучении всех точек заданной области пространства и

Без ограничения общности полагаем, что поисковая система (ПС) включает J поисковых единиц (ПЕ), динамика векторов...

Проблема построения информационно-поискового тезауруса

· использование как поискового средства при поиске документов; · единицы традиционных информационно-поисковых тезаурусов.

· Ресурсы в коллекции (publ_cat); · Список разделов (тем) (temas_class). Объекты, которые хранятся в системе, являются статьями.

Семантический поиск документов, классифицированных...

Семантический поиск документов, классифицированных в международной системе классификации патентов.

Адаптивный поиск информации в Internet. Классификация документов в системе электронного документооборота.

Использование в распределённых информационно-управляющих...

Одним из фундаментальных вопросов современной теории поиска объектов является выбор модели поисковых усилий (поискового потенциала) поисковой системы и поисковых единиц, её составляющих.

Обсуждение

Социальные комментарии Cackle

Похожие статьи

Архитектура информационной системы предприятий

Ключевые слова: информационная система, информационные технологии, менеджмент предприятия, архитектура ИС, клиент-сервер

Поэтому актуальным является исследование и поиск способов решения проблем управления архитектурой информационных систем (ИС)...

Анализ информационных технологий для веб-публикации...

Осуществлять поиск этих данных можно по разным параметрам: по типу и имени элемента, атрибутам (метаданным) объекта с возможностью указания сложных критериев (больше

Веб-публикация ГИС представляет собой распределённую информационную систему.

Разработка информационной поисковой системы...

Разработка информационной поисковой системы позиционирования технологического оборудования реакторного отделения АЭС.

Таким образом, ИПСПТО реакторного отделения позволяет осуществлять поиск по электронной схеме каждого вида технологического...

Информационная архитектура | Статья в журнале...

Архитектура информационной системы предприятий.

Headless-архитектура информационной системы предприятия. Архитектура универсальных средств автоматизации научных установок.

Математические модели процессов наблюдения в составе...

Процесс поиска в таких системах основывается на радиолокационном обзоре – периодическом облучении всех точек заданной области пространства и

Без ограничения общности полагаем, что поисковая система (ПС) включает J поисковых единиц (ПЕ), динамика векторов...

Проблема построения информационно-поискового тезауруса

· использование как поискового средства при поиске документов; · единицы традиционных информационно-поисковых тезаурусов.

· Ресурсы в коллекции (publ_cat); · Список разделов (тем) (temas_class). Объекты, которые хранятся в системе, являются статьями.

Семантический поиск документов, классифицированных...

Семантический поиск документов, классифицированных в международной системе классификации патентов.

Адаптивный поиск информации в Internet. Классификация документов в системе электронного документооборота.

Использование в распределённых информационно-управляющих...

Одним из фундаментальных вопросов современной теории поиска объектов является выбор модели поисковых усилий (поискового потенциала) поисковой системы и поисковых единиц, её составляющих.

Архитектура информационной системы предприятий

Ключевые слова: информационная система, информационные технологии, менеджмент предприятия, архитектура ИС, клиент-сервер

Поэтому актуальным является исследование и поиск способов решения проблем управления архитектурой информационных систем (ИС)...

Анализ информационных технологий для веб-публикации...

Осуществлять поиск этих данных можно по разным параметрам: по типу и имени элемента, атрибутам (метаданным) объекта с возможностью указания сложных критериев (больше

Веб-публикация ГИС представляет собой распределённую информационную систему.

Разработка информационной поисковой системы...

Разработка информационной поисковой системы позиционирования технологического оборудования реакторного отделения АЭС.

Таким образом, ИПСПТО реакторного отделения позволяет осуществлять поиск по электронной схеме каждого вида технологического...

Информационная архитектура | Статья в журнале...

Архитектура информационной системы предприятий.

Headless-архитектура информационной системы предприятия. Архитектура универсальных средств автоматизации научных установок.

Математические модели процессов наблюдения в составе...

Процесс поиска в таких системах основывается на радиолокационном обзоре – периодическом облучении всех точек заданной области пространства и

Без ограничения общности полагаем, что поисковая система (ПС) включает J поисковых единиц (ПЕ), динамика векторов...

Проблема построения информационно-поискового тезауруса

· использование как поискового средства при поиске документов; · единицы традиционных информационно-поисковых тезаурусов.

· Ресурсы в коллекции (publ_cat); · Список разделов (тем) (temas_class). Объекты, которые хранятся в системе, являются статьями.

Семантический поиск документов, классифицированных...

Семантический поиск документов, классифицированных в международной системе классификации патентов.

Адаптивный поиск информации в Internet. Классификация документов в системе электронного документооборота.

Использование в распределённых информационно-управляющих...

Одним из фундаментальных вопросов современной теории поиска объектов является выбор модели поисковых усилий (поискового потенциала) поисковой системы и поисковых единиц, её составляющих.

Задать вопрос