Библиографическое описание:

Алёшин А. В. Решение проблемы оптимизации использования информационно-поисковых систем в работе ИТУП «СофтСервис» (г. Гродно) // Молодой ученый. — 2015. — №2. — С. 43-45.

Решающую роль при разработке современных ИПС играют объёмы исходных данных. К системам, работающим с большим объемом информации, таким как Web предъявляются всё более жёсткие требования по производительности и качеству поиска.

Статья посвящена решению проблемы оптимизации использования информационно-поисковых систем в работе ИТУП «СофтСервис», г. Гродно.

Ключевые слова: Интернет, информационно-поисковые системы, Оптимизация поисковых алгоритмов и архитектуры поиска, увеличение мошностей, метапоисковая система

 

В настоящее время работает ряд авторитетных международных конференций, посвящённых обсуждению вопросов информационного поиска, например, таких как: WWW (World Wide Web) Conference — специально организованная конференция для решения задач связанных с Интернет; TREC (Text Retrieval Conference) серия конференций, сконцентрированных на исследовании различных областей информационного поиска и их задач. Она поддерживается National Institute of Standards and Technology (NIST) и Association of Religion Data Archives (ARDA), расположенных в США, начиная с 1992. Целью TREC является поддержка исследований сообщества информационного поиска с помощью предоставления инфраструктуры, необходимой для развития его технологий. Из Российских конференций посвященные вопросам информационного поиска, можно выделить всероссийскую конференцию «Электронные библиотеки» (RCDL) [5, с. 246].

Также вопросами улучшения качества поиска и внедрением информационно-поисковых систем, занимаются коммерческие организации Яндекс, Галактика-Зум Sphinx, Lucene, Google и др. [3, с. 157].

Многие системы поиска информации проходят тестирование на конференциях TREC, WWW Conference, таким образом, задавая приоритетные направления для проведения исследований в области поиска [1, с. 98].

Существует большой спектр предлагаемых решений: начиная от построения технологии информационного поиска, структур, индексов и до анализа текста. Безусловно, решение каждой задачи важно и полезно для повышения качества поиска. Тем не менее, именно от методов ранжирования документов во многом зависит эффективность существующих поисковых систем [2, с. 167].

Решающую роль при разработке современных ИПС играют объёмы исходных данных. К системам, работающим с большим объемом информации, таким как Web-поиск, крупные электронные библиотеки предъявляются всё более жёсткие требования по производительности и качеству поиска. Поскольку в настоявшее время количество информации, представленной в электронном виде, продолжает возрастать экспоненциально, вопрос реализации эффективных, масштабируемых и производительных информационно-поисковых систем на сегодняшний день остаётся открытым для исследователей. В 2014 только в Интернете количество доступной и содержательной информации по оценкам аналитиков составляет порядка 900 экзабайтов.

Практической базой написания магистерской диссертации на тему «Исследование архитектур информационно-поисковых систем» явилось ИТУП «СофтСервис». Так, как научно-производственную практику проходил в городе Гродно, на ИТУП «СофтСервис» в отделе автоматизации и информационного обеспечения.

Нами было установлено, что в ИТУП «СофтСервис» на современном этапе развития осуществлять поиск и использовать мощные потоки информации становится все труднее.

В ходе написания магистерской диссертации на тему «Исследование архитектур информационно-поисковых систем» нами были изучены методы и способы поиска информации в Интернете, используемые для работы ИТУП «СофтСервис».

В условиях постоянного роста объема информации главная задача поисковых систем — сохранение приемлемых для пользователей скорости и полноты выполнения запросов.

На сегодняшний день нам видится три основных подхода для уменьшения времени отклика:

-              оптимизация базовых поисковых алгоритмов и архитектуры поиска:

-              регулярное увеличение мощностей вычислительных ресурсов поисковой системы;

-              использование архитектурной возможности масштабирования системы (если масштабируемость была заложена при проектировании системы).

Оптимизация поисковых алгоритмов и архитектуры поиска — это улучшение самого механизма поиска, а также изменение архитектуры (добавление/удаление узлов) для увеличения качества поиска и уменьшения времени [4, с. 83].

Увеличение мошностей — это регулярный переход на более мощные процессоры, добавление оперативной памяти, увеличение объёма жёстких дисков.

Для повышения производительности поиска информации в работе ИТУП «СофтСервис», г. Гродно предлагаю использовать мета поисковые системы. Метапоисковая система — это система, которая предоставляет единый доступ к нескольким другим поисковым системам, т. е. обслуживает запросы пользователей за счет опрашивания других поисковых систем (полностью независимых и не предоставляющих никакой специальной информации о содержимом своих индексов или используемых методах поиска).

Такие системы популярны в силу ряда причин:

-              Повышение полноты охвата — ни одна поисковая система не имеет полного покрытия Web, и использование нескольких поисковых систем повышает вероятность обнаружения искомого документа. Хотя полнота ответа не является очень популярным критерием оценки эффективности поиска в Web, для некоторых задач, в частности, при составлении обзора, она очень важна.

-              Повышение качества поиска — это выбор тех поисковых систем, которые лучше всего соответствуют текущим потребностям пользователя. Например, это может быть использование специализированной поисковой системы вместо поисковой системы общего назначения,

Расширить список информационных ресурсов в ИТУП «СофтСервис» можно следующими путями:

−        провести поиск в зарубежных метапоисковых системах с целью выявления баз данных, посвященных конкретно тематике поиска;

−        провести поиск по гипертекстовым ссылкам, двигаясь от уже найденных документов;

−        провести поиск баз данных, опираясь на структуру URL уже найденных документов.

Использование исследованных методов позволяет пользователю самостоятельно проводить поиск информации в новой информационной среде. Она дает возможность не только улучшить качество получаемой в результате поиска информации, но и повысить ее полноту.

Рекомендации при поиске информации в Интернете для сотрудников ИТУП «СофтСервис»:

1.                  Необходимо стараться понять смысл вопроса. Возможно, ответ пользователю уже известен. Чтобы найти правильный адрес страницы, необходимо искать одновременно ключевые слова из вопроса и известный пользователю Интернет ответ.

2.                  Число документов, полученных в результате поиска, может быть огромно. Поэтому решающее значение для оптимального поиска информации имеет правильный набор ключевых слов.

3.                  Необходимо проверять орфографию в написании слова. Необходимо пользоваться синонимами, если список найденных страниц слишком мал.

4.                  Необходимо искать больше, чем по одному слову. Максимально сужать предмет поиска.

5.                  Желательно использовать настройки поиска в поисковых системах, чтобы задать удобные параметры описания документов и структуру страницы с результатами поиска.

 

Литература:

 

1.             Беркгаут, В. В. Интернет: первые шаги [Текст] / В. В. Беркгаут. — М.: Р·Валент, 2010. — 113 с. — ISBN 5–93439–019–8.

2.             Ботт, Э. Л. Компьютерные сети [Текст] / Э. Л. Ботт. — М.: Вильяме, 2006. — 328 c. — ISBN 4–872–59332–2.

3.             Вейскас, Д. C. Компьютерные сети. Принципы, технологии, протоколы [Текст]/ Д. C. Вейскас. — СПб: Питер, 2007. — 481 c. — ISBN 4–285–76652–2.

4.             Кренов, В. В. Интернет для начинающих [Текст] / В.В Кренов. — СПб.: Питер, 2008. — 473 с. — ISBN 4–238–26129–3.

5.             Основы экономической информатики [Текст] / Под ред. А. Н. Морозевича. — Минск: БГЭУ, 2012. — 383 с. — ISBN 8–245–79452–2.

Обсуждение

Социальные комментарии Cackle