Решающую роль при разработке современных ИПС играют объёмы исходных данных. К системам, работающим с большим объемом информации, таким как Web предъявляются всё более жёсткие требования по производительности и качеству поиска.
Статья посвящена решению проблемы оптимизации использования информационно-поисковых систем в работе ИТУП «СофтСервис», г. Гродно.
Ключевые слова: Интернет, информационно-поисковые системы, Оптимизация поисковых алгоритмов и архитектуры поиска, увеличение мошностей, метапоисковая система
В настоящее время работает ряд авторитетных международных конференций, посвящённых обсуждению вопросов информационного поиска, например, таких как: WWW (World Wide Web) Conference — специально организованная конференция для решения задач связанных с Интернет; TREC (Text Retrieval Conference) серия конференций, сконцентрированных на исследовании различных областей информационного поиска и их задач. Она поддерживается National Institute of Standards and Technology (NIST) и Association of Religion Data Archives (ARDA), расположенных в США, начиная с 1992. Целью TREC является поддержка исследований сообщества информационного поиска с помощью предоставления инфраструктуры, необходимой для развития его технологий. Из Российских конференций посвященные вопросам информационного поиска, можно выделить всероссийскую конференцию «Электронные библиотеки» (RCDL) [5, с. 246].
Также вопросами улучшения качества поиска и внедрением информационно-поисковых систем, занимаются коммерческие организации Яндекс, Галактика-Зум Sphinx, Lucene, Google и др. [3, с. 157].
Многие системы поиска информации проходят тестирование на конференциях TREC, WWW Conference, таким образом, задавая приоритетные направления для проведения исследований в области поиска [1, с. 98].
Существует большой спектр предлагаемых решений: начиная от построения технологии информационного поиска, структур, индексов и до анализа текста. Безусловно, решение каждой задачи важно и полезно для повышения качества поиска. Тем не менее, именно от методов ранжирования документов во многом зависит эффективность существующих поисковых систем [2, с. 167].
Решающую роль при разработке современных ИПС играют объёмы исходных данных. К системам, работающим с большим объемом информации, таким как Web-поиск, крупные электронные библиотеки предъявляются всё более жёсткие требования по производительности и качеству поиска. Поскольку в настоявшее время количество информации, представленной в электронном виде, продолжает возрастать экспоненциально, вопрос реализации эффективных, масштабируемых и производительных информационно-поисковых систем на сегодняшний день остаётся открытым для исследователей. В 2014 только в Интернете количество доступной и содержательной информации по оценкам аналитиков составляет порядка 900 экзабайтов.
Практической базой написания магистерской диссертации на тему «Исследование архитектур информационно-поисковых систем» явилось ИТУП «СофтСервис». Так, как научно-производственную практику проходил в городе Гродно, на ИТУП «СофтСервис» в отделе автоматизации и информационного обеспечения.
Нами было установлено, что в ИТУП «СофтСервис» на современном этапе развития осуществлять поиск и использовать мощные потоки информации становится все труднее.
В ходе написания магистерской диссертации на тему «Исследование архитектур информационно-поисковых систем» нами были изучены методы и способы поиска информации в Интернете, используемые для работы ИТУП «СофтСервис».
В условиях постоянного роста объема информации главная задача поисковых систем — сохранение приемлемых для пользователей скорости и полноты выполнения запросов.
На сегодняшний день нам видится три основных подхода для уменьшения времени отклика:
- оптимизация базовых поисковых алгоритмов и архитектуры поиска:
- регулярное увеличение мощностей вычислительных ресурсов поисковой системы;
- использование архитектурной возможности масштабирования системы (если масштабируемость была заложена при проектировании системы).
Оптимизация поисковых алгоритмов и архитектуры поиска — это улучшение самого механизма поиска, а также изменение архитектуры (добавление/удаление узлов) для увеличения качества поиска и уменьшения времени [4, с. 83].
Увеличение мошностей — это регулярный переход на более мощные процессоры, добавление оперативной памяти, увеличение объёма жёстких дисков.
Для повышения производительности поиска информации в работе ИТУП «СофтСервис», г. Гродно предлагаю использовать мета поисковые системы. Метапоисковая система — это система, которая предоставляет единый доступ к нескольким другим поисковым системам, т. е. обслуживает запросы пользователей за счет опрашивания других поисковых систем (полностью независимых и не предоставляющих никакой специальной информации о содержимом своих индексов или используемых методах поиска).
Такие системы популярны в силу ряда причин:
- Повышение полноты охвата — ни одна поисковая система не имеет полного покрытия Web, и использование нескольких поисковых систем повышает вероятность обнаружения искомого документа. Хотя полнота ответа не является очень популярным критерием оценки эффективности поиска в Web, для некоторых задач, в частности, при составлении обзора, она очень важна.
- Повышение качества поиска — это выбор тех поисковых систем, которые лучше всего соответствуют текущим потребностям пользователя. Например, это может быть использование специализированной поисковой системы вместо поисковой системы общего назначения,
Расширить список информационных ресурсов в ИТУП «СофтСервис» можно следующими путями:
− провести поиск в зарубежных метапоисковых системах с целью выявления баз данных, посвященных конкретно тематике поиска;
− провести поиск по гипертекстовым ссылкам, двигаясь от уже найденных документов;
− провести поиск баз данных, опираясь на структуру URL уже найденных документов.
Использование исследованных методов позволяет пользователю самостоятельно проводить поиск информации в новой информационной среде. Она дает возможность не только улучшить качество получаемой в результате поиска информации, но и повысить ее полноту.
Рекомендации при поиске информации в Интернете для сотрудников ИТУП «СофтСервис»:
1. Необходимо стараться понять смысл вопроса. Возможно, ответ пользователю уже известен. Чтобы найти правильный адрес страницы, необходимо искать одновременно ключевые слова из вопроса и известный пользователю Интернет ответ.
2. Число документов, полученных в результате поиска, может быть огромно. Поэтому решающее значение для оптимального поиска информации имеет правильный набор ключевых слов.
3. Необходимо проверять орфографию в написании слова. Необходимо пользоваться синонимами, если список найденных страниц слишком мал.
4. Необходимо искать больше, чем по одному слову. Максимально сужать предмет поиска.
5. Желательно использовать настройки поиска в поисковых системах, чтобы задать удобные параметры описания документов и структуру страницы с результатами поиска.
Литература:
1. Беркгаут, В. В. Интернет: первые шаги [Текст] / В. В. Беркгаут. — М.: Р·Валент, 2010. — 113 с. — ISBN 5–93439–019–8.
2. Ботт, Э. Л. Компьютерные сети [Текст] / Э. Л. Ботт. — М.: Вильяме, 2006. — 328 c. — ISBN 4–872–59332–2.
3. Вейскас, Д. C. Компьютерные сети. Принципы, технологии, протоколы [Текст]/ Д. C. Вейскас. — СПб: Питер, 2007. — 481 c. — ISBN 4–285–76652–2.
4. Кренов, В. В. Интернет для начинающих [Текст] / В.В Кренов. — СПб.: Питер, 2008. — 473 с. — ISBN 4–238–26129–3.
5. Основы экономической информатики [Текст] / Под ред. А. Н. Морозевича. — Минск: БГЭУ, 2012. — 383 с. — ISBN 8–245–79452–2.