Влияние параметров интернет-сайта на его индексацию в поисковых системах | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 28 декабря, печатный экземпляр отправим 1 января.

Опубликовать статью в журнале

Автор:

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №9 (20) сентябрь 2010 г.

Статья просмотрена: 132 раза

Библиографическое описание:

Пестряков, Р. В. Влияние параметров интернет-сайта на его индексацию в поисковых системах / Р. В. Пестряков. — Текст : непосредственный // Молодой ученый. — 2010. — № 9 (20). — С. 71-73. — URL: https://moluch.ru/archive/20/2021/ (дата обращения: 17.12.2024).

 

В современных условиях интернет развивается стремительными темпами. С каждым днём интернет сайтов становится всё больше и больше, конкуренция растёт, и поэтому постоянно возникает вопрос – как привлечь новых посетителей на недавно созданный сайт.

Обычно, большинство посетителей приходят на сайт с поисковых систем. В России наиболее популярными являются поисковые системы, разработанные компаниями Яндекс и Google. С них приходит основная часть посетителей.

Поэтому очень актуальным вопросом на сегодняшний день является вопрос повышения позиций интернет сайта в результатах поиска поисковых систем Яндекс и Google. Но чтобы сайт появился в результатах поиска, нужно чтобы этот сайт был проиндексирован поисковой системой. Индексация интернет сайта – это процесс занесения содержимого интернет сайта в базу данных поисковой системы. Сайт заносится в базу постранично, поэтому очень важно добиться индексации как можно большего числа страниц сайта. А для этого нужно знать, что влияет на процесс индексации.

В течение нескольких месяцев проводились исследования, в результате которых было выяснено, что на процесс индексации влияют следующие факторы: структура и содержание сайта, доменная зона, хостинг, на котором расположен сайт, наличие гиперссылок на сайт с других сайтов. Наиболее важными факторами здесь являются структура и содержание сайта. Поэтому, при создании сайтов и разработке систем для создания сайтов очень важно обратить внимание на многие моменты, чтобы индексация прошла успешно.

Первый момент, на который стоит обратить внимание – это содержание страниц сайта. В идеале, текст каждой страницы должен быть уникальным и максимально читабельным. Он не должен повторяться на других страницах и не должен быть заимствован с других сайтов. В нём не должно быть грамматических и синтаксических ошибок, поскольку это может привести либо к удалению сайта из базы поисковой системы (так называемое выпадение сайта из индекса), либо к повышению позиций сайта по ошибочным запросам. Желательно, чтобы текст был поделён на абзацы - это важно с точки зрения поисковой системы Яндекс. Текст не должен содержать большое количество одинаковых слов или словосочетаний, поскольку это может быть расценено поисковой системой как поисковый спам, и сайт будет удален из базы поисковой системы.

Так, для эксперимента было создано 20 сайтов на русском языке, которые были размещены на бесплатном хостинге (http://narod.yandex.ru/). Все сайты были добавлены для индексации в системе Яндекс через специальную форму добавления сайта, которую предоставляет сама поисковая система.  Дополнительных способов ускорения индексации не применялось. 5 сайтов были наполнены бессмысленным текстом – 2 из них были проиндексированы, но через неделю они выпали из индекса, 3 из них не были проиндексированы. Следующие 5 сайтов были созданы с использованием статей, заимствованных с других сайтов. 4 из них были проиндексированы через 2 недели. Эти сайты продержались в индексе поисковой системы около месяца. 1 сайт не был проиндексирован. Остальные 10 сайтов были созданы с различными нарушениями рекомендаций по составлению текстов для страниц сайта. Сайты с чрезмерным количеством опечаток были проиндексированы, но через 2-3 недели выпали из индекса. Сайты с большим количеством повторяющихся слов либо не были проиндексированы вообще, либо быстро выпадали из индекса, в зависимости от тематики сайта и частоты повторения слов.

Подобный эксперимент был проведен с поисковой системой Google. Было создано несколько сайтов, которые были размещены на платном хостинге на субдоменах уже существующего домена. В ходе эксперимента было установлено, что поисковая система Google немного по-другому реагирует на содержание страниц сайта. Сайты, содержащие бессмысленный текст остаются в индексе Google значительно дольше, чем в индексе Яндекса, однако Google очень плохо индексирует сайты, содержащие статьи, заимствованные у других сайтов. Также Google обращает внимание на несуществующие страницы и страницы с одинаковым текстом. То есть, если на сайте присутствует большое количество ссылок на страницы, которых не существует, или сайт содержит много страниц с одинаковым содержанием, то такой сайт в большинстве случаев не будет проиндексирован.

Помимо содержания сайта на процесс индексации влияет структура сайта. Под структурой сайта понимается совокупность многих параметров, начиная от шаблона сайта и способа перелинковки страниц, и заканчивая такими параметрами, как наличие или отсутствие xml карты сайта,  наличие внутренних ссылок и даже тип url страниц сайта. Учитывается также и тип сайта. Так, например, flash сайты хоть и индексируются, но происходит это далеко не всегда удачно, поскольку некоторые ссылки могут игнорироваться, а это приводит к попаданию в индекс небольшого числа страниц. Лучше всего индексируются простые html сайты, созданные без использования визуальных редакторов и различных систем администрирования сайтов.

Немаловажную роль играет перелинковка страниц между собой. Так, чтобы поисковый робот нашел страницу, она должна находиться не далее чем в трёх кликах от главной страницы. Поэтому, если на сайте много страниц, желательно разделять их на категории. Если разделить сайт на категории нельзя, то выходом может служить xml карта сайта, в которой указываются адреса всех страниц сайта.

Меню сайта не должно быть построено при помощи языка программирования javascript, т.к. поисковые системы не обрабатывают javascript код. В качестве эксперимента было создано 2 сайта про автомобили. В первом сайте меню было создано при помощи javascript, во втором меню было создано средствами html и css. Через 3 недели во втором сайте было проиндексировано 15 страниц из 23, а в первом сайте только одна главная страница. Через 4 недели во втором сайте было проиндексировано 23 страницы из 23, а в первом по-прежнему одна. Результаты эксперимента говорят о том, что если при создании сайта используется меню, построенное на javascript, то обязательно нужно дополнительно создавать xml карту сайта, чтобы поисковый робот нашел все страницы сайта.

Карта сайта в xml формате очень хорошо помогает индексации в поисковых системах, особенно это касается поисковой системы Google. В ней достаточно добавить карту сайта в специальном разделе для вебмастеров, и вскоре сайт будет проиндексирован. Причём индексация большого количества страниц займёт меньше времени, чем в случае отсутствия карты сайта.

При создании страниц сайта важно, чтобы url страниц были понятны человеку и содержали ключевые слова. Например, страницу про автомобили лучше назвать auto.html или auto-for-you.html, но не 01-28-13.html.  Это хоть и не отразится на индексации, но в результатах поиска при остальных равных условиях, предпочтение будет отдано странице с названием auto.html. То есть это очень важно с точки зрения оптимизации страницы под поисковые запросы.

Помимо содержания и структуры сайта, на его индексацию влияет также хостинг и доменная зона. Так, если сайт будет расположен на хостинге, сервера которого бывают часто недоступны, то поисковый робот может не найти сайта и не проиндексировать его. Поэтому следует выбирать хостинг понадежнее. Идеальным вариантом является аренда выделенного сервера, хотя это и дорогое удовольствие. Если планируется размещать сайт на бесплатном хостинге, то следует учитывать, что для каждого бесплатного хостинга у поисковых систем свой уровень доверия, поэтому на одних хостингах сайты индексируются быстрее, а на других не индексируются совсем. Так, например, из 3-х сайтов, созданных на английском языке и размещённых на хостинге http://atspace.com/, поисковой системой Google не был проиндексирован ни один, хотя требования к содержанию и структуре сайтов соблюдались. После того, как эти сайты были перенесены на платный хостинг, они были проиндексированы системой Google в течение недели.

В выборе хостинга есть один любопытный момент - поисковые системы очень хорошо относятся к бесплатным хостингам, которые они же сами и предоставляют. Так, например, сайты, расположенные на хостинге http://narod.yandex.ru/, который принадлежит компании Яндекс,  достаточно хорошо индексируются поисковой системой Яндекс (если они конечно сделаны с соблюдением вышеперечисленных рекомендаций). А блоги, созданные при помощи сервиса http://www.blogger.com/, который предоставляется компанией Google, отлично индексируются  поисковой системой Google.

 

 

 

Литература:

 

  1. И. Ашманов, А. Иванов. Оптимизация и продвижение сайтов в поисковых системах Питер, 2009 г., 400 стр.
  2. Д. Н. Колисниченко Поисковые системы и продвижение сайтов в Интернете. Вильямс, 2007 г., 272 стр.
  3. Авинаш Кошик. Веб-аналитика. Анализ информации о посетителях веб-сайтов. Диалектика 2009 г., 464 стр.

 

 

Основные термины (генерируются автоматически): поисковая система, сайт, карт сайта, сайт были, страница, страница сайта, бесплатный хостинг, поисковый робот, процесс индексации, результат поиска.


Задать вопрос