Библиографическое описание:

Пестряков Р. В. Влияние параметров интернет-сайта на его индексацию в поисковых системах // Молодой ученый. — 2010. — №9. — С. 71-73.

 

В современных условиях интернет развивается стремительными темпами. С каждым днём интернет сайтов становится всё больше и больше, конкуренция растёт, и поэтому постоянно возникает вопрос – как привлечь новых посетителей на недавно созданный сайт.

Обычно, большинство посетителей приходят на сайт с поисковых систем. В России наиболее популярными являются поисковые системы, разработанные компаниями Яндекс и Google. С них приходит основная часть посетителей.

Поэтому очень актуальным вопросом на сегодняшний день является вопрос повышения позиций интернет сайта в результатах поиска поисковых систем Яндекс и Google. Но чтобы сайт появился в результатах поиска, нужно чтобы этот сайт был проиндексирован поисковой системой. Индексация интернет сайта – это процесс занесения содержимого интернет сайта в базу данных поисковой системы. Сайт заносится в базу постранично, поэтому очень важно добиться индексации как можно большего числа страниц сайта. А для этого нужно знать, что влияет на процесс индексации.

В течение нескольких месяцев проводились исследования, в результате которых было выяснено, что на процесс индексации влияют следующие факторы: структура и содержание сайта, доменная зона, хостинг, на котором расположен сайт, наличие гиперссылок на сайт с других сайтов. Наиболее важными факторами здесь являются структура и содержание сайта. Поэтому, при создании сайтов и разработке систем для создания сайтов очень важно обратить внимание на многие моменты, чтобы индексация прошла успешно.

Первый момент, на который стоит обратить внимание – это содержание страниц сайта. В идеале, текст каждой страницы должен быть уникальным и максимально читабельным. Он не должен повторяться на других страницах и не должен быть заимствован с других сайтов. В нём не должно быть грамматических и синтаксических ошибок, поскольку это может привести либо к удалению сайта из базы поисковой системы (так называемое выпадение сайта из индекса), либо к повышению позиций сайта по ошибочным запросам. Желательно, чтобы текст был поделён на абзацы - это важно с точки зрения поисковой системы Яндекс. Текст не должен содержать большое количество одинаковых слов или словосочетаний, поскольку это может быть расценено поисковой системой как поисковый спам, и сайт будет удален из базы поисковой системы.

Так, для эксперимента было создано 20 сайтов на русском языке, которые были размещены на бесплатном хостинге (http://narod.yandex.ru/). Все сайты были добавлены для индексации в системе Яндекс через специальную форму добавления сайта, которую предоставляет сама поисковая система.  Дополнительных способов ускорения индексации не применялось. 5 сайтов были наполнены бессмысленным текстом – 2 из них были проиндексированы, но через неделю они выпали из индекса, 3 из них не были проиндексированы. Следующие 5 сайтов были созданы с использованием статей, заимствованных с других сайтов. 4 из них были проиндексированы через 2 недели. Эти сайты продержались в индексе поисковой системы около месяца. 1 сайт не был проиндексирован. Остальные 10 сайтов были созданы с различными нарушениями рекомендаций по составлению текстов для страниц сайта. Сайты с чрезмерным количеством опечаток были проиндексированы, но через 2-3 недели выпали из индекса. Сайты с большим количеством повторяющихся слов либо не были проиндексированы вообще, либо быстро выпадали из индекса, в зависимости от тематики сайта и частоты повторения слов.

Подобный эксперимент был проведен с поисковой системой Google. Было создано несколько сайтов, которые были размещены на платном хостинге на субдоменах уже существующего домена. В ходе эксперимента было установлено, что поисковая система Google немного по-другому реагирует на содержание страниц сайта. Сайты, содержащие бессмысленный текст остаются в индексе Google значительно дольше, чем в индексе Яндекса, однако Google очень плохо индексирует сайты, содержащие статьи, заимствованные у других сайтов. Также Google обращает внимание на несуществующие страницы и страницы с одинаковым текстом. То есть, если на сайте присутствует большое количество ссылок на страницы, которых не существует, или сайт содержит много страниц с одинаковым содержанием, то такой сайт в большинстве случаев не будет проиндексирован.

Помимо содержания сайта на процесс индексации влияет структура сайта. Под структурой сайта понимается совокупность многих параметров, начиная от шаблона сайта и способа перелинковки страниц, и заканчивая такими параметрами, как наличие или отсутствие xml карты сайта,  наличие внутренних ссылок и даже тип url страниц сайта. Учитывается также и тип сайта. Так, например, flash сайты хоть и индексируются, но происходит это далеко не всегда удачно, поскольку некоторые ссылки могут игнорироваться, а это приводит к попаданию в индекс небольшого числа страниц. Лучше всего индексируются простые html сайты, созданные без использования визуальных редакторов и различных систем администрирования сайтов.

Немаловажную роль играет перелинковка страниц между собой. Так, чтобы поисковый робот нашел страницу, она должна находиться не далее чем в трёх кликах от главной страницы. Поэтому, если на сайте много страниц, желательно разделять их на категории. Если разделить сайт на категории нельзя, то выходом может служить xml карта сайта, в которой указываются адреса всех страниц сайта.

Меню сайта не должно быть построено при помощи языка программирования javascript, т.к. поисковые системы не обрабатывают javascript код. В качестве эксперимента было создано 2 сайта про автомобили. В первом сайте меню было создано при помощи javascript, во втором меню было создано средствами html и css. Через 3 недели во втором сайте было проиндексировано 15 страниц из 23, а в первом сайте только одна главная страница. Через 4 недели во втором сайте было проиндексировано 23 страницы из 23, а в первом по-прежнему одна. Результаты эксперимента говорят о том, что если при создании сайта используется меню, построенное на javascript, то обязательно нужно дополнительно создавать xml карту сайта, чтобы поисковый робот нашел все страницы сайта.

Карта сайта в xml формате очень хорошо помогает индексации в поисковых системах, особенно это касается поисковой системы Google. В ней достаточно добавить карту сайта в специальном разделе для вебмастеров, и вскоре сайт будет проиндексирован. Причём индексация большого количества страниц займёт меньше времени, чем в случае отсутствия карты сайта.

При создании страниц сайта важно, чтобы url страниц были понятны человеку и содержали ключевые слова. Например, страницу про автомобили лучше назвать auto.html или auto-for-you.html, но не 01-28-13.html.  Это хоть и не отразится на индексации, но в результатах поиска при остальных равных условиях, предпочтение будет отдано странице с названием auto.html. То есть это очень важно с точки зрения оптимизации страницы под поисковые запросы.

Помимо содержания и структуры сайта, на его индексацию влияет также хостинг и доменная зона. Так, если сайт будет расположен на хостинге, сервера которого бывают часто недоступны, то поисковый робот может не найти сайта и не проиндексировать его. Поэтому следует выбирать хостинг понадежнее. Идеальным вариантом является аренда выделенного сервера, хотя это и дорогое удовольствие. Если планируется размещать сайт на бесплатном хостинге, то следует учитывать, что для каждого бесплатного хостинга у поисковых систем свой уровень доверия, поэтому на одних хостингах сайты индексируются быстрее, а на других не индексируются совсем. Так, например, из 3-х сайтов, созданных на английском языке и размещённых на хостинге http://atspace.com/, поисковой системой Google не был проиндексирован ни один, хотя требования к содержанию и структуре сайтов соблюдались. После того, как эти сайты были перенесены на платный хостинг, они были проиндексированы системой Google в течение недели.

В выборе хостинга есть один любопытный момент - поисковые системы очень хорошо относятся к бесплатным хостингам, которые они же сами и предоставляют. Так, например, сайты, расположенные на хостинге http://narod.yandex.ru/, который принадлежит компании Яндекс,  достаточно хорошо индексируются поисковой системой Яндекс (если они конечно сделаны с соблюдением вышеперечисленных рекомендаций). А блоги, созданные при помощи сервиса http://www.blogger.com/, который предоставляется компанией Google, отлично индексируются  поисковой системой Google.

 

 

 

Литература:

 

  1. И. Ашманов, А. Иванов. Оптимизация и продвижение сайтов в поисковых системах Питер, 2009 г., 400 стр.
  2. Д. Н. Колисниченко Поисковые системы и продвижение сайтов в Интернете. Вильямс, 2007 г., 272 стр.
  3. Авинаш Кошик. Веб-аналитика. Анализ информации о посетителях веб-сайтов. Диалектика 2009 г., 464 стр.

 

 

Основные термины (генерируются автоматически): страниц сайта, поисковой системой, поисковой системы, поисковой системой google, содержание страниц сайта, интернет сайта, содержание сайта, процесс индексации, числа страниц сайта, карту сайта, базы поисковой системы, поисковый робот, поисковые системы, поисковых систем, создании страниц сайта, позиций интернет сайта, Индексация интернет сайта, содержимого интернет сайта, бесплатном хостинге, результатах поиска.

Обсуждение

Социальные комментарии Cackle