Как запретить индексацию сайта или страницы в поисковых системах

Продвижение сайтов самостоятельно | Индексация сайта

В прошлой статье мы рассмотрели вопросы ускорения индексации сайта. Говорили о том, что это важная часть всех работ по продвижению. Тем не менее, есть ситуации, когда нужно закрыть от индексации либо весь сайт, либо какую-то часть: разделы, страницы, ссылки и т.д. Сегодня мы рассмотрим вопрос, как запретить индексацию сайта в поисковых системах. В каких случаях это требуется? Обычно запрет индексации ставится на различные служебные модули сайта. Которые не несут смысловой нагрузки, как для пользователей, так и для ПС. Это администраторский раздел, формы регистрации и ввода информации, профили юзеров и т.д. Так же это может быть и секретный раздел на форуме, содержание которого мы не хотим показывать всем. Кроме того, надо закрыть дубли страниц от индексации, которые могут создавать различные движки сайтов.

Запрещать индексировать можно как всю страницу целиком, так и отдельную ее часть, например кусок текста или ссылку. Поэтому можно говорить как о глобальном запрете индексирования, так и о локальном. Теперь поговорим предметно, как это реализовать.

Запрет индексации сайта в robots.txt


При помощи файла robots.txt мы можем запретить индексацию отдельной страницы или целого раздела сайта. Я уже писал подробную статью с множеством примеров про robots.txt. Там вы можете прочитать, что это за файл, как его создавать и настраивать. В контексте данной статьи я напомню, как запретить индексацию в robots.txt

User-agent: *
Disallow: /kolobok.html
Disallow: /foto/


Где, * - определяет, что инструкции предназначены для всех ПС;
Disallow: /kolobok.html - запрещает индексировать файл kolobok.html;
Disallow: /foto/ - дает запрет на индексацию всего содержимого папки foto.

Если вам надо запретить несколько папок и/или страниц, все их указываем в роботсе.

Запрет индексации страницы в мета-теге robots


Для запрета индексации отдельной страницы можно воспользоваться мета-тегом robots. Особенность его использования в отличие от robots.txt в том, что он дает указания сразу всем ПС. А в robots.txt можно настроить под отдельную поисковую систему. Этот мета тег подчиняется общим правилам формата html и должен находится в заголовке страницы между тегами <head><⁄head>.Пример записи для запрета:

<meta name="robots" content="noindex, nofollow">


Атрибут content может содержать такие условия:

index - разрешает индексацию этой страницы;
noindex – запрещает индексацию страницы ;
follow – разрешает индексировать ссылки на этой странице;
nofollow – запрещает индексацию ссылок на странице;
all – включает в себя сразу index и follow (разрешает индексировать и страницу и ссылки);
none – включает noindex и nofollow, т.е. запрещает индексацию

пример записи, которая разрешает все:

<meta name="robots" content="all"/>


Или запрещает все и индексацию текста и ссылок:

<meta name="robots" content="none"/>


Так же, можно указать для какой ПС предназначены ограничения в мета теге robots. Яндекс точно понимает такую запись:

<meta name="yandex" content="all"/>



Запрет индексации ссылки: атрибут rel="nofollow" тега <A>


Давайте теперь расскажу, как закрыть ссылку от индексации. Что бы закрыть конкретную ссылку от индексации можно воспользоваться атрибутом rel="nofollow" в теге <A>. Пример записи атрибута:

<a href="//site.ru" rel="nofollow">ссылка</a>


Атрибут rel="nofollow" учитывают все нужные нам поисковики: Яндекс и Google. В отличие от мета-тега «robots», который, запрещает индексировать сразу все ссылки, «rel» закрывать только одну ссылку.

Часто этот атрибут применяют, когда не желают терять по ссылкам ссылочный вес страницы.

Запрет индексации тегом <noindex>


При помощи тега <noindex> можно закрыть от индексации определенную часть страницы. Это может быть кусок текста или кода, что угодно. Часто вебмастера закрывают этим тегом счетчики статистики и скрипты на сайтах. Пример записи:

<noindex>часть страницы, которую надо закрыть от индексации</noindex>


Тег «noindex» может располагаться в любой части страницы и не чувствителен к вложенности. Что бы сделать его валидным, применяйте такую запись:

<!––noindex––>текст, индексирование которого нужно запретить<!––/noindex––>



Запрет индексации в htaccess


Файл htaccess может заблокировать доступ к определенной части сайта, например к отдельной странице. Если вы хотите закрыть страницу от Яндекса то вам нужна такая запись.

RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} yandex
RewriteRule ^тут_урл_страницы$ - [F]



Вот мы и разобрали все возможные способы и методы запрета индексации как целых разделов или страниц сайта, так и каких-то определенных частей. Кстати, посмотреть какие страницы вашего сайта закрыты от индексации можно в панеле вебмастера, как в Яндексе, так и в Google. Для этого нужно сайт добавить свой сайт в аккаунт, и при анализе страниц будет видно, какие из них закрыты.

В следующей статье предлагаю рассмотреть вопрос, почему сайт не индексируется.

Оглавление