SEO и GEO · 20 июня 2026 · 7 мин чтения

robots.txt: как настроить и не закрыть сайт от поиска

Что такое robots.txt простыми словами, как настроить файл и не закрыть сайт от индексации по ошибке. Синтаксис, директива Sitemap, robots.txt для WordPress и Тильды, частые ошибки и проверка.

Файл robots.txt в корне сайта, директивы User-agent, Disallow и Sitemap
Содержание · 9

robots.txt: как настроить и не закрыть сайт от поиска

Один файл в корне сайта решает, какие страницы попадут в поиск, а какие нет. Настроишь правильно - роботы Яндекса и Google не тратят время на мусорные страницы и быстрее находят нужные. Ошибёшься в одной строке - и весь сайт выпадает из выдачи, а владелец месяцами не понимает, почему трафика нет.

Разберём по-человечески: что это за файл, как он устроен, как написать рабочий robots.txt и какие ошибки в нём встречаются чаще всего.

robots.txtодин файл в корне сайта 3 строкиминимум, чтобы файл работал 2 минутыпроверить, не закрыт ли сайт

Что такое robots.txt простыми словами#

robots.txt - это инструкция для поисковых роботов. Лежит в корне сайта и открывается по адресу вашсайт.ру/robots.txt. Любой может его посмотреть, это нормально.

Когда робот Яндекса или Google заходит на сайт, он первым делом читает этот файл. В нём написано, по каким разделам ходить можно, а по каким не стоит. Например, незачем индексировать корзину, страницу оплаты или результаты внутреннего поиска - это служебные страницы, в выдаче им делать нечего.

Логика по умолчанию простая: что явно не запрещено, то разрешено. Если файла нет вообще или в нём нет запретов, робот обходит весь сайт. Поэтому robots.txt нужен не чтобы «открыть» сайт, а чтобы аккуратно закрыть лишнее и подсказать роботу, где лежит карта сайта.

Как устроен файл: основные директивы#

robots.txt состоит из блоков. Каждый блок начинается со строки User-agent - это имя робота, к которому относятся правила. Дальше идут разрешения и запреты.

  • User-agent - кому адресованы правила. * означает «всем роботам». Можно указать конкретного: YandexBot, Googlebot.
  • Disallow - что обходить нельзя. Disallow: /admin/ закрывает раздел, Disallow: / закрывает весь сайт.
  • Allow - что обходить можно. Нужна, чтобы открыть исключение внутри закрытого раздела.
  • Sitemap - ссылка на карту сайта. Показывает роботу полный список страниц.
  • Clean-param - только для Яндекса. Помогает не плодить дубли из-за меток в адресе (utm, sort и подобных).

Пути в Disallow и Allow пишутся от корня сайта. Регистр важен: /Catalog/ и /catalog/ для робота разные адреса.

Рабочий пример robots.txt#

Базовый файл для обычного сайта выглядит так:

User-agent: *
Disallow: /admin/
Disallow: /cart/
Disallow: /search/
Disallow: /*?utm_

Sitemap: https://вашсайт.ру/sitemap.xml

Что здесь происходит. Правила действуют для всех роботов. Закрыты админка, корзина и внутренний поиск - страницы, которые в выдаче не нужны. Строка Disallow: /*?utm_ отсекает адреса с рекламными метками, чтобы они не плодили дубли. В конце - ссылка на карту сайта.

Этого достаточно большинству сайтов-визиток и небольших каталогов. Не нужно закрывать всё подряд «на всякий случай»: чем меньше запретов, тем меньше шансов случайно спрятать нужное.

Не уверены, что у вас в robots.txt: прогоните сайт через бесплатный аудит видимости. Среди проверок - есть ли файл, не закрывает ли он сайт целиком и указана ли карта сайта. Оценка за пару минут, без регистрации.

Как закрыть сайт или страницу от индексации#

Здесь живёт самое частое заблуждение, поэтому разберём отдельно.

Чтобы закрыть весь сайт от роботов, ставят так:

User-agent: *
Disallow: /

Эту заглушку обычно вешают на время разработки, чтобы черновик не попал в поиск. Но robots.txt только просит робота не обходить страницу. Он не убирает её из выдачи. Если на закрытую страницу ведут внешние ссылки, она всё равно может всплыть в результатах - без описания, но всплыть.

Поэтому правило такое: чтобы страница гарантированно не попала в поиск, нужен мета-тег noindex на самой странице, а не Disallow в robots.txt. noindex разрешает роботу зайти и прямо говорит «не показывай меня в выдаче». Подробнее, почему сайт может не индексироваться, разбирали в статье почему сайт не виден в поиске.

robots.txt для WordPress, Тильды и Битрикса#

Запрос «robots txt для wordpress» ищут часто, поэтому коротко про популярные системы.

  • WordPress отдаёт виртуальный robots.txt сам. Его стоит дополнить: добавить Sitemap и закрыть /wp-admin/ (кроме /wp-admin/admin-ajax.php). Делают это плагином или физическим файлом в корне.
  • Тильда настраивает robots.txt в параметрах проекта. Карта сайта подключается там же, отдельный файл руками заводить не нужно.
  • Битрикс генерирует robots.txt в админке (Маркетинг → Поисковая оптимизация). Стандартный набор уже неплохой, но карту сайта и лишние GET-параметры стоит проверить.

Общий принцип для любой CMS один: не закрывайте файлы оформления (CSS и скрипты). Если робот их не видит, он не понимает, как выглядит страница, и хуже её оценивает.

Частые ошибки#

Забытая заглушка Disallow: /. Сайт ушёл в прод закрытым для всех. Самая дорогая ошибка - проверяйте robots.txt сразу после запуска.

Нет ссылки на карту сайта. Без Sitemap робот находит новые страницы медленнее. Карта - это прямой список, его стоит указать.

Закрыты CSS и скрипты. Робот не видит вёрстку и считает сайт сломанным или неудобным для мобильных. Оформление закрывать не нужно.

Запрет нужных разделов. Иногда под Disallow случайно попадает каталог или блог. Перечитайте каждую строку: что именно она закрывает.

robots.txt вместо noindex. Пытаются спрятать страницу Disallow, а она всё равно в выдаче. Для скрытия - noindex.

Как проверить robots.txt#

Три способа, от простого к надёжному.

Глазами. Откройте вашсайт.ру/robots.txt в браузере. Найдите все Disallow. Особенно ищите Disallow: / под User-agent: * - это закрытый сайт.

В Яндекс Вебмастере. Раздел Инструменты → Анализ robots.txt. Можно ввести адрес страницы и увидеть, разрешена она к обходу или нет.

Через аудит. Прогоните сайт через бесплатную проверку видимости: она сама скажет, есть ли robots.txt, не закрывает ли он сайт целиком, указана ли карта сайта - и проверит ещё три десятка сигналов поиска и нейросетей.

Что дальше#

robots.txt - это база технического SEO, но только база. Файл в порядке, а сайт всё равно не растёт в выдаче - значит, дело в других сигналах: скорость, структура, тексты под запросы, дубли. Полную картину показывает бесплатный аудит на 30 показателей, а с нуля технику и смысл мы собираем в рамках SEO-продвижения.

Если нужен не точечный фикс, а разбор всего сайта с приоритетами и планом - это полный аудит сайта: техника, страницы, семантика и конкуренты, отчёт-документ и созвон по итогам.

Отдельная история - доступ для нейросетей. Тем же файлом управляют и AI-роботы: GPTBot, ClaudeBot и другие. Как не закрыться от них по ошибке, разобрали в статье как открыть сайт для нейросетей.

FAQ

Частые вопросы про robots.txt

  • 01Что такое robots.txt простыми словами?
    Текстовый файл в корне сайта, который говорит роботам, какие страницы обходить можно, а какие нет. Лежит по адресу вашсайт.ру/robots.txt. Нет файла или запретов - роботы ходят по всему сайту.
  • 02Как настроить robots.txt для сайта?
    Минимум: строка User-agent: * для всех роботов, под ней Disallow для служебных разделов (корзина, админка, поиск) и строка Sitemap со ссылкой на карту сайта. Открытые страницы перечислять не нужно.
  • 03Как закрыть сайт или страницу от индексации?
    Disallow: / под User-agent: * закрывает весь сайт. Но robots.txt только просит не обходить страницу, а не убирает её из выдачи. Чтобы страница точно не попала в поиск, нужен мета-тег noindex.
  • 04Где лежит robots.txt и как его проверить?
    В корне сайта, открывается по адресу вашсайт.ру/robots.txt. Проверить можно в Яндекс Вебмастере (Анализ robots.txt) или через бесплатный аудит - он скажет, не закрыт ли сайт случайно.
  • 05Нужен ли robots.txt для WordPress или Тильды?
    Да. WordPress отдаёт виртуальный robots.txt, но его стоит дополнить картой сайта и закрыть служебные разделы. На Тильде файл настраивается в параметрах проекта.
  • 06В чём разница robots.txt и noindex?
    robots.txt управляет обходом - просит не заходить. noindex управляет индексацией - разрешает зайти, но запрещает показывать в выдаче. Для гарантированного скрытия страницы нужен noindex.

Источники#

robots.txtrobots txt для сайтаиндексация сайтатехническое seositemapзакрыть сайт от индексации
Юрий, основатель Digital Impuls
— ОБ АВТОРЕ

Юрий · основатель Digital Impuls

Веду агентство Digital Impuls в Москве: сайты, SEO и GEO, Telegram-боты и AI-автоматизация под бизнес-задачу. Пишу разборы от практики — что реально проверили на проектах клиентов.

О студии и подходе →
— DIGITAL IMPULS

Нужен сайт, который приносит заявки?

Делаем сайты под бизнес-задачу с фикс-ценой и сроком. Начните с бесплатного аудита текущего сайта.

— TELEGRAM-КАНАЛ

Не пропусти следующий разбор.

Дублируем каждый пост в Telegram с короткой выжимкой.

@digitalimpulschannel →