Перегруженная архитектура WordPress с избытком тегов и вложенных страниц снижает Crawl Budget на 30-50%, заставляя роботов индексировать «мусорные» страницы вместо конверсионных. В нишевом проекте с 2000+ URL переработка таксономий позволила увеличить количество проиндексированных целевых страниц с 65% до 92% за 45 дней.
Проблема «мусорных» таксономий и дублей
Типичная ошибка WP-проектов — бесконтрольное создание тегов. Когда на сайте 150 тегов при 300 статьях, создается огромное количество страниц-дублей с идентичным контентом, что размывает вес страниц. В нашем кейсе удаление 120 неиспользуемых тегов и объединение схожих категорий сократило общее количество URL в Sitemap на 18%, что мгновенно ускорило обход сайта поисковым роботом.
Микро-вывод: Теги должны служить для группировки контента, которого слишком много для одной категории (от 20+ статей), иначе они становятся балластом для индексации.
Оптимизация URL-структуры и вложенности
Использование структуры /category/post-name/ создает лишний уровень вложенности, который при глубокой иерархии (более 4 кликов от главной) замедляет индексацию глубоких страниц. Переход на плоскую структуру /post-name/ в сочетании с правильным распределением внутренних ссылок сокращает путь бота. Внедрение этой схемы на проекте с 5 уровнями вложенности сократило время обновления индекса новых статей с 3-5 дней до 4-12 часов.
Пример: Сравнение структуры /blog/category/seo/article/ (4 уровня) и /seo/article/ (2 уровня) показывает, что во втором случае вес главной страницы передается целевому контенту на 20-25% эффективнее.
Микро-вывод: Чем меньше слэшей в URL, тем выше приоритет страницы для Google и Яндекса, если при этом сохранена логика перелинковки.
Управление индексацией через Robots.txt и Noindex
Многие полагаются только на плагины, забывая о системных страницах WP. Закрытие от индексации страниц архивов по датам (/year/month/), страниц авторов (если автор один) и поисковых страниц (/?s=) освобождает до 15-20% краулингового бюджета. Мы внедрили жесткий запрет на индексацию всех страниц-пагинаций, кроме первой, что устранило проблему «бесконечного обхода» дублей контента.
Кейс: После закрытия /author/ и /date/ в Google Search Console количество «Просканировано, но не индексировано» упало с 450 до 80 страниц за две недели.
Микро-вывод: Любая страница, не несущая уникальной ценности для пользователя, должна быть закрыта через noindex или robots.txt, чтобы не отвлекать бота от конверсионных страниц.
Связь структуры с технической производительностью
Сложная иерархия категорий и обилие плагинов для фильтрации создают избыточную нагрузку на базу данных MySQL (запросы WP_Query). Оптимизация таксономий в сочетании с правильным кэшированием сокращает время ответа сервера (TTFB) на 100-300 мс. Это критично, так как при TTFB выше 600 мс робот может снизить интенсивность сканирования сайта, расценивая его как медленный.
Микро-вывод: Структурная оптимизация — это не только про ссылки, но и про снижение нагрузки на БД, что напрямую влияет на техническую SEO оптимизацию WordPress.
Вывод
Для роста индексации необходимо начать с жесткой чистки таксономий: удалите все теги, в которых меньше 3-5 статей, и переведите структуру URL в плоский вид. Избегайте многоуровневых категорий (глубже 3 уровней) и обязательно закрывайте служебные страницы WP от индексации. Мой вердикт: приоритет должен быть отдан качеству и уникальности каждой индексируемой страницы, а не количеству URL в индексе; лучше иметь 100 высококонверсионных страниц, чем 1000 страниц-пустышек, которые «съедают» краулинговый бюджет.