WordPress существенно облегчает жизнь всему малому бизнесу, блоггерам да и часто крупным новостным сайтам. У WordPress уже разработаны готовые и автоматические решения для множества случаев, по типу канонических ссылок, размещение рекламы + плагины практически для всего, что только может пригодится.

Но с легкостью публикации контента и дизайна, у владельцев сайтов появляется новая проблема:

Дублированный контент

Дублирование контента — распространенная причина, по которой сайты на WordPress не могут занять ТОП позиции. Хотя эта проблема в WordPress отличается от традиционного понимания в SEO, тут скорее не точное копирование контента в коде, но данная проблема все же нуждается в решении. Вот пять наиболее распространенных типов дублирования: контента в WordPress и способы их устранения.


#1. Метки (Теги)

Теги — огромная проблема для многих WordPress сайтов. Когда вы размещаете статью, она создает уникальную страницу, с контентом, который, по вашему мнению, имеет значение. Но также на странице будут отображаться фрагменты других статей, если тег совпадает с категорией или главной страницей сайта, то теперь вы создали конкурента на этой странице на сайте.

Теги также обычно являются модифицированными версиями самих себя, что создает невероятно похожий контент, который будет конкурировать с самим собой. Когда это происходит, ни одна из страниц не будет ранжироваться, что приводит к девальвации сайта.

Хорошие новости! Есть простое решение. Можно либо полностью избавиться от тэгов, либо добавить на страницы тегов meta robots — noindex follow. Тег noindex follow скажет поисковым системам, что эту страницу не стоит индексировать, но можно сканировать ссылки с них.

Теперь поисковые системы будут знать, что страница не так полезна, как другие, и тем самым вы помогаете поисковому роботу найти хороший контент.


#2. Категории

На страницах категорий присутствуют многочисленные посты и статьи, на подобии страниц тегов. Скорее всего названия каждой отдельной новости будет прописано в теге H1 и с первыми абзацами поста, что будет частичным дублем самих статей. Вот почему страницы категорий редко считаются полезными. Однако есть нюансы.

В WordPress, категории предназначены для разделения контента по отдельным разделам внутри сайта, пользователь, которому интересна информация с данного раздела, может зайти в нужную категорию, и она будет ему полезна. Так же, через страницу категорий поисковик может найти старые страницы, поэтому к категориям, стоит подойти иначе, чем к страницам тегов.

В этом случае стоит добавить meta robots – index follow — теги, и создаете уникальные заголовки и описание для всех страниц категорий и страниц листинга.


#3. Подобные статьи

Следующая, популярная ошибка в WordPress — отсутствие уникального контента. К примеру, возьмем кулинарный блог, с рецептами. Если у вас есть 20 рецептов печений, скорее всего, многие из них используют схожие формулировки и ингредиенты, что и может создать конкуренцию между данными рецептами и дублирование контента. Каждый рецепт уникален и может быть полезен, но, если вы не проделаете работу по уникализации каждого из этих рецептов, они будут просто дублированным контентом.

В такие случаи будет полезно сделать отдельную категорию (подкатегорию) для рецептов печений и добавить модификаторы (например, сладкие, соленый, для вечеринок, для больших компаний и т.д.). Так же в такие категории добавьте SEO текст соответствующей теме (не обязательно вверху). Убедитесь, что текст актуален для конкретной категории и в нем отображаться соответствующие страницы.


#4. Периодичные публикации

Вы делаете тематические посты на регулярной основе? Они так же будут недостаточно уникальны. В такие случаи стоит добавлять дату (год, месяц) в заглавие (Лучшие анекдоты за Апрель 2018).


#5. Страницы результатов поиска

WordPress самостоятельно генерирует URL-адреса для каждого нового результата поиска на сайте. В данном случае стоит добавить meta robots — noindex nofollow. И также найдите уникальный идентификатор, который находится в URL страницы поиска. В случаи сайта это «?s=» или «*&s=» и добавьте запрет на этот параметр в файл robots.txt.


#6. мета-тэг Canonical

Мета-тэг Canonical замечательнейших инструмент для борьбы с дублями контента — поисковик просто не будет индексировать страницу, если в Canonical прописан другой URL. Дублированный контент появляется, если одна и та же страница доступна по разным адресам. Например, если на сайте есть тег MORE для разделения материала на вступительную часть, которая публикуется на главной, и полную версию, открываемую либо по нажатию на заголовок, либо по нажатию на ссылку, формируемую с помощью тега MORE (например, Читать далее…).

В таком случаи, полная версия будет иметь один адрес, а при клике на «Читать далее» — по другому, (отличаться они будут только наличием чего то подобного —  #more-8283 в конце URL адреса). Во втором случае документ откроется на том месте, где он закончился на главной странице блога (где стоял тег more).

В этом случаи стоит добавить Мета-тэг Canonical, который будет указывать какая версия страницы является канонической. Проблема легко решается, с помощью плагина All in One SEO Pack, просто поставив галочку в настройках «Канонические URL».


#7. Остальное

Любые системы на сайте, которые автоматизируют и облегчают работу, могут создавать дублированный контент. Это может быть PDF-версии контента для печати, которые также могут проиндексироватся, или RSS-канал, в котором чаще всего загружаются заголовки и описания.

В целом, большинство данных проблем WordPress легко находятся и решаются, используя данные советы. Исключив с индекса дублированный контент, можно заметно улучшить индексацию полезного контента и тем самым улучшив ранжирование в поиске.


читайте также: Google: CMS на котором работает сайт не является фактором ранжирования | Миф о дублированном контенте