Дублированный контент внутри сайта

Если вы не первый день интересуетесь SEO, то наверняка слышали о дублированном контенте и о проблемах, присущих данному понятию. Эти «проблемы» реальны, и пока они не будут решены, работа над вашим сайтом будет напрасна с точки зрения SEO-оптимизации, так как вы будете терять значительные позиции рейтинга.

как поисковик определяет уникальный или дублирвоанный контент

Какие бывают типы дублированного контента? Что можно сделать, чтобы избежать или хотя бы минимизировать негативное влияние на рейтинг и производительность вебсайта?

  • Страницы, на которых использован один и тот же шаблон с небольшим лишь отличием.
  • Интернет-магазины, описание товаров в которых полностью повторяет описание, данное производителем продукции.
  • Канонические вариации страниц (http:// или http://www)
  • Копирование целых текстов с одного вебсайта на другой.

Как видно из списка, приведенного выше, существуют различные виды дублированного контента, и стоит избегать каждого из этих типов. Сделать это различными способами, включая также отключение индексации определенных страниц, либо обработкой контента и доведения его до уникального статуса.

Сегодня мы хотим рассказать вам лишь о том типе, который создается посредством вашей CMS — системы управления контентом (WordPress, Drupal, Joomla и т.п.), а также о способах обхода данной проблемы.

Мы часто делаем акцент на значимости уникального контента на страницах сайта. Можно иметь 10000 страниц, 9000 из которых будут отличаться не более чем на 15% ввиду разности заголовков, использованной картинки и описания, но это НЕ означает, что этот контент уникален и имеет высокое качество.

Решения проблемы с дублированным контентом

Есть несколько вещей, которые вы можете сделать, дабы избежать дублирования контента, исправить нестыковку с каноническими ссылками или указать, какие страницы нужно индексировать, а какие не требуется.

  1. Пишите гораздо больше, чтобы избежать акцентирования внимания на конкретных страницах.
  2. Уникалтзтруйте источники данных или часто-используемые базы данных продукции для электронных магазинов.
  3. Создайте дополнительные описания продукции, чтобы ваши страницы с определенной продукцией имели собственный уникальный пункт в описании.
  4. Не забывайте пользоваться мета-тэгами и отредактировать файл robots.txt для того, чтобы заблокировать или предупредить индексацию максимально схожих страниц (которые могут привести даже к наказанию).
  5. Используйте канонический тэг, чтобы страницы шли одна за другой в логическом порядке, и чтобы все ссылки возвращали пользователей на одну и ту же единственно главную страницу сайта. Это особенно важно, если какой-либо товар размещен в нескольких подкатегориях.
  6. Уникализируйте ссылки в подвале, чтобы предотвратить путаницу, возникшую вследствие попытки «сделать каждую страницу уникальной».

Постарайтесь посмотреть на сайт с точки зрения поисковой системы(Яндекс, Google). Если у вас есть страницы, оформленные точно также, как и 30-40 других подобных страниц, то вряд ли ее нужно индексировать, тем самым расходую ресурсы поисковика и упуская возможность поднять рейтинги важности вебсайта и его позицию в выдаче.

Немного разъясним вышеприведенные пункты:

Для решения нестыковки с каноническими ссылками, используете 301 перенаправление. Это можно реализовать посредством некоторой корректировки файла .htaccess (предположительно вы используете сервер на Linux).

Также перепроверьте, нет ли у вас нескольких версий главной страницы, если да, то перенаправьте все ссылки на одну определенную страницу. Например, http://www.вашсайт.ру/ или http://www.вашсайт.ру/index.html или http://www.вашсайт.ру/default.htm |.aspx |.shtml | .cfm и так далее.

Также, при ссылках на эти страницы (как в навигации на вашем собственном сайте, так и с других вебсайтов), убедитесь, что вы используете одну стабильную ссылку.

Советы по решению проблем, связанных с несколькими страницами частично дублируемого содержания:

Существует несколько решений. Вы можете использовать канонический тэг для того, чтобы сослаться обратно на исходную страницу, либо определить, что должно индексироваться, а что нет.

Если у вас есть возможность персонализировать заголовки на странице, то вы можете использовать простой мета-тэг.

NOINDEX, FOLLOW – Текст не учитывается, но поисковые системы будут следовать по ссылкам и передавать вес, а также переходить дальше по страницам, имеющимся на странице.

<meta name="robots" content="noindex, follow"/>

INDEX, NOFOLLOW – сообщает паукам о необходимости индексации страницы, но не следовать дальше по ссылкам на странице, либо вообще учитывать их значимость.

<meta name="robots" content="index, nofollow"/>

NOINDEX, NOFOLLOW – информирует пауков о том, что страницу не нужно индексировать и, более того, не нужно вообще учитывать ее и размещенные на ней ссылки в алгоритме.

<meta name="robots" content="noindex, nofollow"/>

То же самое может быть реализовано и со стороны сервера за счет редактирования файла robots.txt.

Если у вас имеются динамически загружающиеся страницы, в URL которых производится ввод  id сессий либо каких-то других уникальных данных, то здесь лучше всего использовать канонический тэг. За счет этого можно быть уверенными в том, что страница не создает дублированный контент в CMS.

Канонический тэг представляет собой тэг, который с недавнего времени учитывается тремя основными поисковыми системами (Яндекс, Google, и Bing). Он позволяет избежать путаницы с индексированием страниц, и не допускает несколько страниц с минимальными различиями к учету в индексации.

Добавляя канонический тэг, вы можете быть уверенными в том, что только одна важная страница имеет значение для поисковой системы.

Еще одна расширенная тактика SEO-оптимизации для избежания дубликатов

Если вы хотите выделить свой сайт в поисковых системах, то будьте готовыми к дополнительной работе, устройстве решений, которые поддерживают незначительные изменения в URL, контенте страницы, структуре ссылок и архитектуре самой CMS. Все эти изменения являются второстепенными в тщательном планировании, и их можно избежать, если изначально все сделать правильно.

Тем не менее, так как не всегда есть опции, важно иметь возможность реализации существенных изменений, и выполнения функций по созданию оптимальных условий по привлечению людей на сайт, т.е. собственные приложения, хаки, какие-то наработки и прочее, что поможет вам адаптировать, модифицировать и оптимизировать вашу CMS и контент «на лету». Важно иметь возможность изменять заголовки и многое другое.

В случае, когда редизайн ресурса недопустим, всегда можно воспользоваться существующими плагинами, которые помогут вам выделить «денежные» страницы вашего сайта.

Кстати, говорил ли я вам о том, что всё это делается абсолютно бесплатно? Если ваш ресурс основан на CMS WordPress, то я сразу же советую вам скачать один из seo-плагинов он позволит вам переписать заголовки, отредактировать мета данные, страницы архива и тэгов, улучшить отображение заголовков, изменить файлы robots.txt и .htaccess, а также предоставит множество других функций, связанных с оптимизацией SEO.

Как было сказано выше, лучше изначально все делать правильно, чем потом искать изысканные решения возникшей проблемы.

20
Янв

Вверх