Если вы не первый день интересуетесь SEO, то наверняка слышали о дублированном контенте и о проблемах, присущих данному понятию. Эти «проблемы» реальны, и пока они не будут решены, работа над вашим сайтом будет напрасна с точки зрения SEO-оптимизации, так как вы будете терять значительные позиции рейтинга.
Какие бывают типы дублированного контента? Что можно сделать, чтобы избежать или хотя бы минимизировать негативное влияние на рейтинг и производительность вебсайта?
- Страницы, на которых использован один и тот же шаблон с небольшим лишь отличием.
- Интернет-магазины, описание товаров в которых полностью повторяет описание, данное производителем продукции.
- Канонические вариации страниц (http:// или http://www)
- Копирование целых текстов с одного вебсайта на другой.
Как видно из списка, приведенного выше, существуют различные виды дублированного контента, и стоит избегать каждого из этих типов. Сделать это различными способами, включая также отключение индексации определенных страниц, либо обработкой контента и доведения его до уникального статуса.
Сегодня мы хотим рассказать вам лишь о том типе, который создается посредством вашей CMS — системы управления контентом (WordPress, Drupal, Joomla и т.п.), а также о способах обхода данной проблемы.
Мы часто делаем акцент на значимости уникального контента на страницах сайта. Можно иметь 10000 страниц, 9000 из которых будут отличаться не более чем на 15% ввиду разности заголовков, использованной картинки и описания, но это НЕ означает, что этот контент уникален и имеет высокое качество.
Решения проблемы с дублированным контентом
Есть несколько вещей, которые вы можете сделать, дабы избежать дублирования контента, исправить нестыковку с каноническими ссылками или указать, какие страницы нужно индексировать, а какие не требуется.
- Пишите гораздо больше, чтобы избежать акцентирования внимания на конкретных страницах.
- Уникалтзтруйте источники данных или часто-используемые базы данных продукции для электронных магазинов.
- Создайте дополнительные описания продукции, чтобы ваши страницы с определенной продукцией имели собственный уникальный пункт в описании.
- Не забывайте пользоваться мета-тэгами и отредактировать файл robots.txt для того, чтобы заблокировать или предупредить индексацию максимально схожих страниц (которые могут привести даже к наказанию).
- Используйте канонический тэг, чтобы страницы шли одна за другой в логическом порядке, и чтобы все ссылки возвращали пользователей на одну и ту же единственно главную страницу сайта. Это особенно важно, если какой-либо товар размещен в нескольких подкатегориях.
- Уникализируйте ссылки в подвале, чтобы предотвратить путаницу, возникшую вследствие попытки «сделать каждую страницу уникальной».
Постарайтесь посмотреть на сайт с точки зрения поисковой системы(Яндекс, Google). Если у вас есть страницы, оформленные точно также, как и 30-40 других подобных страниц, то вряд ли ее нужно индексировать, тем самым расходую ресурсы поисковика и упуская возможность поднять рейтинги важности вебсайта и его позицию в выдаче.
Немного разъясним вышеприведенные пункты:
Для решения нестыковки с каноническими ссылками, используете 301 перенаправление. Это можно реализовать посредством некоторой корректировки файла .htaccess (предположительно вы используете сервер на Linux).
Также перепроверьте, нет ли у вас нескольких версий главной страницы, если да, то перенаправьте все ссылки на одну определенную страницу. Например, http://www.вашсайт.ру/ или http://www.вашсайт.ру/index.html или http://www.вашсайт.ру/default.htm |.aspx |.shtml | .cfm и так далее.
Также, при ссылках на эти страницы (как в навигации на вашем собственном сайте, так и с других вебсайтов), убедитесь, что вы используете одну стабильную ссылку.
Советы по решению проблем, связанных с несколькими страницами частично дублируемого содержания:
Существует несколько решений. Вы можете использовать канонический тэг для того, чтобы сослаться обратно на исходную страницу, либо определить, что должно индексироваться, а что нет.
Если у вас есть возможность персонализировать заголовки на странице, то вы можете использовать простой мета-тэг.
NOINDEX, FOLLOW – Текст не учитывается, но поисковые системы будут следовать по ссылкам и передавать вес, а также переходить дальше по страницам, имеющимся на странице.
<meta name="robots" content="noindex, follow"/>
INDEX, NOFOLLOW – сообщает паукам о необходимости индексации страницы, но не следовать дальше по ссылкам на странице, либо вообще учитывать их значимость.
<meta name="robots" content="index, nofollow"/>
NOINDEX, NOFOLLOW – информирует пауков о том, что страницу не нужно индексировать и, более того, не нужно вообще учитывать ее и размещенные на ней ссылки в алгоритме.
<meta name="robots" content="noindex, nofollow"/>
То же самое может быть реализовано и со стороны сервера за счет редактирования файла robots.txt.
Если у вас имеются динамически загружающиеся страницы, в URL которых производится ввод id сессий либо каких-то других уникальных данных, то здесь лучше всего использовать канонический тэг. За счет этого можно быть уверенными в том, что страница не создает дублированный контент в CMS.
Канонический тэг представляет собой тэг, который с недавнего времени учитывается тремя основными поисковыми системами (Яндекс, Google, и Bing). Он позволяет избежать путаницы с индексированием страниц, и не допускает несколько страниц с минимальными различиями к учету в индексации.
Добавляя канонический тэг, вы можете быть уверенными в том, что только одна важная страница имеет значение для поисковой системы.
Еще одна расширенная тактика SEO-оптимизации для избежания дубликатов
Если вы хотите выделить свой сайт в поисковых системах, то будьте готовыми к дополнительной работе, устройстве решений, которые поддерживают незначительные изменения в URL, контенте страницы, структуре ссылок и архитектуре самой CMS. Все эти изменения являются второстепенными в тщательном планировании, и их можно избежать, если изначально все сделать правильно.
Тем не менее, так как не всегда есть опции, важно иметь возможность реализации существенных изменений, и выполнения функций по созданию оптимальных условий по привлечению людей на сайт, т.е. собственные приложения, хаки, какие-то наработки и прочее, что поможет вам адаптировать, модифицировать и оптимизировать вашу CMS и контент «на лету». Важно иметь возможность изменять заголовки и многое другое.
В случае, когда редизайн ресурса недопустим, всегда можно воспользоваться существующими плагинами, которые помогут вам выделить «денежные» страницы вашего сайта.
Кстати, говорил ли я вам о том, что всё это делается абсолютно бесплатно? Если ваш ресурс основан на CMS WordPress, то я сразу же советую вам скачать один из seo-плагинов он позволит вам переписать заголовки, отредактировать мета данные, страницы архива и тэгов, улучшить отображение заголовков, изменить файлы robots.txt и .htaccess, а также предоставит множество других функций, связанных с оптимизацией SEO.
Как было сказано выше, лучше изначально все делать правильно, чем потом искать изысканные решения возникшей проблемы.