Тег canonical перенос ссылочной масы. Канонические URL-адреса в WordPress: когда и как использовать их. Несколько ссылок rel=canonical с одной страницы

Здравствуйте, друзья!

Сегодня будет очень важная статья, которая очень тесно пересекается с темой про дубли страниц.

Так, что внимательно вникаем и, если что-то непонятно, то пишите в комментарии. Темой обсуждения является животрепещащий атрибут rel="canonical", который призван для предотвращения дублированного контента и упрощения индексации поисковым системам.
Пройдемся по каждому вопросу по порядку, чтобы сложилась целостная картина.

Принцип работы атрибута rel="canonical"

Атрибут или тег canonical (как еще называют) используется для того, чтобы дать поисковым системам понять, какой адрес правдивый и является главным для каждой страницы на сайте.

Rel="canonical" - это один из важнейших моментов в оптимизации любого сайта, который позволяет решить проблему дублированного контента. Особая нужда в его использовании появляется при использовании различных дижков для создания сайтов, таких как: WordPress, phpBB и других.

Различные движки помимо основных страниц генерируют еще и другие документы с точно таким же контентом, но выполняющие совершенно другие задачи, например:

  • версия страницы для печати;
  • мобильная версия статьи;
  • и любые другие страницы с таким же контентом, но с другими адресами.

Если взять сайт на WordPress, то при включенной функции древовидных комментариев доступна кнопка "Ответить" под каждым комментом.

Она делает адрес совершенно другим, а вот контент никуда не изменяется. Происходит явное дублирование контента, что очень плохо.

Одним из самых действенных способов предотвратить появление такой страницы в индексе поисковых систем является добавления на все подобные страницы атрибута rel="canonical", который укажет, что только статья является предпочтительным документом для индексации, а все остальные в индекс брать не нужно.

Как прописывать rel="canonical"

На различных движках (например, WordPress) добавление атрибута rel="canonical" происходит в автоматическом режиме. Также атрибут добавляется с помощью различных SEo плагинов.

Если же хотим добавить canonical в ручном режиме, то в область ресурса стоит добавить следующую строчку.

< link rel = "canonical" href = "адрес страницы" / >

Данный строку нужно обязательно добавить в секцию шапки сайта, то есть между открывающим и закрывающим тегом . Иначе поисковые системы проигнорируют ваше указание в виде этого атрибута. Также стоит добавлять его на каждую страницу, которая не является главной и доступна по другому адресу.

Если взять в пример ситуацию выше с адресами страниц, создаваемые кнопками ответа на комментарии на WordPress, то в исходном коде каждой такой страницы можно видеть атрибут rel="canonical".

Как видим, канонический адрес указывает на основную страницу, когда исходный код я просматривал по адресу:

http://i-am-kulinar.ru/poleznoe-obzory-intervyu/ne-proigral-nikto.html?replytocom=5499#respond

http : //i-am-kulinar.ru/poleznoe-obzory-intervyu/ne-proigral-nikto.html?replytocom=5499#respond

Такая страница благодаря атрибуту канонических адресов в индекс не попадет. Поисковики прекрасно примут во внимание ваше указание.

Рассмотрев основной принцип работы данного атрибута, можно перейти к следующему вопросу материала.

В каких случаях использовать?


Теперь стоит рассмотреть основные ошибки, которые могут допускаться и их стоит избегать.

Основные ошибки


Когда разобрали основные ошибки, которых стоит избегать и которые чаще всего употребляются, стоит упомянуть плагины WordPress и некоторые моменты работы с атрибутом rel="canonical" на том движке.

Сanonical в плагинах WordPress

Начнем с одного из самых популярных решений на рынке - all in one seo pack. Плагин хорош и добавляет данный атрибут в код каждой страницы, удаляя при этом стандартный canonical, создаваемый средствами движка. Для этого стоит включить соответствующую настройку.

Существует 2 проблемы, которые могут препятствовать нормальной индексации сайта и помочь конкурентам насолить нам.

Первый момент касается неправильной работы атрибута со страницами пагинации. Выше я писал, что каждая страница должна быть каноничной. Плагин же в rel="canonical" вписывает адрес на первую страницу (на главный адрес омена) из всего списка пагинации.


Такой вариант может существовать, но он не совсем правильный, так как все страницы пагинации с большой вероятностью могут быть исключены из индекса ПС. Если это недопустимо, то проблему нужно решать.

Вторым моментом является косяк, который я описывал в соответствующей статье (). Он может помочь нашим конкурентам добавить нежелательные страницы в индекс с помощью инструментов addurl в поисковый индекс. Данный косяк конечно же исправляется и хорошо, что средствами самого же плагина, активировав определенную настройку "No Pagination for Canonical URLs".

На данном моменте тут я подробно останавливаться не буду, так как вопрос не маленький. Если хотите избежать второй проблемы при использовании этого плагина, то читайте статью по ссылке в предыдущем абзаце. Там все очень подробно расписано, что да как.

Вторым плагином на обозрении стоит Platinum seo pack. К страницам пагинации он относится с уважением. Проблема заключается лишь в дублировании rel="canonical". Просмотрев исходный код страницы, можно увидеть, что при включенной функции добавления атрибута, не убирается стандартный атрибут, выводимый движком.


Канонические URL – это загадка для многих людей, и потому многие могут неправильно использовать такие URL для задания, к примеру, 301 редиректа. Люди предполагают, что эта возможность имеет отношение к SEO, однако они не знают, когда и как следует использовать их. В WordPress в частности (по сравнению с обычным HTML сайтом) может быть достаточно тяжело вручную задавать канонические URL для каждой страницы сайта без обращения к плагинам вследствие работы шаблонов темы, имеющихся в системе управления контентом.

В этой статье мы поможем разрешить некоторые пользовательские вопросы, которые связаны с каноническими URL. Пользователи, которые не работают с WordPress, также могут найти эту статью полезной для себя, поскольку в ней будут предложены основные принципы канонических адресов, применимые к любой системе управления контентом или к методам разработки.

Обратите внимание, что эта статья может показаться для вас достаточно сложной, если у вас нет технических навыков, связанных с WordPress, базовым HTML или SEO. Мы познакомим вас сначала с основными терминами. Если вдруг что-то в статье вам покажется непонятным, вы всегда можете поискать в поисковой системе ответы на возникшие вопросы.

Что представляет собой канонический URL?

Канонический URL (часто описываемый как rel=canonical, канонический тег и т.д.) – это то, что используется поисковыми системами при отсылке к материалу на вашем сайте, когда страница с материалом имеет несколько версий на вашем сайте или даже в сети. Сегодня канонические URL используются для решения некоторых сложных проблем с дублированием контента, и иногда эта возможность применяется для задания 301 редиректа.

Google предлагает прекрасное объяснение целей канонических URL . Я настоятельно рекомендую изучить его. Они сделали его максимально ясным.

Возможно, вы считаете, что ваш сайт не имеет дублированного контента. Прекрасно, если вы позаботились о том, чтобы ваш контент не повторялся на разных страницах. В противном случае это может вылиться в снижение ваших показателей в поисковой выдаче.

Если вы решили продублировать текст на вашем сайте, подумайте об этом серьезно: если бы вы были поисковой системой, которая старается дать ответ на пользовательский запрос, вы бы предложили пользователю две идентичных страницы в поисковой выдаче? Нет! Это бесполезно для людей. Вместо этого вы бы предложили столько разнообразных результатов в выдаче (SERP), сколько сможете найти, что, соответственно, полностью отвечало бы поисковым потребностям людей.

Таким образом, если вы дублируете контент на своем сайте, вы можете – и должны – ожидать, что Google не будет ранжировать все ваши страницы. Однако это не слишком хорошо, если вы думаете только о показателях поисковых систем и присутствию в SERP.

Дубли URL-адресов, о которых вы, возможно, не знали

Отлично, давайте вернемся назад и предположим, что мы убедились в уникальности наших страниц сайта. Однако у вас по-прежнему могут остаться некоторые «скрытые» дублируемые URL, о которых вы просто не знаете (в реальности они, конечно же, не скрыты). Это может удивить вас, но вы должны знать – поисковые системы видят следующие URL как совершенно обособленные, отдельные, даже если они выводят на экран один и тот же контент:

  • http://www.examplesite.com (обратили внимание на www?)
  • http://examplesite.com
  • https://examplesite.com (обратили внимание на https?)
  • http://www.examplesite.com/ (обратили внимание на слэш в конце?)
  • http://examplesite.com/index.php

Именно по этой причине нам и нужны канонические URL в теге HEAD кода HTML всех ваших страниц. Вы должны сообщить поисковым системам, какую из версий всех вышеупомянутых URL (и других версий) они должны просмотреть.

Да, вы должны принять окончательное решение о том, собираетесь ли вы использовать www или нет во всех ваших ссылках в процессе веб-маркетинга. Вы должны придерживаться одной ссылочной стратегии по всему сайту, и даже за его пределами. Все те, кто пользуется вашими URL, должны знать это: сотрудники, партнеры, каталоги, в которых вы перечислены, люди, которые ссылаются на вас – все.

Вы также должны определиться с тем, будете ли вы использовать слэш в конце URL, а также будете ли вы использовать https (если вы принимаете на сайте важную информацию, такую как, к примеру, данные кредитных карт). Выберите один вариант и придерживайтесь его. На вашем месте я бы выбрал тот, который используется чаще всего, чтобы избежать головной боли при исправлении своих URL.

К счастью, если вы пользуетесь WordPress, то большую часть этих проблем удастся решить. Мы рассмотрим разные плагины и другие вещи, которые помогут вам справиться с этим.

Однако есть и другие места, в которых канонические URL оказываются очень полезными.

Дублируемый контент, создаваемый таксономиями

Допустим, вы пишете статью, и вы включаете ту статью в многочисленные рубрики блога с разными метками в WordPress (все это называется таксономиями). Люди всегда делают это. Или, допустим, вы занимаетесь электронной коммерцией, и ваши продукты появляются в многочисленных рубриках. У нас появляется проблема: контент может быть представлен несколько раз по разным URL, что упрощает пользователям навигацию по сайту. К примеру:

  • http://examplesite.com/store/candy/chocolate-truffles
  • http://examplesite.com/store/foods/chocolate-truffles

Вы хотите, чтобы ваши пользователи могли найти шоколадные трюфели в двух рубриках: «candy» и «food». Это прекрасно. Но какой из двух URL должен быть проиндексирован поисковыми системами? Помните, что они не станут ранжировать оба URL. Таким образом, вы должны выбрать это самостоятельно. И именно в этом случае на первый план выходят канонические URL. Такие URL расскажут поисковым системам: «эй, этот контент точно такой же, что и на другой странице; пожалуйста, проиндексируй его».

Помните, что ни одна поисковая система не обязана повиноваться данной канонизации, и они могут проигнорировать ее, если посчитают ее неправильной.

Использование перекрестных канонических URL при дублировании контента с других сайтов

Есть самая важная причина, почему вам требуется канонический URL. Про нее мы поговорим ниже (есть и другие, но они более сложные, при этом принцип – тот же самый). Бывает так, что вы публикуете на своем сайте контент, который также появляется на других сайтах. Самый простой пример такой ситуации – синдикация (к примеру, пресс-релизы).

Допустим, ваша компания публикует пресс-релиз и передает его на ваш сайт. Это вполне нормальное явление. Однако пресс-релизы работают следующим образом: они могут бесплатно использоваться любым издателем контента. Они специально создаются для того, чтобы их копировали и распространяли. Есть даже целые сети синдикации, как, к примеру, PRWeb. Это достаточно старая форма маркетинга.

Однако она порождает проблемы с SEO. Для робота поисковой системы контент пресс-релиза на вашем сайте является точно таким же, как контент пресс-релиза на других новостных сайтах. Как понять, где оригинал? Какой URL выводить в SERP (поисковой выдаче)? Помните – вы должны его выбрать.

Обычно поисковые системы выбирают его самостоятельно, если вы ничего им не предложите. И делается такое предложение при помощи канонического URL. В случае с пресс-релизами, однако, маловероятно, что каждый небольшой новостной журнал будет задавать канонический URL, указывающий на ваш сайт. Помните, что многие про это просто не знают. Я сомневаюсь, что они будут торопиться с указанием оригинального источника контента и с соответствующим кодированием HTML. Они ведь публикуют по несколько разных статей в день.

Таким образом, вы должны позаботиться об этом на своем сайте. На вашем месте я бы использовал канонический URL на странице, содержащей ваш пресс-релиз, и ссылался бы на его копию в основной сети синдикации, в которой вы опубликовали статью для последующей дистрибуции. К примеру, вы можете сослаться на копию статьи на сайте PRweb.com (если вы используете этот сервис).

Если вы хотите увидеть живой пример ситуации, не касающейся пресс-релизов, и при этом затрагивающей канонические URL, давайте посмотрим на следующую статью, которую я написал для KISSmetrics год назад:

Вскоре после этого сайт Entrepreneur.com взял эту статью, потому что у них было соглашение с KISSmetrics (помните, у них было разрешение!)

Теперь у нас есть тот же самый контент, доступный по двум URL адресам. В техническом плане это – дублируемый контент, а это плохо! Однако не стоит бояться. Если вы посмотрите исходный код статьи на Entreprenuer.com, то вы найдете там следующее:

Это говорит поисковым системам о том, где был представлен оригинальный контент, что является верным решением. Это также снимает подозрения о краже контента в глазах поисковых роботов (которые не могут знать о ваших законных правах на публикацию работы).

Однако не стоит создавать целый сайт, состоящий из статей других людей. В этом случае канонический URL вряд ли поможет вам с ранжированием. Поэтому не злоупотребляйте данной тактикой.

В каких случаях вы не можете использовать канонические URL для внешнего дублируемого контента

Я хочу рассказать об этом, поскольку я часто сталкиваюсь с такими ситуациями. Если вы хотите вывести описание компании или персональную биографию на вашем сайте, я не рекомендую использовать те же самые слова и фразы, которые вы используете в ваших социальных профилях или в других местах сети.

Если вы задаете то же самое описание, которое указано у вас в LinkedIn или на вашей бизнес-странице Google Plus, то вы, по сути, дублируете контент. Не стоит использовать канонический URL на странице About, и подцеплять к ней ваш профиль из социальной сети. Ваша страница About должна ранжироваться самостоятельно. В таком случае, пожалуйста, используйте уникальное описание для внешнего использования. Я делаю так для всех своих клиентов.

Как использовать канонические URL в WordPress

Есть несколько способов сделать это, но я собираюсь показать вам самый лучший, которым пользуюсь я сам: просто воспользуйтесь плагином WordPress SEO от Joost De Valk.

Как только вы установите этот плагин на своем сайте, он позволит вам позаботиться о многочисленных SEO показателях, в том числе и о канонических URL. Однако плагин предлагает и другие настройки, на которые нужно обратить внимание.

На скриншоте ниже вы можете видеть, что на экране редактирования отдельной записи или страницы (плагин работает и для произвольных типов записей) панель WordPress SEO предлагает массу настроек и полей. Чтобы задать канонические URL, которые вы можете использовать для разных вещей – пресс-релизов или внешних дублей контента, – перейдите на вкладку Advanced:

Щелкните по выпадающему списку, чтобы выбрать тип URL для канонического адреса в теге head всех ваших страниц:

Когда не нужно использовать канонический URL

Во-первых, прочтите следующую в блоге Google Webmaster Central о распространенных ошибках с rel=canonical URL. Убедитесь в том, что вы – или ваш разработчик – не допустили их. Во-вторых, не используйте канонические URL в следующих ситуациях:

Когда вы хотите сделать 301 редирект

Если вы хотите перенаправить одну страницу к другой, чтобы пользователи, которые ввели старый URL или нажали на мертвую ссылку, были перенаправлены к новому URL, вам нужно использовать 301 редирект. Не используйте для этого канонические URL. Однако в SEO они часто применяются таким вот образом.

Редирект означает, что есть только одно место, где представлен контент, и вы вынуждаете пользователей перейти к этой странице. Это подходит, к примеру, в том случае, если вы перенесли свой сайт на новый домен или настроили новую структуру URL вследствие реконструкции сайта. Вы можете также использовать 301 редирект для отправки людей к версии вашего сайта с www или без www (это позволяет убедиться в том, что никто не перейдет на ваш сайт по неправильному адресу).

Благодаря каноническим адресам, вы можете иметь тот же самый контент на разных страницах в сети, и иметь один «оригинальный» источник контента. Иными словами, разные страницы, содержащие один и тот же контент, могут существовать и просматриваться пользователями.

Однако еще в 2011 году Рэнд Фишкин провел один интересный эксперимент, в котором он использовал канонический URL в хэдере всех страниц старого домена, чтобы таким образом улучшить ранжирование другого нового домена. И это сработало. Он поведал об этой истории в своей записи . Запись также объясняет, почему канонические URL так важны для кросс-доменной синдикации контента в мире SEO. Я не думаю, что сегодня это сработает, но можете попробовать в качестве эксперимента.

Когда вы хотите, чтобы поисковые системы проигнорировали вашу страницу

Помните, что rel=canonical – это не решение проблем с дублями контента. Поисковая оптимизация гораздо сложнее, и иногда более подходящее решение заключается в том, чтобы использовать файл robots для закрытия страниц от индексации. Именно поэтому плагин WordPress SEO включает в себя соответствующие опции.

Я рекомендую своим клиентам закрывать от индексации некоторые страницы, которые не являются полезными для посетителей. К примеру, зачем вам в выдаче страница Terms and Conditions, страницы входа в систему? Их там быть не должно. Лучше освободить дорогу более ценному контенту. К нему относятся продающие страницы, описания товаров и информативные записи блога.

Я также советую использовать правило no-index для страниц с очень малым количеством контента (поскольку ваш сайт в таком случае выглядит слишком несодержательным) и для архивов, которые дублируют контент. В WordPress это применимо к архивам авторов, архивам по дате, и, в моем случае, к архивам меток (поскольку они содержат тот же контент, что и архивы рубрик). Вы можете также закрыть от индексации произвольные типы записей и их архивы, если они только передают контент с других страниц вашего сайта.

Примечание: если вы что-то закрываете от индексации, то вам нужно будет удалить этот контент также из карты сайта, иначе это приведет к ошибкам в Google Webmaster Tools.

Поправляем URL-адрес для соответствия его с каноническим указателем

Помните, мы говорили выше о том, что нужно выбрать одну версию URL, которая будет использовать во всех ссылках с данного момента? Отлично, как только вы сделаете это, вам нужно будет «почистить» или исправить URL-адреса на вашем сайте и в других местах, чтобы они ссылались на выбранную вами версию. Допустим, что вы приняли решение использовать версию без www на вашем сайте. Теперь вам нужно убедиться в том, что все внешние и внутренние ссылки используют выбранную вами версию. Если нет, то надо постараться изменить URL-адреса. Да, это может показаться достаточно сложным действием, но это стоит того.

Чтобы быстро заменить все URL на своем сайте, вы можете использовать такой инструмент, как Search Replace DB . Однако используйте его только в том случае, если вы понимаете, что вы делаете.

Есть также плагины, которые позволяют провести поиск и замену через консоль WordPress. После проведенной замены удалите все, что соединено с вашей базой данных, чтобы избежать лишних рисков, связанных с безопасностью.

Чтобы справиться с мертвыми ссылками в записях и страницах, воспользуйтесь плагином, таким как, к примеру, Redirection , который выполнит эту задачу за вас.

Когда вы все это сделаете, убедитесь в том, что вы вошли в свой аккаунт Google Webmaster Tools и установили предпочтительный URL для вашего сайта. Кроме того, отправьте обе версии – с www и без www – вашего сайта в Google Webmaster Tools, чтобы задать предпочтения.

Заключение: используйте канонические URL для преимуществ в плане SEO

Надеемся, мы справились с хаосом, который имелся вокруг канонических ссылок и влияния их на SEO. Если вы по-прежнему не разобрались во всех аспектах, я рекомендую перейти по ссылкам, приведенным в данной статье. Однако самое лучшее достижение – теперь вы знаете, как использовать канонические адреса, знаете, что у них есть потенциал, который позволит добиться великолепных SEO результатов.

Дублированный контент – проблема, с которой могут справиться далеко не все владельцы бизнес-сайтов. Порой у них просто нет времени, чтобы решать эту проблему. К счастью, поисковые системы понимают, что порой тот же самый контент может быть доступен по разным URL-адресам, причем вполне законно. Поисковые системы предложили нам инструмент, который мы можем использовать – так давайте же воспользуемся им в своих интересах!

Канонический URL (canonical) позволяет указать поисковой системе, какая ссылка является предпочтительной для индексации. Настройкой canonical необходимо заниматься, если у вас на сайте имеются страницы с одинаковым содержанием. Ввиду особенностей CMS сайта могут автоматически создаваться страницы с одним и тем же контентом по разным адресам URL (более подробно читайте ниже). Появление подобных страниц возможно вследствие таких причин:

  1. Если вы написали одно и то же сообщение в разных темах блога, то есть вероятность автоматического создания еще одной страницы сайта.
  2. Например, у вас есть несколько доменов: http://article.example.com и http://blogs.example.com. И вы планируете размещать информацию сразу на обоих ресурсах. В таком случае размещаемый контент будет дублированным.
  3. Если была обновлена структура вашего сайта, после чего URL страниц сайта могли быть изменены.

Чтобы не допустить дублирования страниц сайта в поисковой выдаче, необходимо настроить канонические URL, после чего поисковик сможет определить, какую страницу нужно индексировать. Рассмотрим причины, из-за которых важно заниматься настройкой canonical:

  1. Если на разных страницах вашего сайта публикуется частично или полностью идентичная информация, то следует указать, какую страницу следует считать основной.
  2. Одна и та же информация, размещенная на разных страницах, затрудняет получение статистики о данных страницах.

Как настроить канонические адреса

Рассмотрим способы настройки «канонических» URL:

  1. Следует указать, какой URL считается основным. Сделать это можно при помощи атрибута rel="canonical" тега link. Например, на сайте присутствует несколько страниц с идентичным содержимым. Для того чтобы задать URL https://example.com/buyingcar в качестве основного, указываем на страницах с дублируемым контентом в блоке head кода страницы тег вида . В данной ситуации вы задаете главный URL, который в дальнейшем будет использован для просмотра сообщения о покупке автомобилей. Также эта страница будет показываться в результатах поисковой выдачи. Предпочтительнее задавать адрес сайта в абсолютном виде (https://example.com/buyingcar), избегайте относительных путей (/buyingcar).
  2. В карту сайта добавляем только канонические URL, в таком случае вы сможете сообщить поисковому роботу, какие страницы сайта вы считаете основными. При индексировании сайта поисковой робот не будет заходить на неканонические страницы, тем самым быстрее индексируя сайт.
  3. Для различных CMS существуют различные плагины, которые позволяют настроить канонические URL, например, для WordPress можно воспользоваться Yoast SEO .

Для OpenCart настройка атрибута canonical производится средствами CMS. Необходимо зайти в настройки товара и задать параметр SEO URL.

Для настройки canonical в Joomla нужно включить в настройках CMS функцию SEF. После включения для технических страниц вида /index.php?option будет добавлен атрибут rel="canonical" (с указанием URL на страницу с настроенным ЧПУ).

Как проверить дублированный контент

Проверить, настроен canonical для страниц вашего сайта или нет, можно с помощью следующих инструментов:

1. Для проверки настройки canonical, открываем html-код страницы и проверяем наличие атрибута canonical у тега link (в блоке кода страницы).

Также проверить контент на наличие дублей можно с помощью операторов поиска, рассмотрим на примере Google. Для этого нужно ввести в поисковую строку site:имя_домена "запрос", в итоге аналогично поиску от Яндекса по результатам поисковой выдачи делаем вывод о наличии дублированного контента.

3. Еще один способ найти дублируемый контент – уникальность. В этом нам помогут специальные программы и сервисы, мы рассмотрим на примере сервиса text.ru. Для анализа необходимо добавить информацию со страницы вашего сайта в сервис и запустить проверку. В результате вы увидите, на каких сайтах в Интернете есть такой же текст, и на сколько процентов ваш текст совпадает с текстами других сайтов.

Итог

Грамотно настроенный canonical повышает эффективность работы и ускоряет индексирование сайта. Если у вас не получится самостоятельно это сделать, то вы можете обратиться к нашим специалистам , и мы сделаем настройку rel="canonical" для вашего сайта.

Чтобы осуществлять правильное продвижение страниц сайта в поисковых системах, необходимо сообщать роботам, какие URL более предпочтительны для попадения в индекс. Это задаётся с помощью специальных тегов.

Что такое rel canonical?

Остановимся подробнее на теге rel=»canonical». Его основная цель - борьба с дублями страниц и неинформативными страницами (например страницами пагинации), а также повышение качества индексации с помощью прописывания приоритетного адреса.

У меня был сайт с ограниченным краулинговым бюджетом. То есть по факту там было тысяч 10 страниц, но в индексе могли быть только 2 тысячи (потому что сайт был молодой и не трастовый). В итоге те страницы, которые мне были нужны в индексе, часто туда не попадали. Помог каноникал — проставление со страниц пагинации каноникала на основные URL позволило четко дать поисковикам понять, какие страницы должны быть в индексе.

Что такое каноническая ссылка?

Тег canonical будет чрезвычайно полезен, если на вашем сайте есть страницы-дубли, которые имеются в доступе по различным адресам. С помощью него необходимо прописать приоритетный канонический URL для восприятия поисковиками.

Что важно - будет также передаваться ссылочный вес и прочие характеристики страницы (PageRank и др.).

Этот атрибут указывается внутри тега на URL-дубликатах с указанием предпочитаемого URL. Оформляется он таким образом:

Для чего нужен каноникал?

При наличии похожих страниц в индексации поисковиками участвуют все они одновременно. В итоге ни одна из них в полной мере не продвигается по причине того, что внутренние ссылки имеются на обе страницы. Поисковик не знает, какой из них нужно отдать приоритет.

То же самое касается и внешних ссылок - продвигается не один URL, а несколько, а вес также распределяется между ними. И сайт находится на более низких позициях, чем мог бы быть.

Благодаря каноникал в индексе поисковиков будет предпочитаемый канонический URL.

Примеры использования

Например, у вас на сайте есть печатная версия страницы. Или отдельный урл для мобильной версии. И вы ставите каноникал с них на основную страницу, в итоге эта основная страница получает больший вес и плюс при ранжировании, а из индекса убирается куча мусора.

Как каноникал используется для пагинации

Нужно проставить rel canonical со страниц пагинации (site.ru/category/page/2) на первую из них (site.ru/category).

Мнения о настройке пагинации разнятся - некоторые специалисты говорят о необходимости закрытия от поисковиков всех страниц пагинации, другие - о том, что лучше их оставить в доступе роботов поисковых систем.

Яндекс рекомендует со всех страниц пагинации настраивать каноническую ссылку на первую из них. Как итог - яндекс-робот воспримет, что именно первую страницу необходимо индексировать. Про индексацию товаров уточняется, что по другим ссылкам Яндекс всё равно будет переходить.

Специалисты Google склоняются к следующим вариантам:

  1. оставить всё по-прежнему - поисковик по-разному распознаёт и воспринимает различные виды страниц;
  2. создать отдельный URL-адрес «Показать всё» и установить его как канонический - особенно рекомендуется для многостраничных статей;
  3. прописать в теге линк атрибуты rel=»prev» и rel=»next» с целью фиксации взаимосвязи между URL-адресами; поисковик будет выдавать первый из них.

А вот видос Деваки, где он подробно поясняет за пагинацию:

Атрибуты rel=»next» и rel=»prev»

Есть также и другое мнение — типа страницы пагинации закрывать не надо, что они наоборот должны получать дополнительный трафик. И тут важны два момента:

  • Все URL должны иметь уникальный параметр тега Title, уникальный текст и meta-теги;
  • Если Вы больше ориентируетесь на Google, то рекомендовано обязательное использование атрибутов rel=»next» и rel=»prev», которые нужно настроить так, чтобы каждая предыдущая страница ссылалась на следующую. На корневом адресе задаётся URL следующего, на последующих - URL предыдущей и следующей, на последней - только предыдущей.

Можно прописать пагинацию этими тегами, а каноническую ссылку оформить на первую или на главную страницу - в зависимости от особенностей ресурса.

Тема с SEO пагинатором

Вот допустим один из блогов (Sawynih или как-то так, уже не помню) писал о кейсе, когда страницы пагинации давали дополнительный трафик.

Если на разных URL представлен похожий товар, навигацию можно задать следующими способами:

  1. Прописать уникальные значения параметров автоматически, собирая заголовки из отдельных частей, к примеру:

    (купить|заказать|приобрести) юбки в (саратове|ростове|астрахани) (по низкой цене|выгодно|дешево) со скидкой (в магазине|в интернет магазине)

    Будут созданы уникальные значения метатегов.

  2. Самым эффективным и трудоемким является самостоятельное прописывание этих параметров, вручную. Все заголовки будут уникальными и очень сильно отличаться друг от друга, в том числе по смыслу. Это позволит продвинуть каждый URL по низкочастотным и низко конкурентным ключевым запросам в ТОП выдачи поисковиков. Благодаря применению этого способа расширится семантическое ядро. Плюс также в том, что для интернет-магазина множество статей писать нецелесообразно.

Важно осуществить эту работу один раз индивидуально для каждого URL. Параметры будут зафиксированы поисковиками.

Настройка Canonical для WordPress

Многие плагины для WordPress прекрасно работают с данным тегом.

Большинство из них просты в применении - активируем плагин, а канонические ссылки прописываются автоматически. В других SEO-плагинах достаточно установить галочку возле этого параметра в настройках. Если какая-то статья относится одновременно к разным категориям, то каноническая ссылка фиксируется самостоятельно.

При использовании плагина Yoast SEO и расположения поста в разных категориях, поисковик будет видеть только одну страницу.

Что еще полезно знать о каноникал?

Важно подчеркнуть следующие моменты:

  1. Тег canonical - не директива, а подсказка, которую следует учесть и проанализировать, выделив наиболее подходящий URL для поисковой выдачи.
  2. Касаемо оформления канонических ссылок отсутствует запрещающий момент в виде относительного пути. Даже в случае введения тега со ссылкой на документ, относительные пути станут восприниматься так, как прописано в базовом URL.
  3. Канонические страницы могут содержать не абсолютно одинаковое наполнение, и это логично. Могут присутствовать незначительные различия.
  4. Даже при наличии ошибки 404, контент будет индексироваться. Но рекомендуется указывать рабочие URL в качестве канонических.
  5. Если канонический url пока не проиндексирован, остаётся ждать - обычно недолго. Когда он распознается, подсказка будет пересмотрена.
  6. Можно использовать редирект - поисковик воспримет перенаправление и будет учитывать другой адрес.
  7. Рекомендуется задавать идентичный тег rel canonical, чтобы результат канонизации был оптимальным.
  8. Канонический урл может прописываться исключительно с текущего домена. Для указания урла с другого домена, следует использовать 301 редирект.
  9. Как оформляются канонические url, можно изучить на примере сайта wikia.com, открыв исходный код страницы http://starwars.wikia.com/wiki/Nelvana_Limited, содержащий canonical url http://starwars.wikia.com/wiki/Nelvana
    Обе ссылки практически одинаковы, но в первой прописан атрибут каноникал - и Google будет отображать версию, заданную в этом параметре.
  10. Вопросы применения каноникал можно задать в официальном блоге для вебмастеров поисковика Google.

В данном случае каноникал проставлен на чёрную овцу

Преимущества, связанные с умением правильно настраивать индексацию с помощью тега canonical:

  • избавление от похожего контента, связанного с недостатками движка, а также созданного искусственно целенаправленными действиями конкурентов;
  • отсутствие необходимости в применении robots.txt для запрета индексации отдельных страниц и угождения всем поисковикам.