Canonical URL Tag – Какъв е смисълът от това?

30.05.2009 от Васил Тошков
Категории: SEO 

Наскоро три големи търсачки: Yahoo, Live и Google приеха чудото, наречено Canonical URL Tag. На доста места се писа по темата, но така и не можах да разбера за какво служи това. Гледам много CMS-и взеха да го включват, новата версия на Mozilla също го разпознава. Реших да проуча въпроса и до го включа в новата версия на Cloxy CMS.

Отначало си помислих, че е поредната простотия на Гугъл, като xml sitemaps и rel nofollow. Оказа се, че този път не е така. Може би защото не са го измислили Гугъл. Идеята е проста – в даден таг да се съдържа оригиналния адрес на страница в Интернет. Целта е избягване на дублирано съдържание или по-точно посочване на оригинала при дублирано съдържание.

Canonical URL Tag се явява нещо като допълнение на 301 редиректа, успешно допълнение. Примери, където успешно се използва:

  • при срещане на големи букви в адреса;
  • при получаване на линк в неправилен формат;
  • при генериране на session_id в адреса от CMS-а;
  • при сортиране на списъци в Интернет;
  • при генериране на index.html или index.php от системата;
  • изобщо при всякакви параметризации на скриптове;

Стига с толкова теория, ето малко примери от моя SEO сайт. В кода може да видите формата на тага: <link href="http://www.example.com/" rel="canonical" />. Като адресът вътре показва адреса на оригиналното съдържание. Важното е CMS-а да го генерира на база вътрешни данни, а не на база сървърни променливи.

Примерите се виждат с най-новата версия на Mozilla Firefox. Горе в дясно на адрес бара се появява иконка със символа „C“. Ако иконата е сива, значи се намирате на каноничния адрес. Ако е синя, това означава, че се намирате на грешен адрес и CMS-ът, и браузърът Ви предлагат да отидете на каноничния адрес на тази страница. Както виждате, не е лесно за системата да определи каноничния адрес.

Пример 1: Ако отворите адрес cloxy.com/index.html или cloxy.com/index.php, тогава системата генерира каноничен адрес cloxy.com/ и иконата в адрес бара святка в синьо. Ако задържите мишката върху нея, браузърът ще Ви каже кой е каноничния адрес за тази страница. Чрез щракане върху иконата, отивате на него.

Пример 2: Ако получа афилиейт линк от вида cloxy.com/?affid=23, тогава системата, естествено, казва, че каноничния адрес е cloxy.com/. В първия пример е лесно да се реши проблемът с mod_rewrite или robots.txt. Във втория е по-трудно. Като цяло обаче е излишно и сложно за подобни неща да се правят редиректи и забрани.

Пример 3: Canonical Tag работи и на ниво котви. Примерно адресът cloxy.com/services.html#biz, който е нормален за сайта ми, се пренасочва към cloxy.com/services.html. Това чудо не се сещам как може да се направи чрез mod_rewrite. Но търсачките знаят за котвите и ги обработват лесно.

Пример 4: Ако сайтът Ви има и SSL защитена версия с адреси от типа https://www.example.com/, тогава лесно можете да определите каноничния адрес да е http://www.example.com/ за всички страници и подстраници. Този проблем също не се сещам да има друго решение, освен чрез Canonical URL Tag.

Както се вижда от публикацията, Canonical URL Tag се явява допълнение на 301 redirects, Sitemap XML и robots.txt. По дефиниция не работи между различни домейни, а само на ниво един и същ домейн. Аз обаче все си мисля, че търсачките могат да се борят и срещу напълно копирани страници чрез него. Работи и между поддомейни.

Canonical Tag е един перфектен SEO инструмент, който вече използвам на почти всичките си сайтове и блогове. Внедряването е трудно, ако трябва сами да го програмирате, но после работи вечно и решава бъдещи проблеми. Под Wordpress вече има много разширения, които интегрират Canonical URL Tag в системата.

бутон за споделяне в социални мрежи

Коментари

5 коментара за Canonical URL Tag – Какъв е смисълът от това?

  1. Васил Тошков на 30.05.2009 16:32

    Оказа се, че не самата Mozilla, а добавката SearchStatus дава състоянието на каноничния адрес в адрес бара на браузъра.

  2. Веселин на 31.05.2009 20:47

    Идеята на canonical изобщо не е лоша. Но има един голям недостатък на този етап – работи само с текущя домейн, т.е. не може във варна-българия.ком да сложа рел canonical нещо-друго.бг. А пък ако искам да сложа нещо, което вече съществува някъде другаде, практически не ми се предоставя възможност, освен като го копи пейстна да сложа линк към оригинала и пак не е сигурно, че ако сложа няколко такива неща няма да ям наказание за дупликейтед. Но съм сигурен, че и това ще се промени в скоро време :)

  3. Антон Радев на 02.06.2009 18:55

    Колеги, идеята на тези канони не е лоша, само че както много неща в годините и това ще влезе в суплементала на гугъл за елементи и маркировки (като revisit-after, keywords и т.н.).
    Google сравнително успешно се справя с това сам да преценя кое в кой сайт е важно и кое не е, кое въпреки, че е дублирано е тръстед и е окей да се класира добре.
    С или без този canonical, никой няма да намаже нещо кой знае какво.

    За проблема с копи-пейст сайтовете с промишлени количества Гугъл са се спретнали да се справят сами както могат.

    Тия маркетинг трикчета и трошички като canonical и прочие, са за SEO-тата (по-скоро мераклиите сео-та), които без качествени сайтове искат да се натъпчат където могат и те.

    Така поне мисля аз..

    Поздрави на всички!

  4. Васил Тошков на 03.06.2009 14:58

    При всяко положение Canonical Tag е един стандарт, който времето ще покаже дали е за добро или за лошо. Времето показа, че nofollow е безсмислен и не помага срещу спама. Да се надяваме, че поне Canonical Url Tag ще помогне срещу дублираното съдържание, което е втория голям проблем на Интернет.

    Гледам много хора и CMS-и си го слагат просто „за да има“ и в него пишат адреса от адрес бара. Изглежда не са схванали идеята на всичко това и по този начин повече ще си навредят, отколкото да си помогнат. Случва се и при някои малки CMS-и. Просто един инструмент, а колкото повече инструменти, толкова по-добре, стига да са за добро.

  5. Веселин на 03.06.2009 19:02

    Съгласен съм. Добре е човек да знае за какво точно използва дадено нещо, вместо да го използва на поразия и ефекта вместо да е положителен да бъде отрицателен. До колкото е полезно самото нововъведение, не знам – нямам все още някакви конкретни наблюдения, но стискам палци да е едно от работещите неща ;-)