Как търсачката “вижда” уеб страниците

Търсачките на практика “виждат” страниците в Интернет подобно на хората, разбира се, когато умишлено не е представено друго и/или скрито съдържание на търсачката. Има обаче няколко различия относно това как хората и търсачките отсяват ценната информация от страницата. Ще се опитам да представя процеса структуриран във времето.

1. Търсачката сваля файла на страница.

Това най-често е файл с HTML структура, но може и да е използван друг език за форматиране, като XML, примерно. Възможно е търсачката да индексира и други видове файлове (документи), но в тази статия ще говоря за страници, форматирани с markup езици.

2. Извличане на съдържанието от страницата.

Общо взето всички markup езици са създадени с цел съдържанието от тях лесно да бъде извлечено. В общия случай това е текстът между символите “>” и “<”. Всичко останало се смята за код или “meta” данни. В зависимост от търсачката може да се извличат и данни от “meta” данните. Продължи да четеш »

Линкове от вътрешни страници на сайтове

Тази статия е допълнение на статията Всичко за купуването на връзки, защото се оказа, че не съм успял да напиша абсолютно всичко по темата. Статията е разработена от Драго (SEO пич), за което много му благодаря. Естествено, отново не можем да напишем всичко по темата, но поне се опитахме :) Ако и Вие имате да добавите нещо - ще сме Ви благодарни!

Линкове от вътрешни страници на други сайтове - Този метод също спомага за това бота по-бързо да мине през сайта. Благодарение на този метод, можете да окажете на бота точно през кои страници да мине и така да го манипулирате. Най-ефективен е метода, когато линковете водят на възловите страници. Сайтовете, които служат при този метод, се наричат “сайтове индексатори”.

Това е най-ефективната тактика от всички, описани в предишната статия. Сайтът индексатор е специален сайт, който тегли съдържанието от вашите сайтове, индексира своите вътрешни страници и след това се само обновява - затваря страниците, които попадат в индекса и на тяхно място вади нови, непроиндексирани. Продължи да четеш »