Как да си пазим съдържанието от кражба

юни 21, 2008 от Васил Тошков · 14 коментара
Категории: SEO, Блогове 

Всеки качествен сайт и най-вече блог, става жертва на кражба на съдържание. Това е напълно нормално – слабите сайтове искат да приличат на големите и им подражават. Също така много сайтове просто са създадени от копирано съдържание. Напоследък обаче кражбите на съдържание стават не с цел подражаване и изграждане, а с цел SEO.

Съдържанието е едно от най-апетитните неща за търсачките, защото те самите и потребителите печелят от него. Съдържанието е и един от най-големите фактори при SEO, именно затова борбата и гладът за качествено съдържание са огромни. Това е и целта на Интернет – да съдържа максимално количество качествено съдържание.

Обикновено, когато даден материал бива публикуван в Интернет, то той не се индексира веднага от търсачките. Необходимо е време той да бъде открит от роботите и да бъде причислен към съответния сайт. Оттам нататък това парче текст се счита за собственост на сайта на който е открито и всички негови копия се поставят в Supplemental Results.

Този сценарий изглежда справедлив, но често сайтовете, които крадат съдържание, го крадат с огромни количества и от много места. Следователно те биват много по-често индексирани от тези, които публикуват оригиналите. Съдържанието се намира по-бързо при тях и кражбата е на лице.

Съвременните блогове и CMS системи имат така наречените RSS канали, по които изнасят съдържанието си към програми за четене на потребителите. Тези канали се следят от търсещите машини и новото съдържание се индексира възможно най-бързо и се причислява към определения сайт.

Но тези канали се следят и от крадците на съдържание и именно през тях изтича и се публикува съдържанието в сайта крадец. Една възможна предпазна мярка е тези канали да излъчват само част от публикувания материал или само заглавието му. Така по-голямата част от текста се предпазва от кражба.

Разбира се, има и сайтове, които крадат съдържание на базата на скриптове и при тях единственото спасение е да се прихване IP адресът на злосторникът и да се блокира. Подобни скриптове за щастие се срещат рядко, поне за сега. Ако се пускат през proxy или през различни машини – шансовете ни да ги блокираме намаляват

Причисляването на съдържанието към даден сайт обаче не зависи само от това на кой сайт първо е намерено то. Старите сайтове и тези, които публикуват по-често, както и тези, които са по-големи като размер, се ползват с привилегии при определянето на оригинала на съдържание.

Много често сайтовете, които крадат съдържание са стари, големи и често индексирани. Срещу такива почти нямаме шансове. Единственото спасение е да успеем да накараме копиращия сайт да слага реални връзки към материалите от нашия сайт, които са копирани. Това за жалост се случва трудно и рядко.

Въпреки всичко има закони и лицензи, които се опитват да запазят правата на хората, които честно си пишат съдържание. Много хора изобщо не разбират, че са копирани и чрез труда си работят и изкарват пари за някой крадец, а техните сайтове не мърдат откъм SEO. Именно затова съветвам често да търсите изречения от сайта си и да се уверявате, че Вашия сайт излиза на първо място.

Преструктуриране на сайт (блог)

декември 26, 2007 от Васил Тошков · 3 коментара
Категории: SEO, Блогове 

Вчера реших да преструктурирам два мои блога, защото връзките на статиите им не ме удовлетворяваха. Единият сайт беше много известен и посещаван, другият е този. Подобна промяна ми се струваше рискована, защото първият сайт имаше няколко статии, които се класираха много добре с ключовите си думи.

По принцип в такава ситуация се пренасочват старите връзки с грешка тип 301 към новите, но в първия случай това нямаше как да стане, защото връзките бяха на кирилица. Поне аз не успях да подкарам Apache-то да ги захапе и да ги пренасочи. От друга страна, публикациите в блога бяха прекалено много и ме чакаше голямо писане.

Какво направих: и в двата блога влязох в съответния контролен панел на Wordpress за управление на връзките и просто ги промених както аз ги искам. Качих и нови карти sitemap.xml на сайтовете и започнах да чакам. 24 часа след това установих, че при първия блог над 80% от старите връзки ги нямаше и бяха заменени с новите им еквиваленти.

При текущия блог положението е по-лошо, просто защото още не е разработен и бота на Google не стои постоянно тук. Но като цяло е впечатляващо за колко малко време се индексираха новите структури и изчезнаха старите такива. Даже статиите, които се класираха добре в първия блог си бяха на мястото в SERP-а с новите си адреси.

От всичко това си правя извода, че от Google са усъвършенствали системите за откриване на дублирано съдържание и оценяване кой е първоизточника и кое е копието. Това като цяло е добре, когато се отнася за преструктуриране на сайтове. Но дали няма да даде предимство на тези, които копират съдържание?

Примерно имаме блог, който бива копиран от някой друг сайт (блог). Ако от нашият блог поради някаква причина изчезнат статии или си сменят адресите, то дали няма за първоизточник да бъде обявен сайтът, който ни копира? Да се надяваме, че от Google са предвидили ситуацията и това не се случва.