Как да си пазим съдържанието от кражба

21.06.2008 от Васил Тошков
Категории: SEO, Блогове 

Всеки качествен сайт и най-вече блог, става жертва на кражба на съдържание. Това е напълно нормално – слабите сайтове искат да приличат на големите и им подражават. Също така много сайтове просто са създадени от копирано съдържание. Напоследък обаче кражбите на съдържание стават не с цел подражаване и изграждане, а с цел SEO.

Съдържанието е едно от най-апетитните неща за търсачките, защото те самите и потребителите печелят от него. Съдържанието е и един от най-големите фактори при SEO, именно затова борбата и гладът за качествено съдържание са огромни. Това е и целта на Интернет – да съдържа максимално количество качествено съдържание.

Обикновено, когато даден материал бива публикуван в Интернет, то той не се индексира веднага от търсачките. Необходимо е време той да бъде открит от роботите и да бъде причислен към съответния сайт. Оттам нататък това парче текст се счита за собственост на сайта на който е открито и всички негови копия се поставят в Supplemental Results.

Този сценарий изглежда справедлив, но често сайтовете, които крадат съдържание, го крадат с огромни количества и от много места. Следователно те биват много по-често индексирани от тези, които публикуват оригиналите. Съдържанието се намира по-бързо при тях и кражбата е на лице.

Съвременните блогове и CMS системи имат така наречените RSS канали, по които изнасят съдържанието си към програми за четене на потребителите. Тези канали се следят от търсещите машини и новото съдържание се индексира възможно най-бързо и се причислява към определения сайт.

Но тези канали се следят и от крадците на съдържание и именно през тях изтича и се публикува съдържанието в сайта крадец. Една възможна предпазна мярка е тези канали да излъчват само част от публикувания материал или само заглавието му. Така по-голямата част от текста се предпазва от кражба.

Разбира се, има и сайтове, които крадат съдържание на базата на скриптове и при тях единственото спасение е да се прихване IP адресът на злосторникът и да се блокира. Подобни скриптове за щастие се срещат рядко, поне за сега. Ако се пускат през proxy или през различни машини – шансовете ни да ги блокираме намаляват

Причисляването на съдържанието към даден сайт обаче не зависи само от това на кой сайт първо е намерено то. Старите сайтове и тези, които публикуват по-често, както и тези, които са по-големи като размер, се ползват с привилегии при определянето на оригинала на съдържание.

Много често сайтовете, които крадат съдържание са стари, големи и често индексирани. Срещу такива почти нямаме шансове. Единственото спасение е да успеем да накараме копиращия сайт да слага реални връзки към материалите от нашия сайт, които са копирани. Това за жалост се случва трудно и рядко.

Въпреки всичко има закони и лицензи, които се опитват да запазят правата на хората, които честно си пишат съдържание. Много хора изобщо не разбират, че са копирани и чрез труда си работят и изкарват пари за някой крадец, а техните сайтове не мърдат откъм SEO. Именно затова съветвам често да търсите изречения от сайта си и да се уверявате, че Вашия сайт излиза на първо място.

бутон за споделяне в социални мрежи

Коментари

14 коментара за Как да си пазим съдържанието от кражба

  1. SSH_ON на 21.06.2008 18:45

    Добра статия. Лошото е, че в Интернет законите са просто добро пожелание. Бог високо, цар далече. Няма оправия с кражбата на съдържание. Където ми е важно, пускам само частичен RSS. И без това повечето хора не го използват, пълен RSS бюлетин само улеснява спамерите. Иначе забелязвам, че Google са успели да индексират доста RSS скрапери, има лек напредък в тази област и много скрап системи не се индексират в Google.

  2. Васил Тошков на 21.06.2008 18:59

    Аз се надявам поне да махнат тежестта на старите сайтове и да зачитат съдържанието там, където е намерено първо. И ако някой знае как по законен път човек може да си защити правата при кражба на Интернет съдържание – нека сподели.

  3. dzver на 21.06.2008 20:05

    Мда, много мъчна работа, обаче за сега освен 3рд нюз и калдата, почти няма проблеми с това. А и калдата изпълниха доста от изискванията на блог обществото.

  4. SSH_ON на 21.06.2008 23:51

    Да си защитиш съдържанието е като да спреш тегленето на музика, софтуер и филми от Интернет. Тоест не може да стане. Дори не може да се намали. И да тръгнеш да се разправяш с някой, до задънена улица ще стигнеш и няма да си заслужава времето, парите и нервите. Наистина единственото решение е търсещите машини да определят с точност първоизточника на съдържанието, но и това ми се струва не лека задача. Просто някои сайтове винаги ще се индексират по-бързо от други. Заглавието на статията е малко подвеждащо, защото не се предлагат реални решения за опазване на съдържанието :) Ограничаването на RSS емисията е нож с две остриета понякога, тъй като някои потребители държат на RSS четците си… Няма решение и оправия.

  5. Хотел Веста-Монтана на 22.06.2008 00:11

    Според мен, ако някой показва някъде RSS емисия от твоя сайт, при положения че ти (собственика на сайта) си я пуснал трудно може да е нарече кражба. И доколкото съм виждал сайтове които публикуват RSS емисии, винаги връзките сочат към оргиналния сайт и поне на тези на които съм си правил труда да погледна връзките са били директни. Така, че според мен това си е жива реклама за източника на RSS.
    И още нещо. Обикновенно се публикуват емисии към интересни сайтове (блогове), така, че щом вземат ваши RSS канали, които вие пускате, значи пишете интересно:). А ако някой иска допълнително съдържание на своя сайт веднага ще му предоставя мой RSS канал без да се притеснявам, че ме краде.

  6. SSH_ON на 22.06.2008 00:25

    Хотел Монтана, не става въпрос за пуснати widgets с някакви RSS емисии в sidebar примерно. Васко има предвид сайтове, чиито съдържание се базира изцяло на RSS емисиите на чужди сайтове. Тъй наречените скрапери. Или поне аз така разбирам нещата :)

  7. Хотел Веста-Монтана на 22.06.2008 00:54

    Еее ама вие искате сега хем да пуснете RSS за може вашите материали да са достъпни за повече хора хем искате да се появяват на някакви тайни места и другите които така да се каже рекламират вашето съдържание да нямат никаква изгода от това. Освен това има едно много лесно решение на проблема, дори две.
    1. Пускате в RSS само зглавието както беше посочено по горе.
    2. Спирате изобщо RSS.
    При втория случай вече, ако някой копира съдържания от сайта ти и не спази условиятана сайта, ако има такива, може да се нарече кражба.
    При другите случай не съм съгласен, с това, че вие пускате RSS канал за ползване и после наричате някой дето го ползва крадец.
    И освен това какво като има сайтове които се базират изцяло на RSS. За мен те са удобни защото минавам през тях преглеждам набързо какво ново и ако ме интересува отивам при източника. Тази вечер тук попаднах по подобен начин само, че от dao.bg, само дето в дао ходя по рядко, отколкото прглеждам сайтове с RSS като например rss-novini.com. Така, че продължавам да смятам, че хората излъчващи RSS имат полза от включването на техните канали в подобни сайтове. Да не говорим, че в цитирания сайт връзките са директни та няма накъде повече. И това ако не е SEO за източниците на RSS здраве му кажи.

  8. Васил Тошков на 22.06.2008 09:50

    Социалните мрежи нямат нищо общо с крадците на съдържание (освен тези, които слагат nofollow или редиректващ линк). Ако на един социален сайт всичко му е наред откъм SEO и дава реална връзка към оригинала, тогава печелят и той и собственика на материала.

    Проблемът са сайтове, които имат единствената цел да генерират съдържание. Те крадат съдържание за сметка на неговия собственик. Така сайтът на автора се зачуква в суплементала, а крадецът бележи невиждани успехи и това съдържание започва завинаги да работи за него.

    Това не е честно и трябва да се наказва. От Google гледам полагат някакви усилия, но не винаги дават резултат. Ако SEO-тата се обеденим и репортваме такива сайтове – ще помогнем на много хора и няма да губин качествените автори.

  9. Ник на 22.06.2008 16:51

    Ами има един много лесен начин за удостоверяване на автора. Казва му се нотариус :). Обаче, тук логиката не е да се ходи при истински такъв, а просто при публикуване на съдържанието да се праща и линк/мейл или нещо от сорта към сървър, който е тръстед и който всички му вярват. Така, винаги може да се провери кой е написал оригинала /естествено ако е копиран 1:1/. Тази идея е доста стара /относно електронния нотариус/ и предимно се отнася за кореспонденция с електронен подпис и сертификати.

    Посредством нея ако някой изпрати писмо, писмото се праща на нотариуса /който е някакъв сървър/ и на получателя. Така при възникнал конфликт винаги може да се провери кога и дали е изпратено писмото. По същата логика това може да се направи и за съдържанието. Въпроса е, че трябва да се направи от достатъчно голяма институция /гугъл???/ на която всички имат доверие.

    Но сменяйки няколко абзаца според мене това автоматично се превръща в нов материал, което и обезмисля начинанието. :)

  10. SSH_ON на 22.06.2008 17:53

    „…вие пускате RSS канал за ползване и после наричате някой дето го ползва крадец.“ – има ли нужда да те убеждавам, че грешиш? Едно е някой да чете с RSS Reader емисията ми, съвсем друго е някой да генерира фиктивни сайтове с изцяло чуждо съдържание, които да монетизира с AdSense (докато не го баннат), а след това да използва за линкване на проекти и манипулиране на търсещите машини. Това си е кражба, blackhat и неморално. И Google го наказва, не е само мое мнение.

  11. Невян на 23.06.2008 08:27

    В алгоритъма за класиране/индексиране се зачитат параметри като дата на публикуване на съдържанието, стил на писане и др., които помагат доста за определяне на първоисточника(оригинал) на информацията. Така че малко бихте се притеснявали ако някой Ви копира и използва съдържанието.
    В случай че това Ви се случи може да атакувате по следния начин:
    1. търсите точните сайтове които копират от Вас. 2. Свързвате се с администраторите за поставяне на връзка към Вашият материал. 3. Ако предходното не помогне ги репортвате.
    Общо взето големите сайтове не вземат информация без да поставят обратна връзка, а ако е малък той трудно пробива до 1-ва страница.

  12. Manol Trendafilov на 23.06.2008 11:05

    Имам подобен проблем – сайт взима RSS-a ми и при търсене в blogsearch съдържанието излиза преди моя сайт. За целта е добре да се resubmit-не сайтмап-а в Google: http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=34609 забелязах, че Wordpress пинг-ва Google за обновления в sitemap. Може да се използва услугата за пинг на blogsearch: http://blogsearch.google.com/ping

  13. RSS новини на 27.06.2008 13:13

    Cloxy, надявам се да говориш само по принцип и да нямаш и ти някакви претенции.
    dzver, още когато сайта не работеше и беше още САМО ИДЕЯ, съм писал в блога на oggin (знам, че го четеш) , месеци преди това! , че всеки, който не иска съдържанието на сайта му да е там си урежда проблема с един майл от адрес admin@примерния.сайт
    Написано е тук (oggin.net):
    http://oggin.net/work/i’m-not-feeling-lucky/
    И тук: (3rdnews.info)
    http://3rdnews.info/content/view/2/172/
    Цитирам: „Важно: Ако новините на вашия уеб сайт присъстват в директорията, а не желаете да са там задължително ни пишете.“
    Тъй като сайта наистина е нарснал много и наистина може някой да не го е прочел, от днес текста ще присъства на още много други места, за да не може после някой да каже, че не го е видял.
    До момента само Тодор Христов от novavizia.com се е свързал с мен.
    Грам не разбирам какъв ти е проблема??? Пиши ми и изчезваш. Какъв е смисъла от репортване на сайтове??? На тоя сайт никога не е имало и 1 реклама и до момента няма приход и 1 лев от него. Безплатно, пише го навсякъде. Целия сайт е един експеримент. Активи – глупости. Къде, какви?

  14. Васил Тошков на 27.06.2008 17:12

    @RSS новини – Говорил съм без да визирам когото и да е. Точно с този сайт не съм си имал никакви проблеми.

    Но вземи слагай реални връзки към материалите, без nofollow. Повече ще спечелиш и ти и сайтовете извори.