Как да си пазим съдържанието от кражба
Всеки качествен сайт и най-вече блог, става жертва на кражба на съдържание. Това е напълно нормално – слабите сайтове искат да приличат на големите и им подражават. Също така много сайтове просто са създадени от копирано съдържание. Напоследък обаче кражбите на съдържание стават не с цел подражаване и изграждане, а с цел SEO.
Съдържанието е едно от най-апетитните неща за търсачките, защото те самите и потребителите печелят от него. Съдържанието е и един от най-големите фактори при SEO, именно затова борбата и гладът за качествено съдържание са огромни. Това е и целта на Интернет – да съдържа максимално количество качествено съдържание.
Обикновено, когато даден материал бива публикуван в Интернет, то той не се индексира веднага от търсачките. Необходимо е време той да бъде открит от роботите и да бъде причислен към съответния сайт. Оттам нататък това парче текст се счита за собственост на сайта на който е открито и всички негови копия се поставят в Supplemental Results.
Този сценарий изглежда справедлив, но често сайтовете, които крадат съдържание, го крадат с огромни количества и от много места. Следователно те биват много по-често индексирани от тези, които публикуват оригиналите. Съдържанието се намира по-бързо при тях и кражбата е на лице.
Съвременните блогове и CMS системи имат така наречените RSS канали, по които изнасят съдържанието си към програми за четене на потребителите. Тези канали се следят от търсещите машини и новото съдържание се индексира възможно най-бързо и се причислява към определения сайт.
Но тези канали се следят и от крадците на съдържание и именно през тях изтича и се публикува съдържанието в сайта крадец. Една възможна предпазна мярка е тези канали да излъчват само част от публикувания материал или само заглавието му. Така по-голямата част от текста се предпазва от кражба.
Разбира се, има и сайтове, които крадат съдържание на базата на скриптове и при тях единственото спасение е да се прихване IP адресът на злосторникът и да се блокира. Подобни скриптове за щастие се срещат рядко, поне за сега. Ако се пускат през proxy или през различни машини – шансовете ни да ги блокираме намаляват
Причисляването на съдържанието към даден сайт обаче не зависи само от това на кой сайт първо е намерено то. Старите сайтове и тези, които публикуват по-често, както и тези, които са по-големи като размер, се ползват с привилегии при определянето на оригинала на съдържание.
Много често сайтовете, които крадат съдържание са стари, големи и често индексирани. Срещу такива почти нямаме шансове. Единственото спасение е да успеем да накараме копиращия сайт да слага реални връзки към материалите от нашия сайт, които са копирани. Това за жалост се случва трудно и рядко.
Въпреки всичко има закони и лицензи, които се опитват да запазят правата на хората, които честно си пишат съдържание. Много хора изобщо не разбират, че са копирани и чрез труда си работят и изкарват пари за някой крадец, а техните сайтове не мърдат откъм SEO. Именно затова съветвам често да търсите изречения от сайта си и да се уверявате, че Вашия сайт излиза на първо място.
бутон за споделяне в социални мрежи
Коментари
14 коментара за Как да си пазим съдържанието от кражба
-
SSH_ON на 21.06.2008 18:45
Добра статия. Лошото е, че в Интернет законите са просто добро пожелание. Бог високо, цар далече. Няма оправия с кражбата на съдържание. Където ми е важно, пускам само частичен RSS. И без това повечето хора не го използват, пълен RSS бюлетин само улеснява спамерите. Иначе забелязвам, че Google са успели да индексират доста RSS скрапери, има лек напредък в тази област и много скрап системи не се индексират в Google.
-
Васил Тошков на 21.06.2008 18:59
Аз се надявам поне да махнат тежестта на старите сайтове и да зачитат съдържанието там, където е намерено първо. И ако някой знае как по законен път човек може да си защити правата при кражба на Интернет съдържание – нека сподели.
-
Мда, много мъчна работа, обаче за сега освен 3рд нюз и калдата, почти няма проблеми с това. А и калдата изпълниха доста от изискванията на блог обществото.
-
Да си защитиш съдържанието е като да спреш тегленето на музика, софтуер и филми от Интернет. Тоест не може да стане. Дори не може да се намали. И да тръгнеш да се разправяш с някой, до задънена улица ще стигнеш и няма да си заслужава времето, парите и нервите. Наистина единственото решение е търсещите машини да определят с точност първоизточника на съдържанието, но и това ми се струва не лека задача. Просто някои сайтове винаги ще се индексират по-бързо от други. Заглавието на статията е малко подвеждащо, защото не се предлагат реални решения за опазване на съдържанието :) Ограничаването на RSS емисията е нож с две остриета понякога, тъй като някои потребители държат на RSS четците си… Няма решение и оправия.
-
Хотел Веста-Монтана на 22.06.2008 00:11
Според мен, ако някой показва някъде RSS емисия от твоя сайт, при положения че ти (собственика на сайта) си я пуснал трудно може да е нарече кражба. И доколкото съм виждал сайтове които публикуват RSS емисии, винаги връзките сочат към оргиналния сайт и поне на тези на които съм си правил труда да погледна връзките са били директни. Така, че според мен това си е жива реклама за източника на RSS.
И още нещо. Обикновенно се публикуват емисии към интересни сайтове (блогове), така, че щом вземат ваши RSS канали, които вие пускате, значи пишете интересно:). А ако някой иска допълнително съдържание на своя сайт веднага ще му предоставя мой RSS канал без да се притеснявам, че ме краде. -
Хотел Монтана, не става въпрос за пуснати widgets с някакви RSS емисии в sidebar примерно. Васко има предвид сайтове, чиито съдържание се базира изцяло на RSS емисиите на чужди сайтове. Тъй наречените скрапери. Или поне аз така разбирам нещата :)
-
Хотел Веста-Монтана на 22.06.2008 00:54
Еее ама вие искате сега хем да пуснете RSS за може вашите материали да са достъпни за повече хора хем искате да се появяват на някакви тайни места и другите които така да се каже рекламират вашето съдържание да нямат никаква изгода от това. Освен това има едно много лесно решение на проблема, дори две.
1. Пускате в RSS само зглавието както беше посочено по горе.
2. Спирате изобщо RSS.
При втория случай вече, ако някой копира съдържания от сайта ти и не спази условиятана сайта, ако има такива, може да се нарече кражба.
При другите случай не съм съгласен, с това, че вие пускате RSS канал за ползване и после наричате някой дето го ползва крадец.
И освен това какво като има сайтове които се базират изцяло на RSS. За мен те са удобни защото минавам през тях преглеждам набързо какво ново и ако ме интересува отивам при източника. Тази вечер тук попаднах по подобен начин само, че от dao.bg, само дето в дао ходя по рядко, отколкото прглеждам сайтове с RSS като например rss-novini.com. Така, че продължавам да смятам, че хората излъчващи RSS имат полза от включването на техните канали в подобни сайтове. Да не говорим, че в цитирания сайт връзките са директни та няма накъде повече. И това ако не е SEO за източниците на RSS здраве му кажи. -
Васил Тошков на 22.06.2008 09:50
Социалните мрежи нямат нищо общо с крадците на съдържание (освен тези, които слагат nofollow или редиректващ линк). Ако на един социален сайт всичко му е наред откъм SEO и дава реална връзка към оригинала, тогава печелят и той и собственика на материала.
Проблемът са сайтове, които имат единствената цел да генерират съдържание. Те крадат съдържание за сметка на неговия собственик. Така сайтът на автора се зачуква в суплементала, а крадецът бележи невиждани успехи и това съдържание започва завинаги да работи за него.
Това не е честно и трябва да се наказва. От Google гледам полагат някакви усилия, но не винаги дават резултат. Ако SEO-тата се обеденим и репортваме такива сайтове – ще помогнем на много хора и няма да губин качествените автори.
-
Ами има един много лесен начин за удостоверяване на автора. Казва му се нотариус :). Обаче, тук логиката не е да се ходи при истински такъв, а просто при публикуване на съдържанието да се праща и линк/мейл или нещо от сорта към сървър, който е тръстед и който всички му вярват. Така, винаги може да се провери кой е написал оригинала /естествено ако е копиран 1:1/. Тази идея е доста стара /относно електронния нотариус/ и предимно се отнася за кореспонденция с електронен подпис и сертификати.
Посредством нея ако някой изпрати писмо, писмото се праща на нотариуса /който е някакъв сървър/ и на получателя. Така при възникнал конфликт винаги може да се провери кога и дали е изпратено писмото. По същата логика това може да се направи и за съдържанието. Въпроса е, че трябва да се направи от достатъчно голяма институция /гугъл???/ на която всички имат доверие.
Но сменяйки няколко абзаца според мене това автоматично се превръща в нов материал, което и обезмисля начинанието. :)
-
„…вие пускате RSS канал за ползване и после наричате някой дето го ползва крадец.“ – има ли нужда да те убеждавам, че грешиш? Едно е някой да чете с RSS Reader емисията ми, съвсем друго е някой да генерира фиктивни сайтове с изцяло чуждо съдържание, които да монетизира с AdSense (докато не го баннат), а след това да използва за линкване на проекти и манипулиране на търсещите машини. Това си е кражба, blackhat и неморално. И Google го наказва, не е само мое мнение.
-
В алгоритъма за класиране/индексиране се зачитат параметри като дата на публикуване на съдържанието, стил на писане и др., които помагат доста за определяне на първоисточника(оригинал) на информацията. Така че малко бихте се притеснявали ако някой Ви копира и използва съдържанието.
В случай че това Ви се случи може да атакувате по следния начин:
1. търсите точните сайтове които копират от Вас. 2. Свързвате се с администраторите за поставяне на връзка към Вашият материал. 3. Ако предходното не помогне ги репортвате.
Общо взето големите сайтове не вземат информация без да поставят обратна връзка, а ако е малък той трудно пробива до 1-ва страница. -
Имам подобен проблем – сайт взима RSS-a ми и при търсене в blogsearch съдържанието излиза преди моя сайт. За целта е добре да се resubmit-не сайтмап-а в Google: http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=34609 забелязах, че Wordpress пинг-ва Google за обновления в sitemap. Може да се използва услугата за пинг на blogsearch: http://blogsearch.google.com/ping
-
RSS новини на 27.06.2008 13:13
Cloxy, надявам се да говориш само по принцип и да нямаш и ти някакви претенции.
dzver, още когато сайта не работеше и беше още САМО ИДЕЯ, съм писал в блога на oggin (знам, че го четеш) , месеци преди това! , че всеки, който не иска съдържанието на сайта му да е там си урежда проблема с един майл от адрес admin@примерния.сайт
Написано е тук (oggin.net):
http://oggin.net/work/i’m-not-feeling-lucky/
И тук: (3rdnews.info)
http://3rdnews.info/content/view/2/172/
Цитирам: „Важно: Ако новините на вашия уеб сайт присъстват в директорията, а не желаете да са там задължително ни пишете.“
Тъй като сайта наистина е нарснал много и наистина може някой да не го е прочел, от днес текста ще присъства на още много други места, за да не може после някой да каже, че не го е видял.
До момента само Тодор Христов от novavizia.com се е свързал с мен.
Грам не разбирам какъв ти е проблема??? Пиши ми и изчезваш. Какъв е смисъла от репортване на сайтове??? На тоя сайт никога не е имало и 1 реклама и до момента няма приход и 1 лев от него. Безплатно, пише го навсякъде. Целия сайт е един експеримент. Активи – глупости. Къде, какви? -
@RSS новини – Говорил съм без да визирам когото и да е. Точно с този сайт не съм си имал никакви проблеми.
Но вземи слагай реални връзки към материалите, без nofollow. Повече ще спечелиш и ти и сайтовете извори.


