Как да си пазим съдържанието от кражба
Всеки качествен сайт и най-вече блог, става жертва на кражба на съдържание. Това е напълно нормално - слабите сайтове искат да приличат на големите и им подражават. Също така много сайтове просто са създадени от копирано съдържание. Напоследък обаче кражбите на съдържание стават не с цел подражаване и изграждане, а с цел SEO.
Съдържанието е едно от най-апетитните неща за търсачките, защото те самите и потребителите печелят от него. Съдържанието е и един от най-големите фактори при SEO, именно затова борбата и гладът за качествено съдържание са огромни. Това е и целта на Интернет - да съдържа максимално количество качествено съдържание.
Обикновено, когато даден материал бива публикуван в Интернет, то той не се индексира веднага от търсачките. Необходимо е време той да бъде открит от роботите и да бъде причислен към съответния сайт. Оттам нататък това парче текст се счита за собственост на сайта на който е открито и всички негови копия се поставят в Supplemental Results.
Този сценарий изглежда справедлив, но често сайтовете, които крадат съдържание, го крадат с огромни количества и от много места. Следователно те биват много по-често индексирани от тези, които публикуват оригиналите. Съдържанието се намира по-бързо при тях и кражбата е на лице.
Съвременните блогове и CMS системи имат така наречените RSS канали, по които изнасят съдържанието си към програми за четене на потребителите. Тези канали се следят от търсещите машини и новото съдържание се индексира възможно най-бързо и се причислява към определения сайт.
Но тези канали се следят и от крадците на съдържание и именно през тях изтича и се публикува съдържанието в сайта крадец. Една възможна предпазна мярка е тези канали да излъчват само част от публикувания материал или само заглавието му. Така по-голямата част от текста се предпазва от кражба.
Разбира се, има и сайтове, които крадат съдържание на базата на скриптове и при тях единственото спасение е да се прихване IP адресът на злосторникът и да се блокира. Подобни скриптове за щастие се срещат рядко, поне за сега. Ако се пускат през proxy или през различни машини - шансовете ни да ги блокираме намаляват
Причисляването на съдържанието към даден сайт обаче не зависи само от това на кой сайт първо е намерено то. Старите сайтове и тези, които публикуват по-често, както и тези, които са по-големи като размер, се ползват с привилегии при определянето на оригинала на съдържание.
Много често сайтовете, които крадат съдържание са стари, големи и често индексирани. Срещу такива почти нямаме шансове. Единственото спасение е да успеем да накараме копиращия сайт да слага реални връзки към материалите от нашия сайт, които са копирани. Това за жалост се случва трудно и рядко.
Въпреки всичко има закони и лицензи, които се опитват да запазят правата на хората, които честно си пишат съдържание. Много хора изобщо не разбират, че са копирани и чрез труда си работят и изкарват пари за някой крадец, а техните сайтове не мърдат откъм SEO. Именно затова съветвам често да търсите изречения от сайта си и да се уверявате, че Вашия сайт излиза на първо място.
Добра статия. Лошото е, че в Интернет законите са просто добро пожелание. Бог високо, цар далече. Няма оправия с кражбата на съдържание. Където ми е важно, пускам само частичен RSS. И без това повечето хора не го използват, пълен RSS бюлетин само улеснява спамерите. Иначе забелязвам, че Google са успели да индексират доста RSS скрапери, има лек напредък в тази област и много скрап системи не се индексират в Google.
Аз се надявам поне да махнат тежестта на старите сайтове и да зачитат съдържанието там, където е намерено първо. И ако някой знае как по законен път човек може да си защити правата при кражба на Интернет съдържание - нека сподели.
Мда, много мъчна работа, обаче за сега освен 3рд нюз и калдата, почти няма проблеми с това. А и калдата изпълниха доста от изискванията на блог обществото.
Да си защитиш съдържанието е като да спреш тегленето на музика, софтуер и филми от Интернет. Тоест не може да стане. Дори не може да се намали. И да тръгнеш да се разправяш с някой, до задънена улица ще стигнеш и няма да си заслужава времето, парите и нервите. Наистина единственото решение е търсещите машини да определят с точност първоизточника на съдържанието, но и това ми се струва не лека задача. Просто някои сайтове винаги ще се индексират по-бързо от други. Заглавието на статията е малко подвеждащо, защото не се предлагат реални решения за опазване на съдържанието
Ограничаването на RSS емисията е нож с две остриета понякога, тъй като някои потребители държат на RSS четците си… Няма решение и оправия.
Според мен, ако някой показва някъде RSS емисия от твоя сайт, при положения че ти (собственика на сайта) си я пуснал трудно може да е нарече кражба. И доколкото съм виждал сайтове които публикуват RSS емисии, винаги връзките сочат към оргиналния сайт и поне на тези на които съм си правил труда да погледна връзките са били директни. Така, че според мен това си е жива реклама за източника на RSS.
И още нещо. Обикновенно се публикуват емисии към интересни сайтове (блогове), така, че щом вземат ваши RSS канали, които вие пускате, значи пишете интересно:). А ако някой иска допълнително съдържание на своя сайт веднага ще му предоставя мой RSS канал без да се притеснявам, че ме краде.
Хотел Монтана, не става въпрос за пуснати widgets с някакви RSS емисии в sidebar примерно. Васко има предвид сайтове, чиито съдържание се базира изцяло на RSS емисиите на чужди сайтове. Тъй наречените скрапери. Или поне аз така разбирам нещата
Еее ама вие искате сега хем да пуснете RSS за може вашите материали да са достъпни за повече хора хем искате да се появяват на някакви тайни места и другите които така да се каже рекламират вашето съдържание да нямат никаква изгода от това. Освен това има едно много лесно решение на проблема, дори две.
1. Пускате в RSS само зглавието както беше посочено по горе.
2. Спирате изобщо RSS.
При втория случай вече, ако някой копира съдържания от сайта ти и не спази условиятана сайта, ако има такива, може да се нарече кражба.
При другите случай не съм съгласен, с това, че вие пускате RSS канал за ползване и после наричате някой дето го ползва крадец.
И освен това какво като има сайтове които се базират изцяло на RSS. За мен те са удобни защото минавам през тях преглеждам набързо какво ново и ако ме интересува отивам при източника. Тази вечер тук попаднах по подобен начин само, че от dao.bg, само дето в дао ходя по рядко, отколкото прглеждам сайтове с RSS като например rss-novini.com. Така, че продължавам да смятам, че хората излъчващи RSS имат полза от включването на техните канали в подобни сайтове. Да не говорим, че в цитирания сайт връзките са директни та няма накъде повече. И това ако не е SEO за източниците на RSS здраве му кажи.
Социалните мрежи нямат нищо общо с крадците на съдържание (освен тези, които слагат nofollow или редиректващ линк). Ако на един социален сайт всичко му е наред откъм SEO и дава реална връзка към оригинала, тогава печелят и той и собственика на материала.
Проблемът са сайтове, които имат единствената цел да генерират съдържание. Те крадат съдържание за сметка на неговия собственик. Така сайтът на автора се зачуква в суплементала, а крадецът бележи невиждани успехи и това съдържание започва завинаги да работи за него.
Това не е честно и трябва да се наказва. От Google гледам полагат някакви усилия, но не винаги дават резултат. Ако SEO-тата се обеденим и репортваме такива сайтове - ще помогнем на много хора и няма да губин качествените автори.
Ами има един много лесен начин за удостоверяване на автора. Казва му се нотариус :). Обаче, тук логиката не е да се ходи при истински такъв, а просто при публикуване на съдържанието да се праща и линк/мейл или нещо от сорта към сървър, който е тръстед и който всички му вярват. Така, винаги може да се провери кой е написал оригинала /естествено ако е копиран 1:1/. Тази идея е доста стара /относно електронния нотариус/ и предимно се отнася за кореспонденция с електронен подпис и сертификати.
Посредством нея ако някой изпрати писмо, писмото се праща на нотариуса /който е някакъв сървър/ и на получателя. Така при възникнал конфликт винаги може да се провери кога и дали е изпратено писмото. По същата логика това може да се направи и за съдържанието. Въпроса е, че трябва да се направи от достатъчно голяма институция /гугъл???/ на която всички имат доверие.
Но сменяйки няколко абзаца според мене това автоматично се превръща в нов материал, което и обезмисля начинанието.
“…вие пускате RSS канал за ползване и после наричате някой дето го ползва крадец.” - има ли нужда да те убеждавам, че грешиш? Едно е някой да чете с RSS Reader емисията ми, съвсем друго е някой да генерира фиктивни сайтове с изцяло чуждо съдържание, които да монетизира с AdSense (докато не го баннат), а след това да използва за линкване на проекти и манипулиране на търсещите машини. Това си е кражба, blackhat и неморално. И Google го наказва, не е само мое мнение.
В алгоритъма за класиране/индексиране се зачитат параметри като дата на публикуване на съдържанието, стил на писане и др., които помагат доста за определяне на първоисточника(оригинал) на информацията. Така че малко бихте се притеснявали ако някой Ви копира и използва съдържанието.
В случай че това Ви се случи може да атакувате по следния начин:
1. търсите точните сайтове които копират от Вас. 2. Свързвате се с администраторите за поставяне на връзка към Вашият материал. 3. Ако предходното не помогне ги репортвате.
Общо взето големите сайтове не вземат информация без да поставят обратна връзка, а ако е малък той трудно пробива до 1-ва страница.
Имам подобен проблем - сайт взима RSS-a ми и при търсене в blogsearch съдържанието излиза преди моя сайт. За целта е добре да се resubmit-не сайтмап-а в Google: http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=34609 забелязах, че Wordpress пинг-ва Google за обновления в sitemap. Може да се използва услугата за пинг на blogsearch: http://blogsearch.google.com/ping
Cloxy, надявам се да говориш само по принцип и да нямаш и ти някакви претенции.
dzver, още когато сайта не работеше и беше още САМО ИДЕЯ, съм писал в блога на oggin (знам, че го четеш) , месеци преди това! , че всеки, който не иска съдържанието на сайта му да е там си урежда проблема с един майл от адрес admin@примерния.сайт
Написано е тук (oggin.net):
http://oggin.net/work/i’m-not-feeling-lucky/
И тук: (3rdnews.info)
http://3rdnews.info/content/view/2/172/
Цитирам: “Важно: Ако новините на вашия уеб сайт присъстват в директорията, а не желаете да са там задължително ни пишете.”
Тъй като сайта наистина е нарснал много и наистина може някой да не го е прочел, от днес текста ще присъства на още много други места, за да не може после някой да каже, че не го е видял.
До момента само Тодор Христов от novavizia.com се е свързал с мен.
Грам не разбирам какъв ти е проблема??? Пиши ми и изчезваш. Какъв е смисъла от репортване на сайтове??? На тоя сайт никога не е имало и 1 реклама и до момента няма приход и 1 лев от него. Безплатно, пише го навсякъде. Целия сайт е един експеримент. Активи - глупости. Къде, какви?
@RSS новини - Говорил съм без да визирам когото и да е. Точно с този сайт не съм си имал никакви проблеми.
Но вземи слагай реални връзки към материалите, без nofollow. Повече ще спечелиш и ти и сайтовете извори.
Gesagt, getan. Oggin ме убеди.
http://3rdnews.info/content/view/80626/1/