Een Scraper-weblog…

ScraperGisterenavond – na genoten te hebben van de geweldige voetbalwedstijd – vond ik een mailtje van collega Kaj Rietberg in mijn mailbox met als onderwerp ‘scraper’. Mijn eerste gedachte was… Hé… iets leuks wellicht voor mijn weblog! Ik kende op dat moment het woord ‘scraper’ niet… Maar toen ik op de links klikte die Kaj in zijn mailtje vermeldde, begreep ik min of meer wat ‘scraper’ betekende…

Wikipedia leerde mij het volgende…

"Scraper sites
De invoering van Google AdSense heeft geleid tot de opkomst van zogenaamde scraper sites. De inhoud van deze sites wordt vaak geautomatiseerd gegenereerd, waarbij gebruik wordt gemaakt van RSS. Naast deze automatische content staan op een prominente plaats de Google AdSense links die de site-eigenaar geld opleveren. Deze sites staan bekend onder de afkorting MFA – Made for AdSense
." (Bron)

Nog meer informatie over ‘scraper sites’ op Google…

Dus ze jatten je auto om die te gebruiken bij een bankoverval… Althans zo zie ik het… Puur crimineel dus! Beter misschien: geld verdienen met het gepikte materiaal van anderen!

Het weblog dat dus berichtjes van mijn weblog jat(te) is te vinden bij Blogger.com. Het is het weblog dat zich noemt ‘Privacy-live’: http://privacy-live.blogspot.com.

De volgende berichten van mij (waarschijnlijk via mijn RSS) werden gejat:

En hier staan de schaamteloos gepikte berichten…

Kortom… door mijn berichtjes – en uiteraard die van anderen – ongestraft te ‘scrapen’ verdient de eigenaar van dit ‘Privacy-live’ weblog geld..!
Ik heb er géén woorden voor… (al hoewel… De lucht rond mijn laptop stonk even naar zwavel!)

5 Responses to Een Scraper-weblog…

  1. Hoi André,

    Ze lappen inderdaad jouw CC-licentie aan de laars, en verklaren vervolgens zelf dat copyright op de bijdrage van toepassing is. Verder is niet te zien van wie deze blog is. Je kunt dus geen protest aantekenen. Via blogger zou je moeten achterhalen wie er achter zit. En verder moet je natuurlijk sowieso niet op de advertenties klikken.

  2. Nou, Nederland was in trance, gisteravond. Nog nooit de snelweg NL-VL zo leeg op een vrijdagavond. Toen ik rond 20.45 uur in de auto wilde stappen, riep een moslima – van kop tot teen in stralend wit – me vriendelijk een aanmanend toe: Vlug, haast je, het gaat beginnen … Waarop ik: U loopt ook nog op straat …. Zij: Ja, maar ik ga ook kijken, hoor! Sterk onder de indruk van zoveel oranje in de straten – aan de verkeerslichten haastte zich een man op de fiets nog naar een overdadig bevlagd café met groot scherm. Hij droeg een knaloranje shirt met zwartekoetjesopdruk én, het mooist van al, een oranje knuffelkoe met vier bengelende poten als hoofddeksel. Ja, de oranjegekte, die wérkt. Ik heb hier in de hall ook oranje vlaggetjes hangen, gekregen in de winkel. Mijn kleinzoon heeft die avond voor het eerst alleen zijn (oranje!) sokken aangetrokken. Bij onze ‘experience shopping’ vond hij de oranje megafoons het leukst. Die oranje cowboyhoeden vond hij maar niks. Het oranjegebak ook maar zozo.

    Natuurlijk heb ik in de auto de match gevolgd op de Nederlandse Radio 1. Het was al vlug: Is dit lekker?! Jaaa, dit is lekkerrrr!! Is dit mooi?! Jaaa, dit is wonderbaaaarlijk mooiii!! Jij weet ook dat het allemaal nog mooier werd, wat later …

  3. Hallo André,

    Dit is een hele slechte truc inderdaad, wij hebben er ook wel last van gehad (niet alleen met blogposts, soms worden hele websites qua teksten overgenomen). Meestal doet men het óf voor goede rankings in Google (dan vormen de teksten vulling voor een zogenaamde ‘linkfarm’ ofwel een site die er enkel is om Google te misleiden), of zoals gezegd voor het binnenhalen van inkomsten uit Adsense.

    Toch een nuance: ‘scraper’ is een vrij standaard term voor zogenaamde spiders die content van pagina’s ‘afschrapen’, maar dit hoeft niet per sé met slechte bedoelingen te zijn: onze site http://www.rocnieuws.nl doet hetzelfde (m.n. voor sites die zelf geen RSS-feeds aanbieden)! Zonder slechte bedoelingen uiteraard en netjes binnen de regels van het citaat- en auteursrecht, maar het blijft wel ‘scrapen’.

  4. ‘Gescraped’ vanop de bewuste site:

    Blog is verwijderd

    Helaas, de blog op privacy-live.blogspot.com is verwijderd. Dit adres is niet beschikbaar voor nieuwe blogs.

    Had je je blog hier verwacht? See: ‘Ik kan mijn blog niet op het web vinden. Waar is deze?’

    Je kan dus op je beide oren slapen, Blogger doet zijn werk goed (ik veronderstel dat je Blogger op de hoogte hebt gebracht)

    Vincent

  5. Met de juiste scriptjes kan dat allemaal volautomatisch. Je geeft zoekopdrachten door naar de achterliggende site(s) die je gebruikt, je verwijdert de oorspronkelijke layout, advertenties en andere ongewenste zaken van de resultaten en je zet er je eigen layout omheen. Kost een middag met PHP en af en toe wat aanpassingen omdat de sites die je gebruikt zo onbeleefd zijn om zomaar hun layout aan te passen.