Das Internet ist groß und weit. Fast alle Inhalte sind jedoch nur eine Google-Suche entfernt. Kein Wunder, dass sich so mancher Zeitgenosse bei unangenehmen Textarbeiten lieber der Arbeit Dritter bedient: Schnell ist ein Text aus dem Netz kopiert und anderswo eingefügt. Das wird schon niemand merken. Ein Plagiat wird es allerdings erst, wenn der Auszug nicht als Quellenangabe zitiert, sondern als eigene Arbeitsleistung ausgegeben wird. Beliebte Quellen sind, neben der Wikipedia, nämlich auch private Websites oder Blogs.
Dabei gibt es im Grunde zwei Varianten von Plagiatoren: Zum Einen sind da Protagonisten aus dem Bildungswesen: Schüler, Studenten und Doktoranden, die entweder nicht wissen, wie sie richtig zitieren, oder vollkommen absichtlich fremde Textpassagen übernehmen und als eigene Arbeit ausgeben. Zum anderen sind da „professionelle“ Plagiatoren: Website-Betreiber, die Content von Ihrer Website kopieren und auf einer eigenen Domain veröffentlichen, um damit per Werbeeinblendung selbst Geld zu machen.
Manche Publisher machen es den Plagiatoren dabei noch einfach: Per RSS-Feed laufen alle Artikel automatisch ins System des Diebes. Während erstere vor allem aus Bequemlichkeit cmd+c und cmd+v drücken, sind die „Profis“ besonders ärgerlich: Der Content-Diebstahl berührt nämlich nicht nur geistiges Eigentum, sondern sorgt ganz nebenbei für bösen „Duplicate Content“, also gleichen Inhalt auf mehreren Domains. Den straft Google nämlich gnadenlos ab – auch zum Nachteil des ursprünglichen Urhebers.
Textplagiate per Google finden
Wenn Sie vermuten, dass Ihre Website heimlich automatisch kopiert wird oder Ihre Schüler, Studenten oder Doktoranden das Web zur Hilfe genommen haben, hilft in aller Regel eine einfache Suche in Google selbst oder in der akademischen Spezialsuchmaschine Google Scholar : Wählen Sie einen Textauszug eines Artikels und kopieren Sie ihn in das Google-Suchfenster. Vergessen Sie nicht, den Auszug mit Anführungszeichen am Anfang und am Ende zu versehen, damit Google ein exaktes Ergebnis ausspuckt. Wichtig dabei ist, dass der Textauszug nicht zu lang, aber auch nicht zu kurz ist: Zwei bis drei zusammenhängende Sätze ohne Zwischenüberschriften oder Bilder sollten reichen.

Google spuckt anschließend alle Ergebnisse aus, in denen genau dieser Textauszug vorkommt. Diese Methode ist einfach und effektiv: Plumpen Content-Diebstahl, egal ob von Ihrer Website oder von einem Schüler, Studenten oder Doktoranden, können Sie so relativ einfach entlarven. Dummerweise greift diese Vorgehensweise nur bei recht eindeutigen „Diebstählen“, da Google weder Veränderungen am Originaltext aufspüren kann, noch über eine Batch-Suche verfügt. Damit versagt die normale Suchmaschinen-Oberfläche, sobald auch nur ein Wort oder Satz verändert wurde – womit Sie mit der Google-Methode nur besonders frechen Content-Dieben auf die Spur kommen. Zur Überführung raffinierterer Diebe müssen Sie eventuell eine Plagiatsuchmaschine bemühen.
Plagiatefinder im Internet nutzen
Plagiat-Suchmaschinen im Netz gibt es wie Sand am Meer: Es gibt Services für den Bildungsbetrieb, die neben dem Internet auch Arbeiten und Bibliotheken abgrasen, die zumeist aber kostenpflichtig sind und eigene Suchmaschinen besitzen, etwa Turnitin . Manche Dienste verlangen einen einfachen Log-in, andere eine monatliche Gebühr. Und die kostenlosen wie etwa plagiatefinder.de greifen nicht selten per API auf Google-Suchdienste zurück. Das Problem hier: Google hat die dafür notwendige API im Mai 2016 deaktiviert, weshalb viele Websites mit Gratis-Plagiatefinder derzeit nicht funktionieren. Es bleiben wenige Plagiat-Suchmaschinen, die kostenlos sind – und trotzdem über eigene Suchroutinen verfügen. Ein Dienst dieser Art ist Copyscape , mit dem sich zumindest gratis die eigene Website auf Plagiate im Netz prüfen lässt. Wer hingegen Inhalte prüfen möchte, sollte zum Webservice Plagscan greifen: Zwar ist auch dieser Dienst kostenpflichtig, kann jedoch recht zielsicher Plagiate aus Internetquellen aufspüren.


Das Problem der Plagiatsuchmaschinen
Grundsätzlich ist die Suche mit Plagiatsuchmaschinen, obwohl kostenpflichtig, häufig fruchtbarer als die Google-Suche: Durch Methoden wie Fingerprinting oder eine Bag-of-Words-Analyse können nämlich nicht nur exakte Quellen, sondern auch Plagiate, in denen Worte oder ganze Sätze geändert wurden, aufgespürt werden. Dummerweise haben alle Dienste dieser Art ein grundsätzliches Problem: Die Plagiate können nur gefunden werden, wenn die Suchmaschine über die nötigen kluge Algorithmen verfügt – und über eine ausreichend große Datenbank. Da ein Zugriff auf Google-Daten mangels API nicht mehr möglich ist und andere Suchmaschinen hier entweder keine oder nur kostenpflichtige APIs anbieten, greifen viele Anbieter zu eigenen Lösungen.

Dummerweise finden die längst nicht alle möglichen Quellen: Die allermeisten Dienste können zwar das Internet abgrasen, bei Büchern oder Dokumenten aus dem Bildungsbereich müssen sie aber meist das Handtuch werfen. Insofern sind die Plagiat-Suchmaschinen zwar praktisch – allerdings nur dann, wenn der Nutzer weiß, dass längst nicht alle möglichen Plagiat-Quellen abgearbeitet werden. So entziehen sich zum Beispiel wissenschaftliche Arbeiten, die nicht veröffentlicht wurden und als Druck in irgendeiner Universitätsbibliothek schlummern, natürlich auch dem Zugriff der Plagiatsuche. Hat jemand hier geklaut, ist das auf technischem Wege nur sehr schwer herauszufinden.

Plagiatsuche, um Plagiate zu verschleiern
Ein generelles Problem im akademischen Betrieb kommt noch hinzu: Einerseits sind Arbeiten vor ca. 2005 in aller Regel nur in Papierform vorrätig, nachträglich digitalisiert und mit einer Texterkennung eingepflegt werden nur die wenigsten Arbeiten. Dadurch sind die meisten älteren Arbeiten, so sie denn nicht als Buch erschienen sind, nicht für die Plagiatsuchmaschinen auffindbar – hier hilft bei Prüfer nur der Einsatz gesunden Menschenverstandes. Und nicht nur das: Zahlreiche Wissens-Plattformen, von Hausarbeiten-Portalen bis offiziellen Universitäts-Bibliotheken mit interner Suchfunktion sind nicht öffentlich zugänglich oder für den Zugriff durch Suchmaschinen gesperrt – auch diese Infos können von Plagiatfindern nicht durchsucht werden.

Eines der größten Probleme tritt allerdings erst in zweiter Reihe auf: Die öffentlich zugänglichen Plagiat-Suchmaschinen sind natürlich auch von Plagiatserstellern durchsuchbar. Wollen etwa Schüler oder Studenten bewusst abschreiben, können natürlich auch sie die Suchmaschinen nutzen, um die nachgemachten Anteile der eigenen Arbeiten etwa durch Umschreiben zu verschleiern. Hinzu kommen Sprachbarrieren: Eine in chinesisch abgefasste Diplomarbeit etwa entzieht sich allein durch die höchst unterschiedlichen Formulierungen in den jeweiligen Sprachen jedem Zugriff der Suchmaschinen.
Bilder-Klau entlarven
Eine Methode der Plagiatssuche ist allerdings relativ sicher und zuverlässig: Die Suche nach gestohlenen Bildern im Web. Dabei hilft die Google-Bildersuche: Wenn Sie Bilderklau vermuten, müssen Sie die Bild-URL oder das Foto selbst nur in der Google-Bildersuche angeben: Klicken Sie hierzu auf das kleine Kamera-Symbol in der Suchleiste. Anschließend spuckt Ihnen Google recht zuverlässig Quellen des Bildes aus – sofern es sie im für Google erreichbaren Teil der Welt, also dem öffentlichen Internet – denn gibt.

Natürlich sind Sie nicht zwangsläufig auf Google angewiesen, um ein Foto-Plagiat aufzuspüren, zumal die Ergebnisse des Suchmaschinen-Riesen nicht wirklich übersichtlich sind. Das ist wohl auch der Grund, warum es gleich mehrere Reverse-Suchdienste für Bilder im Netz gibt, etwa TinEye und ImageRaider , Imagewiki oder die Reddit-only-Suchmaschine Karma Decay . Alle Dienste haben vor allem eines im Auge: Foto-Urheber sollen damit herausfinden, ob und wenn ja, wo ihre Bilder kopiert wurden. Einen besonders schönen Ansatz verfolgt dabei Imagewiki: Bilder können hier – obwohl schon verlinkt und verteilt – nachträglich mit Urheber-Informationen versehen werden. Dadurch können Fotografen, die zum Beispiel bei der Veröffentlichung auf Ihrem Blog Kopierschutzmaßnahmen vergessen haben, Ihre Bilder in den Imagewiki-Katalog aufnehmen, wodurch sie, unabhängig von der sonstigen Quelle im Netz, auf den Urheber zurückverfolgt werden können.

Leider ist der Service nur eine Hilfestellung und keine „offizielle“ Datenbank, trotzdem kann die Suchmaschine Fotografen massiv unterstützen. Wenn es hingegen einfach darum geht, Plagiate oder geklaute Fotos aufzuspüren, stechen vor allem Imageraider und TinEye positiv heraus – auch gegenüber der Google-Bildersuche. Ihre Treffsicherheit ist allerdings ähnlich eingeschränkt wie bei allen anderen Algorithmen dieser Art: Bilder im Web, die zum Beispiel aufgrund eines Javascripts nicht von Suchmaschinen erfasst werden können, tauchen natürlich bei keiner Bildersuche auf – egal ob rückwärts oder vorwärts.

Fazit: Plagiatsuche ist nach wie vor knifflig
Alles in allem sind die technischen Hilfsmittel, egal ob Google oder Plagiatfinder-Services, immer nur so gut wie ihre technische Grundlage: Aufgrund der Trennung von Online- und Offline-Welt sowie wegen des in vielen Teilen öffentlich nicht zugänglichen Deep Webs können sind Suchmaschinen – auch solche für Plagiate – immer beschränkt. Die augenscheinlich „leichte“ Plagiatsuche durch Dienste wie Plagscan fördert längst nicht alle möglichen Ergebnisse zu Tage, sondern nur solche, die der Suchdienst auch Indexieren kann. Im Umkehrschluss bedeutet das: Wenn Sie eine zusammen kopierte Schülerarbeit entlarven oder unrechtmäßige Kopien Ihrer Website im Internet aufspüren möchten, sind die vorhandenen Dienste durchaus hilfreich. Doch sobald Sie sich in akademischen Kreisen bewegen, können die Suchmaschinen nur helfen, wenn gleichzeitig ausreichendes Hintergrundwissen des Plagiat-Suchenden vorhanden sind. Übrigens: Viele Universitäten haben eigene Plagiat-Suchen – allerdings unterliegen auch diese oft den oben genannten Einschränkungen.