Captcha me if you can!

Unter einem Captcha versteht man einen voll automatisierten Test, der dazu dient, einen menschlichen Nutzer zu identifizieren und von einem Spam-Bot zu unterscheiden. Wörtlich übersetzt bedeutet es „Vollautomatischer öffentlicher Turing-Test, um Computer und Menschen zu unterscheiden“. Captchas werden verwendet, um zu entscheiden, ob das Gegenüber ein Mensch oder eine Maschine ist. Sprich eine wilde Zahlen- und Buchstabenkombinationsreihenfolge ohne Sinn, Grammatik, Logik, Grenzen und meist nicht lesbar. Wenn man sich z.B. auf www.mail.com einen Free-Mail Account zulegt, erhält man Captchas die wie folgt aussehen:

Noch ist nicht geklärt, wer die terrains variuos erobert hat oder wo die überhaupt sind. Nun stell man sich die berechtigte Frage, wenn so bedeutungslos, warum dann darüber bloggen? Es liegt wie so oft im Leben an Google, den die haben einen der größten Anbieter für Software, die Spam-Schutz und Texterkennung durch „crowdsourcing“ vereinigt, reCaptcha, vor kurzem gekauft. Auf der Seite von reCaptcha heißt es:

Over 200 million CAPTCHAs are solved every day by people around the world. reCAPTCHA channels this human effort into helping to digitize books and newspapers. When you solve a reCAPTCHA, you help preserve literature by deciphering a word that was not readable by computers.

Warum kauft nun das Internet .. ähm sorry … kauft nun Google so ein Nischenprodukt? Wer in Internetforen kommentieren will, muss oft obskure Zeichen-Folgen in Grafiken erkennen und korrekt eintippen. Das hält Spam-Roboter fern, ist aber eine gigantische Zeitverschwendung. Mit reCaptchas Software will Google sein Bücherscan-Projekt Google Books aufmöbeln. Denn Google scannt ungeheure Mengen von Büchern ein und verwandelt sie per Zeichenerkennung (OCR) in durchsuchbaren Text. Das aber klappt nicht immer, manchmal sind die Vorlagen nicht mehr im besten Zustand. In diesem Fall speichert die Erkennungssoftware das nicht identifizierte Wort als Grafik – für weitere Erkennungsversuche. Jetzt wird´s interessant.

Das können Menschen bekanntlich noch immer besser als Software – und die sollen nun unbemerkt für die Google-Texterkennung eingesetzt werden. Die Wort-Bilder werden in Form von Captchas, also Spam-Roboter-Sperren, einfachen Surfern vorgesetzt – reCaptcha bedient angeblich 100.000 Web-Seiten mit dem Spam-Schutz. Entziffern mehrere Menschen den fast unleserlichen Text einheitlich, geht die reCaptcha-Software davon aus, dass der Text nun stimmen muss – und gibt die richtigen Textfetzen zurück an Google, wo die Ergebnisse in die beanstandeten Texte eingefügt werden. Die größte Zielgruppe für so einen IT-Spaß hat man derzeit zweifelsohne auf Facebook, dem derzeit weltweit größten Sozialen Netzwerk (+300 Millionen Nutzer). Auch dort gibt es Captchas:

Anhand des bereits bekannten Worts klärt die Software, dass hier wirklich ein Mensch an der Arbeit ist. Gibt er die korrekte Bedeutung an, bekommt er Zugang zu dem von reCAPTCHA geschützten Forum, der verborgenen E-Mail-Adresse oder dem betreffenden Blog-Kommentar. Außerdem wird seine Übersetzung des unbekannten Worts in der reCAPTCHA-Datenbank gespeichert. Wenn eine bestimmte Menge Nutzer dieselbe Bedeutung vorgeschlagen hat, stuft die reCAPTCHA-Software sie als glaubwürdig ein. Die digitalisierte Version des Texts wird an die Buch-Datenbank des Internet-Archivs übermitteln und geht zugleich in de reCAPTCHA-Bestand an erkannten Wörtern ein, anhand derer Anfragende als Menschen identifiziert werden.

Wenn man z.B. in asiatischen Nischen-Foren unterwegs ist, dann muss man oft chinsesische bzw. japanische Zeichen eingeben, na dann wird´s erst lustig. Die Site www.nciku.com bietet dafür eine Lösung, einfach das Bild selbst nachzeichnen und sich die Lösung quasi ansagen lassen. Schaust Du kurzen Film (machst Du Ton bitte aus):

Aber warum sollte man Captchas nur dechiffrieren um asiatischen Foren beizutreten oder Buch-Digitalisierung zu perfektionieren, wenn man auch damit noch Geld verdienen kann? So macht es z.B. das deutsche Unternehmen Captcha Ads, die Jungs aus Bonn haben erkannt, dass ein großes Dilemma bei herkömmlichen CAPTCHAs darin besteht, dass sie, um nicht von Spam-Bots ausgelesen werden zu können, immer komplizierter werden und damit auch für Menschen zunehmend schwieriger zu entschlüsseln sind.

Die meisten Web2.0-basierten Internetseiten bieten dem User unterschiedliche Möglichkeiten, interaktiv tätig zu werden. Ob beispielsweise bei Kommentaren in Blogs und Foren oder beim Vernetzen in großen und kleinen Social Networks; Menschen sind ein elementarer Bestandteil bei der Erstellung und Gestaltung der Inhalte. Der Fachbegriff dazu ist nicht neu!

Am Anfang schrieb ich über reCaptcha, das Unternehmen welches von der größten Betrugs … ähm sorry … größten Suchmaschine aufgekauft wurde, um deren Buch-Digitalisierung zu perfektionieren. Der Claim dieses Unternhemen lautet übrigens „Stop Spam. Read Books.“ Zufall? Wenn ja, hilft meist nur noch die Flucht in die Anonymität Sozialer Netzwerke …


1 Antwort auf „Captcha me if you can!“


  1. 1 Todsidiogoume 19. Januar 2012 um 2:33 Uhr

    Youan check following links to read about losing weight.
    How to lose weight fast

    tv online

    iphone 4s cases
    iPad 2

Die Kommentarfunktion wurde für diesen Beitrag deaktiviert.