Sicherheit: Google knackt eigene Captcha-Abfragen
Für die Analyse seiner Streetview-Aufnahmen hat Google einen Algorithmus zum Erkennen von Hausnummern entwickelt. Der lässt sich auch für eine Anwendung nutzen, die eine maschinenbasierte Erkennung eigentlich verhindern soll.
Google hat ein neues Verfahren vorgestellt, mit dem sich die Erkennung von zusammenhängenden Zeichen wie Hausnummern deutlich verbessern lassen soll. Dem 13-seitigen Papier zufolge basiert der Algorithmus auf sogenannten tief gefalteten neuronalen Netzwerken (Deep Convolutional Neural Networks) und ermöglicht eine Genauigkeit von über 90 Prozent bei der Erkennung von Hausnummern in Aufnahmen von Googles Street View. Das Verfahren fasse drei Erkennungsschritte zusammen, die normalerweise separat abgearbeitet würden: Lokalisierung, Zerlegung und Erkennung.
Google nutzt die Hausnummernerkennung beispielsweise, um Läden oder Restaurants genau in den eigenen Kartendiensten zu platzieren. Bei einer anderen Google-Anwendung ist das Verfahren noch deutlich erfolgreicher. Das Anti-Spam-Programm Recaptcha, für das Google mit dem Slogan "Schwer für Bots, leicht für Menschen" wirbt, werde von dem Algorithmus in 99,8 Prozent der Fälle geknackt, selbst in der höchsten Sicherheitskategorie. In einem Blogbeitrag zieht Google daraus den Schluss, dass die Erkennung eines verzerrten Bildes nicht der einzige Faktor sein soll, um zwischen einem Menschen oder einer Maschine zu unterscheiden.
Google: Recaptcha nicht völlig unbrauchbar
Durch einen solchen Algorithmus seien die Captcha-Abfragen aber nicht völlig nutzlos, schreibt Google weiter. Nun sei aber klar geworden, dass man sich nicht allein auf die verzerrten Texte oder Zahlenfolgen verlassen könne. Bislang setzt Google jedoch weiterhin auf die Abfragen, von denen Nutzer zeitweise sehr stark betroffen waren. Um die Captcha-Abfragen genauer und nützlicher zu machen, arbeiteten das Street-View- und das Recaptcha-Team eng zusammen.
Ich stimme dem, was Heretic geschrieben hat vollkommen zu. Google hat selbstverständlich...
Lesen != verstehen Darauf kommts doch eigentlich an. ;)
Ich kann mir nicht vorstellen, dass Google die Trainingsdaten raus gibt. Und ohne die...
zumindest die, die nur Grundkenntnisse besitzen (das sind aber die meisten).