[OCR]Captcha Erkennung verbessern

10/05/2014 14:21 D3luxe.#1

Hey Leute,

ich muss f�r einen Account Creator CAPTCHAs knacken.

Ein Captcha sieht im Original so aus: [Only registered and activated users can see links. Click Here To Register...]
Nachdem BG & Striche entfernt wurden: [Only registered and activated users can see links. Click Here To Register...]

Danach lasse ich (im Moment noch) Tesseract 3 dr�ber laufen.
Tesseract erkennt ein Captcha im Schnitt aber erst nach 6.72 Versuchen richtig, was einer Erkennungsrate von 15% entspricht.

Jetzt zu meiner Frage: Macht es Sinn, die Erkennungsrate noch weiter zu erh�hen? Wenn ja, wie?

Hier wird zum Beispiel erkl�rt, wie sich das Ganze mit einem neuronalen Netzwerk l�sen l�sst: [Only registered and activated users can see links. Click Here To Register...]
Was in meinem Fall aber das Problem aufwirft, dass die Buchstaben teilweise rotiert sind oder sich �berlappen und somit evt. nicht richtig erkannt werden.
W�rde sich die Arbeit trotzdem lohnen?

Hier lassen sich unendlich viele Captchas bekommen: [Only registered and activated users can see links. Click Here To Register...]

10/05/2014 14:48 Shadow992#2

Quote:

Originally Posted by D3luxe.

Hey Leute,

ich muss f�r einen Account Creator CAPTCHAs knacken.

Ein Captcha sieht im Original so aus: [Only registered and activated users can see links. Click Here To Register...]
Nachdem BG & Striche entfernt wurden: [Only registered and activated users can see links. Click Here To Register...]

Danach lasse ich (im Moment noch) Tesseract 3 dr�ber laufen.
Tesseract erkennt ein Captcha im Schnitt aber erst nach 6.72 Versuchen richtig, was einer Erkennungsrate von 15% entspricht.

Jetzt zu meiner Frage: Macht es Sinn, die Erkennungsrate noch weiter zu erh�hen? Wenn ja, wie?

Hier wird zum Beispiel erkl�rt, wie sich das Ganze mit einem neuronalen Netzwerk l�sen l�sst: [Only registered and activated users can see links. Click Here To Register...]
Was in meinem Fall aber das Problem aufwirft, dass die Buchstaben teilweise rotiert sind oder sich �berlappen und somit evt. nicht richtig erkannt werden.
W�rde sich die Arbeit trotzdem lohnen?

Hier lassen sich unendlich viele Captchas bekommen: [Only registered and activated users can see links. Click Here To Register...]

Derartig geringe Rotation st�rt Neuronale Netze normalerweise nicht. Ich w�rde diaber trotzdem mehr preprocessing empfehlen:

1. "Verd�nner" die Linien, schneid unn�tiges "Geschn�rksel" wie z.B. beim C den Strich ab. Mach bei der 7 unten den "Punkt" weg.
2. Verbinde die Buchstaben wieder zu einem ganzen Buchstaben, das d�rfte relativ leicht sein und das Ergebnis sollte sich enorm verbessern.
3. Versuche die Rotation r�ckg�ngig zu machen, das ist auch nicht �beraus schwer, zwar nicht trivial, aber machbar.

Wenn das alles nicht hilft, kannst du immernoch ein eigenes Neuronales Netz ansetzen. Wenn du davon aber wenig Ahnung hast, wird selbst das Trainieren solcher Netze kniffelig, w�rde mich also an deiner Stelle an der Vorverarbeitung halten. Wenn das Ergebnis, dann trotzdem ausbleibt, kannste immer noch ein eigenes Netz machen, in welchem du dann deine Vorvearbeitung mit einflie�en lassen kannst.

10/05/2014 19:02 D3luxe.#3

Quote:

Originally Posted by Shadow992

1. "Verd�nner" die Linien, schneid unn�tiges "Geschn�rksel" wie z.B. beim C den Strich ab. Mach bei der 7 unten den "Punkt" weg.
2. Verbinde die Buchstaben wieder zu einem ganzen Buchstaben, das d�rfte relativ leicht sein und das Ergebnis sollte sich enorm verbessern.
3. Versuche die Rotation r�ckg�ngig zu machen, das ist auch nicht �beraus schwer, zwar nicht trivial, aber machbar.

Danke erstmal f�r die Antwort :)

Ich f�rchte, dass es ziemlich schwierig wird, die Serifen [= Geschn�rksel] einfach so abzuschneiden. Wie willst du festlegen, was eine Serife und was z.B. ein d�nner Strich vom U oder Z etc. ist.

Was ich aber tats�chlich mal probieren muss, ist die Buchstaben wieder zusammen zu flicken.
Habe mir das so gedacht, dass ich ne Liste mache mit allen Pixeln, die vorher mal ein Strich waren und dann einen Radius von x Pixeln auf die Farbe schwarz �berpr�fe.

Und wie man Grafiken in C# rotiert, habe ich mir tats�chlich mal angesehen, die Frage ist dann nur, wie man feststellen kann, dass der Buchstabe gerade ist...

10/05/2014 19:20 Shadow992#4

Quote:

Originally Posted by D3luxe.

Danke erstmal f�r die Antwort :)

Ich f�rchte, dass es ziemlich schwierig wird, die Serifen [= Geschn�rksel] einfach so abzuschneiden. Wie willst du festlegen, was eine Serife und was z.B. ein d�nner Strich vom U oder Z etc. ist.

Was ich aber tats�chlich mal probieren muss, ist die Buchstaben wieder zusammen zu flicken.
Habe mir das so gedacht, dass ich ne Liste mache mit allen Pixeln, die vorher mal ein Strich waren und dann einen Radius von x Pixeln auf die Farbe schwarz �berpr�fe.

Und wie man Grafiken in C# rotiert, habe ich mir tats�chlich mal angesehen, die Frage ist dann nur, wie man feststellen kann, dass der Buchstabe gerade ist...

Ist eine einfache M�glichkeit, jo.

@Rotieren
Naja ich w�rde da ohne gro� Nachzudenken den Ansatz nehmen, den man auch hat, wenn man die Aufgabe per Hand l�sen soll, wie machst du es denn da?

Ganz einfach du nimmst ein Lineal und drehst den ausgeschnittenen Buchstaben solange bis kein Punkt mehr �ber das Lineal hinaus schaut, aber m�glichst viele Punkte das Lineal ber�hren. Dabei darf man nat�rlich nicht mehr als 45� o.�. drehen.

Damit ist der Buchstabe zwar nicht immer perfekt ausgerichtet (z.B. w�re das C ein schlechter Kandidat) aber Buchstaben wie "E", "F", usw. werden damit einwandfrei ausgerichtet.

Wenn man zus�tzlich noch hinzu nimmt, dass ein Buchstabe nie breiter als X-Pixel sein darf (wird ja durch die Schriftart bestimmt), dann richtet man seine Buchstaben auch nie falsch aus.

@Verd�nnern/Abschneiden
Nach ein paar �berlegungen erscheint mir das Prozedere sogar relativ leicht. Du musst einfach nur den Buchstaben in einen "Graphen" �bertragen. Dabei sollte man mit folgendem Algorithmus sehr weit kommen:

Man f�ngt oben links an zu suchen, dann geht man Reihe f�r Reihe durch. Sobald man einen schwarzen Pixel gefunden hat, beginnt man mit dem eigentlichen Algorithmus.

Man zerlegt den Buchstaben jetzt in Linien mit gleich gro�en L�ngen. Die L�nge k�nnte z.B. 5 Pixel betragen. Das hei�t nach jedem 5. Pixel beginnt ein neuer Punkt/Knoten im Graphen.

Man l�uft also sozusagen den Buchstaben ab und legt alle 5 Pixel eine Marke ab. Diese Marken werden dann am Ende verbunden und voila man hat einen Buchstaben mit einer Breite von 1px (oder mehr je nachdem wie breit man die Linien eben macht).

Anschlie�end kann man Linien zwischen denen nur ein sehr kleiner Winkel herrscht zu einer gro�en Linie zusammenfassen.

Damit k�nnte man dann sogar direkt ein selbst programmiertes Neuronales Netz trainieren. W�rde auf jeden Fall auch sehr gute Ergebnisse liefern.

Edit:
Wenn du das Rotieren sogar mit 2 gedachten Linealen machst, kann man sogar so Buchstaben wie "C" ausrichten.

10/05/2014 21:09 D3luxe.#5

Habe mir mal schnell ein kleines Testprogramm geschrieben, das automatisch immer wieder Captchas runterl�dt und versucht, sie mit Tesseract zu knacken.

Die L�sung mit dem Radius funktioniert halbwegs, nachdem ich durch ein bisschen ausprobieren die richtigen Werte (f�r Radius, Durchl�ufe und ben�tigte Treffer) raus hatte, werden schon einige Buchstaben wieder zusammen geflickt.

Das hilft tats�chlich bei ca. 1 von 7 Captchas, um an den richtigen Code zu kommen (ich lasse Tess. vor und nach dem flicken dr�ber laufen).

So wird aus [Only registered and activated users can see links. Click Here To Register...]

Spoiler

Die Buchstabenteile sind also noch nicht komplett miteinander verbunden, aber es ist schon mal ein Anfang.
Das Problem ist im Moment, dass sobald man versucht, noch mehr wiederherzustellen, auch schnell zu viel dazu gegeben wird und man Striche quer �ber die Buchstaben hat.

Ich werde bei Gelegenheit mal das Testprojekt hochladen, wer Zeit & Lust hat zu helfen, kann das gerne tun.

@shadow: Ich verstehe den Ansatz, aber noch nicht genau, wie du dir die Umsetzung vorstellst :/
Buchstaben zu Graph / bzw. den Buchstaben auf eine 'Linienbreite' reduzieren...?

Das Netz scheint mir immer noch eine Nummer zu gro�, ich stelle mir die Umsetzung sehr schwierig vor...

Edit:

Quote:

Wenn du das Rotieren sogar mit 2 gedachten Linealen machst, kann man sogar so Buchstaben wie "C" ausrichten.

Genial!

10/06/2014 13:19 Shadow992#6

Quote:

Originally Posted by D3luxe.

Habe mir mal schnell ein kleines Testprogramm geschrieben, das automatisch immer wieder Captchas runterl�dt und versucht, sie mit Tesseract zu knacken.

Die L�sung mit dem Radius funktioniert halbwegs, nachdem ich durch ein bisschen ausprobieren die richtigen Werte (f�r Radius, Durchl�ufe und ben�tigte Treffer) raus hatte, werden schon einige Buchstaben wieder zusammen geflickt.

Das hilft tats�chlich bei ca. 1 von 7 Captchas, um an den richtigen Code zu kommen (ich lasse Tess. vor und nach dem flicken dr�ber laufen).

So wird aus [Only registered and activated users can see links. Click Here To Register...]

Spoiler

zuerst: [Only registered and activated users can see links. Click Here To Register...]
und dann: [Only registered and activated users can see links. Click Here To Register...]

wobei hier geflickt wurde [gr�n markiert]:
[Only registered and activated users can see links. Click Here To Register...]

Die Buchstabenteile sind also noch nicht komplett miteinander verbunden, aber es ist schon mal ein Anfang.
Das Problem ist im Moment, dass sobald man versucht, noch mehr wiederherzustellen, auch schnell zu viel dazu gegeben wird und man Striche quer �ber die Buchstaben hat.

Ich werde bei Gelegenheit mal das Testprojekt hochladen, wer Zeit & Lust hat zu helfen, kann das gerne tun.

@shadow: Ich verstehe den Ansatz, aber noch nicht genau, wie du dir die Umsetzung vorstellst :/
Buchstaben zu Graph / bzw. den Buchstaben auf eine 'Linienbreite' reduzieren...?

Das Netz scheint mir immer noch eine Nummer zu gro�, ich stelle mir die Umsetzung sehr schwierig vor...

Edit:

Genial!

@Buchstaben reparieren
Gib jedem Buchstaben seinen eigenen "Bereich". Die Bereiche kannst du in etwa so feststellen:
Wenn sich die Buchstaben nie �berlappen (also zumindest nicht viel), dann ist das ganze sehr einfach:
Geh das Bild durch und mach immer einen Bereich, wenn eine Spalte (also eine Pixel-Spalte) keinen einzigen schwarzen Pixel enth�lt. Sobald der Radius f�r das Zusammenf�gen dar�ber hinaus "f�rben" will, dann l�sst du es einfach nicht zu. Die Methode geht auch in abgewandelter Form, wenn sich die Buchstaben nur leicht �berlappen. Der Bereich beginnt/h�rt auf, wo h�chstens eine bestimmte Pixel-Zahl X in der Spalte vorkommt.

Sollten sich die Buchstaben sehr stark �berlappen, musst du zus�tzlich auch die Farbe der Buchstaben f�r die Bereichsaufteilung mit einbeziehen.

@Verd�nnern
Du f�ngst an erst einmal einen schwarzen Pixel zu finden. Gehen wir davon aus, dass dieser Pixel beim "C" der h�chste Punkt ist also ganz oben an der Rundung. Jetzt versuchen wir m�glichst mittig durchs "C" durchzulaufen, wir gehen also zuerst 1px nach rechts, schauen ob hier ein wei�er Pixel ist, wenn dort ein wei�er Pixel ist, gehen wir wieder zur�ck. Jetzt gehen wir einen Pixel nach links, ist dieser Pixel ebenfalls wei�, gehen wir 1px nach oben, auch dieser Pixel ist beim "C" wei�. Also schauen wir uns einen Pixel unten drunter an. Dieser Pixel ist schwarz, also gehen wir weiter Pixel runter, bis sie wei� werden. Anschlie�end setzen wir genau in der Mitte von diesen Pixel (also bei der H�lfte der schwarzen Pixel) eine Marke hin. Jetzt machen wir von unserem gefundenen Pixel aus weiter, schauen wieder alle Pixel an und gehen in die Richtung wo wir schwarze Pixel finden, wobei wir wieder die Mitte suchen und dort einen Marker hinsetzen.

@Verd�nner die Zweite
Gibt sogar noch eine viel einfachere Methode, man unterteilt das Bild einfach in X 2x2, 3x3 oder 4x4 Pixel und sagt dann: "Wenn mehr als die H�lfte der Pixel schwarz ist in unseren neuen 2x2,3x3 ... Pixeln, dann wird an dieser Stelle in einem neuem Bild ein Pixel hingesetzt."

Ist zwar nicht ganz so effektiv wie Methode 1 aber viel leichter umzusetzen und vorallem schneller.

Edit:
Du kannst dir auch einmal Erosion, Dilatation und die Kombination von beidem in der Bildverarbeitung ansehen f�r das F�llen von L�chern. ;)

Edit2:
F�r das Verd�nnern, kannst du dir auch einmal die "Skelettierung / Medial axis" in der Bildverarbeitung ansehen.
Siehe auch: http://de.wikipedia.org/wiki/Skelett...erarbeitung%29

10/08/2014 19:37 VisionEP1#7

Ich habe auch schon Captcha Solver Programmiert auf beide Arten.
F�r die LoL Seite reicht folgendes Prinzip:

1. Hintergrund und St�rlinien entfernen
(einfach tabelle mit farbh�ufung)
2. trennen in einzelne chars
3. mit beispieldaten pixelweise vergleichen.

F�r mein Allgemeines Captcha Solving Netz hab ich nen feed forward 3 Schichtig mit Rprop genommen, und ein zweites Netz,welches mir den Auschnitt liefert.

Allgemein:
Mach viel vorher das spart den trainingsaufwand