|
You last visited: Today at 21:07
Advertisement
Captcha RegEx Cracker
Discussion on Captcha RegEx Cracker within the General Coding forum part of the Coders Den category.
10/09/2013, 20:00
|
#1
|
elite*gold: 77
Join Date: May 2008
Posts: 5,430
Received Thanks: 5,878
|
Captcha RegEx Cracker
Hallo zusammen,
ich habe ein recht triviale Frage, zu der ich bisher jedoch noch keine passende Antwort gefunden habe:
Gibt es einen Captcha-Cracker oder allgemein ein OCR-Programm/eine lib, die mir auf Basis von RegEx gewisse Zeichen interpretiert?
Der Sinn davon ist ganz einfach gehen wir davon aus, dass ich eine eingescannte handschriftliche Rechenaufgabe habe:
Quote:
Wenn ich jetzt per RegEx dem OCR schon im voraus sagen kann:
1. Es kommen nur Zahlen und Rechenzeichen vor.
2. Die Zahlen besitzen keine Nachkommastelle.
3. Nach jedem Rechenzeichen muss entweder ein + oder - kommen oder eine Zahl.
Dann wäre die Erkennungsrate um einiges höher als mit einem System, das von dem kompletten ASC II Satz ausgeht oder vielleicht sogar von UTF8.
Natürlich könnte man nachträglich mit RegEx drüber gehen, dabei bemerkt man dann aber lediglich ob die Syntax der Rechenaufgabe korrekt ist, man kann jedoch nicht die gewonnen Erkentnisse in die OCR-Lib einfließen lassen, zumindest in keine, die ich kenne.
Die Frage ist also erst einmal gibt es OCR-Libs, die derartig (einfache) RegEx-Ausdrücke mit einbeziehen können?
|
|
|
10/09/2013, 20:45
|
#2
|
elite*gold: 2932
Join Date: Oct 2009
Posts: 6,966
Received Thanks: 1,097
|
die meisten ocrs muss man eh selber trainieren, also nur buchstaben und rechenzeichen trainieren
sonst kann man bei den meisten systemen die ich ausprobiert hab auch nen wörterbuch oä angeben
|
|
|
10/09/2013, 22:38
|
#3
|
elite*gold: 77
Join Date: May 2008
Posts: 5,430
Received Thanks: 5,878
|
Quote:
Originally Posted by tolio
die meisten ocrs muss man eh selber trainieren, also nur buchstaben und rechenzeichen trainieren
sonst kann man bei den meisten systemen die ich ausprobiert hab auch nen wörterbuch oä angeben
|
Natürlich lassen sich die Sachen auch nur antrainieren, aber RegEx geht ja über ein vorgegebens Alphabet hinaus sondern sagt auch etwas über die Syntax aus.
|
|
|
10/09/2013, 22:38
|
#4
|
elite*gold: 2932
Join Date: Oct 2009
Posts: 6,966
Received Thanks: 1,097
|
schon klar, ums dann kurz zu sagen, mir ist nichts in der richtung bekannt
|
|
|
10/11/2013, 22:45
|
#5
|
elite*gold: 22
Join Date: Feb 2012
Posts: 576
Received Thanks: 332
|
Schau mal nach dem Algo der Nummernschilder von Autos erkennt,
Anderer Ansatz aber geht auch ganz gut.
|
|
|
10/12/2013, 11:06
|
#6
|
elite*gold: 77
Join Date: May 2008
Posts: 5,430
Received Thanks: 5,878
|
Quote:
Originally Posted by VisionEP1
Schau mal nach dem Algo der Nummernschilder von Autos erkennt,
Anderer Ansatz aber geht auch ganz gut.
|
Wenn ich mich nicht irre, läuft das meistens über Support Vector Maschinen, zumindest bieten diese die höchste Erkennungsrate. Wenn man sich jetzt selbst einen zusammenbastelt kann man den freilich anpassen wie man möchte, aber deswegen ist es immer noch hardcoded und nicht wie RegEx modulisierbar und allgemein änderbar.
|
|
|
10/12/2013, 12:07
|
#7
|
elite*gold: 0
Join Date: Oct 2013
Posts: 327
Received Thanks: 65
|
#nicht genug geschlaften p.q
Naja, Edit:
|
|
|
10/12/2013, 13:25
|
#8
|
elite*gold: 7110
Join Date: Jun 2009
Posts: 28,902
Received Thanks: 25,407
|
Quote:
Originally Posted by Shadow992
Natürlich lassen sich die Sachen auch nur antrainieren, aber RegEx geht ja über ein vorgegebens Alphabet hinaus sondern sagt auch etwas über die Syntax aus. 
|
Ein vorgegebenes Alphabet schränkt es ja schon massiv ein. Die Nachkommastellen halte ich für Peanuts (zumal du das Komma einfach nicht zulassen musst).
Quote:
Originally Posted by Shadow992
Wenn ich mich nicht irre, läuft das meistens über Support Vector Maschinen, zumindest bieten diese die höchste Erkennungsrate. Wenn man sich jetzt selbst einen zusammenbastelt kann man den freilich anpassen wie man möchte, aber deswegen ist es immer noch hardcoded und nicht wie RegEx modulisierbar und allgemein änderbar.
|
Und was hindert dich daran, RegExps in diese Anpassung einfließen zu lassen?
|
|
|
10/13/2013, 22:23
|
#9
|
elite*gold: 77
Join Date: May 2008
Posts: 5,430
Received Thanks: 5,878
|
Quote:
Originally Posted by MrSm!th
Ein vorgegebenes Alphabet schränkt es ja schon massiv ein. Die Nachkommastellen halte ich für Peanuts (zumal du das Komma einfach nicht zulassen musst).
|
Ja da hast du natürlich recht, aber ich würde trotzdem noch das i-Tüpfelchen dafür haben wollen.
Quote:
Originally Posted by MrSm!th
Und was hindert dich daran, RegExps in diese Anpassung einfließen zu lassen?
|
Naja prinzipiell der Programmieraufwand.
Ich würde halt wenn möglich das Rad nicht neu erfinden wollen, sondern auf eine bestehende Lib zurückgreifen können wollen. 
Wenn ich etwas derartiges selbst programmieren würde, wäre ein RegEx-Anpassung selbstverständlich total unproblematisch.
|
|
|
 |
Similar Threads
|
VB RegEx
07/11/2013 - .NET Languages - 8 Replies
Hi,
ich würde aus nem Quellcode ein paar ID's auslesen. Mit BetGetween geht alles super. Nur da es von den ID's mehrere im Quelltext gibt, brauch ich regEx Matches.
src="http://www.howrse.de/media/equideo/imag e/chevaux/normaux/arabe-small/gr-c-icone.png?15883 8126" class="cheval-icone " width="40" height="40"/></a>
<a href='/elevage/chevaux/cheval?id=18923938' class='horsename'>
Diese ID soll rausgefiltert werden."18923938"
Das mache ich mit
|
RegEx Pattern
09/23/2012 - General Coding - 2 Replies
Wäre jemand mal so nett mir einen funktionierenden RegEx Pattern zu geben, um das rotmarkierte rauszufilten? Ich kenn mich nicht besonders gut damit aus und bekomms einfach nicht gebacken..
|
Nexon Captcha Cracker
01/20/2012 - Combat Arms - 3 Replies
http://dl.dropbox.com/u/29811495/2012-01-20_171559 .png
Hallo,
Beim Anmelden bei Nexon muss jeder eines dieser Bildchen "lösen":
http://passport.nexoneu.com/img/63462676116781488 6.gif
Wenn man aber etwas pöses vor hat, z.B. das Nexon Forum zu spammen (op "caeureporter") und nicht nach jedem gebannten Account wieder selbst einen erstellen zu müsse, dann macht es Sinn dafür ein Tool zu schreiben.
Gedacht, nach langer Zeit getan :)
Downhaload
|
Zarenkriege / Khan Wars - Captcha Cracker
06/04/2011 - Browsergames - 3 Replies
Hallo zusammen!, ich möchte Euch gerne einen "Captcha Breaker" für das Browsergame Spiel Zarenkriege bzw. Khan Wars vorstellen!
Der Captcha Breaker ist ein externes Programm, welches das Captcha Pixel für Pixel durch geht und den offfenen Kreis sucht. Es wird bei erfolg die Pos. X sowie Y zurückgegeben. Das ganze läuft als CMD. Eine Readme sowie eine How to use it, ist natürlich mit dabei! ;-)
Es handelt sich hier um keinen Fake! Das ganze kann gerne auf einen Virus überprüft werden,...
|
All times are GMT +1. The time now is 21:08.
|
|