Register for your free account! | Forgot your password?

Go Back   elitepvpers > Coders Den > General Coding
You last visited: Today at 21:07

  • Please register to post and access all features, it's quick, easy and FREE!

Advertisement



Captcha RegEx Cracker

Discussion on Captcha RegEx Cracker within the General Coding forum part of the Coders Den category.

Reply
 
Old   #1
 
Shadow992's Avatar
 
elite*gold: 77
Join Date: May 2008
Posts: 5,430
Received Thanks: 5,878
Captcha RegEx Cracker

Hallo zusammen,

ich habe ein recht triviale Frage, zu der ich bisher jedoch noch keine passende Antwort gefunden habe:

Gibt es einen Captcha-Cracker oder allgemein ein OCR-Programm/eine lib, die mir auf Basis von RegEx gewisse Zeichen interpretiert?

Der Sinn davon ist ganz einfach gehen wir davon aus, dass ich eine eingescannte handschriftliche Rechenaufgabe habe:

Quote:
10+8*122-0
Wenn ich jetzt per RegEx dem OCR schon im voraus sagen kann:
1. Es kommen nur Zahlen und Rechenzeichen vor.
2. Die Zahlen besitzen keine Nachkommastelle.
3. Nach jedem Rechenzeichen muss entweder ein + oder - kommen oder eine Zahl.

Dann wäre die Erkennungsrate um einiges höher als mit einem System, das von dem kompletten ASC II Satz ausgeht oder vielleicht sogar von UTF8.

Natürlich könnte man nachträglich mit RegEx drüber gehen, dabei bemerkt man dann aber lediglich ob die Syntax der Rechenaufgabe korrekt ist, man kann jedoch nicht die gewonnen Erkentnisse in die OCR-Lib einfließen lassen, zumindest in keine, die ich kenne.

Die Frage ist also erst einmal gibt es OCR-Libs, die derartig (einfache) RegEx-Ausdrücke mit einbeziehen können?
Shadow992 is offline  
Old 10/09/2013, 20:45   #2
 
tolio's Avatar
 
elite*gold: 2932
The Black Market: 169/1/0
Join Date: Oct 2009
Posts: 6,966
Received Thanks: 1,097
die meisten ocrs muss man eh selber trainieren, also nur buchstaben und rechenzeichen trainieren

sonst kann man bei den meisten systemen die ich ausprobiert hab auch nen wörterbuch oä angeben
tolio is offline  
Thanks
1 User
Old 10/09/2013, 22:38   #3
 
Shadow992's Avatar
 
elite*gold: 77
Join Date: May 2008
Posts: 5,430
Received Thanks: 5,878
Quote:
Originally Posted by tolio View Post
die meisten ocrs muss man eh selber trainieren, also nur buchstaben und rechenzeichen trainieren

sonst kann man bei den meisten systemen die ich ausprobiert hab auch nen wörterbuch oä angeben
Natürlich lassen sich die Sachen auch nur antrainieren, aber RegEx geht ja über ein vorgegebens Alphabet hinaus sondern sagt auch etwas über die Syntax aus.
Shadow992 is offline  
Old 10/09/2013, 22:38   #4
 
tolio's Avatar
 
elite*gold: 2932
The Black Market: 169/1/0
Join Date: Oct 2009
Posts: 6,966
Received Thanks: 1,097
schon klar, ums dann kurz zu sagen, mir ist nichts in der richtung bekannt
tolio is offline  
Thanks
1 User
Old 10/11/2013, 22:45   #5
 
elite*gold: 22
Join Date: Feb 2012
Posts: 576
Received Thanks: 332
Schau mal nach dem Algo der Nummernschilder von Autos erkennt,
Anderer Ansatz aber geht auch ganz gut.
VisionEP1 is offline  
Old 10/12/2013, 11:06   #6
 
Shadow992's Avatar
 
elite*gold: 77
Join Date: May 2008
Posts: 5,430
Received Thanks: 5,878
Quote:
Originally Posted by VisionEP1 View Post
Schau mal nach dem Algo der Nummernschilder von Autos erkennt,
Anderer Ansatz aber geht auch ganz gut.
Wenn ich mich nicht irre, läuft das meistens über Support Vector Maschinen, zumindest bieten diese die höchste Erkennungsrate. Wenn man sich jetzt selbst einen zusammenbastelt kann man den freilich anpassen wie man möchte, aber deswegen ist es immer noch hardcoded und nicht wie RegEx modulisierbar und allgemein änderbar.
Shadow992 is offline  
Old 10/12/2013, 12:07   #7
 
CallSaul's Avatar
 
elite*gold: 0
Join Date: Oct 2013
Posts: 327
Received Thanks: 65
#nicht genug geschlaften p.q

Naja, Edit:
CallSaul is offline  
Thanks
1 User
Old 10/12/2013, 13:25   #8


 
MrSm!th's Avatar
 
elite*gold: 7110
Join Date: Jun 2009
Posts: 28,902
Received Thanks: 25,407
Quote:
Originally Posted by Shadow992 View Post
Natürlich lassen sich die Sachen auch nur antrainieren, aber RegEx geht ja über ein vorgegebens Alphabet hinaus sondern sagt auch etwas über die Syntax aus.
Ein vorgegebenes Alphabet schränkt es ja schon massiv ein. Die Nachkommastellen halte ich für Peanuts (zumal du das Komma einfach nicht zulassen musst).
Quote:
Originally Posted by Shadow992 View Post
Wenn ich mich nicht irre, läuft das meistens über Support Vector Maschinen, zumindest bieten diese die höchste Erkennungsrate. Wenn man sich jetzt selbst einen zusammenbastelt kann man den freilich anpassen wie man möchte, aber deswegen ist es immer noch hardcoded und nicht wie RegEx modulisierbar und allgemein änderbar.
Und was hindert dich daran, RegExps in diese Anpassung einfließen zu lassen?
MrSm!th is offline  
Thanks
1 User
Old 10/13/2013, 22:23   #9
 
Shadow992's Avatar
 
elite*gold: 77
Join Date: May 2008
Posts: 5,430
Received Thanks: 5,878
Quote:
Originally Posted by MrSm!th View Post
Ein vorgegebenes Alphabet schränkt es ja schon massiv ein. Die Nachkommastellen halte ich für Peanuts (zumal du das Komma einfach nicht zulassen musst).
Ja da hast du natürlich recht, aber ich würde trotzdem noch das i-Tüpfelchen dafür haben wollen.

Quote:
Originally Posted by MrSm!th View Post
Und was hindert dich daran, RegExps in diese Anpassung einfließen zu lassen?
Naja prinzipiell der Programmieraufwand.
Ich würde halt wenn möglich das Rad nicht neu erfinden wollen, sondern auf eine bestehende Lib zurückgreifen können wollen.
Wenn ich etwas derartiges selbst programmieren würde, wäre ein RegEx-Anpassung selbstverständlich total unproblematisch.
Shadow992 is offline  
Reply


Similar Threads Similar Threads
VB RegEx
07/11/2013 - .NET Languages - 8 Replies
Hi, ich würde aus nem Quellcode ein paar ID's auslesen. Mit BetGetween geht alles super. Nur da es von den ID's mehrere im Quelltext gibt, brauch ich regEx Matches. src="http://www.howrse.de/media/equideo/imag e/chevaux/normaux/arabe-small/gr-c-icone.png?15883 8126" class="cheval-icone " width="40" height="40"/></a> <a href='/elevage/chevaux/cheval?id=18923938' class='horsename'> Diese ID soll rausgefiltert werden."18923938" Das mache ich mit
RegEx Pattern
09/23/2012 - General Coding - 2 Replies
Wäre jemand mal so nett mir einen funktionierenden RegEx Pattern zu geben, um das rotmarkierte rauszufilten? Ich kenn mich nicht besonders gut damit aus und bekomms einfach nicht gebacken..
Nexon Captcha Cracker
01/20/2012 - Combat Arms - 3 Replies
http://dl.dropbox.com/u/29811495/2012-01-20_171559 .png Hallo, Beim Anmelden bei Nexon muss jeder eines dieser Bildchen "lösen": http://passport.nexoneu.com/img/63462676116781488 6.gif Wenn man aber etwas pöses vor hat, z.B. das Nexon Forum zu spammen (op "caeureporter") und nicht nach jedem gebannten Account wieder selbst einen erstellen zu müsse, dann macht es Sinn dafür ein Tool zu schreiben. Gedacht, nach langer Zeit getan :) Downhaload
Zarenkriege / Khan Wars - Captcha Cracker
06/04/2011 - Browsergames - 3 Replies
Hallo zusammen!, ich möchte Euch gerne einen "Captcha Breaker" für das Browsergame Spiel Zarenkriege bzw. Khan Wars vorstellen! Der Captcha Breaker ist ein externes Programm, welches das Captcha Pixel für Pixel durch geht und den offfenen Kreis sucht. Es wird bei erfolg die Pos. X sowie Y zurückgegeben. Das ganze läuft als CMD. Eine Readme sowie eine How to use it, ist natürlich mit dabei! ;-) Es handelt sich hier um keinen Fake! Das ganze kann gerne auf einen Virus überprüft werden,...



All times are GMT +1. The time now is 21:08.


Powered by vBulletin®
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
SEO by vBSEO ©2011, Crawlability, Inc.
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

Support | Contact Us | FAQ | Advertising | Privacy Policy | Terms of Service | Abuse
Copyright ©2025 elitepvpers All Rights Reserved.