Hallo zusammen,
ich habe ein recht triviale Frage, zu der ich bisher jedoch noch keine passende Antwort gefunden habe:
Gibt es einen Captcha-Cracker oder allgemein ein OCR-Programm/eine lib, die mir auf Basis von RegEx gewisse Zeichen interpretiert?
Der Sinn davon ist ganz einfach gehen wir davon aus, dass ich eine eingescannte handschriftliche Rechenaufgabe habe:
1. Es kommen nur Zahlen und Rechenzeichen vor.
2. Die Zahlen besitzen keine Nachkommastelle.
3. Nach jedem Rechenzeichen muss entweder ein + oder - kommen oder eine Zahl.
Dann wäre die Erkennungsrate um einiges höher als mit einem System, das von dem kompletten ASC II Satz ausgeht oder vielleicht sogar von UTF8.
Natürlich könnte man nachträglich mit RegEx drüber gehen, dabei bemerkt man dann aber lediglich ob die Syntax der Rechenaufgabe korrekt ist, man kann jedoch nicht die gewonnen Erkentnisse in die OCR-Lib einfließen lassen, zumindest in keine, die ich kenne.
Die Frage ist also erst einmal gibt es OCR-Libs, die derartig (einfache) RegEx-Ausdrücke mit einbeziehen können?
ich habe ein recht triviale Frage, zu der ich bisher jedoch noch keine passende Antwort gefunden habe:
Gibt es einen Captcha-Cracker oder allgemein ein OCR-Programm/eine lib, die mir auf Basis von RegEx gewisse Zeichen interpretiert?
Der Sinn davon ist ganz einfach gehen wir davon aus, dass ich eine eingescannte handschriftliche Rechenaufgabe habe:
Wenn ich jetzt per RegEx dem OCR schon im voraus sagen kann:Quote:
10+8*122-0
1. Es kommen nur Zahlen und Rechenzeichen vor.
2. Die Zahlen besitzen keine Nachkommastelle.
3. Nach jedem Rechenzeichen muss entweder ein + oder - kommen oder eine Zahl.
Dann wäre die Erkennungsrate um einiges höher als mit einem System, das von dem kompletten ASC II Satz ausgeht oder vielleicht sogar von UTF8.
Natürlich könnte man nachträglich mit RegEx drüber gehen, dabei bemerkt man dann aber lediglich ob die Syntax der Rechenaufgabe korrekt ist, man kann jedoch nicht die gewonnen Erkentnisse in die OCR-Lib einfließen lassen, zumindest in keine, die ich kenne.
Die Frage ist also erst einmal gibt es OCR-Libs, die derartig (einfache) RegEx-Ausdrücke mit einbeziehen können?