[VB] Captcha Solver

10/24/2014 02:58 ravvon#1
Servus,
ich entschuldige mich schonmal für mein Mieses Fachwissen und die schlechte Ausdrucksweise aber ich programmiere nur in der Freizeit und tue mir noch sehr schwer mit dem ganzen Stoff da es einfach so viel ist.

Versuche mich gerade an einem kleinen Programm das über HTTP mit einem Server kommuniziert.
Dieser frägt nach einem Captcha und ich würde das Programm gerne das Captcha lösen lassen.
Ich habe bereits gesehen das es dafür vorgefertigte Bibliotheken gibt wie tessnet2.

Das erste Problem worauf ich gestoßen bin, ist dass der Server mich bei der Captcha-Anfrage sofort weiterleitet über den "location:"-Header in der Antwort des Servers.
Ich kann also nicht das Captcha seperat in meinem Programm ansprechen um es irgendwo zu speichern.

Also wäre meine erste Frage einmal wie ich denn an das Captcha rankomme, falls das überhaupt möglich ist.

Weiterhin würde ich mich über jeglichen anderen Tipps freuen die mir bei meinem Vorhaben helfen können.

~ravvon
10/24/2014 11:56 Shadow992#2
Mit einem OCR-System alleine wirst du wirklich nicht weitkommen, damit kriegste wohl maximal 1% aller Captchas gelöst und das dürfte ungefähr der Rate entsprechen, die dabei rauskommt, wenn du einfach zufällig Zeichen probierst.

Siehe dazu auch hier:

[Only registered and activated users can see links. Click Here To Register...]

Und hier:

[Only registered and activated users can see links. Click Here To Register...]
10/24/2014 13:28 warfley#3
Zu dem lösen, Google hatte früher einen dienst, ich weiß nicht wies jetzt aussieht, mit dem du bilder hochladen konntest, und google hat dann darauf schriftzüge markenlogos, und produkte aus google shopping erkannt. Goggels oder so hieß der, der hatte glaube ich eine über 80% captcha löse rate.
10/25/2014 03:19 ravvon#4
Danke erstmal für die schnellen Antworten.
Ich habe mir das mal angeschaut und das ganze ist wohl doch schwerer als gedacht denn die Captchas sind doch immer recht kompliziert.

Aber ich habe trotzdem noch das Problem das ich nicht an das aktuelle Captcha rankomme das angefragt wird da der Link zu den Captchas dynamisch ist.

Weiß jemand wie ich das während dem httpWebRequest auslesen kann?
10/25/2014 13:33 Mostey#5
Irgendwo muss ja der Link zum Captcha stehen. Wenn das Teil eingebunden wird (als img Element), steht im src Attribut sicherlich auch der Link zum Captcha.
10/25/2014 16:12 ravvon#6
Ja den Link zum Captcha hatte ich, aber der Server hat mir immer einen Error zurückgegeben das es das falsche Captcha sei.
Nachdem ich mir die Threads dazu hier durchgelesen habe und ein bissal an dem Code rumprobiert habe denke ich das ich da nen Fehler gemacht habe.

Mir ist dabei aufgefallen das mein WebRequest nicht den selben Aufbau hat wie der des Browser, also die Informationen kommen zwar vor aber in der falschen Reihenfolge.

Zum Beispiel kommt der "Host"-Header bei mir an späterer Stelle als im Browser, macht das einen Unterschied und wenn ja wie kann ich die Reihenfolge der einzelnen Header bestimmen?
10/25/2014 18:25 Mostey#7
Quote:
Originally Posted by ravvon View Post
Ja den Link zum Captcha hatte ich, aber der Server hat mir immer einen Error zurückgegeben das es das falsche Captcha sei.
Nachdem ich mir die Threads dazu hier durchgelesen habe und ein bissal an dem Code rumprobiert habe denke ich das ich da nen Fehler gemacht habe.

Mir ist dabei aufgefallen das mein WebRequest nicht den selben Aufbau hat wie der des Browser, also die Informationen kommen zwar vor aber in der falschen Reihenfolge.

Zum Beispiel kommt der "Host"-Header bei mir an späterer Stelle als im Browser, macht das einen Unterschied und wenn ja wie kann ich die Reihenfolge der einzelnen Header bestimmen?
Die Reihenfolge ist total egal, so lange du sie sendest.

Du müsstest halt mal wirklich deinen Code (mit einem Kommunikationsdump zwischen dir und dem Server) posten sodass man nachvollziehen kann, wo deine Probleme liegen.
10/25/2014 20:56 tolio#8
wichtig ist das du das bild den mit den cookies abrufst die du vorher bekommen hast dann haut das auch hin
10/26/2014 00:31 ravvon#9
So also vielen Dank erstmal für eure Unterstützung, ich habe den Fehler gefunden, erstmal hatte ich beim abrufen des Captcha-Bildes vergessen die Cookies mitzusenden und der Header stimmte nicht ganz mit dem überein was der Server erwartet hat.

Ich arbeite jetzt mal an dem Captcha Solver was aber für mich wohl eine längere Geschichte wird bis ich das durchschaut habe.

~ravvon
10/26/2014 11:35 tolio#10
idR lohnt sich sich mehr in dienste wie deathbycaptcha o.ä. zu investieren, kostet nur nen paar cents und spart unmengen an arbeit