Quote:
Originally Posted by BlackOperations
Hey Danke für deine schnelle Antwort.
Ich möchte Pferde erkennen und dann deren Koordinaten in der echten Welt berechnen.
Am besten sollte es genau diesem Prinzip gehen: [Only registered and activated users can see links. Click Here To Register...]
Ich habe bloß voll die Probleme mit TensorFlow, habe einen Laptop mit Windows7 von 2012 welcher eine zu alte NVIDIA Grafikkarte hat. CUDA wird also nichts und die CPU hat auch nicht die beste Leistung.
Ansonsten dachte ich, dass ich diese Basis nehme: [Only registered and activated users can see links. Click Here To Register...]
Und einfach den PixelMapper hinzufüge um die Koordinaten zu berechnen.
Soll übrigens alles für eine Bachelorarbeit gemacht werden, studiere Geodäsie & Geoinformatik.
Was sagst du zu dem pyimagesearch Sachen?
Nehme an du denkst ich hab mich gar nicht damit befasst und möchte nun direkt die Lösungen haben.
Habe folgendes probiert:
[Only registered and activated users can see links. Click Here To Register...]
Hatte aber mit Tensorflow und pycocotools schon genug Kopfschmerzen, deswegen lasse ich TensorFlow sein.
Ansonsten ist das Tutorial das beste bis jetzt, aber vielleicht gibt es bessere für meine Aufgabe: [Only registered and activated users can see links. Click Here To Register...]
|
Also Tensorflow bzw. deep learning Zeugs läuft eigentlich meistens ganz ordentlich schnell auf 0815 CPUs, wenns nicht ums trainieren geht. Vermutlich niemals in Echtzeit, aber wenn du nur jedes Xte Frame deep learning nutzt und dazwischen simple Heuristiken, sollte das gut machbar sein.
Aus meiner Sicht macht dein Vorhaben aber echt keinen Sinn. Es gibt praktisch keinen fertigen Tracker für dein Anwendungsgebiet und wenn doch dann wirst du um etwas Handarbeit wohl nicht drum rum kommen, also würde sich anbieten sich einfach allgemein in das Thema der Objekterkennung einzuarbeiten.
Je nachdem wie schwer die Pferde zu erkennen sind, etc. braucht es auch nicht zwingend Deep Learning. Meistens liefert Adaboost mit sowas wie LBP-Patterns auch ganz gute Ergebnisse, läuft aber meisten in einem Bruchteil der Zeit und braucht meistens auch nur einen Bruchteill an Trainingsdaten.
Würde sich also anbieten sich einmal damit zu beschäftigen. Auch mit opencv allgemein. OpenCV könnte für deinen Fall eventuell sogar schon genug sein, da braucht man vermutlich gar nicht sowas wie TensorFlow o.ä. Auch wenn du im Kopf behalten musst, dass die Algorithmen in der Regel schlechter sind, wenn sie nicht auf Deep Learning basieren.
Aber egal was du nimmst, du solltest dir erst einmal Grundlagen der Mustererkennung aneignen, sonst macht das alles wenig Sinn. Paar Stichwörter:
Decision Trees, Computer Vision, Object Detection, Adaboost, Local Binary Patern, Histogram of oriented Gradients, ORB keypoints
Das sollte für die Grundlagen eigentlich gut reichen. Ansonsten bietet es sich für bessere Ergebnisse an alle X Frames ein Deep Learning Model deiner Wahl draufzuklatschen und dann Keypoints extrahieren, die du trackst, um nach X weiteren Frames die mit den Deep learning vorhergesagten Punkten abzugleichen und zu refinen.
Edit:
Wenn du mir nicht glaubst zwecks CPU sollte reichen, kannst auch mal in meinem alten projekt reinschauen, da hab ich auch ne relativ alte Laptop CPU genommen und die Zeiten waren ganz ordentlich (Da ist auch ein Vergleich CPU vs. GPU):
[Only registered and activated users can see links. Click Here To Register...]