Optimierung Bildvergleichs Algorithmus

11/25/2015 21:33 Shadow992#1

Hallo zusammen,

momentan sitze ich an einer Library, die ganz simple "ImageSearch"-Sachen k�nnen soll. Das hei�t ich gebe der Library ein Bild im RGB-Bitmap-Format, die Library parsed dieses Bild, indem sie es in seine Bestandteile zerlegt und Meta-Informationen speichert (ala H�he/Breite/Farbmasken/etc.).
Anschlie�end kann man der Library ein zweites Bild geben und dann soll das zweite Bild in dem ersten Bild (welches normalerweise viel gr��er ist) gefunden werden.
Das exakte Finde klappt einwandfrei (auch performancetechnisch).
Bisher ist implementiert:
ImageSearch, PixelSearch, allerlei Helferfunktionen (wie preprocessPicture, getPixel, etc.)

Sowohl ImageSearch als auch PixelSearch laufen (wie bereits erw�hnt) super von der Geschwindigkeit.

Jetzt will ich aber noch eine 3. Methode hinzuf�gen, ich habe sie "FindSimilarImage" genannt. Diese Methode sucht in dem Hauptbild nach einem Bereich, der einem zweitem gegebenen Bild sehr �hnlich ist.

�hnlich ist das Bild und der Bereich f�r mich, wenn folgende Anforderungen erf�llt werden:
- Die Gr��e der Objekte stimmt ganz grob �berein
- Die benutzten Farben stimmen ungef�hr �berein

Mehr pr�fe ich gar nicht und m�chte ich auch nicht wirklich pr�fen lassen.
Es ist also relativ einfach (vom Gef�hl her), aber irgendwie auch nicht.

Mein momentaner Ansatz sieht wie folgt aus (Konkreter Code folgt weiter unten):
1. Erstelle ein 3D-Histogramm des kleinen Bildes, mit einer Gr��e von 8 bins pro Farbkanals (also insgesamt 8*8*8=512 bins)
2. currentX=0, currentY=0
3. Berechne f�r Pixel currentX, currentY des gro�en Bildes die angrenzende Region und berechne das Histogramm dieser Region
4. Vergleiche das Histogramm des Bereiches (vom gro�en Bild) mit dem des kleinen Bildes, mit Hilfe der Hellinger Distanz.
5. Gehe zum n�chsten Pixel (und springe zu Punkt 3, solange wie Pixel verf�gbar sind)

Die Genauigkeit dieses Verfahrens ist sogar besser als ich erwartet hatte, f�r meinen konkreten Anwendungsfall habe ich 0% false positive und ich erkenne rund 95% der Bilder, die auch f�r mich als Mensch "�hnlich" sind.

Das gro�e Problem an der ganzen Sache ist die Performance.
Ich brauche f�r das Suchen einer 30x30 Region in einem 1680x1050 (=Screenshot) Bild 15 Sekunden.
Angestrebte Zeit w�re aber um die 100ms (je weniger desto besser) gewesen.
Jeden Pixel anzuschauen, ist also nicht die L�sung und selbst wenn ich nur jeden 3. Pixel anschauen brauche ich immer noch 5 Sekunden. Bei jedem 30. Pixel w�ren es immer noch 500ms und zus�tzlich w�rde ich etliche �hnliche Bilder "verpassen".

Pseudo/C++ Code von diese Methode sieht wie folgt aus:

PHP Code:


			
void Image::calcHistogram(int accuracy,int xStart, int yStart, int w, int h)
{
    // histogram ist ein std::vector
    histogram.resize(sizeOfHistogram);

    int toShift=8-histogramAccuracy;
    int blueShift=histogramAccuracy+histogramAccuracy;

    for(int y=yStart;y<yStart+h;y++)
    {
        for(int x=xStart;x<xStart+w;x++)
        {
            // Berechne in welchen bin die Farbe des Pixels einzuordnen ist
            Pixel* p=getPixel(x,y);
            int redBins=p->color.red>>toShift;
            int greenBins=(p->color.green>>toShift)<<histogramAccuracy;
            int blueBins=(p->color.blue>>toShift)<<blueShift;

            histogram[redBins + greenBins + blueBins]++;
        }
    }

    float sampledPixels=w*h;

    // Teile der Hellinger Distanz hier rein verlagert, damit es an anderen Stellen schneller geht
    for(int i=0;i<sizeOfHistogram;i++)
    {
        if(histogram[i]!=0)
        {
            histogram[i]=sqrt(histogram[i]/sampledPixels);
        }
    }

}


float Image::checkHistogramDifferences(Image& checkImage)
{
    int sizeOfHistogram=((1<<histogramAccuracy)<<histogramAccuracy)<<histogramAccuracy;

    // use Hellinger distance to calculate differences of 2 given datasets
    float differences=0.0;
    for(int i=0;i<sizeOfHistogram;i++)
    {
        float squareRootDif=histogram[i] - checkImage.histogram[i];
        squareRootDif*=squareRootDif;
        differences+=squareRootDif;
    }
    differences=sqrt(differences)/SQUARE_OF_2;

    return differences;
}

Der Ansatz oben beschrieben s�he also in Pseudo-Code etwa so aus:

PHP Code:


			
    for(int y=0;y<height;y++)
    {
        for(int x=0;x<width+w;x++)
        {
            calcHistogram(accuracy,x,y,widthOfSmallImage,heightOfSmallImage);
            currSolution=checkHistogramDifferences(checkImage);
           updateOldSolutionIfBetter(currSolution);
        }
    }

Deshalb habe ich einmal meine tiefsten KI-Kentnisse ausgepackt und eine Partikelschwarmoptimierung draufgehauen.
Am Anfang war die Begeisterung gro�, die ben�tigte Zeit lag irgendwo bei 50-100ms (je nachdem wie genau man es wollte) und es wurden beim ersten Test auch etliche Bilder als gut erkannt (bisschen mehr als 80%). Die 80% sind zwar nicht perfekt, aber w�re gerade so noch verschmerzbar.

Beim zweiten Bild kam dann aber die Ern�chterung:
Ein gro�es Problem, welches ich da sehr fr�h gemerkt habe war, dass meine Partikel verdammt h�ufig in lokalen Optima stecken bleiben. Wieso sie das tun, ist auch sehr schnell klar. Es gibt einfach 1000+ m�gliche lokale Optima bei meiner Bildersuche und meine Partikel haben kaum eine Chance aus den lokalen Optima auszubrechen, weil wenn ein Bildbereich ungef�hr mit dem gesuchten Bild �bereinstimmt, dann ist sehr sehr unwahrscheinlich, dass in der N�he von dem �hnlichen Bereich sich irgendwo ein neues Optimum befindet. Das hei�t zwischen den Optimas liegen extrem gro�e Spitzen von schlechten L�sungen, welche die Partikel ungern �berwinden, weil es dort ja wieder schlechter wird.

Will man sich das anschaulich klar machen, d�rfte das in etwa so aussehen, wobei die gro�e "Spitze" im Bild mein gesuchtes Optimum ist und der Rest nur lokale Optima sind:
[Only registered and activated users can see links. Click Here To Register...]

Ein zus�tzliches Problem ist, dass meine Partikel sich nur um das Optimum herumfliegen, es jedoch nicht (mit 500 Iterationen und 120 Partikeln) erreichen. Das hei�t sagen wir die perfekte �hnlichkeit in Prozent ausgedr�ckt w�ren 80%, meine Partikel n�hern sich den 80% aber nur bis auf rund 70% (manchmal sogar noch weniger) an. Das finde ich sehr schade und ich wei� nicht wieso.

Daher habe ich 3 Fragen, die relativ unabh�ngig voneinander sind:

Quote:

1. Kennt ihr andere Optimierungsalgorithmen, die mit solchen Suchen in sehr zerkl�fteten Landschaften besser klarkommen?

2. Kennt ihr eine (von der Performance-Seite aus gesehen!) einfache M�glichkeit mein Partikelschwarm aus den lokalen Optima raus zu man�vrieren (Bisher getestet, jedoch ohne nennenswerten Erfolg: Multi-Schwarm-System und Neugruppieren der Schw�rme (DMS-PSO))?

3. Kennt ihr andere Methoden, die genau so leicht wie Histogram zu implementieren sind, ungef�hr genau so pr�zise sind, aber daf�r deutlich schneller ablaufen?

P.S. Partikel-Schwarm-Optimierungs-Code:

Spoiler

PHP Code:


			
float Image::findSimilarImageApproximately(int x, int y,int w, int h,Image& checkImage, int accuracy, int agentsUsed, int iterations,int &bestX, int &bestY)
{
    int widthToCheck=checkImage.width;
    int heightToCheck=checkImage.height;
    if(checkImage.histogramHeight!=checkImage.height || checkImage.histogramWidth!=checkImage.width)
    {
        checkImage.calcHistogram(accuracy,0,0,widthToCheck,heightToCheck);
    }

    std::vector<Agent> agents;
    agents.resize(agentsUsed);

    for(int i=0;i<agentsUsed;i++)
    {
        float r = static_cast <float> (rand()) / static_cast <float> (RAND_MAX);
        agents[i].x=x+w*r;
        r = static_cast <float> (rand()) / static_cast <float> (RAND_MAX);
        agents[i].y=y+h*r;
    }

    std::vector<int> bestSwarmX(16,0);
    std::vector<int> bestSwarmY(16,0);
    std::vector<float> bestSwarmFitness(16,1000000000000);

    int xMaxSpeed=10;
    int yMaxSpeed=10;


    int currSwamrIdx=0;
    for(;iterations>0;iterations--)
    {
        for(int i=0;i<agentsUsed;i++)
        {
            currSwamrIdx=i%16;

            // update vectors
            float r = static_cast <float> (rand()) / static_cast <float> (RAND_MAX);
            agents[i].xSpeed+=2.0*r *((float)(bestSwarmX[currSwamrIdx]-x));
            r = static_cast <float> (rand()) / static_cast <float> (RAND_MAX);
            agents[i].xSpeed+=2.0*r *((float)(agents[i].bestX-x));
            r = static_cast <float> (rand()) / static_cast <float> (RAND_MAX);
            agents[i].ySpeed+=2.0*r *((float)(bestSwarmY[currSwamrIdx]-y));
            r = static_cast <float> (rand()) / static_cast <float> (RAND_MAX);
            agents[i].ySpeed+=2.0*r *((float)(agents[i].bestY-y));

            // calculate fitness
            calcHistogram(accuracy,agents[i].x,agents[i].y,widthToCheck,heightToCheck);
            agents[i].currFitness=checkHistogramDifferences(checkImage);

            if(bestSwarmFitness[currSwamrIdx]>agents[i].currFitness)
            {
                bestSwarmFitness[currSwamrIdx]=agents[i].currFitness;
                bestSwarmX[currSwamrIdx]=agents[i].x;
                bestSwarmY[currSwamrIdx]=agents[i].y;
            }

            if(agents[i].bestFitness>agents[i].currFitness)
            {
                agents[i].bestFitness=agents[i].currFitness;
                agents[i].bestY=agents[i].y;
                agents[i].bestX=agents[i].x;
            }

            // if particles' verctors got too big we have to limit them (so our particle will not move too far and overjump good solutions)
            if(agents[i].ySpeed>yMaxSpeed)
                agents[i].ySpeed=yMaxSpeed;
            if(agents[i].ySpeed<-yMaxSpeed)
                agents[i].ySpeed=-yMaxSpeed;

            if(agents[i].xSpeed>xMaxSpeed)
                agents[i].xSpeed=xMaxSpeed;
            if(agents[i].xSpeed<-xMaxSpeed)
                agents[i].xSpeed=-xMaxSpeed;

            // Add our vectors to current position
            agents[i].x+=agents[i].xSpeed;
            agents[i].y+=agents[i].ySpeed;


            // If agent/particle wants to move out of boundaries, just capture him and move him into boundaries
            if(agents[i].x>=w)
                agents[i].x=w-2;

            if(agents[i].y>=h)
                agents[i].y=h-2;

            if(agents[i].x<x)
                agents[i].x=x+1;

            if(agents[i].y<y)
                agents[i].y=y+1;
        }

        if(iterations%64)
        {
            // Group Subswarms new
            for(int j=0;j<8;j++)
            {
                int ran1=rand()%16;
                int ran2=rand()%16;

                float tmpFit=bestSwarmFitness[ran1];
                int tmpX=bestSwarmX[ran1];
                int tmpY=bestSwarmY[ran1];

                bestSwarmFitness[ran1]=bestSwarmFitness[ran2];
                bestSwarmX[ran1]=bestSwarmX[ran2];
                bestSwarmY[ran1]=bestSwarmY[ran2];

                bestSwarmFitness[ran2]=tmpFit;
                bestSwarmX[ran2]=tmpX;
                bestSwarmY[ran2]=tmpY;
            }

        }

        // Make maximum step smaller with more iterations
        if(iterations<(iterations>>4))
        {
            xMaxSpeed=2;
            yMaxSpeed=2;
        }
        if(iterations<(iterations>>3))
        {
            xMaxSpeed=4;
            yMaxSpeed=4;
        }
        else if(iterations<(iterations>>1))
        {
            xMaxSpeed=8;
            yMaxSpeed=8;
        }
    }
    float bestFitness=10000;

    for(int i=0;i<bestSwarmFitness.size();i++)
    {
        if(bestFitness>bestSwarmFitness[i])
        {
            bestFitness=bestSwarmFitness[i];
            bestX=bestSwarmX[i];
            bestY=bestSwarmY[i];
        }
    }

    return bestFitness;
}

Ich m�chte keinerlei (wirklich keinerlei!) externe Libaries benutzen. Das hei�t weder OpenCV, noch irgendwelche Image-Manipulation-Libs noch sonstiges. Alles was im C++11 Standard jedoch vorkommt benutze ich sehr gerne.

11/26/2015 02:31 .SkyneT.#2

Was spricht dagegen einen der Algorithmen von [Only registered and activated users can see links. Click Here To Register...] nachzuprogrammieren?
Diese waren bei mir bisher sehr performant und genau.

(Deinen Code habe ich nur �berflogen, falls dort schon einer dieser Algorithmen verwendet wird, vergiss das hier einfach :) )

11/26/2015 10:59 Shadow992#3

Quote:

Originally Posted by .SkyneT.

Was spricht dagegen einen der Algorithmen von [Only registered and activated users can see links. Click Here To Register...] nachzuprogrammieren?
Diese waren bei mir bisher sehr performant und genau.

(Deinen Code habe ich nur �berflogen, falls dort schon einer dieser Algorithmen verwendet wird, vergiss das hier einfach :) )

Es ist nicht ganz Template-Matching, sondern eher irgendwas zwischen PixelSearch und TemplateMatching.
Vom Aufwand her, w�ren die vorgestellten Methoden aber genau so "schwer" wie meine jetzige L�sung (ohne PSO).
Das hei�t auch das wird zu langsam sein, da der Aufwand von beiden Methoden (sowohl Template als auch Histogramm) O(n�*m�) (wenn man sagt dass die Bilder beide Quadratisch sind, dann entspricht n=Breite/H�he Bild1 und m=Breite/H�he Bild2) ist und es damit immer noch zu langsam w�re. Vielleicht w�rde es auf Grund von weniger Berechnungen auf 10sec runterbekommen, aber die angestrebten 100ms sinds halt bei weitem noch nicht.

OpenCV d�rfte das selbst rasend schnell machen, weill OpenCV die Grafikkarte benutzt und man damit rund 500 Pixel gleichzeitig berechnen kann. Die Grafikkarte wollte ich aber eigentlich nicht benutzen, weil es dann am Ende wieder Grafikkarten-Konflikte gibt, Versionskonflikte, usw.
Au�erdem ist es recht witzlos eine Library zu haben, die nur Methoden von anderen Libraries called.

11/26/2015 12:28 MrDami123#4

K�nnte man springen? Wenn x% �bereinstimmung kann xpx weiter nicht xx% �bereinstimmung sein, je nach Gr��e. Dann wenn xx% �bereinstimmung die genauste Position lokalisieren, nach oben, unten, rechts, links % Zunahme beachten anstatt alles durchzuscannen.
Dann 'besuchten' Bereich mit % speichern und weiter berechnen, ob etwas mit xx% noch nicht gefunden wurde.
Alternativ auch Bereich die bis zu xx% nicht �bereinstimmen k�nnen direkt �berspringen.

Oder je nach Leistung mehrere threads gleichzeitig durchlaufen lassen, von verschiedenen Positionen, die sich gegenseitig Infos austauschen?

11/26/2015 13:47 Shadow992#5

Quote:

Originally Posted by MrDami123

K�nnte man springen? Wenn x% �bereinstimmung kann xpx weiter nicht xx% �bereinstimmung sein, je nach Gr��e. Dann wenn xx% �bereinstimmung die genauste Position lokalisieren, nach oben, unten, rechts, links % Zunahme beachten anstatt alles durchzuscannen.
Dann 'besuchten' Bereich mit % speichern und weiter berechnen, ob etwas mit xx% noch nicht gefunden wurde.
Alternativ auch Bereich die bis zu xx% nicht �bereinstimmen k�nnen direkt �berspringen.

Oder je nach Leistung mehrere threads gleichzeitig durchlaufen lassen, von verschiedenen Positionen, die sich gegenseitig Infos austauschen?

@Multithreading:
Diese "Optimierung" ist leider schon voll ausgesch�pft, weil ich rund 10 solche Bilder gleichzeitig (in verschiedenen Threads) suchen lasse.

@Springen
Ich kann in dem Bild rumspringen wie ich will.
Tats�chlich gef�llt mir deine idee auch enorm gut.
Den zweiten Teil werde ich wohl ziemlich genau so �bernehmen (also das mit % �nderung beobachten und in die Richtung weitersuchen).
Der erste Teil hingegen hat ein kleines Problem:
Ich m�sste einen Wert festlegen ab welchem mein Bild nicht mehr "�hnlich" genug ist.
Wenn ich diesen Wert fest in meine Methode integriere, dann gibt es aber das Problem, dass ich nicht mehr dem Benutzer der Library �berlassen kann, ab wann er eine �bereinstimmung f�r genug h�lt.
Manche wollen 90% �bereinstimmung, Anderen reicht 40%.
Aber auch den Parameter zu �bergeben finde ich nicht optimal, damit w�re die Lib zwar wieder anpassbarer, aber wenn man die Funktion etwas anders benutzen will und gar keinen Plan hat was f�r Werte man zu erwarten hat, bietet auch das Probleme.
Ein m�gliches Anwendungsgebiet, w�re eine Art "Suche" in X-Bildern, wobei man am Ende das Bild mit der h�chten �bereinstimmung haben m�chte (selbst wenn es nur 10% sind).

Du hast mich jedoch auf eine sehr gute Idee gebracht, ich werde sie hier nur kurz skizzieren, weil ich bisher noch 0 Zeilen dazu implementiert habe:

Ich wei�, dass Evolution�re Algorithmen sehr stabil gegn�ber lokalen Minima/Maxima sind. Bisher wusste ich nur nicht, wie ich die Evolution�ren Algorithmen f�r mein Problem benutzen kann.
Dein Post hat mir dann aber einen Wink mit dem Zaunpfahl gegeben (bisher alles ungetestet und nur im Kopf zusammengedacht):

Initialisierung:
- Erzeuge X (wahrscheinlich irgendwo zwischen 50 und 200) Individuen, die du zuf�llig auf dem Bild verteilst und berechne deren Fitness.

Fitnessberechnung:
- Die Berechnung der Fitness passiert ja �ber "checkHistogramDifferences", je gr��er die Unterschiede, desto schlechter die Fitness.

Selektionsphase (eine der 3 M�glichkeiten werde ich nehmen, vermutlich Option 3):
1. Bestenselaktion (nur die Y besten Individue �berleben)
2. Rangselektion (jedes Individuum hat eine gewisse Chance zu �berleben)
3. Kombination aus beidem (die besten Z Individuen �berleben immer und der Rest wird nach Wahrscheinlichkeit ausgew�hlt)

Mutationsphase:
1. Mit 90% Wahrscheinlichkeit: Bewege die Individuen zuf�llig ein paar Pixel (1px-4px) um ihre aktuelle x,y-Position
2. Mit 10% Wahrscheinlichkeit: Vertausche x und y Koordinate

Rekombinationsphase:
1. Mit 25% Wahrscheinlichkeit: Erzeuge ein komplett neues zuf�lliges Individuum
2. Mit 25% Wahrscheinlichkeit: Nehme den Mittelpunkt der Strecke von zwei Individuen und erzeuge aus diesem Punkt ein neues Individuum
3. Mit 50% Wahrscheinlichkeit: Erzeuge ein neues Individuum, welches in der Umgebung von einem bestehenden Individuum landet (Umgebung irgendwo Gr��e 30-60px Radius)

11/26/2015 15:21 MrDami123#6

Initialisierung:
Anstatt zuf�llige Positionen anzusteuern, w�re es doch besser die Individuen so zu erzeugen, dass eine m�gliche �bereinstimmung immer zu einen %-anteil erkannt wird. Schlie�lich m�chte man ja alles finden also auch mehr als eine �bereinstimmung.
Die Individuen haben die Gr��e der gesuchten �bereinstimmung.

Dabei ist die nicht �berpr�fte Stelle zwischen den Individuen nicht gr��er als die gesuchte �bereinstimmung. Eine �bereinstimmung kann somit auch auf bis zu vier Individuen erkannt werden.

[Only registered and activated users can see links. Click Here To Register...]

Fitnessberechnung:
Jedes Individuum wird einmal gecheckt und alle mit einem % �berleben.

Erkennung:
Das Individuum n�hrt sich nun dem Optimum.

K�nnte man das so machen?

11/26/2015 16:13 Shadow992#7

Quote:

Originally Posted by MrDami123

Initialisierung:
Anstatt zuf�llige Positionen anzusteuern, w�re es doch besser die Individuen so zu erzeugen, dass eine m�gliche �bereinstimmung immer zu einen %-anteil erkannt wird. Schlie�lich m�chte man ja alles finden also auch mehr als eine �bereinstimmung.
Die Individuen haben die Gr��e der gesuchten �bereinstimmung.

Dabei ist die nicht �berpr�fte Stelle zwischen den Individuen nicht gr��er als die gesuchte �bereinstimmung. Eine �bereinstimmung kann somit auch auf bis zu vier Individuen erkannt werden.

[Only registered and activated users can see links. Click Here To Register...]

Fitnessberechnung:
Jedes Individuum wird einmal gecheckt und alle mit einem % �berleben.

Erkennung:
Das Individuum n�hrt sich nun dem Optimum.

K�nnte man das so machen?

Tats�chlich ist es f�r das Funktionieren der Evolution�ren Algorithmen sehr wichtig einen gewissen Zufall zu besitzen (damit sie sich nicht an lokalen Optima aufh�ngen).
Deine Idee werde ich aber auch mit einbauen, nur wahrscheinlich etwas anders.
Das Problem was wir bei dieser Methode haben sieht man sehr sch�n an deinem Bild.

Gehen wir davon aus, dass ein Individuum zu 90% in einem Bereich liegt der sich extrem stark vom vorgegebenen Bild unterscheidet (sagen wir 10% �bereinstimmung).
Nur 10% des Bildes stimmen zu mehr als 90% mit dem gegebenen Bild �berein (z.B. weil nur eine Ecke reinragt).
Damit erg�be sich eine Gesamt�hnlichkeit von:

Quote:

0.9*0.1+0.1*0.9=0.18

Das ist nat�rlich eher ein "Ausnahmefall", der Durchschnittsfall d�rfte so aussehen:
50% stimmen zu 30% �berein und die restlichen 50% stimmen zu 60% �berein.
Das hei�t unser Bild scheint nicht an dieser Position zu sein, aber etwas, dass eine gewisse �hnlichkeit hat (was ja auch gut ist, wenn wir keinen relativ perfekten Match finden).
Die Gesamt�hnlichkeit w�re dann f�r den Durchschnittsfall:

Quote:

0.5*0.3+0.5*0.6=0.45

Da das der Durchschnittsfall ist, d�rften wir rund 75% solcher Werte zu sehen bekommen.
Behalten wir jetzt nur 50% der besten Individuen (was ein recht �blicher Wert ist), schmei�en wir unseren Ausnahmefall mit 0.18 Haus hoch (und eigentlich immer) raus.

Anschlie�end werden wir uns haupts�chlich auf die 45% Gemeinsamkeit st�rzen und sie vielleicht auf 60% verbessern.
Sp�testens ab dann wird es praktisch unm�glich Ausnahmef�lle ausreichend genau anzuschauen, um die beste L�sung zu finden.
Wir w�rden also wieder in etlichen lokalen Optima stecken bleiben und h�tten zwar ein recht gutes Ergebnis, das w�re jedoch �hnlich gut/schlecht wie das der Partikel-Schwarm-Optimierung.

Daher w�re eine Rangselektion f�r diese Methode am besten geeignet, trotzdem kann es passieren, dass eine derartig schlechte L�sung rausfliegt.
Konzentriert man sich jetzt wieder nur auf die guten L�sungen, dann gibt es wieder relativ viele lokale Optima, zwar nicht so viele wie mit der Bestenselektion, aber immer noch genug.
Deswegen ist es wichtig, wenn man derartige L�sungen rausschmei�t ihnen auch wieder eine gewisse Chance f�rs reinkommen zu geben.
V�llig nutzlos ist es jedoch nicht und kann helfen die Performance zu verbessern.

Von daher w�rde ich rein vom Nachdenken her meine bisherige Rekombination in etwa wie folgt anpassen:

Rekombinationsphase:
1. Mit 20% Wahrscheinlichkeit: Erzeuge ein komplett neues zuf�lliges Individuum
2. Mit 20% Wahrscheinlichkeit: Nehme den Mittelpunkt der Strecke von zwei Individuen und erzeuge aus diesem Punkt ein neues Individuum
3. Mit 40% Wahrscheinlichkeit: Erzeuge ein neues Individuum, welches in der Umgebung von einem bestehenden Individuum landet (Umgebung irgendwo Gr��e 30-60px Radius)
4. Mit 20% Wahrscheinlichkeit: Nehme den Mittelpunkt der Strecke von zwei Individuen, die nahe beieinander liegen, und erzeuge aus diesem Punkt ein neues Individuum

Wobei man schauen m�sste wie einfach/schnell man die "N�he" von zwei Individuen pr�fen kann und ob sich der zus�tzliche Berechnungsaufwand lohnt oder ob man die benutzte Zeit daf�r lieber in ein paar Individuen/Iterationen stecken sollte.
Dazu kann ich aber gar nichts sagen, rein intuitiv denke ich macht das keinen gro�en Unterschied, aber es ist trotzdem ausprobierenswert.

11/26/2015 18:37 MrDami123#8

hmmm... sagen wir mal man erzeugt die Individuen wie in meinem Beispiel, damit man die gesamte Fl�che sicher abdeckt und dabei m�glichst wenig Individuen erzeugt.

Als n�chstes w�rde ich mittels xpx Ann�herung(oben,unten,rechts,links) ermitteln wollen, welche Individuen auf die gleiche �bereinstimmung zeigen und alle bis auf eine fallen lassen.
Da die freie Fl�che zwischen den erzeugten Individuen nicht gro� genug ist, als das sich dort eine �bereinstimmung verstecken k�nnte, reicht das ein Individuum mit beliebigem % auf eine �bereinstimmung zeigt.

Nun n�hrt man sich der �bereinstimmung wieder (o,u,r,l) mit xpx und ermittelt in welche Richtung es geht und wie viel % man mit wie viel px bekommt. Aus dem % und px berechnet man nun einen m�glichen Sprung aufs Optimum.
(Man muss hier keine zweite N�herung durchf�hren und kann die Werte vom vorherigen Schritt nehmen - nur als Erkl�rung)
Dann kalibriert man sich auf Optimum.

(Ein Individuum kann auch auf zwei oder mehrere zeigen und muss dann vermehrt werden.)

Bin aus den Fingern heraus nicht f�hig das zu programmieren, w�rde mich aber interessieren, welcher Ansatz bei den Tests vielversprechender ist. Finden-Lokalisieren-Algorithmus oder Evolution�rer-Algorithmus.

11/26/2015 19:01 Shadow992#9

Quote:

Originally Posted by MrDami123

hmmm... sagen wir mal man erzeugt die Individuen wie in meinem Beispiel, damit man die gesamte Fl�che sicher abdeckt und dabei m�glichst wenig Individuen erzeugt.

Als n�chstes w�rde ich mittels xpx Ann�herung(oben,unten,rechts,links) ermitteln wollen, welche Individuen auf die gleiche �bereinstimmung zeigen und alle bis auf eine fallen lassen.
Da die freie Fl�che zwischen den erzeugten Individuen nicht gro� genug ist, als das sich dort eine �bereinstimmung verstecken k�nnte, reicht das ein Individuum mit beliebigem % auf eine �bereinstimmung zeigt.

Nun n�hrt man sich der �bereinstimmung wieder (o,u,r,l) mit xpx und ermittelt in welche Richtung es geht und wie viel % man mit wie viel px bekommt. Aus dem % und px berechnet man nun einen m�glichen Sprung aufs Optimum.
(Man muss hier keine zweite N�herung durchf�hren und kann die Werte vom vorherigen Schritt nehmen - nur als Erkl�rung)
Dann kalibriert man sich auf Optimum.

(Ein Individuum kann auch auf zwei oder mehrere zeigen und muss dann vermehrt werden.)

Bin aus den Fingern heraus nicht f�hig das zu programmieren, w�rde mich aber interessieren, welcher Ansatz bei den Tests vielversprechender ist. Finden-Lokalisieren-Algorithmus oder Evolution�rer-Algorithmus.

Ich werde einmal beides benchmarken/programmieren.
Nur damit ich deine Idee auch einigerma�en so umsetzen kann wie du meintest. Der Algorithmus s�he ganz grob so aus, oder?

Quote:

1. Erzeuge Individuen, so dass die Freir�ume zwischen 2 Individuen etwa der H�lfte der Breite/H�he des zu suchenden Bildes entspricht
2. Berechne die Fitness von jedem Individuum und schmei�e alle au�er das beste Individuum raus
3. Schaue in jeder Richtung von dem �berlebenden Individuum und versuche das Individuum Schrittweise zu verbessern, indem man es in die Richtung verschiebt, die am meisten �bereinstimmung verspricht
4. Wiederhole das Ganze solange bis man keine bessere Position mehr gefunden hat

11/26/2015 19:42 MrDami123#10

Quote:

1. Erzeuge Individuen, so dass die Freir�ume zwischen 2 Individuen etwa der H�lfte der Breite/H�he des zu suchenden Bildes entspricht
2. Berechne die Fitness von jedem Individuum und schmei�e alle au�er das beste Individuum raus
3. Schaue in jeder Richtung von dem �berlebenden Individuum und versuche das Individuum Schrittweise zu verbessern, indem man es in die Richtung verschiebt, die am meisten �bereinstimmung verspricht
4. Wiederhole das Ganze solange bis man keine bessere Position mehr gefunden hat

1. Erzeuge Individuen, so dass die Freir�ume zwischen 2 Individuen etwas kleiner als das zusuchende Bild sind. (Das eine �bereinstimmung erkannt wird - umso weniger umso besser)

2. Berechne die Fitness von jedem Individuum und schmei�e alle au�er das beste Individuum raus (falls das zusuchende Bild nur einmal im Bild vorkommt - als test nehmen wir mal 1 zusuchendes bild im bild)

3. Finde die Richtung in x,y indem die �bereinstimmung verbessert wird und speicher um wie viel % es besser wird bei wie viel px schrittweite

4. Mach ein Sprung in px auf das mathematische Optimum also 100%. (z.B. 5px nach unten +7% -> berechnen wie viel px noch fehlen bis 100% und dort das Individuum erzeugen)

5. Gehe Schrittweise bis zum Optimum, wenn nicht schon drauf.

11/26/2015 20:12 Shadow992#11

Quote:

Originally Posted by MrDami123

1. Erzeuge Individuen, so dass die Freir�ume zwischen 2 Individuen etwas kleiner als das zusuchende Bild sind. (Das eine �bereinstimmung erkannt wird - umso weniger umso besser)

2. Berechne die Fitness von jedem Individuum und schmei�e alle au�er das beste Individuum raus (falls das zusuchende Bild nur einmal im Bild vorkommt - als test nehmen wir mal 1 zusuchendes bild im bild)

3. Finde die Richtung in x,y indem die �bereinstimmung verbessert wird und speicher um wie viel % es besser wird bei wie viel px schrittweite

4. Mach ein Sprung in px auf das mathematische Optimum also 100%. (z.B. 5px nach unten +7% -> berechnen wie viel px noch fehlen bis 100% und dort das Individuum erzeugen)

5. Gehe Schrittweise bis zum Optimum, wenn nicht schon drauf.

Tats�chlich sieht eine Abwandlung von diesem Algorithmus ziemlich vielversprechend aus.

Ich habe deinen original Ansatz gepr�ft und dabei einmal bisschen weniger als die H�lfte der H�he/Breite als Abstand zwischen zwei Individuen genommen, das beste damit gefundene Ergebnis war �hnlichkeit von 0.3 = 30% (maximal m�glich war 70%).
Der Ansatz verh�lt sich also wie erwartet ziemlich instabil was lokale Optima angeht.

Wenn man den Abstand der Individuen aber so gestaltet, dass sie sich zur H�lfte �berlappen, bekommt man ziemlich gute Ergebnisse.
Die Ergebnisse sind zwar nicht perfekt, aber sie finden ein Optimum mit 65% �hnlichkeit. Noch besser wird das Ganze, wenn man die Individuen zu 3/4 �berlappen l�sst.
Bei 3/4 �berlappung sieht es nach ersten Tests so aus als w�rde in 99% der F�lle das globale Optimum gefunden werden.
Auch die ben�tigte Zeit ist "ok". Es sind rund 200ms. Das ist zwar nicht ganz mein angestrebter Wert, aber mit ein paar Optimierungen k�nnte man das Ganze sicher noch auf knapp �ber 100ms dr�cken.

Bei 1/2 �berlappung braucht es 40ms, was echt verdammt gut ist, daf�r ist er leider noch nicht perfekt genug was das Auffinden angeht.
2/3 �berlappung sieht mir nach einem sinnvollen Kompromiss aus, hier braucht der Algorithmus ziemlich genau 100ms und findet in den meisten F�llen das Optimum.

Ich werde jetzt noch die Evolution�ren Algorithmen testen und auch ein paar mehr Beispiel anschauen. Der original Ansatz von dir scheint wie die PSO an den lokalen Optima zu scheitern.

Edit:
EA: Schnell f�r kleine Bilder, die in riesigen Bildern gefunden werden sollen (Such-Bild: bis ca 50x50, Gro�es Bild ab ca. 2500x2500)
�berlappungsmethode: Sehr gut bei allen "Standard"-Aufl�sungen (also um die 1680x1050).

Ich werde beide Methode anbieten in meiner Library, einmal f�r den "Extrem-User", der riesige Bilder analysieren lassen m�chte und einmal f�r den Durchschnittsnutzer, der nur seinen Bildschirm begutachten will.

Danke an alle, vor allem an MrDami123, ohne deinen Ansatz w�re ich nie auf die �berlappungsmethode gekommen. Danke dir :)

Edit2:
Setzt man den �berlappungswert auf 2.2 kriegt man ca. 80ms f�r ein 1680*1050 Bild hin und die Erkennungswerte sind weiterhin echt Spitze.

11/30/2015 13:26 MrDami123#12

Ja super, freut mich das es so gut klappt! :)