Problem mit der Parameter�bergabe f�r Inline-ASM in Interpreter-Sprache

08/18/2015 21:51 Shadow992#1

Ich bin momentan dabei Inline-Assembler in meinen Interpreter zu integrieren.

Wichtig dabei ist, dass ich den ASM-Code m�glichst nur einmalig und m�glichst vor dem "Kompilieren" in Opcodes �bersetzen m�chte.
Bei ASM-JIT-Kompilierung g�be es mein beschriebenes Problem gar nicht. Aber JIT soll wirklich der letzte Ausweg sein. Ein Notfallplan sozusagen.

Meine Ursprungsidee war einfach und sollte prinzipiell auch klappen.
Sobald mein Interpreter die Stelle des Opcodes erreicht schreibt er ihn in einen Bereich der ausf�hrbar ist und springt ihn an, anschlie�end wird zur�ckgesprungen.

Ein Problem gibt es jetzt nur wenn ich mit dem Code-St�ck kommunizieren m�chte.
Meine Anfangsidee war "einfach" die Werte auf den Stack zu pushen, die ich verwenden m�chte und im ASM-Code muss ich sie dann nur poppen.

Pseudocode m��ig also so:

PHP Code:


			
ByteArray var = #CompileASM("Pop edx \n Pop ecx \n add edx,ecx")



int var2=10

int var3=20



Push(var2)

Push(var3)



Execute(var)

Das Problem dabei ist, dass mein Interpreter ja erst Push interpretieren muss, weswegen ich nicht wei� ob der Stack bis zum Execute nicht schon wieder zugem�llt ist.
Eine Idee, die ich dann hatte war einen extra Speicherbereich zu allokieren f�r meinen eigenen Stack.
Also in etwa so:

PHP Code:


			
ByteArray var = #CompileASM("Pop edx \n Pop ecx \n add edx,ecx")



int var2=10

int var3=20



int adresse = VirtualAlloc(...)

int alteAdresse

asm

{

    mov alteAdresse, esp

    mov esp, adresse 

}

Push(var2)

Push(var3)

asm

{    

    mov esp, alteAdresse

}



asm

{

    mov esp, adresse 

}

Execute(var)

Aber hier liegt das Problem jetzt, dass ich nicht wei� ob mein Interpreter beim Interpretieren vom "Push" Werte von meinem alten Stack braucht.

Da ich vollen Zugriff auf den zu generierenden ASM-Code habe kann ich auch automatisiert beliebig ASM-Code einf�gen lassen falls n�tig.

Momentan benutze ich zum Compilen w�hrend dem "Compilen von meinem Skriptcode" FASM, um den ASM-Code in den entsprechenden Opcode umzuwandeln.
Wie gesagt w�rde ich das Ganze JIT machen, k�nnte ich einfach den Pointer zu den Variablen reinschreiben lassen in den ASM-Code und dann compilen, aber JIT will ich halt eigentlich nicht.

Hat jemand noch eine andere Idee wie ich trotzdem eine Art Parameter�bergabe machen kann?

08/19/2015 07:15 Dr. Coxxy#2

mach aus der execute funktion eine mit variablen parametern - da pushst du einfach direkt inline die parameter bevor du var aufrufst - dann kannste sicher sein, dass der stack net zwischendurch kaputtgemacht wurde.

alternativ kannst du der execute funktion einen optionalen stackparameter angeben, also quasi:

Code:

MyStack = new Stack_t();
MyStack.push(MyArg3);
MyStack.push(MyArg2);
MyStack.push(MyArg1);
exectue(var, MyStack);

und in execute dann:

Code:

push esp;
mov esp, MyStack.getPtr();
call var;
pop esp;

08/19/2015 13:17 Shadow992#3

Quote:
Originally Posted by Dr. Coxxy
mach aus der execute funktion eine mit variablen parametern - da pushst du einfach direkt inline die parameter bevor du var aufrufst - dann kannste sicher sein, dass der stack net zwischendurch kaputtgemacht wurde.

alternativ kannst du der execute funktion einen optionalen stackparameter angeben, also quasi:
Code:
MyStack = new Stack_t();
MyStack.push(MyArg3);
MyStack.push(MyArg2);
MyStack.push(MyArg1);
exectue(var, MyStack);
und in execute dann:
Code:
push esp;
mov esp, MyStack.getPtr();
call var;
pop esp;

Oh das ist eine super Idee, vor allem Variante 2 gef�llt mir sehr gut, weil ich damit gleichzeitig gewisserma�en garantieren kann, dass der ASM-Code nicht meinen Interpreter-Stack kaputt machen kann.

Danke dir ich glaube so werde ich es machen. :)

08/19/2015 18:11 Dr. Coxxy#4

Quote:

Originally Posted by Shadow992

Oh das ist eine super Idee, vor allem Variante 2 gef�llt mir sehr gut, weil ich damit gleichzeitig gewisserma�en garantieren kann, dass der ASM-Code nicht meinen Interpreter-Stack kaputt machen kann.

Danke dir ich glaube so werde ich es machen. :)

bidd�, pass auf, dass dein manueller stack genug platz f�r r�cksprungadresse, lokale variablen der funktion, etc. hat ;)

08/19/2015 20:38 Shadow992#5

Quote:

Originally Posted by Dr. Coxxy

bidd�, pass auf, dass dein manueller stack genug platz f�r r�cksprungadresse, lokale variablen der funktion, etc. hat ;)

Ich werde meinen Stack so implementieren, dass der Skripter angeben muss wie gro� der Stack sein soll, wobei ich eine Mindestgr��e von 8kb festlegen werde (sollte denke ich f�r die meisten kleinen Code-St�cke reichen).

Noch eine kleine "Styling"-Frage, mein momentaner Ansatz sieht in etwa so aus:

PHP Code:


			
    Beispielcode:
        ByteArray var = #CompileASM("Pop edx \n Pop ecx \n add edx,ecx")

        MyStack = new Stack(8000);
        MyStack.push(MyArg2);
        MyStack.push(MyArg1);

        exectue(var, MyStack);



    Stack.push-Methode(arg):
        MyStack.Last_Address+=4 // Die ersten 4 Bytes werden absichtlich leer gelassen
        mov [MyStack.Last_Address], arg



    execute-Methode(opcode,MyStack):
        mov [MyStack.Start_adress], esp // An der ersten Position von meinem Stack steht immer der original esp-Wert
        mov esp, MyStack.Last_Adress // neuen esp Wert setzen
        call opcode
        mov esp, [MyStack.Start_adress] //Wert zur�cksetzen

Sollte ich vor dem Execute Aufruf die General-Purpose-Register sichern oder sollte ich das dem Programmierer des ASM-Codes �berlassen?

F�r das automatische Sichern spricht, dass es nicht sehr fehleranf�llig ist, weil es eben automatisch passiert.

Auf der anderen Seite, wenn jemand nur eax benutzt, "verschwende" ich einige Zyklen mit dem sichern der anderen Register.

Und da man Inline-ASM wohl nur f�r sehr zeitkritische Sachen benutzt (oder f�r Sachen, die anders nur schwer umsetzbar sind, da braucht man dann aber meistens auch wenig Register), w�re ein unn�tiges Sichern nicht so optimal.

Und wo ich weiterhin sehr "skeptisch" bin ist beim Sichern der Statusregister. Theoretisch sollte der Compiler meiner Meinung nach niemals so viel Code wegoptimieren, dass er ein cmp/add/etc. vom jeweiligen jne/je/etc. "wegzieht" oder lehne ich mich da zu weit aus dem Fenster? Und sollte daher auch die Statusregister sichern (ist das �berhaupt m�glich)?

08/19/2015 22:15 Dr. Coxxy#6

Quote:

Originally Posted by Shadow992

Sollte ich vor dem Execute Aufruf die General-Purpose-Register sichern oder sollte ich das dem Programmierer des ASM-Codes �berlassen?

F�r das automatische Sichern spricht, dass es nicht sehr fehleranf�llig ist, weil es eben automatisch passiert.

Auf der anderen Seite, wenn jemand nur eax benutzt, "verschwende" ich einige Zyklen mit dem sichern der anderen Register.

Und da man Inline-ASM wohl nur f�r sehr zeitkritische Sachen benutzt (oder f�r Sachen, die anders nur schwer umsetzbar sind, da braucht man dann aber meistens auch wenig Register), w�re ein unn�tiges Sichern nicht so optimal.

fasst es eigtl schon gut zusammen, geschmackssache, im zweifel wird bei ner scriptsprache aber perfomance wahrscheinlich eh nicht sooooo ne riesenrolle spielen.

Quote:

Und wo ich weiterhin sehr "skeptisch" bin ist beim Sichern der Statusregister. Theoretisch sollte der Compiler meiner Meinung nach niemals so viel Code wegoptimieren, dass er ein cmp/add/etc. vom jeweiligen jne/je/etc. "wegzieht" oder lehne ich mich da zu weit aus dem Fenster? Und sollte daher auch die Statusregister sichern (ist das �berhaupt m�glich)?

O.o wo soll denn der compiler in deinem asm was optimieren?
compiler (zmdst der ms vcc) optimiert kein inline asm.

08/20/2015 02:47 Shadow992#7

Quote:

Originally Posted by Dr. Coxxy

fasst es eigtl schon gut zusammen, geschmackssache, im zweifel wird bei ner scriptsprache aber perfomance wahrscheinlich eh nicht sooooo ne riesenrolle spielen.

Alles klar, denke dann auch dass ich die "alles sichern"-Methode nehmenw erde.

Quote:

Originally Posted by Dr. Coxxy

O.o wo soll denn der compiler in deinem asm was optimieren?
compiler (zmdst der ms vcc) optimiert kein inline asm.

Naja gehen wir von etwas derartigen in Pseudo-C aus:

PHP Code:


			

InterpretOpcode(...)
if(i==0)
{
  i++;
}

Dann wird der Compiler es in etwa in das �bersetzen:

PHP Code:


			

push ...
call InterpretOpcode
cmp eax, 0
jne end_if
inc eax
end_if:

Wenn der Compiler aber (aus welchem Optimierungsgr�nden auch immer), das in folgenden Code umwandeln w�rde:

PHP Code:


			

cmp eax, 0
push ...
call InterpretOpcode
jne end_if
inc eax
end_if:

M�sste ich das Statusregister ebenfalls sichern, weil es ja sein kann, dass der Aufruf das Register ver�ndert.

Was ich jetzt aussagen wollte ist, dass ich bezweifle, dass die zweite (optimierte) Variante jemals so oder so �hnlich in der "freien" Natur vorkommt. :D
Oder liege ich da falsch?

08/20/2015 10:29 Jeoni#8

Das Flag-Register wird in den Konventionen, an denen sich viele Compiler (MSVC eingeschlossen) als "Caller-Saved" angesehen, da sehr viele Instructions Einfluss auf das Flag-Register nehmen. Das hei�t, dass angenommen werden muss, dass eine aufgerufene Funktion dieses Register ver�ndert. Braucht man es nach einem call noch, muss man es davor sichern und danch wiederherstellen. Hab noch nie gesehen, dass der Compiler sowas generiert.
Auch einige Register gelten als Caller-Saved. Die muss eine aufgerufene Funktion also nicht sichern. Andere Register gelten als Callee-Saved. Diese m�ssen am Ende einer Funktion den gleichen Wert wie am Anfang aufweisen.
Welches Register nun was ist, kann [Only registered and activated users can see links. Click Here To Register...] nachgesehen werden.
Mit freundlichen Gr��en
Jeoni

08/20/2015 18:40 Dr. Coxxy#9

falls du wirklich funktions�bergreifend einen gleichen kontext in deiner scriptsprache anbieten willst, sollteste dir mal angucken wie windows die threads und deren kontexte verwaltet, stichwort get/setthreadkontext und der kontext struktur angucken (findeste in der winnt.h) sowie mal bissle guglen oder windows internals lesen - da kannste dir evtl. bissle abgucken.

EDIT:
achsoo, jetzt erst dein problem verstanden - nein, solange du dich an die von jeon erw�hnten regeln innerhalb deines assemblers h�ltst, bzw. durch speichern der entsprechenden register vor ausf�hren des scriptcodes sicherstellst, dass diese beachtet werden, kriegst du keine probleme.