Searching fast colisionfree one-way function

09/13/2015 16:45 Shadow992#1

Heyho guys,

my question is quite easy but it seems like the answer is really hard (maybe impossible to solve at all?).

I am searching for a colisionfree fast one way function. This function does not have to be very secure. A simple "Factorization" of givens number would be enough if we could make it colisionfree.

It is really important that I can guarantee no colisions at all or just very very few colisions (if no colisions is not possible).
The second really important thing is speed. The function must be as fast as possible.
Security is nearly unimportant because if breaking one "hash" would take about 2-5mins this is enough. If you want to break the "complete Problem" you would have to calculate 100 to 200 hashes which then will take around 200 to 1000mins and this is really more than enough.
Even 10mins for 100 "succesfully breaks" would be enough.

I know there are several really good and fast perfect hashing algorithms.
But the problem is I dont know the set of inputs.

How exactly I want to use it, is this way:

1. Input of my program will be a set of strings (length can vary between few chars and 100 and more chars). They will all be given as plaintext. So at this moment I could use a perfect hash.
2. After hashing all strings I will write them to a file, each "hashed" value will get a new line.

Then Ive got a second program which I want to spread with my generated text file.

The input of the second program will be a concrete word.
This program now calculates the hash and searches for this hash in my generated text file.
The problem is, the user should be able to add new hashed values, too.
So at this moment I am not longer able to use a perfect hash.

Why cant I use an encrypted database or something similiar?
The answer is quite simpel:
The second programm will be open source, so if I use a fixed password/username/etc. for encryption/authentification everyone could easily read all hashes and their corresponding values of database or decrypt text file easily.

So does anyone know a fast and colisionfree (at least nearly colisionfree) one way function for strings (but for ints its ok too then ill group chars up to an int)?

What I thought about was something of that:
Just multiply the value of each character with a variable, e.g.:

PHP Code:


			
var=new BigNum();
for (i=0;i<stringLength;i++)
{
   factorized.push(DoFactorization(str[i]));
   var*=str[i];
}
// do something with factorized numbers
// solving factorization of calculated bignum is really hard
// but solving factorization for my small numbers is quite easy so it should be fast

This function is not colisionfree at all. So I thought Ill use the generated value as key for an encryption algorithm.

But this wont guarantee me colisionfreeness, too.
Because 2 different key with different plaintext may result in the same "hashed" value.

So does anyone have got a good suggestion?
Will e.g. using SHA256 and appending length of original string give me enough "colisionfreeness" to securely do searching for strings in the way I want to do it? Even if it would fit my needs. Generating a 256Bit number for strings with only one character isnt what i really want to do, but ok if there are no other solutions. And even if this is the only solution there is one more problem:
I would need a copyrightfree/zlib-licensed version of this hash function.

Just to note:
There will be many of these text files generated (I think around 1.000.000 of these files and more when time goes on). So hash must be extremely good for nearly any combination of strings from around 1 char to 1000 chars. There will be around (when user used second program completely) 1000 words/hashed values in the generated text file.

Thanks in advance for any suggestion. :)

09/13/2015 21:01 warfley#2

Ich bin jetzt mal ganz dreist und antworte in Deutsch.

Du suchst also schlicht und ergreifend eine Funktion die zwar Injektiv ist, aber nicht invertierbar, wie du sch�n am Anfang schon vermutet hast ist das unm�glich

Quote:

Eine injektive Funktion f : M → N l�sst sich invertieren, denn zu jedem y ∈ f(M) existiert genau ein x ∈ M mit y = f(x).

[Only registered and activated users can see links. Click Here To Register...]

Das hei�t du musst deine Bed�rfnisse runter schrauben auf einen Hash (wie du selbst schon gemerkt hast). Und da verstehe ich nicht warum du kein bekanntes Hash verfahren verwenden willst/kannst. Etwas besseres was die Anzahl an Kollisionen betrifft wirst du wohl nicht finden k�nnen.

Jeder k�nnte hier jetzt versuchen ein Hashverfahren sich auszudenken, aber besser als aktuelles SHA Hashing wird nichts davon sein.

PS: Und bezeichne bekannte verfahren bitte nicht als perfect Hash, in ein paar Jahren sind die auch schon outdated, die Hash Algorithmen sind nur aktuell gut, das zeigt auch sch�n der Werdegang von MD5, dem Algorithmus von dem mal lange dachte er h�tte keine Kollisionen, bis er nun in der Versenkung f�r unbrauchbare Hashs verschwunden ist.
Und auch heute l�uft bereits die suche nach einem SHA 6 Algorithmus um den aktuellen SHA 5 abzul�sen wenn dieser nicht mehr gut ist

09/14/2015 00:45 Shadow992#3

Quote:

Originally Posted by warfley

Ich bin jetzt mal ganz dreist und antworte in Deutsch.

Du suchst also schlicht und ergreifend eine Funktion die zwar Injektiv ist, aber nicht invertierbar, wie du sch�n am Anfang schon vermutet hast ist das unm�glich

[Only registered and activated users can see links. Click Here To Register...]

Das hei�t du musst deine Bed�rfnisse runter schrauben auf einen Hash (wie du selbst schon gemerkt hast). Und da verstehe ich nicht warum du kein bekanntes Hash verfahren verwenden willst/kannst. Etwas besseres was die Anzahl an Kollisionen betrifft wirst du wohl nicht finden k�nnen.

Jeder k�nnte hier jetzt versuchen ein Hashverfahren sich auszudenken, aber besser als aktuelles SHA Hashing wird nichts davon sein.

PS: Und bezeichne bekannte verfahren bitte nicht als perfect Hash, in ein paar Jahren sind die auch schon outdated, die Hash Algorithmen sind nur aktuell gut, das zeigt auch sch�n der Werdegang von MD5, dem Algorithmus von dem mal lange dachte er h�tte keine Kollisionen, bis er nun in der Versenkung f�r unbrauchbare Hashs verschwunden ist.
Und auch heute l�uft bereits die suche nach einem SHA 6 Algorithmus um den aktuellen SHA 5 abzul�sen wenn dieser nicht mehr gut ist

Mit Perfect Hash ist auch wirklich die Gruppe der "Perfect Hashes" gemeint. ;)
Z.b.
[Only registered and activated users can see links. Click Here To Register...]
Oder
[Only registered and activated users can see links. Click Here To Register...]

Nur verbieten mir 90% der perfect Hashes den Eingaberaum dynamisch zu erweitern ohne alle ungehashten Strings zu haben, was ich ja eben vermeiden m�chte.
Mir scheint aber wohl, dass das die Einzige sowohl umsetzbare als auch von der Geschwindigkeit her beste L�sung ist. Dann werde ich wohl auf das dynamischen Hinzuf�gen von neuen Strings verzichten m�ssen.

Mit der Injektivit�t hast du vollkommen recht. Tats�chlich geht es mir auch nicht um darum, dass die Funktion nicht invertierbar ist, sondern es ausreichend schwer ist die Invertfunktion zu finden.

Als Beispiel kann man hier die Multiplikation von x sehr gro�en Primzahlen hernehmen. Oder es reichen sogar 2, wobei die anschlie�ende Aufgabe daraus besteht die Primfaktorzerlegung dieser entstehenden Zahl zu ermitteln.

Die Faktorisierung von einer sehr gro�en Zahl N l�sst sich nur mit pseudopolynomiellen Aufwand finden.
Habe ich jedoch diese gro�e Zahl N bereits vorfaktorisiert (auf Zahlen kleiner gleich 256) ist das Finden der endg�ltigen Faktorisierung ein Scherz.

�hnliches gilt f�r die Rabin-Funktion x^2 % n, wobei n eine Zahl bestehend aus der Multiplikation zweier Primzahlen p und q ist.

Es gibt also mehr als genug solcher "Funktionen" das Einzige was ich suche ist eine Funktion, die kolisionsfrei ist.

Angeblich soll die folgende Funktion kolisionsfrei sein und schwer umkehrbar:
z^x mod n, wobei n wieder p*q ist und z bzw. x beliebig aber gro� sein sollten. Aber mir erscheint auch nach l�ngerem Nachdenken keine Variante einzufallen, welche nicht entweder zu einfach umzukehren ist (n�mlich wenn n > z^x f�r alle z,x) oder aber es doch zu Kolisionen kommen kann (zumindest theoretisch und in meinem Kopf).

Die "Standard"-Hashes reichen mir nicht weil ich garantieren muss, dass in den 1000 gehashten W�rtern keine Hashes doppelt vorkommen. Da geht es nicht um "Naja dann dauert es halt ein paar Sekunden l�nger bei wenigen Ausnahmen" sondern da geht es um ein "2x derselbe Hash und das ganze Programm funktioniert nicht mehr". Tats�chlich will ich aber unbedingt vermeiden, dass der Hash ein m�glicher Fehlerherd sein k�nnte. Das Programm soll nicht wegen 2x denselben Hash (und selbst wenn es nur bei jedem 100.000 mal ausf�hren ist) kaputt gehen.

Ich will den Leuten, die das Programm benutzen garantieren k�nnen, dass egal wie oft sie das Programm starten, solange sie nichts am Programm �ndern es immer gleich funktionieren wird. Egal welche Strings jetzt gehasht wurden.

Edit:
W�re ein Public-Key-Verfahren in welchem ich lediglich den privaten Schl�ssel mitliefere nicht auch eine M�glichkeit? Ich bin mir gerade unsicher ob man auf Basis vom privaten Schl�ssel den �ffentlichen Schl�ssel berechnen kann, ich gehe aber stark davon aus.

09/14/2015 11:14 ComputerBaer#4

Quote:

Originally Posted by Shadow992

Edit:
W�re ein Public-Key-Verfahren in welchem ich lediglich den privaten Schl�ssel mitliefere nicht auch eine M�glichkeit? Ich bin mir gerade unsicher ob man auf Basis vom privaten Schl�ssel den �ffentlichen Schl�ssel berechnen kann, ich gehe aber stark davon aus.

Aus dem privaten Schl�ssel kann man den �ffentlichen erzeugen, aus dem �ffentlichen aber nicht den privaten. Wenn du also den privaten Schl�ssel auslieferst, kannst du auch gleich komplett auf die Verschl�sselung verzichten.

Deinem Open-Source-Programm w�rde auch der �ffentliche Schl�ssel reichen, es soll ja nur verschl�sseln k�nnen.

Allerdings darf dein anderes Programm entweder nicht auf dem PC des Nutzers laufen (also z.B. eine Webseite) oder zumindest nicht den privaten Schl�ssel enthalten (das muss auf deinem Server geschehen). Ansonsten ist es m�glich den privaten Schl�ssel aus deinem Programm zu extrahieren und der ganze Schutz ist nutzlos. Edit: Das Programm verschl�sselt doch auch nur, es reicht also auch hier der �ffentliche Schl�ssel. Den privaten Schl�ssel k�nntest du also im grunde wegwerfen, nachdem du ihn erstellt hast.

---

Ich wei� jetzt nicht genau worum es geht, also sage ich einfach was ich mir grade denke:
Der Benutzer auf dessen PC beide Programme laufen sollte den Inhalt der verschl�sselten Datei kennen, immerhin hat er sie eingegeben, soweit richtig? Und dein Schutz soll verhindern das jemand einfach an den Inhalt kommt, weil er als "Passwort" f�r das zweite Programm dient, oder? Jedenfalls irgendwas in der Richtung, ist auch egal.

Du k�nntest dar�ber nachdenken, vielleicht f�r jeden Benutzer ein eigenes Schl�sselpaar zu generieren, dass sich dann nur auf diesem PC befindet. Wenn du den privaten Schl�ssel dann noch mit einem Passwort sicherst, das der Benutzer festlegt oder du zuf�llig erzeugst und dann wegwirfst, sollte nicht mehr viel geschehen k�nnen. Der Benutzer muss dann nur jedes mal wenn er Werte mit dem privaten Schl�ssel hinzuf�gen will das Passwort eingeben, zur �berpr�fung durch das zweite Programm mit dem �ffentlichen Schl�ssel ist das Passwort nicht notwendig. Edit: Der Benutzer muss dann in keinem der beiden Programme das Passwort eingeben, da ja beide Programme nur verschl�sseln, aber keines die Daten entschl�sselt.

Auf diese Art ist das Schl�sselpaar am Sichersten. Wenn das �ber einen Server von dir l�uft, k�nnte jemand den Server knacken und den Schl�ssel entwenden, ob der dann ein Passwort hat oder nicht spielt da keine Rolle, das steht da ja auch irgendwo.

Edit: Das war doch mal ein umfangreicher Denkfehler bei mir, daf�r k�nnte es dein Problem gel�st haben.

09/14/2015 12:12 Shadow992#5

Quote:

Originally Posted by ComputerBaer

Aus dem privaten Schl�ssel kann man den �ffentlichen erzeugen, aus dem �ffentlichen aber nicht den privaten. Wenn du also den privaten Schl�ssel auslieferst, kannst du auch gleich komplett auf die Verschl�sselung verzichten.

Deinem Open-Source-Programm w�rde auch der �ffentliche Schl�ssel reichen, es soll ja nur verschl�sseln k�nnen.

Allerdings darf dein anderes Programm entweder nicht auf dem PC des Nutzers laufen (also z.B. eine Webseite) oder zumindest nicht den privaten Schl�ssel enthalten (das muss auf deinem Server geschehen). Ansonsten ist es m�glich den privaten Schl�ssel aus deinem Programm zu extrahieren und der ganze Schutz ist nutzlos. Edit: Das Programm verschl�sselt doch auch nur, es reicht also auch hier der �ffentliche Schl�ssel. Den privaten Schl�ssel k�nntest du also im grunde wegwerfen, nachdem du ihn erstellt hast.

Oh das klingt nach einer ziemlich geilen L�sung. :D
Ich glaube den Weg sollte ich tats�chlich weiterverfolgen. Ich hatte in Erinnerung, dass man den privaten Schl�ssel zum Verschl�sseln braucht und den �ffentlichen zum Entschl�sseln.

Quote:

Originally Posted by ComputerBaer

Ich wei� jetzt nicht genau worum es geht, also sage ich einfach was ich mir grade denke:
Der Benutzer auf dessen PC beide Programme laufen sollte den Inhalt der verschl�sselten Datei kennen, immerhin hat er sie eingegeben, soweit richtig? Und dein Schutz soll verhindern das jemand einfach an den Inhalt kommt, weil er als "Passwort" f�r das zweite Programm dient, oder? Jedenfalls irgendwas in der Richtung, ist auch egal.

Sowohl das Erste als auch das Zweite Programm sollen open source werden.
Das triffts relativ gut. Genaugenommen geht es darum, dass es einen Benutzer geben wird, der mit Programm #1 die Text-Datei generiert und in diese Datei bestimmte "Namen/W�ter/Funktionen" eingeben kann.
Anschlie�end kann er Programm #2 mit der generierten Datei weiterverbreiten, sodass andere Leute (ohne Wissen/Erfahrung) dieses "Pack" einfach verwenden k�nnen.
Daher ist es auch enorm wichtig, dass der Fehlerherd auf keinen Fall die Text-Datei ist, weil den "Entwicklern" kann ich vielleicht noch erkl�ren was eine Kolision ist bzw. warum es nicht funktioniert.
Aber erkl�re das mal Laien, die einfach nur das Programm benutzen wollen, mehr nicht.
Die "Verschl�sselung"/das "Hashing" soll verhindern, dass man "einfach so" den Klartext der Textdatei kopieren kann und es in seine eigenen Projekte verwendet.
Da ich bei dieser Datei nichts "parsen" muss, sondern nur schauen muss ob die vom (Laien-)Benutzer eingegebene Funktionen/etc. existieren und herausfinden muss an welcher Stelle sie existieren, muss ich das Ganze nie wieder entschl�sseln, nicht einmal zum Bearbeiten (im besten Falle).

Da das Ganze nur ein "relativ" einfacher Schutz sein soll reicht mir sowohl eine geringe Sicherheitsstufe als auch Komplexit�t des Algorithmuses aus.
Das Ganze soll es einfach nicht mehr lohnenswert machen, dass man den Inhalt kopiert, weil man f�r eine einzige Datei 10min aufw�rts braucht.
Diese Text-Datei ist n�mlich nur ein relativ unbedeutender Teil des Ganzen, weswegen man dann lieber mit den "kryptischen" (sprich den gehashten Values) weiterarbeitet als da 10min auf ein Ergebnis zu warten.

Quote:

Originally Posted by ComputerBaer

Du k�nntest dar�ber nachdenken, vielleicht f�r jeden Benutzer ein eigenes Schl�sselpaar zu generieren, dass sich dann nur auf diesem PC befindet. Wenn du den privaten Schl�ssel dann noch mit einem Passwort sicherst, das der Benutzer festlegt oder du zuf�llig erzeugst und dann wegwirfst, sollte nicht mehr viel geschehen k�nnen. Der Benutzer muss dann nur jedes mal wenn er Werte mit dem privaten Schl�ssel hinzuf�gen will das Passwort eingeben, zur �berpr�fung durch das zweite Programm mit dem �ffentlichen Schl�ssel ist das Passwort nicht notwendig. Edit: Der Benutzer muss dann in keinem der beiden Programme das Passwort eingeben, da ja beide Programme nur verschl�sseln, aber keines die Daten entschl�sselt.

Auf diese Art ist das Schl�sselpaar am Sichersten. Wenn das �ber einen Server von dir l�uft, k�nnte jemand den Server knacken und den Schl�ssel entwenden, ob der dann ein Passwort hat oder nicht spielt da keine Rolle, das steht da ja auch irgendwo.

Edit: Das war doch mal ein umfangreicher Denkfehler bei mir, daf�r k�nnte es dein Problem gel�st haben.

Direkt speichern auf dem PC geht auf Grund meiner Erkl�rung weiter oben nat�rlich nicht. Aber das macht nichts, ich kann einfach in meine "Konfigurations"-Datei, die mit verschickt/generiert wird den public Key speichern lassen, damit hat jeder Benutzer einen anderen private/public Key (oder zumindest viele) und damit w�rde auch das Herausfinden eines einzigen private Keys nicht automatisch die Sicherheit aller im Umlauf befindlichen Dateien beeinflussen.

Ich denke tats�chlich, dass das die Beste L�sung ist. :)
Danke f�r eure Hilfe, vielleicht f�llt jemanden (nur Interessehalber) doch noch eine gute daf�r geeignete One-Way-Funktion ein. :D

Edit:
Ein tolles Feature daran ist auch noch, dass der Entwickler jetzt mit Hilfe des private Keys seine Text-Datei wieder herstellen kann, sollte er die original W�rter/Funktionen verloren haben.
Top das gef�llt mir sehr gut. :)

09/14/2015 13:56 MrSm!th#6

Quote:

Angeblich soll die folgende Funktion kolisionsfrei sein und schwer umkehrbar:
z^x mod n, wobei n wieder p*q ist und z bzw. x beliebig aber gro� sein sollten. Aber mir erscheint auch nach l�ngerem Nachdenken keine Variante einzufallen, welche nicht entweder zu einfach umzukehren ist (n�mlich wenn n > z^x f�r alle z,x) oder aber es doch zu Kolisionen kommen kann (zumindest theoretisch und in meinem Kopf).

Da RSA auf diesem Problem aufbaut, kannst du davon ausgehen, dass es schwierig genug ist. Allerdings m�ssen die Primzahlen daf�r verdammt gro� sein (RSA Keys sind mind. 2048 Bit lang, um als sicher/unknackbar zu gelten). Es ist allerdings auch verdammt langsam im Vergleich zu symmetrischen Verfahren wie AES.

Prinzipiell ist es aber durchaus korrekt. Man nehme ein beliebiges Public-Key-Verfahren (wie z.B. RSA), teile den Private-Key niemandem mit (offenbar ist Entschl�sselung keine Anforderung) und fertig ist die kollisionsfreie Einwegfunktion. Ein Hash ist das dann nicht mehr, weil die Ausgabedaten genau so gro� sind wie die Eingabedaten, aber das ist auch der einzige Weg, wie es absolut kollisionsfrei bleiben kann.

Quote:

Die "Standard"-Hashes reichen mir nicht weil ich garantieren muss, dass in den 1000 gehashten W�rtern keine Hashes doppelt vorkommen. Da geht es nicht um "Naja dann dauert es halt ein paar Sekunden l�nger bei wenigen Ausnahmen" sondern da geht es um ein "2x derselbe Hash und das ganze Programm funktioniert nicht mehr". Tats�chlich will ich aber unbedingt vermeiden, dass der Hash ein m�glicher Fehlerherd sein k�nnte. Das Programm soll nicht wegen 2x denselben Hash (und selbst wenn es nur bei jedem 100.000 mal ausf�hren ist) kaputt gehen.

F�r SHA-512 (und das ist gerade mal SHA2) sind bisher keine Kollisionen gefunden worden und damit wird weltweit ein Vielfaches der Datenmenge von ein 100.000 W�rtern gehasht. Unz�hlige Anwendungen bauen auf der Annahme auf, dass kein Hash doppelt vorkommt und funktionieren bis heute. Wenn du eine Kollision f�r SHA2 finden solltest, kannst du dich auf diverse Interviewanfragen der Fachpresse gefasst machen. Damit d�rftest du recht schnell sehr bekannt im Gebiet der Kryptologie werden.

Entweder beh�ltst du die L�nge der Eingabedaten bei, dann hast du de facto eine Verschl�sselung anstatt einer Hashfunktion. Oder du hashst die Daten, hast dann aber die - theoretisch vorhandene, aber sehr unwahrscheinliche - M�glichkeit einer Kollision. Eine bessere Hashfunktion mit geringerer Kollisionswahrscheinlichkeit als aktuelle Standards wirst du wahrscheinlich nicht einfach mal so finden. Falls doch, siehe meine Aussage zu den Interviewanfragen.

Ein asymmetrisches Verschl�sselungsverfahren passt eigentlich am besten zu deinen Anforderungen, w�re jedoch vergleichsweise langsam (wobei es bei dir auch keine >2048 Bit Keys sein m�ssten, 1024 reichen locker). Einen SHA-Hash zu berechnen geht dagegen recht schnell, denn auf Geschwindigkeit sind derartige Verfahren ausgelegt, da hast du dann aber wieder das geringe Restrisiko, dass es Kollisionen geben wird.

Quote:

W�re ein Public-Key-Verfahren in welchem ich lediglich den privaten Schl�ssel mitliefere nicht auch eine M�glichkeit? Ich bin mir gerade unsicher ob man auf Basis vom privaten Schl�ssel den �ffentlichen Schl�ssel berechnen kann, ich gehe aber stark davon aus.

Umgekehrt, du teilst nur den �ffentlichen Schl�ssel mit und verwirfst den privaten. Das ist dann das, was ich oben geschildert habe.

Edit:

Meh, ich h�tte erst zuende lesen sollen. Ich lasse die teilweise redundanten Informationen trotzdem mal stehen.

Quote:

Ich glaube den Weg sollte ich tats�chlich weiterverfolgen. Ich hatte in Erinnerung, dass man den privaten Schl�ssel zum Verschl�sseln braucht und den �ffentlichen zum Entschl�sseln.

Es spielt f�r das Verfahren keine Rolle. Du kannst sowohl den �ffentlichen als auch den privaten Schl�ssel zur Verschl�sselung verwenden, solange dann der jeweils andere Schl�ssel zur Entschl�sselung verwendet wird. Das funktioniert in beide Richtungen.
Es ist nur wichtig, dass der private Schl�ssel privat bleibt, da man aus ihm den �ffentlichen berechnen kann. Ob du nun willst, dass die �ffentlichkeit nur entschl�sseln oder nur verschl�sseln kann, h�ngt vom Anwendungsfall ab (bei Zertifikaten w�rdest du z.B. mit dem privaten Schl�ssel verschl�sseln bzw. signieren und mit dem �ffentlichen entschl�sseln bzw. die Signatur �berpr�fen).

09/14/2015 13:58 Serraniel#7

Was das private public Key Verfahren angeht kann man mit beiden Schl�ssen "verschl�sseln", je nachdem was man braucht.
Ich will jetzt nicht mit Alice und Bob anfangen da ich denke, dass dir die Kurzform ausreicht bei deinen Kenntnissen:
Wenn du eine Nachricht verschl�sseln willst, dass nur der Empf�nger sie lesen kann, verschl�sselst du die Nachricht mit dem public key des Empf�ngers.
Wenn es dir um Authentizit�t/Signatur geht, kannst du die Nachricht mit deinem private key verschl�sseln. Diese kann man dann mit deinem public key entschl�sseln (und zwar jeder). Damit stellt man sicher, dass auch wirklich du der Absender warst, da nur du deinen private key kennst.

Und beide Anwendungen haben gemeinsam, dass der private key nur dir bekannt ist.

09/14/2015 14:43 Shadow992#8

Quote:

Originally Posted by MrSm!th

Da RSA auf diesem Problem aufbaut, kannst du davon ausgehen, dass es schwierig genug ist. Allerdings m�ssen die Primzahlen daf�r verdammt gro� Sein (RSA Keys sind mind. 2048 Bit lang, um als sicher zu gelten). Es ist allerdings auch verdammt langsam im Vergleich zu symmetrischen Verfahren wie AES.

Prinzipiell ist es aber durchaus korrekt. Man nehme ein beliebiges Public-Key-Verfahren (wie z.B. RSA), teile den Private-Key niemandem mit (offenbar ist Entschl�sselung keine Anforderung) und fertig ist die kollisionsfreie Einwegfunktion. Ein Hash ist das dann nicht mehr, weil die Ausgabedaten genau so gro� sind wie die Eingabedaten, aber das ist auch der einzige Weg, wie es kollisionsfrei bleiben kann.

F�r SHA-512 (und das ist gerade mal SHA2) sind bisher keine Kollisionen gefunden worden und damit wird weltweit ein Vielfaches der Datenmenge von ein 100.000 W�rtern gehasht. Wenn du eine Kollision f�r SHA2 finden solltest, kannst du dich auf diverse Interviewanfragen der Fachpresse gefasst machen. Damit d�rftest du recht schnell sehr bekannt im Gebiet der Kryptologie werden.

Ich wei� nicht, wie du darauf kommst, dass du etwas Besseres finden wirst als alle anderen Kryptoanalytiker der Welt, aber du kannst von Folgendem ausgehen:

Entweder du verzichtest auf die Einweg-Eigenschaft oder auf die geringere Kollisionswahrscheinlichkeit.
Hei�t: Entweder beh�ltst du deine eindeutigen Werte, indem du diese direkt oder verschl�sselt (und eben nicht gehasht) in deine Datei schreibst oder du machst deine eigene Hashfunktion, die dann aber eine h�here Kollisionswahrscheinlichkeit haben wird.
Den dritten Fall, n�mlich, dass du eine ausreichend sichere Einwegfunktion mit geringerer Kollisionswahrscheinlichkeit als die der aktuellen Standards findest, wird es h�chstwahrscheinlich nicht geben. Wenn doch, siehe oben.

Aktuell klingt es f�r mich danach, dass ein Verschl�sselungsverfahren hier angebrachter w�re, weil es keine Hashfunktion geben kann, die beliebige Daten in einen Hash aus einer begrenzten Wertemenge umwandeln, ohne dass Kollisionen auftauchen. Allerdings m�sstest du daf�r den Schl�ssel verf�gbar machen, es sei denn, du entscheidest dich f�r ein asymmetrisches Verfahren. Das w�rde alle bisher von dir genannten Anforderungen erf�llen, w�re jedoch vergleichsweise langsam. Einen SHA-Hash zu berechnen geht dagegen recht schnell, denn auf Geschwindigkeit sind derartige Verfahren ausgelegt (da hast du dann aber wieder die - wenn auch sehr sehr unwahrscheinliche - M�glichkeit, dass es Kollisionen geben wird).

Darf man nach mehr Details zu deinem Anwendungsfall fragen? Vielleicht l�sst sich dein Problem anders l�sen.

Umgekehrt, du teilst nur den �ffentlichen Schl�ssel mit und verwirfst den privaten. Das ist dann das, was ich oben geschildert habe.

Naja 95% der Hashe reizen ja einen "Weg" komplett aus.
Entweder sie sind auf enorme Geschwindigkeit ausgelegt (wie z.B. Hashing-Verfahren f�r Hashtables) oder auf enorme Sicherheit und dennoch einigerma�en schnell (SHA2, etc.) oder aber auf Kolisionsfreiheit+Geschwindigkeit (f�r gro�e Datenbanken z.B. perfect Hashing).
Was ich aber brauche ist etwas, das weder besonders sicher sein muss (aber auch nicht in Bruchteilen einer Millisekunde umkehrbar ist), noch au�erordentlich schnell sein muss (klar je schneller desto besser, aber es gibt kein "Totschlag"-Kriterium bei der Zeit), daf�r aber Kolisionsfreiheit garantieren kann.
Anwendungsgebiete f�r derartige Algorithmen gibt es meiner Meinung nach relativ wenige, weswegen es dazu wohl auch nur wenige Leute geben wird, die sich mit den Anforderungen n�her besch�ftigen.
Daher war ich eigentlich davon �berzeugt, dass ich mir zumindest teilweise selbst etwas einfallen lassen muss (und bisher kennt ja auch niemand eine derartige Funktion oder kann mir gewiss sagen, dass es soetwas nicht gibt, was meine Vermutung wohl best�tigt).

Konkret geht es um eine Art Schutz f�r meinen Interpreter.
Dem Problem, welchem ich momentan gegen�ber stehe ist folgendes:

Ich m�chte, dass man Befehle von einem Server empfangen kann und diese mein Interpreter anschlie�end auch ausf�hren kann. In PseudoCode-C++ also in etwa so:

PHP Code:


			
void myOwnFunc(int param1)
{
  // Do something
}

int main()
{
  string str=DownloadCommands("http ...");
  // in str k�nnte z.b. folgendes drin stehen: "myOwnFunc(21)"
  interpretCommand(str);
}

Mein Interpreter l�uft einmalig bevor er einen Befehl ausf�hrt �ber das komplette Skript und schreibt sich die Zeile+Namen der Funktion in eine Map, damit wenn jemand sp�ter "interpretCommand" aufruft die Zuordnung eindeutig und schnell passiert.

Es ist also wichtig, dass der Interpreter auch Funktionen, die als String gegeben sind interpretieren kann. Gleichzeitig m�chte ich aber eigentlich ein "Umbenennen" der Funktionen durchf�hren, damit R�ckschl�sse auf den Funktionsnamen nicht mehr einfach so m�glich ist.

F�r die Strings, die fest in den zu interpretierenden Code integriert sind ergibt sich dadurch keinerlei Probleme, die k�nnte ich einfach mit umbenennen Probleme gibt es nur wenn mein Pseudo-C++-Code von oben in das umgewandelt wird:

PHP Code:


			
void asdiuhuawdkjasdj(int param1)
{
  // Do something
}

int main()
{
  string str=DownloadCommands("http ...");
  // in str k�nnte z.b. folgendes drin stehen: "myOwnFunc(21)"
  interpretCommand(str);
}

In meiner Interpreter-Map wird jetzt anschlie�end nur der Eintrag "asdiuhuawdkjasdj" existieren, der Programmierer hatte seine Funktion aber "myOwnFunc" gennant weswegen er auch erwartet, dass er sie von au�en per Texteingabe o.�. mit diesem Namen aufrufen kann.

Dem Programmierer jetzt aber die Last auf zu erlegen, dass er die umbenannten Funktionen benutzt anstatt der normalen f�nde ich mehr als unangenehm.

Deswegen brauche ich ein Mapping von "Normal" -> "Umbenannt".
Da ich sowohl den Interpreter als auch den Compiler Open-Source machen will kann ich die Schiene "Security by Obscurity" zumindest bezogen auf meinen Compiler/Interpreter-Code vergessen.

Ich denke jetzt erkennt man auch warum die Sicherheitsstufe nicht sehr wichtig ist. Denn wenn jemand 10 oder mehr Minuten wartet bis er alle Funktionen "zur�ckgewandelt" hat, dann hat er es wirklich mehr als verdient die original Funktionen zu sehen. Vor allem weil die original Namen nat�rlich nur einen relativ kleinen Teil des Codes darstellen. Die restlichen H�rden, wie variablen Umbenennungen etc. sind unumkehrbar gemacht, das hei�t effektiv gesehen bringt es nicht so gigantisch viel 10min in das reversen der Namen zu stecken.

Dass jedoch SHA2 bisher so "kolisionsfrei" ist, wusste ich nicht. Dennoch w�rde da das Problem bestehen bleiben, dass Namen mit 2 Buchstaben pl�tzlich 256Bit und mehr lang sind (je nach Version), was sich nat�rlich negativ auf die Datei-Gr��e auswirkt und ich deswegen umgehen will.

Mir scheint also die asymmetrische Verschl�sselung als perfekt. Garantierte Kolisionsfreiheit und variable L�nge sind genau die 2 Sachen, die mir enorm wichtig sind. Selbst wenn es bei SHA2 bisher noch keine Kolisionen gab und man auch noch ewig nach welchen sucht, ist mir die Garantie doch viel mehr Wert.

Vor allem weil bei einem Hash, der definitionsgem�� eine feste L�nge besitzen muss, immer Kolisionen vorhanden sind, ob man es schafft genau diese Eingaben zu generieren ist nat�rlich eine andere Sache, aber es gibt sie theoretisch.

Quote:

Originally Posted by Serraniel

Was das private public Key Verfahren angeht kann man mit beiden Schl�ssen "verschl�sseln", je nachdem was man braucht.
Ich will jetzt nicht mit Alice und Bob anfangen da ich denke, dass dir die Kurzform ausreicht bei deinen Kenntnissen:
Wenn du eine Nachricht verschl�sseln willst, dass nur der Empf�nger sie lesen kann, verschl�sselst du die Nachricht mit dem public key des Empf�ngers.
Wenn es dir um Authentizit�t/Signatur geht, kannst du die Nachricht mit deinem private key verschl�sseln. Diese kann man dann mit deinem public key entschl�sseln (und zwar jeder). Damit stellt man sicher, dass auch wirklich du der Absender warst, da nur du deinen private key kennst.

Und beide Anwendungen haben gemeinsam, dass der private key nur dir bekannt ist.

Dankesch�n f�r die kurze Aufkl�rung. :)