Anagramm Programm

01/14/2016 15:53 NRj�#1

Hi. Ich habe ein Problem mit einem Programm. Die Aufgabenstellung: Erstelle ein Programm das �berpr�ft ob 2 W�rter Anagramme sind oder nicht. Hier der Quelltext:

Spoiler

Probiert man die W�rter aab und baa oder baa und aba etc. funktioniert alles. Jedoch bei aab und abb nicht. Da zeigt es an, dass es ein Anagramm ist, obwohl das nicht stimmt. K�nnt ihr mir helfen?

01/14/2016 16:43 warfley#2

Das liegt daran das strspn nur �berpr�ft ob die zeichen vorkommen nicht ob die anzahl oder Reihenfolge stimmt. ich w�rde es etwa so machen:

Code:

int isAnagram(char[] s1, char[] s2, int length){
  for (i=0; i<length; i++) 
    if (s1[i]!=s2[length-i-1])
      return 0;
  return -1;
}

01/14/2016 17:40 Jeoni#3

Die Begr�ndung, warum dein Programm nicht funktioniert, hat warfly schon gegeben. Pr�sentiert hat er aber eine Funktion, die man eher isPalindrome nennen sollte. Sie pr�ft nur auf einen Spezialfall eines Anagramms, n�mlich dem des Palindroms.

W�rde es irgendwie so machen:

Code:

int isAnagram(const char* s1, const char* s2, unsigned int length)
{
	unsigned char chars[255]; // count of one char must not exceed 255; assume that even in a string a character can have a value of [0;255]
	memset(chars, 0, sizeof(chars));

	for (unsigned int i = 0; i < length; i++)
	{
		chars[s1[i]]++;
		chars[s2[i]]--;
	}

	for (unsigned int i = 0; i < (sizeof(chars) / sizeof(chars[0])); i++)
		if (chars[i])
			return 0;

	return -1;
}

Wenn genau die gleichen Zeichen (und die gleiche Anzahl f�r jedes dieser Zeichen) in s1 wie in s2 vorkommen, ist das array "chars" nach der ersten Schleife wieder vollst�ndig mit 0 gef�llt. Ich hoffe, es ist ungef�hr klar, was ich meine bzw. dass sich alles andere eh aus dem Quelltext erkl�rt.
Mit freundlichen Gr��en
Jeoni

01/14/2016 18:00 hazejp#4

Du k�nntest das Problem komplett ohne Schleifen l�sen:

Code:

static int compare_char(const void *x, const void *y) {
  return *((const char*)x) - *((const char*)y);
}

char is_anagram(const char *a, const char *b) {
  int lenA = strlen(a);
  char *cpA, *cpB, res;
  if (strlen(b) != lenA) return 1;
  cpA = strdup(a);
  cpB = strdup(b);
  qsort(cpA, lenA, 1, compare_char);
  qsort(cpB, lenA, 1, compare_char);
  res = strcmp(cpA, cpB);
  free(cpA);
  free(cpB);
  return res;
}

01/14/2016 18:13 Jeoni#5

Trotz scheinbarer Schleifenlosigkeit der L�sung, ist die Komplexit�t doch h�her.
Die von mir vorgeschlagene L�sung hat eine Komplexit�tsklasse von O(N). Mit einem konstanten Faktor bestehend aus der zweiten Schleife und dem memset. Also quasi O(N+c), aber meines Wissens nach schreibt man das so nicht, ist aber vllt. genauer.
Die schleifenlose L�sung hat eine Komplexit�tsklasse von O(N*log(N)) (wobei log der Logarithmus zur Basis 2 ist), durch die Verwendung von qsort. Auch hier kann man das wieder genauer spezifizieren mit O(2*N*log(N)+2N). Die 2N kommen aus dem strdup, was intern ja auch letztlich eine Schleife ist, die N mal durchlaufen wird. Die Komplexit�t von strcmp (also im worst case wieder N) kommt noch hinzu. Abgesehen von der h�heren algorithmischen Komplexit�t kostet das Allokieren (hier in strdup) und Deallokieren auch seine Zeit (allerdings unabh�ngig von der Stringl�nge N), weil dahinter ja letztlich auch irgendwelche Algorithmen sitzen, die f�r's Heap-Speichermanagement verantwortlich sind.
Auch wenn die Funktion selber tats�chlich schleifenlos ist (Unterfunktionen nicht einbezogen), wollte ich das nur mal anbringen ;)
Mit freundlichen Gr��en
Jeoni

01/14/2016 18:34 hazejp#6

Tats�chlich z�hlt mein Programm nicht zu den effizientesten. Tja, das ich habe ich nun von meiner Faulheit... �brigens ist strdup() obiges Beispiel betreffend redundant. Immerhin w�re mit richtig angesetzten Optimierungen "noch" O(N+2N*log(N)) zu erreichen :)

01/14/2016 20:19 NRj�#7

Ich dank euch Leute. Leider bin ich nicht auf dem selben Level eurer geposteten codes. So sehr wie ich es versuche sie zu verstehen, es gelingt mir nicht. Und c & p ist nicht der Sinn der Sache. :)

01/14/2016 21:35 warfley#8

Quote:

Originally Posted by Jeoni

Die Begr�ndung, warum dein Programm nicht funktioniert, hat warfly schon gegeben. Pr�sentiert hat er aber eine Funktion, die man eher isPalindrome nennen sollte. Sie pr�ft nur auf einen Spezialfall eines Anagramms, n�mlich dem des Palindroms.

Stimmt verwechsel die immer :D

Quote:

Ich dank euch Leute. Leider bin ich nicht auf dem selben Level eurer geposteten codes. So sehr wie ich es versuche sie zu verstehen, es gelingt mir nicht. Und c & p ist nicht der Sinn der Sache.

Dann versuche ich dir mal den Code von Jeoni zu erkl�ren:

Die Idee ist, ein Ansistring besteht aus Charactern, Byte gro�en Zahlen von 0 bis 255 (Siehe ASCII Tabelle). Um rauszufinden ob das Wort ein Anagramm ist m�ssen wir nur �berpr�fen ob die anzahlen aller einzelnen Buchstaben bei beiden W�rtern gleich sind. Wir z�hlen also die A's, die B's, etc.
Daf�r wird ein Array verwendet welches die Anzahlen sichert. Dieses Array ben�tigt 255 Felder (f�r die Zeichen 1..255, 0 darf sowieso nur einmal vorkommen am Ende eines Strings)

Code:

unsigned char chars[255];

der Datentyp unsigned char stellt Zahlen zwischen 0 und 255 dar, da du eh nicht mehr buchstaben in deinem Wort haben kannst reicht er v�llig aus, der typ k�nnte nat�rlich auch int sein.

Nun hat sich Jeoni in seinem Code zunutze gemacht das ein 'A' letztlich nur eine Zahl ist (65), und man dar�ber dann auf ein Array Feld zugreifen kann
So w�rde

Code:

arr['A'] = 3

eine 3 in das 65te Feld des Arrays schreiben.

Nun wird einfach in einer Schleife �ber die W�rter gelaufen.
Um nur ein Array zu verwenden wird f�r jeden Buchstaben in Wort 1 der entsprechende Counter erh�ht

Code:

chars[s1[i]]++;

und f�r jeden Buchstaben aus Wort 2 der Counter verringert

Code:

chars[s2[i]]--;

Somit, wenn die W�rter aus den selben Buchstaben bestehen muss der Counter in der Summe f�r jeden Buchstaben 0 ergeben.

das memset am Anfang ist nur daf�r da um zun�chst einmal alle Felder des Arrays zu nullen, bei Statischen Arrays ist der Speicher, welcher f�r das Array alloziiert wurde bereits beschrieben mit den werten die zuletzt dort lagen.

Ein kleiner Lauf mit den w�rtern ABC und BCA:

Code:

1. Schleifendurchgang:
chars['A']++;
chars['B']--;
Damit ist:
chars[65] == 1
und
chars[66] == -1 (255)

2. Schleifendurchgang:
chars['B']++;
chars['C']--;
Damit ist:
chars[65] == 1
und
chars[66] == 0 (-1 + 1)
und 
chars[66] == -1 (255)

3. Schleifendurchgang:
chars['C']++;
chars['A']--;
Damit ist:
chars[65] == 0 (+1 - 1)
und
chars[66] == 0 (-1 + 1)
und 
chars[66] == 0 (-1 + 1)

Die anderen Felder wurden nie verwendet, daher sind alle Felder = 0 also ist es ein Anagramm

Code:

for (unsigned int i = 0; i < (sizeof(chars) / sizeof(chars[0])); i++)
		if (chars[i])
			return 0;

	return -1;

Macht nichts anderes als zu �berpr�fen:
Gehe jedes Feld durch, ist das feld != 0 (k�rzer mit if (chars[i])) dann ist es kein Anagramm, und return 0 (false)
Wenn f�r jedes Feld der Wert = 0 war so wurde kein false returned, also return -1 (true)