RegExp Verschachtelung

01/29/2015 12:20 Mr.Tr33#1

Hallo,
ich habe gerade ein kleines aber doch gro�es Problem welches ich nicht durch Google finden konnte bzw. nicht die L�sung :D

Ich habe z.B. folgenden String: [Only registered and activated users can see links. Click Here To Register...] (er wird hier komischerweise falsch dargestellt bzw. voll verkr�ppelt)
So, ich kann jetzt Problemlos nach LIST und /LIST suchen, dann w�rde ich aber entweder auf das erste /LIST treffen, oder das aller letzte /LIST
Ich finde aber nicht das nur dazugeh�rige.
Kennt jemand daf�r eine L�sung?
Am besten eine PHP freundliche? :D

MfG
Mr.Tr33

01/29/2015 18:25 .StarSplash#2

Nicht mit einfachem preg_match suchen, sondern mit preg_match_all. Dann kriegst du ein Array mit allen Treffern zur�ck.

01/29/2015 19:26 Mr.Tr33#3

Dies ist mir bewusst.
Wenn ich folgenden Pattern benutze: \[list\](.*?)\[/list\]
Dann bekomme ich das wieder:

Code:

[LIST][*]a[*][LIST][*]hans[*]peter[*]baum[/LIST]

Wenn ich aber diesen Pattern benutze: \[list\](.*)\[/list\]
Dann bekomme ich einfach alles wieder, was ich ihm als String gegeben habe, weil es eben mit

anf�ngt und

endet.

01/29/2015 19:53 Tasiro#4

Du versuchst, eine kontextfreie Sprache mit einem regul�ren Ausdruck zu beschreiben. Das ist nur in speziellen F�llen m�glich; wenn die Sprache nicht nur kontextfrei, sondern auch regul�r ist. Das ist aber in deinem Fall nicht so.

Mit anderen Worten: Es gibt keine L�sung allein mit regul�ren Ausdr�cken f�r dein Problem.

Du k�nntest es mit einem rekursiv absteigenen Parser versuchen, ein solcher ist in der Regel recht einfach zu schreiben.
Davon abgesehen hast du nicht dein Ziel genannt, nur den Weg.

01/29/2015 19:59 Mr.Tr33#5

Quote:

Originally Posted by Tasiro

Mit anderen Worten: Es gibt keine L�sung allein mit regul�ren Ausdr�cken f�r dein Problem.

K�nntest du mir vielleicht ein Beispiel dazu geben bitte? :)

Quote:

Originally Posted by Tasiro

Du k�nntest es mit einem rekursiv absteigenen Parser versuchen, ein solcher ist in der Regel recht einfach zu schreiben.
Davon abgesehen hast du nicht dein Ziel genannt, nur den Weg.

Ich m�chte am Ende dass es das erste LIST mit demzweiten /LIST als ein Paar sieht, das zweite LIST und das erste /LIST und dann halt das 3te LIST und das 3te /LIST als ein Paar. Sprich die dazugeh�rigen Teile und nicht einfach die als erstes, egal von welcher Richtung, im Weg stehen.

01/29/2015 20:19 .StarSplash#6

Dann ist das mal wieder ein Paradebeispiel f�r nen Stack ;o
Damit erreicht du genau das.

01/30/2015 20:03 Tasiro#7

Quote:

Originally Posted by Mr.Tr33

K�nntest du mir vielleicht ein Beispiel dazu geben bitte? :)

Standardbeispiel: Sei L = {aⁿbⁿ : n∈ℕ, n≠0}, die Sprache der W�rter ab, aabb, aaabbb usw. Es muss also f�r jedes a genau ein b vorhanden sein. Das l�sst sich nicht mit einem endlichen Automat realisieren, da bei m Zust�nden sp�testens bei dem m+1. a wieder ein Zustand eingenommen wird, der sich von einem bereits vorher angenommenen Zustand nicht unterscheiden l�sst.
Damit l�sst sich das nicht mit einem DEA und damit auch nicht mit einem regul�ren Ausdruck beschreiben.

Dein Problem ist �hnlich, bei dir k�nnen zwischen jedem [LIST]-[/LIST]-Paar nicht nur ein weiteres Paar stehen, sondern mehrere, dazu noch anderer Text. Das macht die Aufgabe nat�rlich nicht einfacher.

Quote:

Originally Posted by Mr.Tr33

Ich m�chte am Ende dass es das erste LIST mit demzweiten /LIST als ein Paar sieht, das zweite LIST und das erste /LIST und dann halt das 3te LIST und das 3te /LIST als ein Paar. Sprich die dazugeh�rigen Teile und nicht einfach die als erstes, egal von welcher Richtung, im Weg stehen.

Warum m�chtest du die Paare paaren?

Wenn du einen Baum deiner Paare erstellen m�chtest, k�nntest du das etwa so machen:

Code:

function parseCode (code, ref i)
    if code contains "[i]" at index i then
        i += length of "[i]"
        result = new BBCode ("i", parseCode (code, i))
        if code contains "[/i]" at index i then
            i += length of "[/i]"
        else
            writeErrorMessage ("missing [/i] at index " + i)
        end if

    else if ... // andere F�lle
        ...
    end if
end function

Oder du nutzt eine der vielen Bibliotheken daf�r. Du musst blo� nach "BB Code Parser" und der gew�nschten Sprache suchen.

02/01/2015 03:01 dowhile#8

Quote:

Originally Posted by Tasiro

Du versuchst, eine kontextfreie Sprache mit einem regul�ren Ausdruck zu beschreiben. Das ist nur in speziellen F�llen m�glich; wenn die Sprache nicht nur kontextfrei, sondern auch regul�r ist. Das ist aber in deinem Fall nicht so.

Mit anderen Worten: Es gibt keine L�sung allein mit regul�ren Ausdr�cken f�r dein Problem.

Regul�re Ausdr�cke in Programmiersprachen sind in der Regel nicht regul�r, sondern wesentlich m�chtiger. In PHP gibt es sogar rekursive regul�re Ausdr�cke, mit denen der TE sein Problem l�sen k�nnen sollte.

02/01/2015 14:12 Mr.Tr33#9

Quote:

Originally Posted by dowhile

Regul�re Ausdr�cke in Programmiersprachen sind in der Regel nicht regul�r, sondern wesentlich m�chtiger. In PHP gibt es sogar rekursive regul�re Ausdr�cke, mit denen der TE sein Problem l�sen k�nnen sollte.

Ein Beispiel w�re dabei immer hilfreich :)

Quote:

Originally Posted by Tasiro

Warum m�chtest du die Paare paaren?

Ich m�chte diese paaren damit ich beim k�rzen des Codes (damit ich z.B. nur 800 Zeichen anzeigen lassen kann) es am Ende richtig anzeigen lassen kann.

02/01/2015 15:26 Tasiro#10

Quote:

Originally Posted by dowhile

rekursive regul�re Ausdr�cke

Interessant, was die sich alles einfallen lassen. Nur ist das hierf�r nicht unbedingt eine gute Idee...

Quote:

Originally Posted by Mr.Tr33

Ein Beispiel w�re dabei immer hilfreich :)

[Only registered and activated users can see links. Click Here To Register...]
Und noch ein paar mehr Links zu dem Thema:
[Only registered and activated users can see links. Click Here To Register...]
[Only registered and activated users can see links. Click Here To Register...]