Register for your free account! | Forgot your password?

Go Back   elitepvpers > Coders Den > General Coding
You last visited: Today at 13:12

  • Please register to post and access all features, it's quick, easy and FREE!

Advertisement



Regex find HTML part between two html elements

Discussion on Regex find HTML part between two html elements within the General Coding forum part of the Coders Den category.

Reply
 
Old   #1
 
FreewayC's Avatar
 
elite*gold: 0
Join Date: Sep 2011
Posts: 60
Received Thanks: 4
Regex find HTML part between two html elements

Hallo,


folgendes Problem:
Ich möchte gerne über Regular Expressions einen bestimmten HTML Part von einer Website extrahieren.

Der HTML Part sieht wie folgt aus
HTML Code:
<strong>Info <!-- Dazwischen befinden sich andere HTML Elemente, wie zum Beispiel 'breaks' aber natürlich auch ganz normale Strings und Zahlen (Datum) -->  </strong>
Ich möchte den kompletten Content zwischen den zwei Tags. Natürlich gibt es auch mehrere "<strong>" im Dokument aber es gibt nur ein <strong> wo das Wort "Info" danach erfolgt, deshalb sollte "<strong>Info" der Einstiegspunkt sein


besten Dank und freundliche Grüße,
freewayc
FreewayC is offline  
Old 02/06/2016, 00:58   #2
 
alpines's Avatar
 
elite*gold: 60
Join Date: Aug 2009
Posts: 2,256
Received Thanks: 815
Das hier parst den kürzesten Teil raus (bricht ab dem 1. </strong> ab)
Code:
(?s)(<strong>Info.+?<\/strong>)
Das hier parst das Längste raus
Code:
(?s)(<strong>Info.+<\/strong>)
Wenn du uns mehr Infos gibst können wir das Pattern besser spezifizieren.
alpines is offline  
Thanks
1 User
Old 02/06/2016, 02:37   #3
 
elite*gold: 0
Join Date: Jun 2011
Posts: 225
Received Thanks: 8
Ich habe oft gelesen, dass man Regex bei HTML Code nicht nutzen sollte, sondern lieber einen Html Parser!

Wenn ich es mal gebraucht habe, habe ich aber auch Regex genutzt.
Krabat2 is offline  
Old 02/06/2016, 04:31   #4
 
elite*gold: 0
Join Date: Feb 2009
Posts: 1,137
Received Thanks: 573
Quote:
Originally Posted by Krabat2 View Post
Ich habe oft gelesen, dass man Regex bei HTML Code nicht nutzen sollte, sondern lieber einen Html Parser!

Wenn ich es mal gebraucht habe, habe ich aber auch Regex genutzt.
Es kommt immer drauf an wie oft man den Seitenquelltext ausliest, wenn man nur eine Information benötigt ist regex schön und gut, wenn man mehrere Sachen aus dem Quelltext lesen will sollte man einen HTML Parser verwenden der den HTML Text einmal einließt und in eine geeignete Datenstruktur zum schnellen und ressourcenschonenden Zugriff schreibt.

Sonst erzeugt man einfach nur einen gigantischen unnötigen Overhead.
warfley is offline  
Old 02/06/2016, 16:31   #5
 
FreewayC's Avatar
 
elite*gold: 0
Join Date: Sep 2011
Posts: 60
Received Thanks: 4
Danke @alpines, genau das was ich gesucht habe
FreewayC is offline  
Reply


Similar Threads Similar Threads
[C#]Regex
09/25/2014 - .NET Languages - 9 Replies
Hallo Epvp, kann mir wer helfen? Ich hab den Queltext einer Seite und muss einen bestimmten Teil davon als String speichern. Diesen Teil brauche ich: <input type="hidden" value="4c2a74dfacc40345e8049e0d94ac0fce889411 9b" name="CSRF_TOKEN"/> Der gesammte Queltext ist natürlich noch viel größer. Die Value von dem Input Field wird aber benötigt.
Regex für Profis
09/15/2014 - General Coding - 6 Replies
Heii ich suche einen Regex Profi Ich brauche einen Regex für eine Passwortanforderungsabfrage Das Passwort muss Gross & Kleinbuchstaben beinhalten Mindestens eine Zahl und ein Sonderzeichen Kann mir da jemand helfen ??
Regex help
11/21/2013 - General Coding - 4 Replies
Hello! I am not so good with regular expressions but i still want to learn and understand it correctly :p I want to regex a SQL statement. I only want that my sql string contains, a SELECT, SHOW and DESCRIBE and of course at the and a ; i am coding in Java at it looks like this atm: ... Pattern p = Pattern.compile("^(SELECT|SHOW|DESCRIBE).*;$& quot;);
[Vb.net] Regex Problem
07/13/2013 - .NET Languages - 0 Replies
hat sich erledigt
VB RegEx
07/11/2013 - .NET Languages - 8 Replies
Hi, ich würde aus nem Quellcode ein paar ID's auslesen. Mit BetGetween geht alles super. Nur da es von den ID's mehrere im Quelltext gibt, brauch ich regEx Matches. src="http://www.howrse.de/media/equideo/imag e/chevaux/normaux/arabe-small/gr-c-icone.png?15883 8126" class="cheval-icone " width="40" height="40"/></a> <a href='/elevage/chevaux/cheval?id=18923938' class='horsename'> Diese ID soll rausgefiltert werden."18923938" Das mache ich mit



All times are GMT +1. The time now is 13:13.


Powered by vBulletin®
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
SEO by vBSEO ©2011, Crawlability, Inc.
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

Support | Contact Us | FAQ | Advertising | Privacy Policy | Terms of Service | Abuse
Copyright ©2025 elitepvpers All Rights Reserved.