Informationen einer Seite auslesen und darstellen ohne API

06/07/2013 10:48 externus#1
Hey,
könnte mir jemand hier helfen.

Also ist es möglich, dass jemand auf meiner eigenen Seite eine Suchanfrage eingibt, und diese wird dann an [Only registered and activated users can see links. Click Here To Register...] übergeben, das Ergebnis soll dann ausgelesen werden, so dass ich es auf meiner eigenen Seite wiederum ausgeben kann, aber in anderer Darstellungsform, also nicht iwie quasi als Screenshot oder so :D

Das ganze ist für ein Studentenprojekt, wir sollen für unser Modul Internettechnologie als Praxisprojekt eine eigene Seite machen, die so ähnlich ist wie clevertanken, also günstigste Tankstelle suchen usw. und wir müssen ja irgendwie an die Daten kommen.

Wäre nett, wenn mir jemand erklären kann, wie man das bewerkstelligt.

Danke schonmal
06/07/2013 12:14 マルコ#2
Mit [Only registered and activated users can see links. Click Here To Register...] die Suchanfrage übermitteln (GET Parameter anpassen) und dann per Regex nach den entsprechenden Ergebnissen suchen.
Du solltest am Anfang evtl per Regex die Tabelle in einzelne Zeilen aufsplitten - und dann mit 2. Regex diese wiederum jeweils auslesen. So würde ich das machen.
06/07/2013 12:51 externus#3
Schonmal danke für die Antwort.
Kann, aber noch nicht so viel mit den Begriffen anfangen, habe noch nicht so die großen Kenntnisse darin, aber werde mal schauen, ob ich im Inet dazu was finde.
Oder vllt. hast du noch ein paar Quellen oder selber Infos, die mich erleuchten :)
06/07/2013 14:27 Der-Eddy#4
https://de.wikipedia.org/wiki/Regul%C3%A4rer_Ausdruck
[Only registered and activated users can see links. Click Here To Register...]

über RegEx kann man die Inhalte die man bekommen hat durch ein Pattern filtern
06/10/2013 09:12 Cr4nkSt4r#5
Ich würde auch noch vorschlagen, dass du statt file_get_contents curl verwendest ;)
[Only registered and activated users can see links. Click Here To Register...]

1. Ist es schöner und sauberer
2. Wird man mit curl weniger mit Problemen konfrontiert was das Funktionelle betrifft (Bsp.: allow_url_fopen wurde auf off gesetzt)
3. Ist curl schneller
4. Hat curl einfach schöne und viele Einstellungsmöglichkeiten

Für den Anfang scheint es vll. schwieriger zu begreifen sein, aber an sich ist es ganz einfach und du wirst auch nicht viel von dem Spektrum von curl können müssen um deine Idee um zu setzen.
file_get_contents ist halt gerne bei diesen ganzen Kindern und ihren Gaminghomepages beliebt, warum bleibt mir jedoch ein Rätsel :P

Wie gesagt, kann man, muss man jedoch nicht.
Nur schlage ich halt vor, wenn, dann richtig und man lernt auch ein wenig was man später wieder anwenden kann ^^
06/10/2013 10:28 _robox#6
Es Solde auch über Dom lösbar sein.

[Only registered and activated users can see links. Click Here To Register...]

wie du siehst bietet dir PhP mehr als ein Lösung weg.
06/10/2013 16:14 マルコ#7
Quote:
Originally Posted by Cr4nkSt4r View Post
2. Wird man mit curl weniger mit Problemen konfrontiert was das Funktionelle betrifft (Bsp.: allow_url_fopen wurde auf off gesetzt)
Curl kann genau so deaktiviert sein. Das ist kein Argument.

Quote:
Originally Posted by Cr4nkSt4r View Post
file_get_contents ist halt gerne bei diesen ganzen Kindern und ihren Gaminghomepages beliebt, warum bleibt mir jedoch ein Rätsel :P
fgc ist eine Funktion, die dir den Inhalt einer übergebenen URL schnell mal zurück gibt. Da ich nicht denke, dass der TE viel Ahnung von PHP hat, denke ich, dass es sinnvoller ist, er fängt klein an. Curl ist sicherlich der korrekte Weg, aber wie du schon selbst sagst der schwierigere.


@_robox:
Stimmt, DOM gibt es auch noch. Hätt ich fast vergessen^^

@TE: Nimm statt regex lieber DOM, falls vorhanden. Und zum Download der Seite musst du wissen, ob du es dir einfach machen willst, oder ob du dich mal gescheit hinsetzt und dir Curl anschaust. Da ich aber denke, dass du PHP nicht mal grundlegend kannst, rate ich dir eher erstmal zum einfacheren Weg, um ein Durcheinander und Fehler vorzubeugen.
06/11/2013 17:28 Else#8
Je nach Aufwand empfiehlt es sich DOM zu verwenden. Für 1-2 Zeilen brauche ich nicht solchen Aufwand betreiben und kann mir schnell einen Regex zusammenstellen und die Daten auswerten.