Seite 1 von 1

Internetseite speichern

Verfasst: 16.12.2018 23:02
von Fordey_ra
Gibt es eine einfache Lösung eine Internetseite bzw. weitere Seiten aufzurufen und die dann als Text auf meinen PC zu speichern ?

Habe bereits hier in der Suche leider nichts gefunden.

Auch Google brachte keine weiteren Lösungen.

Re: Internetseite speichern

Verfasst: 16.12.2018 23:37
von ccode_new
Hallo Fordey_ra,

willst du dieses Problem mit PureBasic lösen, oder reicht eine allgemeine Lösung ?

Als 1. gilt hier der oberste Grundsatz:

Text ist nicht gleich TEXT.

Formatiert ?, und wenn ja wie ?

Das beste Format ist komplett als HTML mit Zusätzen in einem Ordner (aber es geht dir ja nur um den Text, nicht um die Bilder, oder ?)

Oder PDF ?

Als 2. denke ich: Dein genutzter Internet-Browser kann vielleicht schon mehr als du denkst.

Re: Internetseite speichern

Verfasst: 17.12.2018 00:21
von Fordey_ra
Ich möchte die Seiten automatisch aufrufen und in einer Text Datei speichern (AscII).

Das es mehr als 1000 Seiten sind möchte ich über PureBasic aufrufen.

Natürlich, wenn ein fertiges Programm das schon kann ginge auch dieses.

Die Text Datei möchte mit PureBasic dann weiter verarbeiten.

Re: Internetseite speichern

Verfasst: 17.12.2018 02:43
von STARGÅTE
Fordey_ra hat geschrieben:Ich möchte die Seiten automatisch aufrufen und in einer Text Datei speichern (AscII).
Da wäre immer noch die Frage wie das genau aussehe soll? Sind die Seiten schon reine Textdateien? Musst du den HTML-Code parsen und den reinen Text fildern? Brauchst du die ganze Seite, einschließlich Styles, Bilder, Scripte usw.?

Ansonsten gibts in PB halt:
ReceiveHTTPFile(URL$, Filename$ [, Flags [, UserAgent$]])

Re: Internetseite speichern

Verfasst: 17.12.2018 12:01
von Fordey_ra
Auf der Seite ist Hauptsächlich Text.
Mich Interessiert auch nur der Text keine Bilder.

Re: Internetseite speichern

Verfasst: 17.12.2018 13:08
von RSBasic
Du kannst per RegEx ganz einfach den HTML-Code in Reintext konvertieren. Beispiele gibt es bei Google genügend.