Internetseite speichern

Anfängerfragen zum Programmieren mit PureBasic.
Fordey_ra
Beiträge: 71
Registriert: 17.08.2010 22:30

Internetseite speichern

Beitrag von Fordey_ra »

Gibt es eine einfache Lösung eine Internetseite bzw. weitere Seiten aufzurufen und die dann als Text auf meinen PC zu speichern ?

Habe bereits hier in der Suche leider nichts gefunden.

Auch Google brachte keine weiteren Lösungen.
ccode_new
Beiträge: 1214
Registriert: 27.11.2016 18:13
Wohnort: Erzgebirge

Re: Internetseite speichern

Beitrag von ccode_new »

Hallo Fordey_ra,

willst du dieses Problem mit PureBasic lösen, oder reicht eine allgemeine Lösung ?

Als 1. gilt hier der oberste Grundsatz:

Text ist nicht gleich TEXT.

Formatiert ?, und wenn ja wie ?

Das beste Format ist komplett als HTML mit Zusätzen in einem Ordner (aber es geht dir ja nur um den Text, nicht um die Bilder, oder ?)

Oder PDF ?

Als 2. denke ich: Dein genutzter Internet-Browser kann vielleicht schon mehr als du denkst.
Betriebssysteme: div. Windows, Linux, Unix - Systeme

no Keyboard, press any key
no mouse, you need a cat
Fordey_ra
Beiträge: 71
Registriert: 17.08.2010 22:30

Re: Internetseite speichern

Beitrag von Fordey_ra »

Ich möchte die Seiten automatisch aufrufen und in einer Text Datei speichern (AscII).

Das es mehr als 1000 Seiten sind möchte ich über PureBasic aufrufen.

Natürlich, wenn ein fertiges Programm das schon kann ginge auch dieses.

Die Text Datei möchte mit PureBasic dann weiter verarbeiten.
Benutzeravatar
STARGÅTE
Kommando SG1
Beiträge: 6996
Registriert: 01.11.2005 13:34
Wohnort: Glienicke
Kontaktdaten:

Re: Internetseite speichern

Beitrag von STARGÅTE »

Fordey_ra hat geschrieben:Ich möchte die Seiten automatisch aufrufen und in einer Text Datei speichern (AscII).
Da wäre immer noch die Frage wie das genau aussehe soll? Sind die Seiten schon reine Textdateien? Musst du den HTML-Code parsen und den reinen Text fildern? Brauchst du die ganze Seite, einschließlich Styles, Bilder, Scripte usw.?

Ansonsten gibts in PB halt:
ReceiveHTTPFile(URL$, Filename$ [, Flags [, UserAgent$]])
PB 6.01 ― Win 10, 21H2 ― Ryzen 9 3900X, 32 GB ― NVIDIA GeForce RTX 3080 ― Vivaldi 6.0 ― www.unionbytes.de
Aktuelles Projekt: Lizard - Skriptsprache für symbolische Berechnungen und mehr
Fordey_ra
Beiträge: 71
Registriert: 17.08.2010 22:30

Re: Internetseite speichern

Beitrag von Fordey_ra »

Auf der Seite ist Hauptsächlich Text.
Mich Interessiert auch nur der Text keine Bilder.
Benutzeravatar
RSBasic
Admin
Beiträge: 8022
Registriert: 05.10.2006 18:55
Wohnort: Gernsbach
Kontaktdaten:

Re: Internetseite speichern

Beitrag von RSBasic »

Du kannst per RegEx ganz einfach den HTML-Code in Reintext konvertieren. Beispiele gibt es bei Google genügend.
Aus privaten Gründen habe ich leider nicht mehr so viel Zeit wie früher. Bitte habt Verständnis dafür.
Bild
Bild
Antworten