Page 1 sur 3
Comment enregistrer une page internet compléte???
Publié : mar. 29/déc./2015 11:00
par JohnJohnsonSHERMAN
Coucou, c´est encore moi!!!
Voila, tout est dans le titre. Comment faire pour enregistrer sur le disque ue page internet avec toutes ses images et tout et la réutiliser sans onnection internet par la suite ? Avec ReceiveHTTPfile() ca ne fait simplement.... rien : quand je prend l´exemple de PB, que je remplace leur adresse par un truc genre wiki, article sur le Sherman (évidemment), ca ne dl rien du tout... peut etre que j´aurais oublié un truc tout con?
Ah aussi,comment on peut connaitre le format (html, css,php ou autre) d´une page qui ne le précise pas (genre
www.google.com)?
Merci d´avance!
Re: Comment enregistrer une page internet compléte???
Publié : mar. 29/déc./2015 13:01
par nico
Avec ReceiveHTTPfile() et après checker toute les dépendances dans le code source.
Re: Comment enregistrer une page internet compléte???
Publié : mar. 29/déc./2015 13:06
par JohnJohnsonSHERMAN
Checker les dépendances??? Y'a pas un code tout fait quelque part??? #FlemmeDeToutFaire...
Avec ReceiveHTTPfile() ca ne fait simplement.... rien
Donc? Je suis paumé !
Re: Comment enregistrer une page internet compléte???
Publié : mar. 29/déc./2015 13:07
par Ar-S
#FlemmeDeChecher ?
Re: Comment enregistrer une page internet compléte???
Publié : mar. 29/déc./2015 13:41
par GallyHC
Ar-S> tu as surement oublié #FlemmeDeTaider.
GallyHC
Re: Comment enregistrer une page internet compléte???
Publié : mar. 29/déc./2015 14:23
par nico
Avec ReceiveHTTPfile() ca ne fait simplement.... rien
Ben si, ça fonctionne très bien.
Re: Comment enregistrer une page internet compléte???
Publié : mar. 29/déc./2015 22:08
par venom
nico a écrit :Avec ReceiveHTTPfile() ca ne fait simplement.... rien
Ben si, ça fonctionne très bien.
Oui je confirme
@++
Re: Comment enregistrer une page internet compléte???
Publié : mer. 30/déc./2015 7:34
par Micheao
JohnJohnsonSHERMAN a écrit :
Ah aussi,comment on peut connaitre le format (html, css,php ou autre) d´une page qui ne le précise pas (genre
http://www.google.com)?
Merci d´avance!
Sous FireFox clique de droite sur la page puis Information de la page
Re: Comment enregistrer une page internet compléte???
Publié : mer. 30/déc./2015 9:52
par Marc56
JohnJohnsonSHERMAN a écrit :
Ah aussi,comment on peut connaitre le format (html, css,php ou autre) d´une page qui ne le précise pas (genre
http://www.google.com)?
Pour une page dynamique (comme du PHP) tu ne verra pas la source originale, mais la sortie du script.
Donc une page PHP enregistrée devient une page statique, qui n'affiche que le résultat.
(Tu devrais te documenter sur les formats avant de te lancer dans un programme d'enregistrement de page.)

Re: Comment enregistrer une page internet compléte???
Publié : mer. 30/déc./2015 10:31
par microdevweb
Code : Tout sélectionner
InitNetwork()
ReceiveHTTPFile("http://www.microdevweb.com/index.php","teste.php")
Va bien télécharger le fichier, ou page retourner par le serveur. Par contre affiché la page doit ce faire par un autre traitement.
Re: Comment enregistrer une page internet compléte???
Publié : mer. 30/déc./2015 14:55
par microdevweb
@Spock,
Oui si le programme par défaut est le navigateur, dans mon cas par exemple ça ouvre un ide

Re: Comment enregistrer une page internet compléte???
Publié : mer. 30/déc./2015 16:08
par nico
T'as mis php comme extension alors que tu aurais du mettre html, tu ne peux pas avoir du code php, tu ne peux que récupérer du code html généré par du php.
Re: Comment enregistrer une page internet compléte???
Publié : mer. 30/déc./2015 18:22
par cage
Personnellement j'utilise wget qui existe pour Windows, Unix et Linux
Permet de récupérer tout ou partie d'un site et de le rejouer offline
Re: Comment enregistrer une page internet compléte???
Publié : jeu. 31/déc./2015 10:37
par JohnJohnsonSHERMAN
Désolé pour ce long silence, j´avais plus d´internet hier

...
Ca m´intéresse ton truc , cage, ou trouves tu cette fonction wget?
Re: Comment enregistrer une page internet compléte???
Publié : jeu. 31/déc./2015 10:58
par cage
Une recherche sur google devrait te permettre de trouver wget.exe pour Win
Wget est en natif sur certains Unix/Linux, autrement c'est un paquet a installer.
Code : Tout sélectionner
C:\Users\gg\Desktop>wget
wget: missing URL
Usage: wget [OPTION]... [URL]...
Try `wget --help' for more options.
C:\Users\gg\Desktop>
C:\Users\gg\Desktop>wget --help
GNU Wget 1.11.4, a non-interactive network retriever.
Usage: wget [OPTION]... [URL]...
Mandatory arguments to long options are mandatory for short options too.
Startup:
-V, --version display the version of Wget and exit.
-h, --help print this help.
-b, --background go to background after startup.
-e, --execute=COMMAND execute a `.wgetrc'-style command.
Logging and input file:
-o, --output-file=FILE log messages to FILE.
-a, --append-output=FILE append messages to FILE.
-d, --debug print lots of debugging information.
-q, --quiet quiet (no output).
-v, --verbose be verbose (this is the default).
-nv, --no-verbose turn off verboseness, without being quiet.
-i, --input-file=FILE download URLs found in FILE.
-F, --force-html treat input file as HTML.
-B, --base=URL prepends URL to relative links in -F -i file.
Download:
-t, --tries=NUMBER set number of retries to NUMBER (0 unlimits).
--retry-connrefused retry even if connection is refused.
-O, --output-document=FILE write documents to FILE.
-nc, --no-clobber skip downloads that would download to
existing files.
-c, --continue resume getting a partially-downloaded file.
--progress=TYPE select progress gauge type.
-N, --timestamping don't re-retrieve files unless newer than
local.
-S, --server-response print server response.
--spider don't download anything.
-T, --timeout=SECONDS set all timeout values to SECONDS.
--dns-timeout=SECS set the DNS lookup timeout to SECS.
--connect-timeout=SECS set the connect timeout to SECS.
--read-timeout=SECS set the read timeout to SECS.
-w, --wait=SECONDS wait SECONDS between retrievals.
--waitretry=SECONDS wait 1..SECONDS between retries of a retrieval.
--random-wait wait from 0...2*WAIT secs between retrievals.
--no-proxy explicitly turn off proxy.
-Q, --quota=NUMBER set retrieval quota to NUMBER.
--bind-address=ADDRESS bind to ADDRESS (hostname or IP) on local host.
--limit-rate=RATE limit download rate to RATE.
--no-dns-cache disable caching DNS lookups.
--restrict-file-names=OS restrict chars in file names to ones OS allows.
--ignore-case ignore case when matching files/directories.
--user=USER set both ftp and http user to USER.
--password=PASS set both ftp and http password to PASS.
Directories:
-nd, --no-directories don't create directories.
-x, --force-directories force creation of directories.
-nH, --no-host-directories don't create host directories.
--protocol-directories use protocol name in directories.
-P, --directory-prefix=PREFIX save files to PREFIX/...
--cut-dirs=NUMBER ignore NUMBER remote directory components.
HTTP options:
--http-user=USER set http user to USER.
--http-password=PASS set http password to PASS.
--no-cache disallow server-cached data.
-E, --html-extension save HTML documents with `.html' extension.
--ignore-length ignore `Content-Length' header field.
--header=STRING insert STRING among the headers.
--max-redirect maximum redirections allowed per page.
--proxy-user=USER set USER as proxy username.
--proxy-password=PASS set PASS as proxy password.
--referer=URL include `Referer: URL' header in HTTP request.
--save-headers save the HTTP headers to file.
-U, --user-agent=AGENT identify as AGENT instead of Wget/VERSION.
--no-http-keep-alive disable HTTP keep-alive (persistent connections).
--no-cookies don't use cookies.
--load-cookies=FILE load cookies from FILE before session.
--save-cookies=FILE save cookies to FILE after session.
--keep-session-cookies load and save session (non-permanent) cookies.
--post-data=STRING use the POST method; send STRING as the data.
--post-file=FILE use the POST method; send contents of FILE.
--content-disposition honor the Content-Disposition header when
choosing local file names (EXPERIMENTAL).
--auth-no-challenge Send Basic HTTP authentication information
without first waiting for the server's
challenge.
HTTPS (SSL/TLS) options:
--secure-protocol=PR choose secure protocol, one of auto, SSLv2,
SSLv3, and TLSv1.
--no-check-certificate don't validate the server's certificate.
--certificate=FILE client certificate file.
--certificate-type=TYPE client certificate type, PEM or DER.
--private-key=FILE private key file.
--private-key-type=TYPE private key type, PEM or DER.
--ca-certificate=FILE file with the bundle of CA's.
--ca-directory=DIR directory where hash list of CA's is stored.
--random-file=FILE file with random data for seeding the SSL PRNG.
--egd-file=FILE file naming the EGD socket with random data.
FTP options:
--ftp-user=USER set ftp user to USER.
--ftp-password=PASS set ftp password to PASS.
--no-remove-listing don't remove `.listing' files.
--no-glob turn off FTP file name globbing.
--no-passive-ftp disable the "passive" transfer mode.
--retr-symlinks when recursing, get linked-to files (not dir).
--preserve-permissions preserve remote file permissions.
Recursive download:
-r, --recursive specify recursive download.
-l, --level=NUMBER maximum recursion depth (inf or 0 for infinite).
--delete-after delete files locally after downloading them.
-k, --convert-links make links in downloaded HTML point to local files.
-K, --backup-converted before converting file X, back up as X.orig.
-m, --mirror shortcut for -N -r -l inf --no-remove-listing.
-p, --page-requisites get all images, etc. needed to display HTML page.
--strict-comments turn on strict (SGML) handling of HTML comments.
Recursive accept/reject:
-A, --accept=LIST comma-separated list of accepted extensions.
-R, --reject=LIST comma-separated list of rejected extensions.
-D, --domains=LIST comma-separated list of accepted domains.
--exclude-domains=LIST comma-separated list of rejected domains.
--follow-ftp follow FTP links from HTML documents.
--follow-tags=LIST comma-separated list of followed HTML tags.
--ignore-tags=LIST comma-separated list of ignored HTML tags.
-H, --span-hosts go to foreign hosts when recursive.
-L, --relative follow relative links only.
-I, --include-directories=LIST list of allowed directories.
-X, --exclude-directories=LIST list of excluded directories.
-np, --no-parent don't ascend to the parent directory.
Mail bug reports and suggestions to <bug-wget@gnu.org>.
C:\Users\gg\Desktop>
Si tu arrives a faire ce que tu veux avec wget, rien ne t’empêche ensuite d'essayer de le faire avec PB et de partager ton code.
Gérard