J'ai donné le lien vers le fichier de données de test en tête de code
http://www.lexique.org/listes/liste_mots.php
Prendre le fichier
Liste des mots fusionnée (je ne met pas le lien direct pour qu'il ne soit pas indexé par les robots)
Je remet aussi le code pour charger le fichier rapidement (une fois dézippé)
Code : Tout sélectionner
If Not OpenFile(0, "c:\tmp\liste_mots_mix.txt")
Debug "Fichier non chargé"
End
EndIf
While Not Eof(0)
Txt$ = ReadString(0, #PB_Ascii | #PB_File_IgnoreEOL)
Wend
CloseFile(0)
start = ElapsedMilliseconds()
; --- Code à tester
Debug "Temps: " + StrF((ElapsedMilliseconds() - start) / 1000.0, 2) + " seconde(s)"

Grace à
#PB_File_IgnoreEOL qu'on m'a indiqué il y a quelques temps, le chargement d'un fichier est considérablement plus rapide que ligne par ligne. (mais je n'ai pas comparé avec la version "peek")
Le fichier des mots est une archive zip de seulement 950 ko (décompacté: 3.6mo) et qui contient un fichier de 295 000 lignes (ouvrable avec n'importe quel éditeur ascii)
C'est de l'ascii (encodage windows 1252), pas de l'utf-8: transformer si nécessaire.
Ce fichier peut être
très utile pour celui qui veut se faire un
correcteur d'orthographe car il contient aussi toutes les déclinaisons des verbes et toutes les villes françaises.
(dans le cas d'une ville, le code postal est sur la même ligne séparé par un tab)
