PolluxLe 13/10/2006 à 10:13
a priori la solution la plus simple serait de prendre tous les blocs de N caractères du premier fichier, mettre tout ça dans une hash table, et ensuite parcourir le 2è fichier pour voir les blocs de N caractères qui sont déjà dans la hash table ^^ (temps O(N*(n1+n2)log(n1)), espace O(N*n1))
mais si ce que tu veux c'est plutôt découper tes fichiers en un faible nombre de gros blocs identiques (de taille très supérieure à N si possible), c'est un peu différent : dans ce cas-là il vaut mieux utiliser un arbre des suffixes...