Pour faire simple mes données sont tout simplement des URLs à stocker avec des liens entre chaque URL. Le stockage doit pendre en compte plusieurs niveaux (un site, les domaines du site, les urls du site,...). Seul le serveur stocke l'intégrité des données, les clients sont amenés assez souvent à effectuer des requêtes au serveur pour déterminer où non si une URL existe dans la base.
J'ai plusieurs problèmes qui se posent. Quel est le modèle de stockage à utiliser (base de données, table de hachage sur DD, indexe, autre ?).
Si j'utilise une base de données, est-il judicieux de créer une seule table qui soit capable d'accueillir toutes les URLs ou créer autant de table qu'il existe de site WEB ? Quelle est en gros la méthode la plus optimisée en terme de performance ? La contrainte importante et que connaitre l'existence d'une URL dans la base doit correspondre à une réponse quasi instantanée afin d'éviter des attentes de communication entre un client et le serveur.
Enfin, si un modèle de stockage basé sur une base de données genre MySQL est une très mauvaise idée, vers quoi me tourner et vers quelle bibliothèque C++ ?
Merci d'avance. J'avoue que je ne vois actuellement aucun modèle de stockage capable d'accueillir autant de données.
