Malgré les milliards de pages indexées par Google et ses confrères classiques, certains estiment qu’il reste encore beaucoup d’informations cachées et difficilement accessibles.
Il existe certains moteurs de recherche spécialisés dans la recherche sur le web invisible appelé DeepWeb.
Les raisons sont nombreuses : format de fichiers non standards, base de données non indexées, veilles pages, algorithmes de pertinences des moteurs de recherche, etc. On considère que le web « visible » indexé n’est que la partie émergée de l’iceberg. Il existe encore 80% l’information qui reste cachée.
Alors comment accéder au web invisible en dehors de Google ?
On y accède par ricochet en cherchant indirectement ce type de site :
- Les archives du web : https://archive.org/ archive l’historique des sites internet depuis des dizaines d’années. Vous pouvez y faire un peu d’archéologie digitale et dénicher une perle rare.
- Les bibliothèques : leur catalogue n’est disponible que sur leur site. En France nous avons Gallica de la BNF. Il en existe des dizaines spécialisées par domaine. Cherchez le votre.
- Les bases de données gratuites et payantes. Ex: Insee, etc.
- wolframalpha : est un système un peu différent. Posez une question et il y répondra. Voici quelques exemples ici : http://www.wolframalpha.com/examples/?src=input
- le Darknet : il existe plusieurs moteurs Darknet (ToR par exemple).
Avertissement : le DeepWeb regorge de moteurs de recherche underground. Ils sont souvent la porte d’entrée pour les virus, malwares et autres bonnes nouvelles. Je vous invite à ne pas vous en servir sans prendre de TRES grandes précautions.
Préférez les sites officiels !
Bien sur l’accès à l’information n’est pas aussi simple qu’avec un Google ou un Bing. Cela demande un peu plus de savoir faire.