|
dtSearch
6 Spider
|
dtSearch
Desktop et Network
contiennent un robot Web intégré pour l'indexation
et la recherche de sites Web accessibles au public. |
|
dtSearch
reconnaît automatiquement et supporte les formats HTML, PDF,
XML, ainsi que d'autres documents texte tels que les fichiers de
traitement de texte et les tableurs. |
|
dtSearch
Desktop et Network afficheront les pages et les documents Web retrouvés
par le Spider avec les occurrences en surbrillance ainsi que (pour
HTML et PDF) les liens et les images. |
Comment fonctionne dtSearch Web Spider
Indexation
d'un site Web
Pour
indexer un site Web, sélectionnez "Ajouter site" comme
dans la boîte de dialogue ci-dessous.
Saisissez
le nom du site Web, par exemple http://www.federalreserve.gov/
Puis sélectionnez la profondeur d'analyse. La profondeur
d'analyse est le nombre de niveaux dans le site que dtSearch atteindra
lors de la recherche de pages. Si vous sélectionnez une profondeur
de 1 en effectuant une recherche sur http://www.federalreserve.gov/,
seules les pages liées directement à la page d'accueil
seront retrouvées. Une profondeur de 4 permettra d'atteindre
quatre niveaux dans le site.
Affichage Après
une recherche, dtSearch Spider affiche les fichiers HTML ou PDF retrouvés
avec les occurrences en surbrillance et tous les liens et les images
intacts. Le résultat ressemble à la page Web d'origine,
les seules différences sont la surbrillance des occurrences et
les options de navigation supplémentaires ("occurrence suivante",
"document précédent", "document suivant",
etc.).
|
| HTML
file retrieved by dtSearch Spider |
|
dtSearch utilise des convertisseurs de
fichiers intégrés pour convertir d'autres formats de texte
tels qu'un traitement de texte et des tableurs en HTML pour un affichage
avec les occurrences en surbrillance. Consultez Champs
pour des options de recherche XML.
Note
technique dtSearch Spider
ne "capture" pas des sites Web indexés. Pour afficher
un fichier indexé avec le Spider, dtSearch retournera au site
Web pour accéder au document.
Rubriques
annexes
|