Info - Numéro du millénium

Conseils aux utilisateurs de dtSearch


De nouveaux champs à explorer!

Dans dtSearch 5.x, la colonne de la fenêtre Résultats de recherche intitulée 'titre' contient par défaut les 80 premiers caractères du document. Les exceptions à cette règle sont les documents PDF et HTML qui utilisent respectivement le titre de l'information sur le document et les balises <TITLE>.

Si vous utilisez MS Word, vous pouvez créer un titre de substitution ou de nouveaux champs tels que 'Service' ou 'Projet'. Tous les champs créés deviennent recherchables.

Pour ce faire, lorsque vous enregistrez un document Word, choisissez File|Properties [Fichier|Propriétés] et vous pouvez facilement saisir des valeurs pour Titre, Sujet, Commentaires, etc., à partir de l'onglet Summaries [Résumé]. Dans l'onglet Custom [Personnalisé], sélectionnez un nom de la liste ou saisir un nouveau nom. Assurez-vous que les champs créés sont de types 'Texte'.

Ces nouveaux champs apparaîtront dans la liste des Champs recherchables dans la boîte de dialogue Recherche dans toutes les versions à partir de la version 5.22. Dans les versions précédentes, choisissez Options|Define Text Fields [Options|Définir des champs textuels], cliquez sur New Field [Nouveau] et saisissez un nom de champ. Puis, cochez sur 'Display field in search results'[Afficher le champ dans les résultats de recherche]. Enregistrez et Fermez la boîte de dialogue puis reconstruisez l'index contenant les documents Word.



Accès plus rapide en 2000!

Si vous avez mis à niveau votre logiciel Microsoft Office et si vous utilisez dtSearch pour indexer vos bases de données Access 2000, le retour d'occurrences sera beaucoup plus rapide en mettant à niveau de dtSearch 5.21 à la version 5.22.


Champs HTML

dtSearch crée des champs recherchables à partir des balises META des documents HTML, ceux-ci peuvent apparaître dans la fenêtre Résultats de recherche. Des balises META NAME peuvent être créées dans n'importe quel logiciel de création de pages Web et elles sont automatiquement créées lorsque vous enregistrez un document Word 97 dans le format HTML. Par défaut, Word 97(8) crée des onglets 'Généré par', 'Modèle' et 'Type de contenu'. En utilisant File|Properties [Fichier|Propriétés] dans Word 97, vous pouvez créer des BALISES META supplémentaires qui apparaîtront dans la liste des champs recherchables de dtSearch.

Pour que ces champs recherchables apparaissent dans la fenêtre Résultats de recherche, utilisez les options Options|Define Text Fields [Options|Définir des champs textuels]. Dans la zone Beginning of field [Début du champ], saisissez <META NAME="Department" CONTENTS="Housing">, remplacez vos propres valeurs par NAME et CONTENTS. Choisissez 'Ignore case' [Ignorer la casse] et 'display field in search results' [Afficher le champ dans les résultats de recherche], Enregistrez, Fermez et Mettez à jour l'index.

Un bogue qui rendait les champs HTML affichés inutilisables a été résolu dans la version 5.22 de dtSearch et dans les versions ultérieures.



Indexation de fichiers PDF

Les développeurs qui incorporent le moteur dtSearch pour indexer les fichiers PDF doivent être informés de l'existence du brevet LZW d'Unisys. Créer des applications qui recherchent ces fichiers ou l'utilisation de la version finale de dtSearch pour indexer les fichiers ne pose aucun problème - des royalties sont payées à Unisys.

Si vous indexez en utilisant le moteur directement, il vous faudra acquérir une licence auprès d'Unisys ou utiliser la version utilisateur final. Une autre solution existe si vous ne souhaitez pas utiliser le produit utilisateur final de dtSearch pour construire un index. Il est possible, si vous contrôlez la procédure de création PDF, de créer tous les fichiers PDF avec la nouvelle méthode de compression "Flate". En effet, elle ne contient pas la méthode LZW et le moteur dtSearch indexera les fichiers. Une option, dans Adobe Distiller, contrôle cela.



French Connection

dtSearch 5 permet aux utilisateurs de localiser des 'opérateurs' (par exemple ET, OU, etc.) dans leur propre langue.

Par exemple, pour remplacer les opérateurs par défaut AND, OR, NOT dans le fichier Options.dat par des opérateurs en français, vous devez saisir:

Connectors = {et=and} {ou=or} {sauf=not} {prox/=w/} {contient=contains}{jusque=to}

Assurez-vous que tous les caractères saisis sont 'recherchables'. Par exemple, pour que le caractère / soit recherchable, utilisez dans Options, Index Options, Edit Alphabet [Options, Options d'indexation, Modifiez l'alphabet] et cliquez sur 47 et activez la case Letter [Lettre] (recherchable).



Indexation du symbole de l'Euro

Maintenant que le symbole de l'Euro(€) est disponible dans plusieurs polices et qu'il est sur le clavier anglais (Ctrl+Alt+4 ou AltGr+4 ou Alt+0128 si vous préférez utiliser le pavé numérique !), il est nécessaire qu'il soit recherchable dans dtSearch!

Dans dtSearch, sélectionnez Options|Index Options [Options, Options d'indexation], et appuyez sur le bouton Edit Alphabet [Modifiez l'alphabet]. Faites défiler la liste alphabétique jusqu'au caractère 128 - le symbole de l'Euro doit apparaître, sélectionnez-le avec votre souris et assurez-vous que la casse Lettre recherchable est activée.

Si votre alphabet ne contient pas le symbole de l'Euro, vous devez mettre à jour votre jeu de caractères, le site Web de Microsoft contient des mises à jour téléchargeables gratuites.

Si vous créez des documents PDF ou n'importe quel autre document que vous souhaitez envoyer à des utilisateurs n'utilisant pas les dernières polices contenant le symbole de l'Euro - vous devez utiliser l'option 'incorporer la police'.




Un visualiseur externe bloque votre vue?

Lorsque vous choisissez d'utiliser un visualiseur externe, il est plus pratique de désélectionner [Ouvrir automatiquement le premier document dans les résultats'] à partir de Options|Preferences [Options|Préférences]. Cela vous permettra de visualiser votre liste de résultats de recherche et de choisir un document. Appuyez sur ALT+TAB pour retourner à dtSearch afin de sélectionner un autre document ou d'effectuer une nouvelle recherche.


Plus d'options dans la version 5.22

Une nouvelle caractéristique dans dtSearch 5.22 vous permet de choisir la façon dont le nom du fichier est affiché dans la fenêtre Résultats de recherche sans avoir à modifier le fichier Options.dat.

Sélectionnez Options|Index Options [Options|Options d'indexation] et un nouveau groupe de noms de fichier apparaît au bas de la boîte de dialogue. Les nouvelles options: 'Use PDF title attribute as filename for Adobe Acrobat files' [Utiliser le titre PDF comme nom de fichier pour les fichiers Adobe Acrobat] et 'Use HTML <TITLE> as filename for HTML files' ['Utiliser HTML <TITLE> comme nom de fichier pour les fichiers HTML'] (Lorsque vous choisissez cette option, le champ 'titre' affiché dans les résultats de recherche sera le contenu de la balise <TITLE> + le contenu de la balise <BODY>.)


Eviter les conflits de version!

Si vous souhaitez tester la dernière version bêta de dtSearch tout en conservant votre version actuelle, cela signifie l'installation de plusieurs versions sur une même machine. Les différentes versions partagent un répertoire 'privé', ce qui peut entraîner des confusions!

Pour chaque copie de dtSearch installée, créez un raccourci puis cliquez sur le côté droit de la souris pour modifier les Properties [Propriétés] pour que le Chemin d'accès cible comprenne le paramètre de la ligne de commande /dir (nom de répertoire privé), par exemple:

"c:\Program Files\dtsearch52\dtswin.exe" /dir "c:\dtsearch52"
"c:\Program Files\dtsearch53\dtswin.exe" /dir "c:\dtsearch53"

Vous trouverez un article (DTS0136) sur la page Web des FAQ qui traite de ce problème et du partage d'une seule copie de dtSearch sur une même machine entre des utilisateurs souhaitant différents paramètres d'options.


Prise en charge des langues

dtSearch utilise un fichier stemming.dat qui permet de développer des recherches en utilisant les règles de troncation. Par exemple, la saisie du mot applique et la sélection de l'option troncation vous permettra de retrouver les documents qui non seulement contiennent le mot 'applique' mais aussi les variations grammaticales appliquer, appliquée, applique. En fait, la saisie d'une variation grammaticale permettra de retrouver les documents contenant toutes les autres. Le nombre de règles de troncation sera de 500 à partir de la version 5.23 de dtSearch.

Jusqu'à présent les utilisateurs qui souhaitaient les règles pour une autre langue devaient modifier eux-mêmes les fichiers. Maintenant, les fichiers de troncation sont disponibles pour la plupart des langues européennes auprès de ElectronArt Design (UK) dans le Language Extension Pack [Module de prise en charge linguistique] pour développeurs. Il comprend des fichiers des règles de troncation et des mots inutiles ainsi que des fichiers test et une documentation pour le français, l'allemand, l'italien, l'espagnol, le néerlandais, le suédois, le danois, le portugais (brésilien/européen), le finnois et le norvégien.


[ Haut de la page]


Copyright 1997-2000 ElectronArt Design Ltd
Mise à jour 7 août 2000