"Le moteur puissant de recherche de dtSearch, ses nombreuses caractéristiques et le personnel du support technique ont permis à InfoEdge de développer InfoDox.com sur une courte période de temps pour un projet de cette étendue"

Text Retrieval Engine est essentiel à un référentiel documentaire basé sur le Web

L'évolution de l'Internet et les exigences des procédures de contentieux ont été les facteurs du développement de InfoDox.com, un référentiel documentaire basé sur le Web de la société InfoEdge Technology. La société offre des applications de gestion de documents et conçoit des bases de données personnalisées. Le concept d'un référentiel documentaire basé sur le Web est devenu nécessaire avec l'évolution de la société. Une interface avec l'Internet était nécessaire afin de satisfaire les exigences des clients.

InfoEdge avait besoin d'une capacité de recherche assez rapide, sûre et souple pour contenir une grande quantité de documents et assez rentable pour prendre en charge des petits projets. Il était aussi important que les systèmes possèdent des capacités de recherche, qu'ils soient mis à jour continuellement et qu'ils permettent un accès à l'Internet mais sans contraindre l'utilisateur à une gestion compliquée du matériel et du logiciel.

L'équipe du développement a réalisé que l'examen d'une collection importante de documents et la disponibilité d'images via l'Internet étaient des éléments fondamentaux. Les documents de base de InfoEdge sont des documents du contentieux ou des documents relatifs aux problèmes légaux. Les procès ont tendance à durer longtemps et le système recherché devait être assez souple pour s'adapter aux changements de circonstances. Par exemple, si un procès traite de lésions dues aux déchets chimiques, l'obtention des dossiers médicaux de toutes les parties peut prendre des mois, voire des années. La taille de la collection de documents peut doubler. Dans le cas contraire, un client peut souhaiter avoir tous les documents d'un procès regroupés dans une base de données pour éliminer ceux qui ne sont pas importants. Dans ce cas, la taille de la base de données peut être réduite de façon significative.

En raison de la taille des documents, InfoDox.com devait offrir la possibilité de passer directement à un texte ou à une image défini en affichant, dans les fichiers recherchés, la page du document et la ligne du texte recherché. Les documents sont regroupés à partir de différentes origines. Le système recherché devait être capable de recevoir les fichiers à partir de différentes sources car les documents sont tous reçus dans différents formats, certains en copie papier, d'autres sont des cassettes vidéo de déposition. Le traitement de plusieurs types de fichiers était essentiel, de même que la conversion de ces fichiers en formats pouvant être affichés et recherchés à partir du Web. Après des mois de recherche, l'équipe du développement de InfoEdge a été capable de satisfaire ces besoins et pouvait offrir des images sur le Web.

Chaque base de données de InfoDox.com consiste en un document et une table de "noms". Pour chaque nouvelle base de données dans InfoDox.com, le client doit répondre aux questions suivantes concernant ses besoins en matière de données:

  1. Quelles propriétés (champs) des documents souhaitez-vous capturer? Exemples: Date document, Type document, etc.
  2. Dans quels champs les listes de choix doivent-elles être disponibles pour rechercher et saisir des données afin d'assurer la consistance de la base de données?
  3. Quelles sont les valeurs disponibles pour chaque liste décrite à l'étape 2?
"dtSearch Text Retrieval Engine offre toutes les caractéristiques de recherche nécessaires à InfoDox.com, y compris la surbrillance des résultats dans les recherches en texte intégral"

Une fois que les besoins du client ont été déterminés, un administrateur de la base de données à InfoEdge conçoit sa structure et la construit, cela fait partie du service d'InfoEdge. InfoEdge extrait des données, ou dans ce cas, des documents, et les répartis dans des zones (saisie des données dans InfoDox ou en externe), des images (copies papier scannées) et l'OCR (texte intégral à partir des images). Toutes les données converties sont ensuite chargées dans l'application InfoDox. Le traitement de tous les documents, de l'imagerie, du codage, de la reconnaissance optique des caractères, etc. est fourni par InfoEdge, si nécessaire. InfoDox.com utilise le moteur de recherche en texte intégral de dtSearch et un moteur de recherche de base de données relationnelle qui entraînent la livraison des informations via le navigateur Web des utilisateurs dans le format HTML standard. L'utilisateur reçoit les images qui sont le résultat de la combinaison d'un plan de compression élevée avec un mode de transmission, d'un texte converti en format HTML avec surbrillance des occurrences et des zones.

dtSearch Text Retrieval Engine offre toutes les caractéristiques de recherche nécessaires à InfoDox.com, y compris la surbrillance des résultats dans les recherches en texte intégral. En combinant le moteur de recherche et la technologie d'imagerie, les besoins de rapidité et de performance ont été satisfaits. Le moteur puissant de recherche de dtSearch, ses nombreuses caractéristiques et le personnel du support technique ont permis à InfoEdge de développer InfoDox.com sur une courte période de temps pour un projet de cette étendue. Le produit final permet aux utilisateurs de rechercher instantanément une grande quantité de données textuelles tout en incorporant des possibilités de recherche par expressions régulières, par opérateurs booléens, par troncation et par thesaurus. Les utilisateurs peuvent aussi tirer avantage des possibilités de la recherche floue pour retrouver des documents même si les mots recherchés contiennent des fautes d'orthographe ou si des erreurs apparaissent après la lecture OCR.

Pour assurer la sécurité des documents, InfoEdge a incorporé un protocole appelé Secure Sockets Layer (SSL). Il permet d'identifier les utilisateurs autorisés, d'interdire l'accès aux utilisateurs non autorisés et de chiffrer les transmissions de données du référentiel documentaire au navigateur de l'utilisateur. Il s'agit de la même technologie utilisée par les institutions financières pour transmettre des données sensibles et pour traiter les transactions par cartes de crédit sur Internet.

Avec l'introduction d'InfoDox.com au début de l'année dernière, InfoEdge Technology, Inc. a été la première société à utiliser le modèle ASP pour les champs d'imagerie de documents et l'aide au litige. Bien que le succès de InfoDox.com soit dû à la combinaison de technologies utilisées par InfoEdge pour générer une solution puissante et rentable pour ses clients, la performance de dtSearch Text Retrieval Engine était un facteur important. Le produit permet aux utilisateurs d'InfoDox.com de rechercher des millions de documents en quelques secondes au lieu de quelques minutes ou de quelques heures.


www.dtsearch.co.uk   Tel: 0208 554 8660    Fax: 0208 554 0665   info@dtsearch.co.uk