|
"Le
moteur puissant de recherche de dtSearch, ses
nombreuses caractéristiques et le personnel
du support technique ont permis à InfoEdge
de développer InfoDox.com sur une courte
période de temps pour un projet de cette
étendue"
|
|
Text
Retrieval Engine est essentiel à un référentiel
documentaire basé sur le Web
L'évolution
de l'Internet et les exigences des procédures
de contentieux ont été les facteurs du
développement de InfoDox.com, un référentiel
documentaire basé sur le Web de la société
InfoEdge Technology. La société offre
des applications de gestion de documents et conçoit
des bases de données personnalisées. Le
concept d'un référentiel documentaire
basé sur le Web est devenu nécessaire
avec l'évolution de la société.
Une interface avec l'Internet était nécessaire
afin de satisfaire les exigences des clients.
InfoEdge
avait besoin d'une capacité de recherche assez
rapide, sûre et souple pour contenir une grande
quantité de documents et assez rentable pour
prendre en charge des petits projets. Il était
aussi important que les systèmes possèdent
des capacités de recherche, qu'ils soient mis
à jour continuellement et qu'ils permettent un
accès à l'Internet mais sans contraindre
l'utilisateur à une gestion compliquée
du matériel et du logiciel.
L'équipe
du développement a réalisé que
l'examen d'une collection importante de documents et
la disponibilité d'images via l'Internet étaient
des éléments fondamentaux. Les documents
de base de InfoEdge sont des documents du contentieux
ou des documents relatifs aux problèmes légaux.
Les procès ont tendance à durer longtemps
et le système recherché devait être
assez souple pour s'adapter aux changements de circonstances.
Par exemple, si un procès traite de lésions
dues aux déchets chimiques, l'obtention des dossiers
médicaux de toutes les parties peut prendre des
mois, voire des années. La taille de la collection
de documents peut doubler. Dans le cas contraire, un
client peut souhaiter avoir tous les documents d'un
procès regroupés dans une base de données
pour éliminer ceux qui ne sont pas importants.
Dans ce cas, la taille de la base de données
peut être réduite de façon significative.
En
raison de la taille des documents, InfoDox.com devait
offrir la possibilité de passer directement à
un texte ou à une image défini en affichant,
dans les fichiers recherchés, la page du document
et la ligne du texte recherché. Les documents
sont regroupés à partir de différentes
origines. Le système recherché devait
être capable de recevoir les fichiers à
partir de différentes sources car les documents
sont tous reçus dans différents formats,
certains en copie papier, d'autres sont des cassettes
vidéo de déposition. Le traitement de
plusieurs types de fichiers était essentiel,
de même que la conversion de ces fichiers en formats
pouvant être affichés et recherchés
à partir du Web. Après des mois de recherche,
l'équipe du développement de InfoEdge
a été capable de satisfaire ces besoins
et pouvait offrir des images sur le Web.
Chaque
base de données de InfoDox.com consiste en un
document et une table de "noms". Pour chaque
nouvelle base de données dans InfoDox.com, le
client doit répondre aux questions suivantes
concernant ses besoins en matière de données:
- Quelles
propriétés (champs) des documents souhaitez-vous
capturer? Exemples: Date document, Type document,
etc.
- Dans
quels champs les listes de choix doivent-elles être
disponibles pour rechercher et saisir des données
afin d'assurer la consistance de la base de données?
- Quelles
sont les valeurs disponibles pour chaque liste décrite
à l'étape 2?
|
|
"dtSearch
Text Retrieval Engine offre toutes les caractéristiques
de recherche nécessaires à InfoDox.com,
y compris la surbrillance des résultats
dans les recherches en texte intégral"
|
|
Une
fois que les besoins du client ont été
déterminés, un administrateur de la base
de données à InfoEdge conçoit sa
structure et la construit, cela fait partie du service
d'InfoEdge. InfoEdge extrait des données, ou
dans ce cas, des documents, et les répartis dans
des zones (saisie des données dans InfoDox ou
en externe), des images (copies papier scannées)
et l'OCR (texte intégral à partir des
images). Toutes les données converties sont ensuite
chargées dans l'application InfoDox. Le traitement
de tous les documents, de l'imagerie, du codage, de
la reconnaissance optique des caractères, etc.
est fourni par InfoEdge, si nécessaire. InfoDox.com
utilise le moteur de recherche en texte intégral
de dtSearch et un moteur de recherche de base de données
relationnelle qui entraînent la livraison des
informations via le navigateur Web des utilisateurs
dans le format HTML standard. L'utilisateur reçoit
les images qui sont le résultat de la combinaison
d'un plan de compression élevée avec un
mode de transmission, d'un texte converti en format
HTML avec surbrillance des occurrences et des zones.
dtSearch
Text Retrieval Engine offre toutes les caractéristiques
de recherche nécessaires à InfoDox.com,
y compris la surbrillance des résultats dans
les recherches en texte intégral. En combinant
le moteur de recherche et la technologie d'imagerie,
les besoins de rapidité et de performance ont
été satisfaits. Le moteur puissant de
recherche de dtSearch, ses nombreuses caractéristiques
et le personnel du support technique ont permis à
InfoEdge de développer InfoDox.com sur une courte
période de temps pour un projet de cette étendue.
Le produit final permet aux utilisateurs de rechercher
instantanément une grande quantité de
données textuelles tout en incorporant des possibilités
de recherche par expressions régulières,
par opérateurs booléens, par troncation
et par thesaurus. Les utilisateurs peuvent aussi tirer
avantage des possibilités de la recherche floue
pour retrouver des documents même si les mots
recherchés contiennent des fautes d'orthographe
ou si des erreurs apparaissent après la lecture
OCR.
Pour
assurer la sécurité des documents, InfoEdge
a incorporé un protocole appelé Secure
Sockets Layer (SSL). Il permet d'identifier les utilisateurs
autorisés, d'interdire l'accès aux utilisateurs
non autorisés et de chiffrer les transmissions
de données du référentiel documentaire
au navigateur de l'utilisateur. Il s'agit de la même
technologie utilisée par les institutions financières
pour transmettre des données sensibles et pour
traiter les transactions par cartes de crédit
sur Internet.
Avec
l'introduction d'InfoDox.com au début de l'année
dernière, InfoEdge Technology, Inc. a été
la première société à utiliser
le modèle ASP pour les champs d'imagerie de documents
et l'aide au litige. Bien que le succès de InfoDox.com
soit dû à la combinaison de technologies
utilisées par InfoEdge pour générer
une solution puissante et rentable pour ses clients,
la performance de dtSearch Text Retrieval Engine était
un facteur important. Le produit permet aux utilisateurs
d'InfoDox.com de rechercher des millions de documents
en quelques secondes au lieu de quelques minutes ou
de quelques heures.
|