|
|
|
Volltext-Suchfunktionen

Grundlegende
Arten von Suchvorgängen
 |
Phrasen-
Suchen finden Phrasen, wie beispielsweise: ein
ordnungsgemäßes Verfahren |
 |
Boolesche
Operatoren beinhalten logische Partikeln, wie beispielsweise
"und/oder/nicht", um Wörter und Phrasen zusammenzufassen:
ein ordnungsgemäßes Verfahren
und nicht (Gleichheit vor dem Gesetz oder Bürgerrechte) |
 |
Nachbarschafts-Suchen finden ein Wort oder eine Phrase "n"
Wörter von einem anderen Wort oder einer anderen Phrase entfernt:
Apfelkuchen w/38 Pfirsichkuchen |
 |
Ähnliche
Schreibweise-Suchen finden Wörter,
die ähnlich geschrieben werden, beispielsweise "Schmiz"
bei einer Suche nach Schmitz. |
 |
Stammformen
suchen finden Endungsvarianten (flektierte Formen)
von Wörtern, beispielsweise holen,
holten, holest, holet, holtet, holtest, holte, holst bei einer Suche
nach holend. |
 |
Numerische
Bereichs suchen finden alle Zahlen, die
in einem Bereich zwischen zwei Zahlen liegen, wie beispielsweise
zwischen 6 und 36. |
 |
Makro
funktionen erleichtern das Einbinden häufig
verwendeter Elemente in eine Suchanfrage. |
 |
Platzhalterzeichen-Unterstützung ermöglicht, dass ?
einen einzelnen Buchstaben repräsentiert, und
dass * mehrere Buchstaben repräsentiert: Apfel*
und nicht Apfel? Soße. |
 |
Information
en zu Feldsuchen finden Sie unter Felder. |
Unscharfe
(Fuzzy) Suchen
|
 |
Unscharfe
(Fuzzy) Suchen verwenden einen proprietären Algorithmus
zum Auffinden von Suchbegriffen, selbst wenn diese Schreibfehler
enthalten. Die Unschärfe des Suchvorgangs kann in einem
Bereich von 0 bis 10 festgelegt werden, so dass die Suche
gemäß dem Schweregrad der in Ihren Dateien vorhandenen
OCR- oder Schreibfehler exakt optimiert werden kann. |
 |
Eine
Suche nach Alphabet mit einer Unschärfe von 1
würde Alphaqet finden; mit einer Unschärfe
von 3 würde sie sowohl Alphaqet als auch Alpkaqet
finden. |
 |
Die
Unschärfe ist nicht fest im Index integriert (hardwired),
so dass sie bei jedem Suchvorgang individuell variiert werden
kann. |
Synonym-/Thesaurus-Suchen
 |
Ebenfalls
unter dem Namen "Konzeptsuche" bekannt ermöglicht
eine Thesaurus-Suche das Auffinden eines Wortes (schnell)
zusammen mit ähnlichen (sinnverwandten) Wörtern
(hier z. B. geschwind und eilig). |
 |
dtSearch
bietet verschiedene Ebenen automatischer Synonymerweiterung. |
Natürlichsprachliche
Suchen
 |
dtSearch
verwendet ein Vektorraummodell zum Vergleich einer Suchanfrage
mit Dokumenten mit passenden Suchausdrücken. |
 |
Mit
natürlichsprachlichen Suchen können unstrukturierte
Suchanfragen wie die folgende erstellt werden: Suche
mir Peters Memo zur Übernahme von MegaHuge Corporation
2004 |
 |
dtSearch
führt dann intelligente Relevanzsortierungen unter Verwendung
automatischer Begriffsgewichtungen durch, die auf Häufigkeit
und Dichte der Treffer in Ihren Dateien basieren. In dem oben
aufgeführten Beispiel erhält Sam eine wesentlich
höhere Relevanzrangfolge, wenn 2004 in 3.000 Dateien
und Sam nur in zwei Dateien vorkommt. |
 |
Auf
diese Weise gelangen Sie durch eine natürlichsprachliche
Suche direkt von einer Suchanfrage in "normalem Deutsch"
zu den relevantesten Dokumenten. |
Unicode-Unterstützung
 |
Unicode-Unterstützung
ermöglicht das Indizieren und Suchen nichtdeutscher Texte,
einschließlich aller Zeichensätze, die vom Unicode-Standard
unterstützt werden. |
 |
Zusätzlich
zur vollständigen Unicode-Unterstützung bietet dtSearch
umfangreiche, zusätzliche Alphabetanpassungsoptionen. |
Kombinieren
verschiedener Arten von Suchvorgängen
 |
Beinahe
alle Sucharten sind kombinierbar. |
 |
Sie
können eine Suchanfrage bis zu einer Länge von 8.000
Zeichen so komplex gestalten, wie Sie möchten. |
 |
Die
einzige große Ausnahme bei der Kombinationsfähigkeit
von Sucharten besteht darin, dass natürlichsprachliche
Suchanfragen grundsätzlich unstrukturiert und somit nicht
mit strukturierten Suchanfragen kombinierbar sind, wie beispielsweise
Suchanfragen, die Boolesche (und/oder/nicht) oder Nachbarschaftsoperatoren
verwenden. |
Variable
Begriffsgewichtung
 |
Variable
Begriffsgewichtung wird in Verbindung mit Booleschen Suchen
angewendet, um Wörtern eine zusätzliche positive
oder negative Verstärkung bezüglich ihrer Relevanzrangfolge
in der Trefferliste zu verleihen. |
 |
Variable
Begriffsgewichtung funktioniert auch in Verbindung mit natürlichsprachlichen
Suchen, um Wörtern eine zusätzliche Verstärkung
zu ihrer Standardrelevanzrangfolge zu verleihen. |
 |
Positive
Begriffsgewichtung kann einem oder mehreren Wörtern in
einer Suche eine zusätzliche Verstärkung verleihen:
Suppe:8
oder Rezept:3 |
 |
Negative
Begriffsgewichtung kann einem oder mehreren Wörtern in
einer Suche eine negative Verstärkung (Abwertung) verleihen:
rot
oder grün oder gelb:-7 |
Sonstige
 |
dtSearch
Desktop und Network bieten die Möglichkeit, die Suchergebnisse
(ebenso wie das erneute Sortieren per Mausklick nach erfolgter
Suche) nach Name, Datum, Feldern, Trefferanzahl oder "Relevanz"
bei einer natürlichsprachlichen Suche zu sortieren. |
 |
dtSearch
Desktop und Network enthalten ebenfalls eine umfangreiche
Auswahl an Tools zum bequemen Erstellen von Suchanfragen,
einschließlich einer Wörterliste mit Bildlauf sowie
der Funktion Browse words. Weitere Informationen hierzu
erhalten Sie unter dtSearch Desktop.
dtSearch Network unterstützt Funktionspakete zur bequemen
gemeinsamen Nutzung bestimmter Suchfunktionen, wie beispielsweise
Makros, Synonymringe im Benutzer-Thesaurus, Alphabetanpassung
und Dateisegmentierung und -regeln. Weitere Informationen
hierzu erhalten Sie unter dtSearch Network. |
 |
Filteroptionen
ermöglichen Ihnen die Einschränkung der zu suchenden
Dateien mittels Name, Datum oder Dateigröße, sowohl
bei indizierten als auch bei nichtindizierten Suchen. |
Leistungsumfang
 |
Der
Leistungsumfang für das Indizieren und Suchen ist unbegrenzt. |
 |
dtSearch
kann so viele Indizes erstellen, wie benötigt werden. |
 |
Jeder
Index kann bis zu 4-8 GB an Dokumenten enthalten. |
 |
dtSearch
kann mit einer einzigen Suchanfrage so viele Indizes durchsuchen,
wie Sie möchten. |
 |
Obgleich
die Indexgröße in Abhängigkeit vom Typ der
Dokumente schwanken kann, liegt sie im Durchschnitt ungefähr
bei 25 % der Größe der Originaldokumente (Faktor
1:4). (Je größer die Datenbank ist, die von dtSearch
indiziert wird, desto tendenziell kleiner wird der Index im
Verhältnis zur Größe der Originaldokumente.) |
 |
Der
Leistungsumfang für nichtindizierte Suchen ist ebenfalls
unbegrenzt. |
Geschwindigkeit
 |
Die
Geschwindigkeit für indizierte Suchen beträgt im
Allgemeinen weniger als eine Sekunde, selbst beim Durchsuchen
mehrerer Gigabytes von Text. |
 |
Indiziertes
Suchen ist optimiert für mehrere gleichzeitige Suchvorgänge
in einem Netzwerk oder einer Website. |
 |
Die
Indizierungsgeschwindigkeit beträgt im Allgemeinen 20 MB/Minute. |
 |
Das
Aktualisieren eines Indexes verläuft sogar noch schneller,
da dtSearch alle Dateien überprüft und nur solche
Dateien neu indiziert, die hinzugefügt oder geändert
wurden. |
Verwandte
Themen
 |
Informationen
zu Optionen für die Dateianzeige im Anschluss an einen
Suchvorgang finden Sie unter Kompatibilität
& Anzeige. |
 |
Informationen
zu Feldsuchen finden Sie unter Felder. |
| |
|
|
|