08.10.2006 von JoDo
Thema: Beschwerde - Wortsuche!
08.10.2006 von JoDo
08.10.2006 von JoDo
Gestern war aus Anlass der langen Nacht der Museen ein Beitrag über das Bestattungsmuseum im Radio.
Na, hab ich nachgeschaut im österreichischen Lexikon.
Kein Wort gefunden bei der Suche nach "Pompfüneberer "!
hat mir das System geantwortet!
Heute hab´ich den Salat und die Helene schenkt mir ordentlich ein! Dabei habe ich mir wirklich Mühe gegeben alle möglichen Variationen den Namen zu schreiben abzusuchen.
Kann es sein, dass der Server auch so seine Mucken hat?
mfG
JoDo
Ich glaube, da bist Du gerade auf eine echte Herausforderung für die EDV gestoßen: unscharfe Suche nach Dialektwörtern.
Das System macht eine einfache Teilstringsuche. Wenn Du also z.B. nach "füneberer" suchst, wird zwar "Pompfüneberer", nicht aber "Pomfineberer" gefunden. Mit einer Suche nach "neberer" würdest Du beide finden.
Das Problem ist, dass das System exakt vergleicht, es aber andererseits für Dialektbegriffe keine einheitliche Schreibweise gibt. Bei der Lautschrift kommt erschwerend hinzu, dass sich die Aussprache regional unterscheiden kann (hoazn/haazn).
Wenn ich ein Wort suche, um es nicht doppelt einzutragen, suche ich nach einem möglichst unzweideutigen Teilstring, von dem es nicht viele Schreibvarianten gibt. Je länger dieser ist, um so leichter - sonst schaue ich im Wörterbuch unter dem jeweiligen Anfangsbuchstaben nach.
Der Luxus wär's natürlich, wenn es eine unscharfe Suche gäbe, die Varianten in der Schreibung wie z.B. die folgenden berücksichtigt und alle denkbaren Varianten sucht:
a/o/å/au (z.B. gschnollt/gschnallt)
ü/i
er/a (z.B. nimma/nimmer)
el/l (z.B. blatteln/blattln)
b/p
d/t
g/k
doppelte vs. einfache Buchstaben
Technisch wäre das z.B. wie folgt zu lösen: Zu jedem Wort wird ein "Suchschlüssel" gespeichert, der wie folgt gebildet wird:
- Alles in Kleinbuchstaben
- Vokale werden durch einen Platzhalter wie "-" ersetzt (Doppelvokale werden dabei auf einen Platzhalter reduziert) oder sogar ganz entfernt.
- Doppelte Konsonanten und "ck" werden zu einem reduziert.
- Wo es Pärchen von "harten" und "weichen" Konsonanten gibt (b/p, d/t, g/k), wird entweder immer der "harte" oder immer der "weiche" Konsonant genommen.
- Wo Lautkombinationen gefunden werden, die unterschiedlich geschrieben werden können (Konsonant+el/Konsonant+l, er/a), wird ein Spezial-Platzhalter (z.B. Großbuchstabe) eingefügt.
Die Suche bildet dann zu dem Suchbegriff ebenfalls einen Suchschlüssel nach dem obigen Schema und vergleicht diesen mit den gespeicherten Suchschlüsseln der Wörter.
Tunen kann man diese Suche vor allem im Bereich der Lautkombinationen und bei der Behandlung von Vokalen.
Auch beim Einstellen neuer Wörter bietet es sich an, diese mit der unscharfen Suche gegen bestehende Einträge abzugleichen und alles Gefundene anzuzeigen.
Alternativ dazu fällt mir noch ein, dass es ja schon eine Art "schwammige" Suche geben muss: bei manchen Worteinträgen werden "ähnliche" Wörter angezeigt. Vielleicht lässt sich das in die Suche einbauen - dabei würde ich dann aber dem Benutzer die Auswahl lassen, da Suche damit schon sehr schwammig wird.
09.10.2006 von JoDo
...was Du da zusammengetragen hast, aber, glaube mir, gestern, da hat irgendetwas gehakt, weil nichts, aber auch gar nichts gegriffen hat. Was ich da angegeben habe, war tatsächlich das und genau das Wort, das schon mehrfach vorhanden ist. Hat mich eigentlich eh gewundert, dass es da noch keinen Eintrag geben sollte.
Trotzdem oder gerade deswegen: Deine Vorschläge verdienen vor den Vorhang geholt zu werden!
vlG
JoDo
Solche Funktionen gibt es in vielen SQL-Datenbanken, allerdings sind diese meist auf Englisch ausgelegt und für andere Sprachen nur bedingt brauchbar. Aber das Prinzip ist für unsere Zwecke durchaus brauchbar...
Ach ja: diese unscharfe Suche ist natürlich auf die österreichischen Begriffe ausgelegt. Für die hochdeutschen Übersetzungen reicht fast der herkömmliche Teilstringvergleich, allenfalls für ß/ss könnte man sich etwas Ähnliches einfallen lassen.