Thesaurus

Ein Thesaurus ist eine Bezugsarbeit, die Wörter gruppiert zusammen gemäß der Ähnlichkeit verzeichnet zu bedeuten (Synonyme und manchmal Antonyme enthaltend) im Gegensatz zu einem Wörterbuch, das Definitionen und Artikulationen enthält. Der größte Thesaurus in der Welt ist der Historische Thesaurus des englischen Wörterbuches von Oxford, das mehr als 920,000 Einträge enthält.

Geschichte

In der Altertümlichkeit, Philo von Byblos authored der erste Text, der jetzt einen Thesaurus genannt werden konnte. Auf Sanskrit ist Amarakosha ein Thesaurus in der Vers-Form, geschrieben im 4. Jahrhundert. Das erste Beispiel des modernen Genres, des Thesaurus von Roget, wurde 1805 von Peter Mark Roget kompiliert, und 1852 veröffentlicht. Einträge im Thesaurus von Roget werden begrifflich aber nicht alphabetisch verzeichnet.

Obwohl einschließlich Synonyme ein Thesaurus als eine ganze Liste aller Synonyme für ein besonderes Wort nicht genommen werden sollte. Die Einträge werden auch entworfen, um Unterschiede zwischen ähnlichen Wörtern zu machen und bei der Auswahl genau des richtigen Wortes zu helfen. Verschieden von einem Wörterbuch gibt ein Thesaurus-Zugang die Definition von Wörtern nicht.

Das Wort "Thesaurus" wird aus dem 16. Jahrhundert aus Neuem Latein der Reihe nach vom lateinischen Thesaurus abgeleitet, der der latinisation des Griechen (thēsauros), wörtlich "Schatz-Laden" ist, allgemein eine Sammlung von Dingen bedeutend, die von großer Wichtigkeit oder Wert sind (und so die mittelalterliche Reihe von thesaurer ein Synonym für den Schatzmeister war). Diese Bedeutung ist durch den Gebrauch von Roget des Begriffes größtenteils verdrängt worden.

Thesauren DARIN

In der Informationswissenschaft, Bibliothekswissenschaft und Informationstechnologie, werden Spezialthesauren für die Informationsgewinnung entworfen. Sie sind ein Typ des kontrollierten Vokabulars, um Zwecke mit einem Inhaltsverzeichnis zu versehen oder zu markieren. Solch ein Thesaurus kann als die Basis eines Index für das Online-Material verwendet werden. Der Kunst- und Architektur-Thesaurus wird zum Beispiel verwendet, um den kanadischen mit einem Inhaltsverzeichnis zu versehen

Informationsgewinnungsthesauren werden formell organisiert, so dass vorhandene Beziehungen zwischen Konzepten ausführlich gemacht werden. Infolgedessen sind sie komplizierter als einfachere kontrollierte Vokabulare wie Autoritätslisten und Synonym-Ringe. Jeder Begriff wird in den Zusammenhang gelegt, einem Benutzer erlaubend, zwischen "dem Büro" das Büro und "Büro" die Möbel zu unterscheiden. Im Anschluss an internationale Standards werden sie allgemein hierarchisch durch Themen, Themen oder Seiten eingeordnet. Verschieden von einem literarischen Thesaurus konzentrieren sich diese Spezialthesauren normalerweise auf eine Disziplin, Thema oder Studienfach.

In der Informationstechnologie vertritt ein Thesaurus eine Datenbank oder Liste semantisch orthogonaler aktueller Suchschlüssel. Im Feld der Künstlichen Intelligenz kann ein Thesaurus manchmal eine Ontologie genannt werden.

Thesauren für die Informationsgewinnung werden normalerweise von Informationsfachmännern gebaut, und haben ihr eigenes einzigartiges Vokabular, das verschiedene Arten von Begriffen und Beziehungen definiert:

Begriffe sind die grundlegenden semantischen Einheiten, um Konzepte zu befördern. Sie sind gewöhnlich Substantive des einzelnen Wortes, da Substantive die konkreteste Wortart sind. Verben können zu Substantiven umgewandelt werden - "reinigt" zur "Reinigung", "liest" zum "Lesen" und so weiter. Adjektive und Adverbien befördern jedoch selten jede für das Indexieren nützliche Bedeutung. Wenn ein Begriff zweideutig ist, ein "Spielraum-Zeichen" kann hinzugefügt werden, um Konsistenz zu sichern, und Richtung darauf zu geben, wie man den Begriff interpretiert. Nicht jeder Begriff braucht ein Spielraum-Zeichen, aber ihre Anwesenheit ist der beträchtlichen Hilfe im Verwenden eines Thesaurus richtig und Erreichen eines richtigen Verstehens des gegebenen Feldes von Kenntnissen.

"Begriff-Beziehungen" sind Verbindungen zwischen Begriffen. Diese Beziehungen können in drei Typen geteilt werden: hierarchisch, Gleichwertigkeit oder assoziativ.

  • Hierarchische Beziehungen werden verwendet, um Begriffe anzuzeigen, die schmaler und im Spielraum breiter sind. Ein "Breiterer Begriff" (BT) oder hyperonym ist ein allgemeinerer Begriff, z.B ist "Apparat" eine Generalisation von "Computern". Gegenseitig sind Narrower Term (NT) oder hyponym ein spezifischerer Begriff, z.B "ist Digitalcomputer" eine Spezialisierung "des Computers". BT und NT sind Gegenstücke; ein breiterer Begriff bezieht notwendigerweise mindestens einen anderen Begriff ein, der schmaler ist. BT und NT werden verwendet, um Klassenbeziehungen, sowie teilweise ganze Beziehungen (meronyms und holonyms) anzuzeigen.
  • Die Gleichwertigkeitsbeziehung wird in erster Linie verwendet, um Synonyme und nahe Synonyme zu verbinden. Gebrauch-Indikatoren (USE) und Used For (UF) werden verwendet, wenn ein autorisierter Begriff für einen anderen gebraucht, Begriff unerlaubt werden soll; zum Beispiel konnte der Zugang für den autorisierten Begriff "Frequenz" den Indikator "UF Pitch" haben. Gegenseitig würde der Zugang für den unerlaubten Begriff "Wurf" den Indikator "USE Frequency" haben. Unerlaubte Begriffe werden häufig "Zugang-Vokabular" genannt, "Zugang weist hin" "nennt Zuleitung", oder "nichtbevorzugte Begriffe", zum autorisierten Begriff hinweisend (auch gekennzeichnet als der Bevorzugte Begriff oder Deskriptor), der gewählt worden ist, um für das Konzept einzutreten. Als solcher kann ihre Anwesenheit im Text Gebrauch durch die automatisierte Indexieren-Software sein, um den Bevorzugten Begriff anzudeuten, der als ein Indexieren-Begriff wird verwendet.
  • Assoziative Beziehungen werden verwendet, um zwei zusammenhängende Begriffe zu verbinden, deren Beziehung weder hierarchisch noch gleichwertig ist. Diese Beziehung wird durch den Indikator "Related Term" (RT) beschrieben. Assoziative Beziehungen sollten mit der Verwarnung angewandt werden, da der übermäßige Gebrauch von RTs Genauigkeit in Suchen reduzieren wird. Denken Sie den folgenden: Wenn der typische Benutzer mit dem Begriff "A" sucht, würden sie auch Mittel wollen, die mit dem Begriff "B" markiert sind? Wenn die Antwort ist nein, dann sollte eine assoziative Beziehung nicht hergestellt werden.

Literarische Thesauren

  • Thesaurus von englischen Wörtern & Ausdrücken (Hrsg. P. Roget); internationale Standardbuchnummer 0-06-272037-6, sieh: Der Thesaurus von Roget.
  • Weltthesaurus (Hrsg. C. Laird); internationale Standardbuchnummer 0-671-51983-2. Diese Ausgabe ist in aufeinander folgenden Ausgaben seit 1971 von Webster verwendet worden:
  • Amerikanischer Schreibtisch-Thesaurus von Oxford (Hrsg. C. Lindberg); internationale Standardbuchnummer 0-19-512674-2
  • Paperback-Thesaurus von Oxford: Die Dritte Ausgabe; internationale Standardbuchnummer 978-0-19-861425-8
  • Zufälliges Hauswortmenü von Stephen Glazier; internationale Standardbuchnummer 0-679-40030-3
  • Historischer Thesaurus von Englisch (HTE)
  • WordNet
  • OpenThesaurus
  • Der Redegewandte Thesaurus durch Tom Heehler; internationale Standardbuchnummer 978-1402243059

Spezialthesauren für die Informationsgewinnung

Thesaurus-Formate

RDF Thesaurus-Formate:

  • TIF RDF Thesaurus-Austausch-Format, SWAD-E Projekt (2003)
  • ILRT RDF Thesaurus-Draftspezifizierung (2001)
  • RDF geschmeidiges Projektdiagramm für ISO entgegenkommende mehrsprachige Thesauren (2001)
  • CERES/NBII Projekt RDF Thesaurus-Deskriptor-Standard (2000)
  • DRC DAML+OIL Ontologie für den ANRUF-Thesaurus (2002)
  • ETB RDF Diagramm für die mehrsprachige pädagogische Thesaurus-Version 0.4 (2001)
  • EDELSTEIN-Konsortium RDF Diagramm für einsprachige Thesauren (2002)
  • Agrovoc/Kaon RDF Diagramm (2001) der Ontologie/Thesaurus
  • Wordnet RDF Diagramm von Sergey Melnik

XML Thesaurus-Formate:

  • MARC-21 XMLSchema.
  • Profil von Zthes Z39.50 für die Thesaurus-Navigation (2001)
  • TML Thesaurus-Preiserhöhungssprache (1999)
  • ADL Thesaurus-Protokoll XML Formate (2002)
  • MeSH (medizinisches Format, 2001)
  • GEMET XML Format (2003)
  • APAIS XML Thesaurus-Format, eine Erweiterung von Zthes (2000)
  • Öffnen Sie Universitätsthesaurus-Diagramme (2002)
  • Soergel XML Thesaurus-Spezifizierung (2001)

Standards und Handbücher

Der ANSI/NISO Z39.19 Standard von 2005 definiert Richtlinien und Vereinbarung für das Format, den Aufbau, die Prüfung, die Wartung und das Management von einsprachigen kontrollierten Vokabularen einschließlich Listen, Synonym-Ringe, taxonomies, und Thesauren.

Für mehrsprachige Vokabulare der ISO können 5964 Richtlinien für die Errichtung und Entwicklung von mehrsprachigen Thesauren angewandt werden.

Thesaurus-Aufbau und Gebrauch: ein praktisches Handbuch. Jean Aitchison, Allan Gilchrist und David Bawden. London und New York: Veröffentlichungen von Europa (2000).

Siehe auch

Außenverbindungen


Tetraodontiformes / Tetris
Impressum & Datenschutz