Die vierte normale Form

Die vierte normale Form (4NF) ist eine normale in der Datenbanknormalisierung verwendete Form. Eingeführt durch Ronald Fagin 1977, 4NF ist das folgende Niveau der Normalisierung nach der Boyce-Codd Normalen Form (BCNF). Wohingegen das zweite, dritte, und Boyce-Codd normale Formen sind mit funktionellen Abhängigkeiten, 4NF beschäftigt, mit einem allgemeineren Typ der als eine mehrgeschätzte Abhängigkeit bekannten Abhängigkeit beschäftigt sind. Ein Tisch ist in 4NF, wenn, und nur wenn, für jede seiner nichttrivialen mehrgeschätzten Abhängigkeiten X Y, X ein Superschlüssel — d. h. X ist, entweder ein Kandidat-Schlüssel oder eine Obermenge davon ist.

Mehrgeschätzte Abhängigkeiten

Wenn die Säulenkopfstücke in einem Verwandtschaftsdatenbanktisch in drei zusammenhanglose Gruppierungen X, Y, und Z geteilt werden, dann, im Zusammenhang einer besonderen Reihe, können wir uns auf die Daten unter jeder Gruppe von Kopfstücken als x, y, und z beziehungsweise beziehen. Eine mehrgeschätzte Abhängigkeit X Y bedeuten, dass, wenn wir einen x wählen, der wirklich im Tisch vorkommt (nennen diese Wahl x), und eine Liste aller xyz Kombinationen kompilieren, die im Tisch vorkommen, werden wir finden, dass x mit denselben y Einträgen unabhängig von z vereinigt wird.

Eine triviale mehrgeschätzte Abhängigkeit X Y sind derjenige, wo entweder Y eine Teilmenge X, oder X und Y zusammen ist, bildet den ganzen Satz von Attributen der Beziehung.

Eine funktionelle Abhängigkeit ist ein spezieller Fall der mehrgeschätzten Abhängigkeit. In einer funktionellen Abhängigkeit X  Y bestimmt jeder x genau einen y nie wieder als einer.

Beispiel

Denken Sie das folgende Beispiel:

Jede Reihe zeigt an, dass ein gegebenes Restaurant eine gegebene Vielfalt der Pizza zu einem gegebenen Gebiet liefern kann.

Der Tisch hat keine Nichtschlüsselattribute, weil sein einziger Schlüssel {Restaurant, Pizza-Vielfalt, Liefergebiet} ist. Deshalb entspricht es alle normalen Formen bis zu BCNF. Wenn wir jedoch annehmen, dass von einem Restaurant angebotene Pizza-Varianten durch das Liefergebiet nicht betroffen werden, dann trifft es sich 4NF nicht. Das Problem besteht darin, dass der Tisch zwei nichttriviale mehrgeschätzte Abhängigkeiten von {Restaurant} Attribut zeigt (der nicht ein Superschlüssel ist). Die Abhängigkeiten sind:

  • {Restaurant} {Pizza-Vielfalt }\
  • {Restaurant} {Übergabe Gebiet }\

Diese nichttrivialen mehrgeschätzten Abhängigkeiten von einem Nichtsuperschlüssel widerspiegeln die Tatsache, dass die Varianten der Pizza ein Restaurant Angebote sind von den Gebieten unabhängig, bis die das Restaurant liefert. Diese Lage der Dinge führt zu Überfülle im Tisch: Zum Beispiel wird uns dreimal gesagt, dass A1 Pizza-Angebote Voll gestopfte Kruste, und wenn A1 Pizza anfängt, Käse-Kruste-Pizzas dann zu erzeugen, wir werden vielfache Reihen, ein für jedes der Liefergebiete der A1 Pizza hinzufügen müssen. Es gibt außerdem nichts, um uns davon abzuhalten, das falsch zu tun: Wir könnten Käse-Kruste-Reihen für alle außer einem der Liefergebiete der A1 Pizza hinzufügen, dadurch scheiternd, die mehrgeschätzte Abhängigkeit {Restaurant} {Pizza-Vielfalt} zu respektieren.

Um die Möglichkeit dieser Anomalien zu beseitigen, müssen wir die Tatsachen über Varianten legen, die in einen verschiedenen Tisch von den Tatsachen über Liefergebiete angeboten sind, zwei Tische nachgebend, die beide in 4NF sind:

Im Gegensatz, wenn sich die Pizza-Varianten, die von einem Restaurant manchmal angeboten sind, von einem Liefergebiet bis einen anderen legitim ändern würden, würde der ursprüngliche Drei-Säulen-Tisch 4NF befriedigen.

Ronald Fagin hat demonstriert, dass es immer möglich ist, 4NF zu erreichen. Der Lehrsatz von Rissanen ist auch auf mehrgeschätzten Abhängigkeiten anwendbar.

4NF in der Praxis

Ein 1992-Vortrag von Margaret S. Wu bemerkt, dass das Unterrichten der Datenbanknormalisierung normalerweise 4NF vielleicht wegen eines Glaubens unvermittelt innehält, dass auf das Tabellenverletzen 4NF (aber Treffen mit allen niedrigeren normalen Formen) in kommerziellen Anwendungen selten gestoßen wird. Dieser Glaube kann jedoch nicht genau sein. Wu berichtet, dass in einer Studie von vierzig organisatorischen Datenbanken mehr als 20 % einen oder mehr Tische enthalten haben, die 4NF verletzt haben, während sie alle niedrigeren normalen Formen entsprochen haben.

Siehe auch

System des Attribut-WertsDie dritte normale FormDie fünfte normale Form
  • Die sechste normale Form

Weiterführende Literatur

Datum, C. J. (1999), Eine Einführung in Datenbanksysteme (8. Hrsg.). Addison-Wesley Longman. Internationale Standardbuchnummer 0-321-19784-4.Kent, W. (1983) Ein Einfaches Handbuch zu Fünf Normalen Formen in der Verwandtschaftsdatenbanktheorie, den Kommunikationen des ACM, vol. 26, Seiten 120-125Datum, C.J. & Darwen, H., & Pascal, F. Datenbank Debunkings

Die dritte normale Form / Richard Perle
Impressum & Datenschutz