Datenlager

In der Computerwissenschaft ist ein Datenlager (DW) eine Datenbank, die für den Bericht und die Analyse verwendet ist. Die im Lager versorgten Daten werden von den betrieblichen Systemen (wie Marktplatz, Verkäufe, usw. wie gezeigt, in der Feige) geladen. Die Daten können einen betrieblichen Datenladen für zusätzliche Operationen durchführen, bevor sie im DW für den Bericht verwendet werden.

Das typische ETL-basierte Datenlager verwendet das Inszenieren, die Integration und die Zugriffsschichten, um seine Schlüsselfunktionen aufzunehmen. Die inszenierende Schicht oder inszenierende Datenbank versorgen rohe aus jedem der ungleichen Quelldatensysteme herausgezogene Daten. Die Integrationsschicht integriert die ungleichen Dateien durch das Umwandeln der Daten von der inszenierenden Schicht, die häufig versorgt, das hat Daten in einer Datenbank des betrieblichen Datenladens (ODS) umgestaltet. Die einheitlichen Daten werden dann zu noch einer anderen Datenbank, häufig genannt die Datenlager-Datenbank bewegt, wo die Daten in hierarchal Gruppen häufig genannt Dimensionen und in Tatsachen und gesamte Tatsachen eingeordnet werden. Die Kombination von Tatsachen und Dimensionen wird manchmal ein Sterndiagramm genannt. Die Zugriffsschicht hilft Benutzern, Daten wiederzubekommen.

Ein von einheitlichen Datenquellsystemen gebautes Datenlager verlangt ETL nicht, Datenbanken inszenierend, oder betriebliche Daten versorgen Datenbanken. Wie man betrachten kann, sind die einheitlichen Datenquellsysteme ein Teil verteilte betriebliche Daten versorgen Schicht. Datenföderationsmethoden oder Datenvirtualisierungsmethoden können verwendet werden, um auf die verteilten einheitlichen Quelldatensysteme zuzugreifen, um Daten direkt in die Datenlager-Datenbanktische zu konsolidieren und anzusammeln. Verschieden vom ETL-basierten Datenlager werden die einheitlichen Quelldatensysteme und das Datenlager alle integriert, da es keine Transformation von dimensionalen oder Bezugsdaten gibt. Diese einheitliche Datenlager-Architektur unterstützt die Bohrmaschine unten von den gesamten Daten des Datenlagers zu den transactional Daten der einheitlichen Quelldatensysteme.

Datenlager können in Datenmärkte unterteilt werden. Datenmärkte versorgen Teilmengen von Daten von einem Lager.

Diese Definition des Datenlagers konzentriert sich auf Datenlagerung. Die Hauptquelle der Daten wird gereinigt, umgestaltet, katalogisiert und für den Gebrauch von Betriebsleitern und anderen Geschäftsfachleuten für Datenbergwerk, analytische Online-Verarbeitung, Marktforschung und Entscheidungshilfe (Marakas & O'Brien 2009) bereitgestellt. Jedoch gestalten die Mittel, Daten zum Extrakt wiederzubekommen und zu analysieren, um und laden Daten, und das Datenwörterbuch zu führen, werden auch als wesentliche Bestandteile eines Datenlagerungssystems betrachtet. Viele Verweisungen auf die Datenlagerung verwenden diesen breiteren Zusammenhang. So schließt eine ausgebreitete Definition für die Datenlagerung Geschäftsnachrichtendienstwerkzeuge, Werkzeuge zum Extrakt ein, gestalten Sie um und laden Sie Daten ins Behältnis und Werkzeuge, um metadata zu führen und wiederzubekommen.

Vorteile eines Datenlagers

Ein Datenlager erhält eine Kopie der Information von den Quelltransaktionssystemen aufrecht. Diese architektonische Kompliziertheit stellt die Gelegenheit zur Verfügung:

  • Erhalten Sie Datengeschichte aufrecht, selbst wenn die Quelltransaktionssysteme nicht tun.
  • Integrierte Daten von vielfachen Quellsystemen, eine Hauptansicht über das Unternehmen ermöglichend. Dieser Vorteil ist immer wertvoll, aber besonders so als die Organisation um die Fusion gewachsen ist.
  • Verbessern Sie Datenqualität, indem Sie konsequente Codes und Beschreibungen zur Verfügung stellen, beflaggend oder sogar schlechte Daten befestigend.
  • Präsentieren Sie die Information der Organisation durchweg.
  • Stellen Sie ein einzelnes allgemeines Datenmodell für alle Daten von Interesse unabhängig von der Quelle der Daten zur Verfügung.
  • Strukturieren Sie die Daten um, so dass es Sinn den Geschäftsbenutzern hat.
  • Strukturieren Sie die Daten um, so dass es ausgezeichnete Anfragenleistung sogar für komplizierte analytische Abfragen liefert, ohne die betrieblichen Systeme zusammenzupressen.
  • Fügen Sie Wert zu betrieblichen kommerziellen Anwendungen, namentlich Systeme des Kundenbeziehungsmanagements (CRM) hinzu.

Geschichte

Das Konzept der Datenlagerung geht auf das Ende der 1980er Jahre zurück, als Forscher von IBM Barry Devlin und Paul Murphy das "Geschäftsdatenlager" entwickelt haben. Hauptsächlich war das Datenlagerungskonzept beabsichtigt, um ein architektonisches Modell für den Datenfluss von betrieblichen Systemen bis Entscheidungshilfe-Umgebungen zur Verfügung zu stellen. Das Konzept hat versucht, die verschiedenen Probleme zu richten, die mit diesem Fluss, hauptsächlich die hohen damit vereinigten Kosten vereinigt sind. Ohne eine Datenlagerungsarchitektur war ein enormer Betrag der Überfülle erforderlich, vielfache Entscheidungshilfe-Umgebungen zu unterstützen. In größeren Vereinigungen war es für vielfache Entscheidungshilfe-Umgebungen typisch, um unabhängig zu funktionieren. Obwohl jede Umgebung verschiedenen Benutzern gedient hat, haben sie häufig viele derselben versorgten Daten verlangt. Der Prozess des Sammelns, Reinigung und Integrierung von Daten von verschiedenen Quellen, gewöhnlich von langfristigen vorhandenen betrieblichen Systemen (gewöhnlich gekennzeichnet als Vermächtnis-Systeme), wurde normalerweise teilweise für jede Umgebung wiederholt. Außerdem wurden die betrieblichen Systeme oft nochmals geprüft, weil neue Entscheidungshilfe-Voraussetzungen erschienen sind. Häufig haben neue Voraussetzungen genötigt, sich zu versammeln, reinigend und neue Daten von "Datenmärkten" integrierend, die für den bereiten Zugang von Benutzern geschneidert wurden.

Schlüsselentwicklungen in frühen Jahren der Datenlagerung waren:

  • Die 1960er Jahre — General Mills und Universität von Dartmouth, in einem gemeinsamen Forschungsprojekt, entwickeln die Begriffe Dimensionen und Tatsachen.
  • Die 1970er Jahre — ACNIELSEN und IRI stellen dimensionale Datenmärkte für Einzelverkäufe zur Verfügung.
  • Die 1970er Jahre — Bill Inmon beginnt, den Begriff zu definieren und zu besprechen: Datenlager
  • 1975 — Sperry Univac Führen MAPPER Ein (Erhalten Sie aufrecht, bereiten Sie Vor, und Erzeugen Sie Exekutivberichte) ist ein Datenbankmanagement und das Melden des Systems, das das erste in der Welt 4GL einschließt. Es war die erste Plattform, die spezifisch entworfen ist, um Informationszentren (ein Vorzeichen von zeitgenössischen Unternehmensdatenlagerungsplattformen) zu bauen
  • 1983 — Teradata führt ein für die Entscheidungshilfe spezifisch entworfenes Datenbankverwaltungssystem ein.
  • 1983 — Sperry Corporation Martyn Richard Jones definiert die Sperry Informationszentrum-Annäherung, der nicht, ein wahrer DW im Sinn von Inmon seiend, hat wirklich viele der Eigenschaften von DW Strukturen enthalten und ist wie definiert, vorher durch Inmon, und später durch Devlin in einer Prozession gegangen. Zuerst verwendet an TSB England & Wales
  • 1984 — Metapher-Computersysteme, die von David Liddle und Don Massaro gegründet sind, befreien Data Interpretation System (DIS). DIS war ein Paket der Hardware/Software und GUI für Geschäftsbenutzer, um ein Datenbankmanagement und analytisches System zu schaffen.
  • 1988 — Barry Devlin und Paul Murphy veröffentlichen den Artikel Eine Architektur für ein Geschäft und Informationssystem in IBM Systems Journal, wo sie den Begriff "Geschäftsdatenlager" einführen.
  • 1990 — Rote Ziegelsysteme, die von Ralph Kimball gegründet sind, führen Rotes Ziegellager, ein Datenbankverwaltungssystem spezifisch für die Datenlagerung ein.
  • 1991 — Prisma-Lösungen, die von Bill Inmon gegründet sind, stellen Prisma-Lager-Betriebsleiter, Software vor, für ein Datenlager zu entwickeln.
  • 1992 — Bill Inmon veröffentlicht das Buch, das das Datenlager Baut.
  • 1995 — Das Datenlagerungsinstitut, eine gewinnorientierte Organisation, die Datenlagerung fördert, wird gegründet.
  • 1996 — Ralph Kimball veröffentlicht das Buch Das Datenlager-Werkzeug.
  • 2000 — Daniel Linstedt veröffentlicht das Datengewölbe, Echtzeit auditable Datenlager-Lager ermöglichend.

Normalisiert gegen die dimensionale Annäherung für die Lagerung von Daten

Es gibt zwei Hauptannäherungen an die Speicherung von Daten in einem Datenlager — die dimensionale Annäherung und die normalisierte Annäherung.

Die dimensionale Annäherung, deren Unterstützer "Kimballites" genannt werden, glaubt an die Annäherung von Ralph Kimball, in der es festgestellt wird, dass das Datenlager mit einem Dimensionalen Diagramm des Modells/Sterns modelliert werden sollte. Die normalisierte Annäherung, auch genannt 3NF Modell, dessen Unterstützer "Inmonites" genannt werden, glaubt an die Annäherung von Bill Inmon, in der es festgestellt wird, dass das Datenlager mit einem E-R modelliert werden sollte, modellieren Modell/normalisieren.

In einer dimensionalen Annäherung werden Transaktionsdaten entweder in "Tatsachen" verteilt, die allgemein numerische Transaktionsdaten oder "Dimensionen" sind, die die Bezugsinformation sind, die Zusammenhang den Tatsachen gibt. Zum Beispiel kann eine Verkaufstransaktion in Tatsachen wie die Zahl von Produkten bestellt und der Preis zerbrochen werden, der für die Produkte, und in Dimensionen wie Ordnungsdatum, Kundenname, Produktzahl, Ordnungsschiff - zu und Rechnung - zu Positionen und Verkäufer bezahlt ist, der dafür verantwortlich ist, die Ordnung zu erhalten.

Ein Schlüsselvorteil einer dimensionalen Annäherung besteht darin, dass das Datenlager für den Benutzer leichter ist, zu verstehen und zu verwenden. Außerdem neigt die Wiederauffindung von Daten vom Datenlager dazu, sehr schnell zu funktionieren. Dimensionale Strukturen sind leicht, für Geschäftsbenutzer zu verstehen, weil die Struktur in Maße/Tatsachen und Zusammenhang/Dimensionen geteilt wird. Tatsachen sind mit den Geschäftsprozessen der Organisation und betrieblichem System verbunden, wohingegen die Dimensionen, die sie umgeben, Zusammenhang über das Maß (Kimball, Ralph 2008) enthalten.

Die Hauptnachteile der dimensionalen Annäherung sind:

  1. Um die Integrität von Tatsachen und Dimensionen aufrechtzuerhalten, wird das Laden des Datenlagers mit Daten von verschiedenen betrieblichen Systemen, und kompliziert
  2. Es ist schwierig, die Datenlager-Struktur zu modifizieren, wenn die Organisation, die die dimensionale Annäherung annimmt, den Weg ändert, auf den es Geschäfte macht.

In der normalisierten Annäherung werden die Daten im Datenlager im Anschluss an, zu einem Grad, Datenbanknormalisierungsregeln versorgt. Tische werden zusammen durch Sachgebiete gruppiert, die allgemeine Datenkategorien (z.B, Daten auf Kunden, Produkten, Finanz, usw.) widerspiegeln. Die normalisierte Struktur teilt Daten in Entitäten, der mehrere Tische in einer Verwandtschaftsdatenbank schafft. Wenn angewandt, in großen Unternehmen ist das Ergebnis Dutzende von Tischen, die zusammen durch ein Web von Verbindungslinien verbunden werden. Außerdem wird jede der geschaffenen Entitäten in getrennte physische Tische umgewandelt, wenn die Datenbank (Kimball, Ralph 2008) durchgeführt wird.

Der Hauptvorteil dieser Annäherung besteht darin, dass es aufrichtig ist, um Information in die Datenbank hinzuzufügen. Ein Nachteil dieser Annäherung ist, dass, wegen der Zahl von beteiligten Tischen, es für Benutzer beide schwierig sein kann zu:

  1. schließen Sie sich Daten von verschiedenen Quellen in die bedeutungsvolle Information und dann an
  2. greifen Sie auf die Information ohne ein genaues Verstehen der Quellen von Daten und von der Datenstruktur des Datenlagers zu.

Es sollte bemerkt werden, dass sowohl normalisiert - als auch dimensionale Modelle in Verwandschaftsdiagrammen vertreten werden kann, weil beide angeschlossene Verwandtschaftstische enthalten. Der Unterschied zwischen den zwei Modellen ist der Grad der Normalisierung.

Diese Annäherungen sind nicht gegenseitig exklusiv, und es gibt andere Annäherungen. Dimensionale Annäherungen können mit Normalisieren-Daten zu einem Grad (Kimball, Ralph 2008) verbunden sein.

Im geInformationssteuerten Geschäft (Wiley 2010) schlägt Robert Hillard eine Annäherung an das Vergleichen der zwei auf den Informationsbedürfnissen nach dem Geschäftsproblem gestützten Annäherungen vor. Die Technik zeigt, dass normalisierte Modelle viel mehr Information halten als ihre dimensionalen Entsprechungen (selbst wenn dieselben Felder in beiden Modellen verwendet werden), aber diese Extrainformation kommt auf Kosten der Brauchbarkeit. Die Technik misst Informationsmenge in Bezug auf das Informationswärmegewicht und Brauchbarkeit in Bezug auf das Kleine Weltdatentransformationsmaß.

Verfeinernd gegen von unten nach oben Designmethodiken

Von unten nach oben Design

Ralph Kimball, ein wohl bekannter Autor auf der Datenlagerung, ist ein Befürworter einer Annäherung an das Datenlager-Design, das er als von unten nach oben beschreibt.

In von unten nach oben werden Annäherungsdatenmärkte zuerst geschaffen, um Bericht und analytische Fähigkeiten für spezifische Geschäftsprozesse zur Verfügung zu stellen. Obwohl es wichtig ist zu bemerken, dass in der Methodik von Kimball von unten nach oben Prozess das Ergebnis der orientierten Verfeinernden Analyse eines anfänglichen Geschäfts der relevanten zu modellierenden Geschäftsprozesse ist.

Datenmärkte, enthalten in erster Linie, Dimensionen und Tatsachen. Tatsachen können jeder Atomdaten und, nötigenfalls, zusammengefasste Daten enthalten.

Der einzelne Datenmarkt modelliert häufig ein spezifisches Geschäftsgebiet wie "Verkäufe" oder "Produktion". Diese Datenmärkte können schließlich integriert werden, um ein umfassendes Datenlager zu schaffen. Die Integration von Datenmärkten wird durch die Durchführung dessen geführt, was Kimball "eine Datenlager-Busarchitektur" nennt.

Die Datenlager-Busarchitektur ist in erster Linie eine Durchführung "des Busses", eine Sammlung von angepassten Dimensionen und angepassten Tatsachen, die Dimensionen sind, die (auf eine spezifische Weise) zwischen Tatsachen in zwei oder mehr Datenmärkten geteilt werden.

Die Integration der Datenmärkte im Datenlager wird auf die angepassten Dimensionen in den Mittelpunkt gestellt (das Wohnen "im Bus"), die die mögliche Integration "Punkte" zwischen Datenmärkten definieren. Die wirkliche Integration von zwei oder mehr Datenmärkten wird dann durch einen Prozess getan, der als "Bohrmaschine über" bekannt ist. Eine Bohrmaschine - über Arbeiten durch die Gruppierung (Zusammenstellung) der Daten entlang den Schlüsseln der (geteilten) angepassten Dimensionen jeder Tatsache, die an der "Bohrmaschine über" gefolgten von einer Verbindungslinie auf den Schlüsseln dieser gruppierten (zusammengefassten) Tatsachen teilnimmt.

Das Aufrechterhalten dichten Managements über die Datenlager-Busarchitektur ist für das Aufrechterhalten der Integrität des Datenlagers grundsätzlich. Die wichtigste Verwaltungsaufgabe stellt sicher, dass Dimensionen unter Datenmärkten entsprechen. In den Wörtern von Kimball bedeutet das, dass "sich" die Dimensionen "anpassen".

Einige betrachten es als einen Vorteil der Methode von Kimball, dass das Datenlager damit endet, in mehrere logisch selbst enthalten (bis zu und einschließlich Des Busses) und konsequente Datenmärkte, aber nicht ein großer und häufig kompliziertes zentralisiertes Modell "segmentiert" zu werden.

Geschäftswert kann so schnell zurückgegeben werden, wie die ersten Datenmärkte geschaffen werden können, und die Methode sich gut zu einer wiederholenden und Forschungsannäherung an das Gebäude von Datenlagern gibt. Zum Beispiel könnte die Datenlagerungsanstrengung in der "Verkaufs"-Abteilung, durch das Gebäude eines Verkaufsdaten-Markts anfangen. Nach der Vollziehung des Verkaufsdaten-Markts könnte sich Das Geschäft dann dafür entscheiden, die Lagerungstätigkeiten in die, sagen wir, "Produktionsabteilung" auszubreiten, auf einen Produktionsdatenmarkt hinauslaufend.

Die Voraussetzung für den Verkaufsdatenmarkt und den Produktionsdatenmarkt, um integrable zu sein, ist, dass sie denselben "Bus" teilen, der sein wird, dass sich die Datenlagerungsmannschaft angestrengt hat, um die angepassten Dimensionen im Bus, und dass die individuellen Datenmarkt-Verbindungen dass Information vom Bus zu identifizieren und durchzuführen. Bemerken Sie, dass das 100-%-Bewusstsein vom Anfall der Datenlagerungsanstrengung nicht verlangt, ist kein Produktionsplan vordringlich erforderlich. Der Verkaufsdaten-Markt ist gut, weil es ist (das Annehmen, dass der Bus abgeschlossen ist) und der Produktionsdatenmarkt eigentlich unabhängig des Verkaufsdatenmarkts (aber ziemlich abhängig des Busses) gebaut werden kann.

Wenn die Integration über den Bus erreicht wird, wird das Datenlager, durch seine zwei Datenmärkte, nicht nur im Stande sein, die spezifische Information zu liefern, die die individuellen Datenmärkte entworfen werden, um, in diesem Beispiel entweder "Verkäufe" oder "Produktions"-Information zu tun, aber integrierte Verkaufsproduktionsinformation liefern können, die häufig von kritischer Geschäftswichtigkeit ist. Eine Integration (vielleicht) auf eine flexible und wiederholende Mode erreicht.

Abwärtsstrukturierung

Bill Inmon, einer der ersten Autoren auf dem Thema der Datenlagerung, hat ein Datenlager als ein zentralisiertes Behältnis für das komplette Unternehmen definiert. Inmon ist einer der Hauptbefürworter der verfeinernden Annäherung an das Datenlager-Design, in dem das Datenlager mit einem normalisierten Unternehmensdatenmodell entworfen wird. "Atom"-Daten, d. h. Daten am Tiefststand des Details, werden im Datenlager versorgt. Dimensionale Datenmärkte, die Daten enthalten, die für spezifische Geschäftsprozesse oder spezifische Abteilungen erforderlich sind, werden vom Datenlager geschaffen. In der Vision von Inmon ist das Datenlager am Zentrum der "Korporativen Informationsfabrik" (CIF), der ein logisches Fachwerk zur Verfügung stellt, um Geschäftsintelligenz (BI) und Geschäftsverwaltungsfähigkeiten zu liefern.

Inmon stellt fest, dass das Datenlager ist:

Thema-orientiert: Die Daten im Datenlager werden organisiert, so dass alle Datenelemente in Zusammenhang mit demselben wirklichen Ereignis oder Gegenstand zusammen verbunden werden.

Unvergänglich: Daten im Datenlager werden nie überschrieben oder — einmal begangen gelöscht, die Daten sind statisch, read-only-, und für den zukünftigen Bericht behalten.

Integriert: Das Datenlager enthält Daten von die meisten oder allen betrieblichen Systemen einer Organisation, und diese Daten werden konsequent gemacht.

Zeitvariante: Für Ein betriebliches System enthalten die versorgten Daten den aktuellen Wert.

Die Abwärtsstrukturierungsmethodik erzeugt hoch konsequente dimensionale Ansichten von Daten über Datenmärkte, da alle Datenmärkte vom zentralisierten Behältnis geladen werden. Abwärtsstrukturierung hat sich auch erwiesen, gegen Geschäftsänderungen robust zu sein. Das Erzeugen neuer dimensionaler Datenmärkte gegen die im Datenlager versorgten Daten ist eine relativ einfache Aufgabe. Der Hauptnachteil zur verfeinernden Methodik ist, dass sie ein sehr großes Projekt mit einem sehr breiten Spielraum vertritt. Die vordringlichen Kosten, für ein Datenlager mit der verfeinernden Methodik durchzuführen, sind und die Dauer der Zeit vom Anfang des Projektes zum Punkt bedeutend, dass anfängliche Vorteile der Erfahrung von Endbenutzern wesentlich sein können. Außerdem kann die verfeinernde Methodik unbiegsam und für das Ändern von Abteilungsbedürfnissen während der Durchführungsphasen unempfänglich sein.

Hybrides Design

Lösungen des Datenlagers (DW) ähneln häufig Mittelpunkt und haben Architektur gesprochen. Vermächtnis-Systeme, die die DW/BI Lösung häufig füttern, schließen Kundenbeziehungsmanagement (CRM) und Unternehmensquellenplanungslösungen (ERP) ein, große Datenmengen erzeugend. Um diese verschiedenen Datenmodelle zu konsolidieren, und den Prozess des Extrakts gestaltet Last um (ETL) zu erleichtern, machen DW Lösungen häufig von einem betrieblichen Datenladen (ODS) Gebrauch. Die Information vom ODS wird dann in den wirklichen DW grammatisch analysiert. Um Datenredundanz zu reduzieren, werden größere Systeme häufig die Daten auf eine normalisierte Weise versorgen. Datenmärkte für spezifische Berichte können dann oben auf der DW Lösung gebaut werden.

Es ist wichtig zu bemerken, dass die DW Datenbank in einer hybriden Lösung auf der dritten normalen Form behalten wird, um Datenredundanz zu beseitigen. Eine normale Verwandtschaftsdatenbank jedoch, ist für Geschäftsnachrichtendienstberichte nicht effizient, wo das dimensionale Modellieren überwiegend ist. Kleine Datenmärkte können für Daten vom festen Lager einkaufen und die gefilterten, spezifischen Daten für die Tatsache-Tische und erforderlichen Dimensionen verwenden.

Der DW stellt effektiv eine einzelne Informationsquelle zur Verfügung, von der die Datenmärkte lesen können, eine hoch flexible Lösung aus einem BI Gesichtspunkt schaffend. Die hybride Architektur erlaubt einem DW, durch eine Master-Datenverwaltungslösung, wo betrieblich, nicht ersetzt zu werden, statische Information konnte wohnen.

Die Datengewölbe-Modellieren-Bestandteile folgen Mittelpunkt und haben Architektur gesprochen. Dieser modellierende Stil ist ein hybrides Design, aus dem besten von Rassemethoden sowohl von der 3. normalen Form als auch vom Sterndiagramm bestehend. Das Datengewölbe-Modell ist nicht eine wahre 3. normale Form, und bricht einige der Regeln, die 3NF diktieren gefolgt werden. Es ist jedoch, eine verfeinernde Architektur mit von unten nach oben Design. Das Datengewölbe-Modell wird eingestellt, um ausschließlich ein Datenlager zu sein. Es wird nicht eingestellt, um zugänglicher Endbenutzer zu sein, der, wenn gebaut, noch den Gebrauch eines Datenmarkts oder Sterndiagramms gestütztes Ausgabe-Gebiet zu Geschäftszwecken verlangt.

Datenlager gegen betriebliche Systeme

Betriebliche Systeme werden für die Bewahrung der Datenintegrität und Geschwindigkeit der Aufnahme von Geschäftstransaktionen durch den Gebrauch der Datenbanknormalisierung und eines Entitätsbeziehungsmodells optimiert. Betriebliche Systementwerfer folgen allgemein den Regeln von Codd der Datenbanknormalisierung, um Datenintegrität zu sichern. Codd hat fünf immer strengere Regeln der Normalisierung definiert. Völlig normalisierte Datenbankdesigns (d. h. diejenigen, die alle fünf Regeln von Codd befriedigen) laufen häufig, auf Information von einer Geschäftstransaktion hinaus, die zu Dutzenden zu Hunderten von Tischen wird versorgt. Verwandtschaftsdatenbanken sind beim Handhaben der Beziehungen zwischen diesen Tischen effizient. Die Datenbanken haben sehr schnelle Leistung des Einsatzes/Aktualisierung, weil nur eine kleine Datenmenge in jenen Tischen jedes Mal betroffen wird, wenn eine Transaktion bearbeitet wird. Schließlich, um Leistung zu verbessern, werden ältere Daten gewöhnlich von betrieblichen Systemen regelmäßig gereinigt.

Datenlager werden für die Geschwindigkeit der Datenanalyse optimiert. Oft sind Daten in Datenlagern denormalised über ein Dimensionsbasiertes Modell. Außerdem zur Geschwindigkeitsdatenwiederauffindung werden Datenlager-Daten häufig mehrmals — in ihrer dem grössten Teil granulierten Form und in zusammengefassten Formen genannt Anhäufungen versorgt. Datenlager-Daten werden von den betrieblichen Systemen gesammelt und im Datenlager sogar gehalten, nachdem die Daten von den betrieblichen Systemen gereinigt worden sind.

Evolution im Organisationsgebrauch

Diese Begriffe beziehen sich auf das Niveau der Kultiviertheit eines Datenlagers:

Offline betriebliches Datenlager: Datenlager in dieser Bühne der Evolution werden auf einem regelmäßigen Zeitzyklus aktualisiert (gewöhnlich täglich, wöchentlich oder monatlich) von den betrieblichen Systemen und den Daten wird in einheitliche Bericht-orientierte Daten versorgt

Off-Linedatenlager: Datenlager in dieser Bühne werden von Daten in den betrieblichen Systemen regelmäßig aktualisiert, und die Datenlager-Daten werden in einer Datenstruktur versorgt, die entworfen ist, um Bericht zu erleichtern.

Auf dem Zeitdatenlager: Online vertritt Einheitliche Datenlagerung die Echtzeitdatenlager-Bühne-Daten im Lager wird für jede Transaktion aktualisiert, die auf den Quelldaten durchgeführt ist

Einheitliches Datenlager: Diese Datenlager sammeln Daten von verschiedenen Gebieten des Geschäfts, so können Benutzer die Information nachschlagen, brauchen sie über andere Systeme.

Beispielanwendungen

Etwas von der Anwendungsdatenlagerung kann dafür verwendet werden sind:

  • Entscheidungshilfe
  • Tendenz-Analyse
  • Finanzvorhersage
  • Butterfass-Vorhersage für Telekommunikationsunterzeichnete, Kreditkartenbenutzer usw.
  • Versicherungsschwindel-Analyse
  • Nennen Sie Rekordanalyse
  • Logistik und Warenbestand-Management
  • Landwirtschaft

Siehe auch

  • Buchhaltungsintelligenz
  • Anker, modellierend
  • Geschäftsintelligenz
  • Geschäftsnachrichtendienstwerkzeuge
  • Datenintegration
  • Datenmarkt
  • Daten, die abbauen
  • Datenpräsentationsarchitektur
  • Daten, die kratzen
  • Datenlager-Gerät
  • Datenbankverwaltungssystem (DBMS)
  • Entscheidungshilfe-System
  • Datengewölbe, modellierend
  • Executive Information System (EIS)
  • Extrakt, verwandeln Sie sich, und Last (ETL)
  • Master Data Management (MDM)
  • Analytische Online-Verarbeitung (OLAP)
  • Online-Transaktion, die (OLTP) in einer Prozession geht
  • Operational Data Store (ODS)
  • Schneeflocke-Diagramm
  • Software als ein Dienst (Saas)
  • Sterndiagramm
  • Sich langsam ändernde Dimension

Weiterführende Literatur

  • Der Davenport, Thomas H. und Harris, Jeanne G. Competing auf der Analytik: Die Neue Wissenschaft, (2007) Geschäftsschulpresse von Harvard Zu gewinnen. Internationale Standardbuchnummer 978-1-4221-0332-6
  • Ganczarski, Joe. Datenlager-Durchführungen: Kritische Durchführungsfaktor-Studie (2009) VDM Verlag internationale Standardbuchnummer 3-639-18589-7 internationale Standardbuchnummer 978-3-639-18589-8
  • Kimball, Ralph und Ross, Margy. Das Datenlager-Werkzeug die Zweite Ausgabe (2002) Internationale Standardbuchnummer von John Wiley and Sons, Inc 0-471-20024-7
  • Linstedt, Graziano, Hultgren. Das Geschäft des Datengewölbes, die Zweite Ausgabe (2010) Dan linstedt, internationale Standardbuchnummer 978-1-4357-1914-9 Modellierend

Links


Dianetics / Disperser
Impressum & Datenschutz