Analytische Online-Verarbeitung

In der Computerwissenschaft ist analytische Online-Verarbeitung oder OLAP , eine Annäherung, um auf Abfragen der mehrdimensional analytisch (MDA) schnell zu antworten. OLAP ist ein Teil der breiteren Kategorie der Geschäftsintelligenz, die auch Verwandtschaftsbericht und Datenbergwerk umfasst. Typische Anwendungen von OLAP schließen Geschäft ein, das für Verkäufe, Marketing, Verwaltungsbericht, Geschäftsprozess-Management (BPM), das Budgetieren und die Vorhersage, die Finanzberichterstattung und die ähnlichen Gebiete, mit neuen Anwendungen heraufkommend wie Landwirtschaft berichtet. Der Begriff OLAP wurde geschaffen, weil eine geringe Modifizierung der traditionellen Datenbank OLTP (Online-Transaktionsverarbeitung) nennt.

OLAP Werkzeuge ermöglichen Benutzern, mehrdimensionale Daten von vielfachen Perspektiven interaktiv zu analysieren. OLAP besteht aus drei grundlegenden analytischen Operationen: Verdichtung (Rollen-), Bohrmaschine unten, und das Schneiden und Würfeln. Verdichtung schließt die Ansammlung von Daten ein, die angesammelt und in einer oder mehr Dimensionen geschätzt werden können. Zum Beispiel werden alle Verkaufsbüros bis zur Verkaufsabteilung oder Verkaufsabteilung gerollt, um Verkaufstendenzen vorauszusehen. Im Gegensatz ist die Bohrmaschine unten eine Technik, die Benutzern erlaubt, durch die Details zu schiffen. Zum Beispiel können Benutzer zu den Verkäufen durch individuelle Produkte zugreifen, die Verkäufe eines Gebiets zusammensetzen. Das Schneiden und Würfeln sind eine Eigenschaft, wodurch Benutzer (das Schneiden) eines spezifischen Satzes von Daten des Würfels und der Ansicht wegnehmen können, die die Scheiben aus verschiedenen Gesichtspunkten (würfelt).

Für OLAP konfigurierte Datenbanken verwenden ein mehrdimensionales Datenmodell, analytischen Komplex berücksichtigend, und fragt ad hoc mit einer schnellen Ausführungszeit. Sie leihen Aspekte von Navigationsdatenbanken, hierarchischen Datenbanken und Verwandtschaftsdatenbanken.

Der Kern jedes OLAP Systems ist ein OLAP Würfel (auch hat einen 'mehrdimensionalen Würfel' oder einen Hyperwürfel genannt). Es besteht aus numerischen Tatsachen genannt Maßnahmen, die durch Dimensionen kategorisiert werden. Der Würfel metadata wird normalerweise aus einem Sterndiagramm oder Schneeflocke-Diagramm von Tischen in einer Verwandtschaftsdatenbank geschaffen. Maßnahmen werden aus den Aufzeichnungen im Tatsache-Tisch abgeleitet, und Dimensionen werden aus den Dimensionstischen abgeleitet.

Als jedes Maß kann gedacht werden, eine Reihe von Etiketten oder damit vereinigte Meta-Daten zu haben. Eine Dimension ist, was diese Etiketten beschreibt; es gibt Auskunft über das Maß.

Ein einfaches Beispiel würde ein Würfel sein, der Verkäufe eines Ladens als ein Maß und Datum/Zeit als eine Dimension enthält. Jeder Verkauf hat ein Etikett des Datums/Zeit, das mehr über diesen Verkauf beschreibt.

Jede Zahl von Dimensionen kann zur Struktur wie Laden, Kassierer oder Kunde durch das Hinzufügen einer Auslandsschlüsselsäule zum Tatsache-Tisch hinzugefügt werden. Das erlaubt einem Analytiker, die Maßnahmen entlang jeder Kombination der Dimensionen anzusehen.

Zum Beispiel:

Verkaufstatsache-Tisch

+-------------+----------+

| sale_amount | time_id |

+-------------+----------+ Zeitdimension

| 2008.10 | 1234 |---+ +---------+-------------------+

+-------------+----------+ | | time_id | Zeitstempel |

| +---------+-------------------+

+----> | 1234 | 20080902 12:35:43 Uhr |

+---------+-------------------+

Mehrdimensionale Datenbanken

Mehrdimensionale Struktur wird als "eine Schwankung des Verwandtschaftsmodells definiert, das mehrdimensionale Strukturen verwendet, um Daten zu organisieren und die Beziehungen zwischen Daten auszudrücken". Die Struktur wird in Würfel gebrochen, und die Würfel sind im Stande, Daten innerhalb der Grenzen jedes Würfels zu versorgen und auf sie zuzugreifen. "Jede Zelle innerhalb einer mehrdimensionalen Struktur enthält angesammelte Daten, die mit Elementen entlang jeder seiner Dimensionen verbunden sind". Selbst wenn Daten manipuliert werden, bleibt es leicht zum Zugang und setzt fort, ein Kompaktdatenbankformat einzusetzen. Die Daten bleiben noch in Wechselbeziehung stehend.

Mehrdimensionale Struktur ist für analytische Datenbanken ziemlich populär, die analytische Online-Verarbeitung (OLAP) Anwendungen (O'Brien & Marakas, 2009) verwenden. Analytische Datenbanken verwenden diese Datenbanken wegen ihrer Fähigkeit, Antworten auf komplizierte Geschäftsabfragen schnell zu liefern. Daten können von verschiedenen Winkeln angesehen werden, der eine breitere Perspektive eines Problems verschieden von anderen Modellen gibt.

Ansammlungen

Es ist gefordert worden, dass für komplizierte Abfragen OLAP Würfel eine Antwort in ungefähr 0.1 % der Zeit erzeugen können, die für dieselbe Abfrage auf OLTP Verwandtschaftsdaten erforderlich ist. Der wichtigste Mechanismus in OLAP, der ihm erlaubt, solche Leistung zu erreichen, ist der Gebrauch von Ansammlungen. Ansammlungen werden vom Tatsache-Tisch durch das Ändern der Körnung auf spezifischen Dimensionen und das Anhäufen von Daten entlang diesen Dimensionen gebaut. Die Zahl von möglichen Ansammlungen wird durch jede mögliche Kombination von Dimensionskörnungen bestimmt.

Die Kombination aller möglichen Ansammlungen und der Grunddaten enthält die Antworten auf jede Abfrage, auf die von den Daten geantwortet werden kann.

Weil gewöhnlich es viele Ansammlungen gibt, die häufig berechnet werden können, wird nur eine vorher bestimmte Zahl völlig berechnet; der Rest wird auf Verlangen gelöst. Das Problem des Entscheidens, welche Ansammlungen (Ansichten) zu rechnen als das Ansicht-Auswahl-Problem bekannt sind. Ansicht-Auswahl kann durch die Gesamtgröße des ausgewählten Satzes von Ansammlungen, die Zeit beschränkt werden, um sie von Änderungen in den Grunddaten oder beiden zu aktualisieren. Das Ziel der Ansicht-Auswahl ist normalerweise, die durchschnittliche Zeit zu minimieren, um auf OLAP-Abfragen zu antworten, obwohl einige Studien auch die Aktualisierungszeit minimieren. Ansicht-Auswahl ist NP-Complete. Viele Annäherungen an das Problem, sind einschließlich gieriger Algorithmen, randomized Suche, genetische Algorithmen und A* Suchalgorithmus erforscht worden.

Typen

OLAP Systeme sind mit der folgenden Taxonomie traditionell kategorisiert worden.

Mehrdimensional

'MOLAP' ist die 'klassische' Form von OLAP und wird manchmal gerade OLAP genannt. MOLAP versorgt das Daten in einer optimierten mehrdimensionalen Reihe-Lagerung, aber nicht in einer Verwandtschaftsdatenbank. Deshalb verlangt es die Vorberechnung und Lagerung der Information im Würfel - die als Verarbeitung bekannte Operation.

Verwandtschafts-

ROLAP arbeitet direkt mit Verwandtschaftsdatenbanken. Die Grunddaten und die Dimensionstische werden als Verwandtschaftstische versorgt, und neue Tische werden geschaffen, um die angesammelte Information zu halten. Hängt von einem Spezialdiagramm-Design ab. Diese Methodik verlässt sich auf die Manipulierung der in der Verwandtschaftsdatenbank versorgten Daten, um das Äußere der Scheiben schneidenden und würfelnden Funktionalität des traditionellen OLAP zu geben. Hauptsächlich ist jede Handlung des Schneidens und Würfelns zum Hinzufügen "WO" Klausel in der SQL Behauptung gleichwertig.

Hybride

Es gibt keine eindeutige Vereinbarung über die Industrie betreffs, was "Hybriden OLAP" einsetzt, außer dass eine Datenbank Daten zwischen der Verwandtschafts- und Speziallagerung teilen wird. Zum Beispiel, für einige Verkäufer, wird eine HOLAP Datenbank Verwandtschaftstische verwenden, um die größeren Mengen von ausführlichen Daten zu halten, und Gebrauch hat Lagerung für mindestens einige Aspekte der kleineren Mengen mehr - gesamte oder weniger ausführlich berichtete Daten spezialisiert.

Vergleich

Jeder Typ hat bestimmte Vorteile, obwohl es Unstimmigkeit über die Details der Vorteile zwischen Versorgern gibt.

  • Einige MOLAP Durchführungen sind für die Datenbankexplosion, ein Phänomen anfällig, das riesengroße Beträge des Abstellraums verursacht, durch MOLAP Datenbanken verwendet zu werden, wenn bestimmte allgemeine Bedingungen entsprochen werden: hohe Zahl von Dimensionen, vorberechneten Ergebnissen und spärlichen mehrdimensionalen Daten.
  • MOLAP liefert allgemein bessere Leistung wegen Spezialindexieren- und Lagerungsoptimierungen. MOLAP braucht auch weniger Abstellraum im Vergleich zu ROLAP, weil die Speziallagerung normalerweise Kompressionstechniken einschließt.
  • ROLAP ist allgemein ersteigbarer. Jedoch ist große Volumen-Aufbereitung schwierig, effizient durchzuführen, so wird sie oft ausgelassen. ROLAP Anfragenleistung kann deshalb schrecklich leiden.
  • Da sich ROLAP mehr auf die Datenbank verlässt, um Berechnungen durchzuführen, hat es mehr Beschränkungen in den Spezialfunktionen, die es verwenden kann.
  • HOLAP umfasst eine Reihe von Lösungen, die versuchen, den besten von ROLAP und MOLAP zu mischen. Es kann allgemein schnell, Skala in einer Prozession vorgehen so, und gute Funktionsunterstützung anbieten.

Andere Typen

Die folgenden Akronyme werden auch manchmal verwendet, obwohl sie nicht so weit verbreitet sind wie diejenigen oben:

  • WOLAP - webbasierter OLAP
  • DOLAP - Arbeitsfläche OLAP
  • RTOLAP - schritthaltender OLAP

APIs und Anfragensprachen

Verschieden von Verwandtschaftsdatenbanken, die SQL als die Standardanfragensprache und weit verbreiteter APIs wie ODBC, JDBC und OLEDB hatten, gab es keine solche Vereinigung in der OLAP Welt seit langem. Die erste echte Standard-API war OLE DB für die OLAP Spezifizierung von Microsoft, das 1997 erschienen ist und die MDX-Anfragensprache eingeführt hat. Mehrere OLAP Verkäufer - sowohl Server als auch Kunde - haben es angenommen. 2001 haben Microsoft und Hyperion den XML für die Analyse-Spezifizierung bekannt gegeben, die von den meisten OLAP Verkäufern gutgeheißen wurde. Seitdem das auch MDX als eine Anfragensprache verwendet hat, ist MDX die allgemeine Norm geworden.

Seit dem September 2011 kann LINQ verwendet werden, um SSAS OLAP Würfel von Microsoft.NET zu fragen.

Produkte

Geschichte

Das erste Produkt, das OLAP-Abfragen durchgeführt hat, war Ausdrücklich, der 1970 veröffentlicht (und durch das Orakel 1995 von Informationsmitteln erworben wurde). Jedoch ist der Begriff bis 1993 nicht erschienen, als er von Edgar F. Codd ins Leben gerufen wurde, der als "der Vater der Verwandtschaftsdatenbank" beschrieben worden ist. Das Papier von Codd hat sich aus einer kurzen Beratenanweisung ergeben, die Codd für die ehemalige Laube-Software (später Hyperion-Lösungen, und 2007 erworben durch das Orakel) als eine Art Marktstaatsstreich übernommen hat. Die Gesellschaft hatte sein eigenes OLAP Produkt, Essbase ein Jahr früher veröffentlicht. Infolgedessen waren die "zwölf Gesetze von Codd der analytischen Online-Verarbeitung" in ihrer Verweisung auf Essbase ausführlich. Es gab eine folgende Meinungsverschiedenheit, und als Computerworld erfahren hat, dass Codd durch die Laube bezahlt wurde, hat sie den Artikel zurückgenommen.

OLAP Markt hat starkes Wachstum gegen Ende der 90er Jahre mit Dutzenden von kommerziellen Produkten erfahren, die in Markt eintreten. 1998 hat Microsoft seinen ersten OLAP Server - Microsoft Analysis Services veröffentlicht, die breite Adoption der OLAP Technologie gesteuert hat und es in die Hauptströmung bewegt hat.

Produktvergleich

Sieh: Vergleich von OLAP Servern.

Marktstruktur

Unten ist eine Liste von OLAP Spitzenverkäufern 2006 mit Zahlen in Millionen von US-Dollars.

Microsoft war der einzige Verkäufer, der unaufhörlich das durchschnittliche Industriewachstum während 2000-2006 überschritten hat. Seit den obengenannten Daten wurde gesammelt, Hyperion ist durch das Orakel, Cartesis durch Geschäftsgegenstände, Geschäftsgegenstände von SAP, Applix von Cognos und Cognos von IBM erworben worden.

Siehe auch

  • Online-Transaktion, die (OLTP) in einer Prozession geht
  • Geschäftsanalytik
  • Prophetische Analytik

Bibliografie

  • Ling Liu und Mehr gezähmte M. Özsu (Hrsg.). (2009). "Enzyklopädie von Datenbanksystemen, 4100 p. 60 illus. Internationale Standardbuchnummer 978-0-387-49616-0.
  • O'Brien, J. A., & Marakas, G. M. (2009). Verwaltungsinformationssysteme (9. Hrsg.). Boston, Massachusetts: McGraw-Hill/Irwin.

Mettmann (Bezirk) / Verbindungspunkt-Station von Mitcham
Impressum & Datenschutz