Zuverlässigkeit (Statistik)

In der Statistik bezieht sich Zuverlässigkeit auf die Konsistenz eines Maßes. Wie man sagt, hat ein Maß eine hohe Zuverlässigkeit, wenn es konsequente Ergebnisse unter konsequenten Bedingungen erzeugt. Zum Beispiel sind Maße der Höhe und Gewichts von Leuten häufig äußerst zuverlässig.

Typen

Es gibt mehrere allgemeine Klassen von Zuverlässigkeitsschätzungen:

  • Inter-rater Zuverlässigkeit bewertet den Grad, zu dem Testhunderte entsprechen, wenn Maße von verschiedenen Leuten genommen werden, die dieselben Methoden verwenden.
  • Test - testet Zuverlässigkeit wieder bewertet den Grad, zu dem Testhunderte von einer Testregierung zum folgenden entsprechen. Maße werden von einem einzelnen rater gesammelt, wer dieselben Methoden oder Instrumente und dieselben Probebedingungen verwendet. Das schließt intra-rater Zuverlässigkeit ein.
  • Zwischenmethode-Zuverlässigkeit bewertet den Grad, zu dem Testhunderte entsprechen, wenn es eine Schwankung in den Methoden oder verwendeten Instrumenten gibt. Das erlaubt inter-rater Zuverlässigkeit, ausgeschlossen zu werden. Wenn, sich mit Formen befassend, es genannte Zuverlässigkeit der parallelen Formen sein kann.
  • Innere Konsistenz-Zuverlässigkeit, bewertet die Konsistenz von Ergebnissen über Sachen innerhalb eines Tests.

Unterschied zur Gültigkeit

Zuverlässigkeit bezieht Gültigkeit nicht ein. D. h. ein zuverlässiges Maß, das etwas durchweg misst, kann nicht messen, was Sie messen wollen. Zum Beispiel, während es viele zuverlässige Tests von spezifischen geistigen Anlagen gibt, würden nicht sie alle gültig sein, um, sagen wir, Arbeitsleistung vorauszusagen. In Bezug auf die Genauigkeit und Präzision ist Zuverlässigkeit der Präzision analog, während Gültigkeit der Genauigkeit analog ist.

Während Zuverlässigkeit Gültigkeit nicht einbezieht, legt ein Mangel an der Zuverlässigkeit wirklich eine Grenze auf Tests gesamte Gültigkeit. Ein Test, der nicht vollkommen zuverlässig ist, kann entweder als ein Mittel von Messattributen einer Person oder als ein Mittel nicht vollkommen gültig sein, Hunderte auf einem Kriterium vorauszusagen. Während ein zuverlässiger Test nützliche gültige Auskunft geben kann, kann ein Test, der nicht zuverlässig ist, nicht vielleicht gültig sein.

Ein Beispiel hat häufig gepflegt zu illustrieren, dass der Unterschied zwischen Zuverlässigkeit und Gültigkeit in den experimentellen Wissenschaften eine allgemeine Badezimmerwaage einschließt. Wenn jemand, der 200-Pfund-Schritte auf einer Skala 10mal ist und Lesungen 15, 250, 95, 140, usw., die Skala bekommt, nicht zuverlässig ist. Wenn die Skala durchweg "150" liest, dann ist es zuverlässig, aber nicht gültig. Wenn es "200" jedes Mal liest, dann ist das Maß sowohl zuverlässig als auch gültig. Das ist, was durch die Behauptung gemeint wird, "Ist Zuverlässigkeit notwendig, aber für die Gültigkeit nicht genügend."

Allgemeines Modell

In der Praxis entsprechen prüfende Maßnahmen nie vollkommen. Theorien der Testzuverlässigkeit sind entwickelt worden, um die Effekten der Widersprüchlichkeit auf der Messgenauigkeit zu schätzen. Der grundlegende Startpunkt für fast alle Theorien der Testzuverlässigkeit ist die Idee, dass Testhunderte den Einfluss von zwei Sorten von Faktoren widerspiegeln:

1. Faktoren, die zu Konsistenz beitragen: Stabile Eigenschaften der Person oder des Attributes, dass man versucht, zu messen

2. Faktoren, die zu Widersprüchlichkeit beitragen: Eigenschaften der Person oder der Situation, die Testhunderte betreffen, aber nichts haben kann, um mit dem Attribut zu tun, das wird misst

Einige dieser Widersprüchlichkeiten schließen ein:

  • Vorläufige, aber allgemeine Eigenschaften der Person: Gesundheit, Erschöpfung, Motivation, emotionale Beanspruchung
  • Vorläufige und spezifische Eigenschaften der Person: Verständnis der spezifischen Testaufgabe, spezifischen Tricks oder Techniken, sich mit den besonderen Testmaterialien, Schwankungen des Gedächtnisses, der Aufmerksamkeit oder der Genauigkeit zu befassen
  • Aspekte der Probesituation: Freiheit von Ablenkungen, Klarheit von Instruktionen, Wechselwirkung der Persönlichkeit, des Geschlechtes oder der Rasse des Prüfers
  • Zufallsfaktoren: Glück in der Auswahl an Antworten durch das bloße Schätzen, kurze Ablenkungen

Die Absicht, Zuverlässigkeit zu schätzen, soll bestimmen, wie viel der Veränderlichkeit in Testhunderten wegen Fehler im Maß ist, und wie viel wegen der Veränderlichkeit in wahren Hunderten ist.

Eine wahre Kerbe ist die replicable Eigenschaft des Konzepts, das wird misst. Es ist der Teil der beobachteten Kerbe, die über verschiedene Maß-Gelegenheiten ohne Fehler wiederkehren würde.

Fehler des Maßes werden sowohl aus dem zufälligen Fehler als auch aus systematischen Fehler zusammengesetzt. Es vertritt die Diskrepanzen zwischen Hunderten, die auf Tests und den entsprechenden wahren Hunderten erhalten sind.

Diese Begriffsdepression wird normalerweise durch die einfache Gleichung vertreten:

Klassische Testtheorie

Die Absicht der Zuverlässigkeitstheorie ist, Fehler im Maß zu schätzen und Weisen anzudeuten, Tests zu verbessern, so dass Fehler minimiert werden.

Die Hauptannahme der Zuverlässigkeitstheorie ist, dass Maß-Fehler im Wesentlichen zufällig sind. Das bedeutet nicht, dass Fehler aus Zufallsprozessen entstehen. Für jede Person ist ein Fehler im Maß nicht ein völlig zufälliges Ereignis. Jedoch, über eine Vielzahl von Personen, wie man annimmt, werden die Ursachen des Maß-Fehlers so geändert, dass Maß-Fehler als zufällige Variablen handeln.

Wenn Fehler die wesentlichen Eigenschaften von zufälligen Variablen haben, dann ist es angemessen anzunehmen, dass Fehler ebenso wahrscheinlich positiv oder negativ sein werden, und dass sie nicht mit wahren Hunderten oder mit Fehlern auf anderen Tests aufeinander bezogen sind.

Es wird dass angenommen:

1. Mittelfehler des Maßes = 0

2. Wahre Hunderte und Fehler sind unkorrelierter

3. Fehler auf verschiedenen Maßnahmen sind unkorrelierter

Zuverlässigkeitstheorie zeigt, dass die Abweichung von erhaltenen Hunderten einfach die Summe der Abweichung von wahren Hunderten plus die Abweichung von Fehlern des Maßes ist.

Diese Gleichung weist darauf hin, dass sich Testhunderte als das Ergebnis von zwei Faktoren ändern:

1. Veränderlichkeit in wahren Hunderten

2. Veränderlichkeit wegen Fehler des Maßes.

Der Zuverlässigkeitskoeffizient stellt einen Index des Verhältniseinflusses von wahren und Fehlerhunderten auf erreichten Testhunderten zur Verfügung. In seiner allgemeinen Form wird der Zuverlässigkeitskoeffizient als das Verhältnis der wahren Kerbe-Abweichung zur Gesamtabweichung von Testhunderten definiert. Oder, gleichwertig, ein minus das Verhältnis der Schwankung des Fehlers zählen und die Schwankung der beobachteten Kerbe:

:


Pentaprism / Gültigkeit (Statistik)
Impressum & Datenschutz