Psychometrics

Psychometrics ist das Studienfach, das mit der Theorie und Technik des psychologischen Maßes betroffen ist, das das Maß von Kenntnissen, geistigen Anlagen, Einstellungen, Charakterzügen und Bildungsmaß einschließt. Das Feld ist in erster Linie mit dem Aufbau und der Gültigkeitserklärung von Maß-Instrumenten wie Fragebogen, Tests und Persönlichkeitsbewertungen beschäftigt.

Es schließt zwei Hauptforschungsaufgaben nämlich ein: (i) der Aufbau von Instrumenten und Verfahren für das Maß; und (ii) die Entwicklung und Verbesserung von theoretischen Annäherungen an das Maß. Diejenigen, die psychometrics üben, sind als psychometricians bekannt. Alle psychometricians besitzen eine spezifische psychometrische Qualifikation, und während viele klinische Psychologen sind, arbeiten andere als menschliche Arbeitskräfte oder Lern- und Entwicklungsfachleuten.

Ursprünge und Hintergrund

Viel von der frühen theoretischen und angewandten Arbeit in psychometrics wurde in einem Versuch übernommen, Intelligenz zu messen. Francis Galton, häufig gekennzeichnet als "der Vater von psychometrics", ausgedachte und eingeschlossene geistige Tests unter seinen Anthropometric-Maßnahmen. Jedoch hat der Ursprung von psychometrics auch Verbindungen zum zusammenhängenden Feld von psychophysics. Zwei andere Pioniere von psychometrics haben Doktorate in Leipzig Psychophysics Laboratorium unter Wilhelm Wundt erhalten: James McKeen Cattell 1886 und Charles Spearman 1906.

Der psychometrician L. L. Thurstone, Gründer und der erste Präsident der Psychometrischen Gesellschaft 1936, hat sich entwickelt und angewandt eine theoretische Annäherung an das Maß gekennzeichnet als das Gesetz des vergleichenden Urteils, eine Annäherung, die nahe Verbindungen zur psychophysical Theorie von Ernst Heinrich Weber und Gustav Fechner hat. Außerdem haben Spearman und Thurstone sowohl wichtige Beiträge zur Theorie als auch Anwendung der Faktorenanalyse, eine statistische Methode entwickelt geleistet und haben umfassend in psychometrics verwendet.

Mehr kürzlich ist psychometrische Theorie im Maß, Einstellungen, und Glaube und akademisches Zu-Stande-Bringen angewandt worden. Das Maß dieser unbeobachtbaren Phänomene, ist und viel von der Forschung schwierig, und die angesammelte Wissenschaft in dieser Disziplin ist in einem Versuch entwickelt worden, solche Phänomene richtig zu definieren und zu messen. Kritiker, einschließlich Praktiker in den physischen Wissenschaften und sozialer Aktivisten, haben behauptet, dass solche Definition und Quantifizierung unmöglich schwierig sind, und dass solche Maße häufig, solcher als mit psychometrischen in Arbeitsverfahren verwendeten Persönlichkeitstests missbraucht werden:

: "Zum Beispiel wird ein Arbeitgeber, der jemanden für eine Rolle will, die konsequente Aufmerksamkeit auf das wiederholende Detail verlangt, wahrscheinlich diesen Job jemandem nicht geben wollen, der sehr kreativ ist und leicht gelangweilt ist."

Abbildungen, wer bedeutende Beiträge zu psychometrics geleistet hat, schließen Karl Pearson, Henry F. Kaiser, L. L. Thurstone, Georg Rasch, Johnson O'Connor, Frederic M. Lord, Ledyard R Tucker, Arthur Jensen und David Andrich ein.

Psychometrisch, psychometrician und psychometrist Anerkennungswoche ist die erste Woche im November.

Definition des Maßes in den Sozialwissenschaften

Die Definition des Maßes in den Sozialwissenschaften hat eine lange Geschichte. Eine zurzeit weit verbreitete Definition, die von Stanley Smith Stevens (1946) vorgeschlagen ist, ist, dass Maß "die Anweisung von Ziffern zu Gegenständen oder Ereignissen gemäß einer Regel" ist. Diese Definition wurde in der Zeitung eingeführt, in der Stevens vier Niveaus des Maßes vorgeschlagen hat. Obwohl weit angenommen, unterscheidet sich diese Definition in der wichtigen Hinsicht aus der mehr klassischen Definition des in den physischen Wissenschaften angenommenen Maßes, der dieses Maß ist, ist die numerische Bewertung und der Ausdruck des Umfangs einer Menge hinsichtlich eines anderen (Michell, 1997).

Tatsächlich wurde die Definition von Stevens des Maßes als Antwort auf das britische Komitee von Ferguson vorgebracht, dessen Stuhl, A. Ferguson, ein Physiker war. Das Komitee wurde 1932 von der britischen Vereinigung für die Förderung der Wissenschaft ernannt, die Möglichkeit zu untersuchen, quantitativ Sinnesereignisse zu schätzen. Obwohl sein Stuhl und andere Mitglieder Physiker waren, hat das Komitee auch mehrere Psychologen eingeschlossen. Der Bericht des Komitees hat die Wichtigkeit von der Definition des Maßes hervorgehoben. Während die Antwort von Stevens eine neue Definition vorschlagen sollte, die beträchtlichen Einfluss im Feld gehabt hat, war das keineswegs die einzige Antwort auf den Bericht. Ein anderer, namentlich verschieden, Antwort sollte die klassische Definition, wie widerspiegelt, in der folgenden Behauptung akzeptieren:

: "Das Maß in der Psychologie und Physik ist in keinem verschiedenen Sinn. Physiker können messen, wenn sie die Operationen finden können, durch die sie den notwendigen Kriterien entsprechen können; Psychologen haben, aber dasselbe zu machen. Sie brauchen sich über die mysteriösen Unterschiede zwischen der Bedeutung des Maßes in den zwei Wissenschaften nicht zu sorgen." (Reese, 1943, p. 49)

Diese auseinander gehenden Antworten werden in alternativen Annäherungen an das Maß widerspiegelt. Zum Beispiel werden Methoden, die auf der Kovarianz matrices gestützt sind, normalerweise auf der Proposition verwendet, dass Zahlen, wie rohe Hunderte auf Bewertungen zurückzuführen gewesen sind, sind Maße. Solche Annäherungen haben implizit die Definition von Stevens des Maßes zur Folge, das nur verlangt, dass Zahlen gemäß einer Regel zugeteilt werden. Wie man allgemein betrachtet, ist die Hauptforschungsaufgabe dann die Entdeckung von Vereinigungen zwischen Hunderten, und Faktoren, die postuliert sind, um solchen Vereinigungen zu unterliegen.

Andererseits, wenn Maß-Modelle wie das Modell von Rasch verwendet werden, werden Zahlen gestützt auf einer Regel nicht zugeteilt. Statt dessen in Übereinstimmung mit der Behauptung von Reese oben werden spezifische Kriterien für das Maß festgesetzt, und die Absicht ist, Verfahren oder Operationen zu bauen, die Daten zur Verfügung stellen, die den relevanten Kriterien entsprechen. Maße werden gestützt auf den Modellen geschätzt, und Tests werden geführt, um festzustellen, ob den relevanten Kriterien entsprochen worden ist.

Instrumente und Verfahren

Die ersten psychometrischen Instrumente wurden entworfen, um das Konzept der Intelligenz zu messen. Die am besten bekannte historische Annäherung ist mit dem Test von Stanford-Binet IQ, entwickelt ursprünglich vom französischen Psychologen Alfred Binet verbunden gewesen. Nachrichtendiensttests sind nützliche Werkzeuge zu verschiedenen Zwecken. Eine alternative Vorstellung der Intelligenz ist, dass kognitive Kapazitäten innerhalb von Personen eine Manifestation eines allgemeinen Bestandteils, oder allgemeinen Nachrichtendienstfaktors, sowie kognitiver zu einem gegebenen Gebiet spezifischer Kapazität sind.

Psychometrics wird weit in der Bildungsbewertung angewandt, um geistige Anlagen in Gebieten wie das Lesen, das Schreiben und die Mathematik zu messen. Die Hauptannäherungen in der Verwendung von Tests in diesen Gebieten sind Klassische Testtheorie und die neueren Maß-Modelle von Item Response Theory und Rasch gewesen. Diese letzten Annäherungen erlauben gemeinsames Schuppen von Personen und Bewertungssachen, der eine Grundlage schafft, um Entwicklungskontinua durch das Erlauben von Beschreibungen der Sachkenntnisse kartografisch darzustellen, die an verschiedenen Punkten entlang einem Kontinuum gezeigt sind. Solche Annäherungen geben starke Auskunft bezüglich der Natur des Entwicklungswachstums innerhalb von verschiedenen Gebieten.

Ein anderer Hauptfokus in psychometrics ist auf der Prüfung gewesen. Es hat eine Reihe von theoretischen Annäherungen an das Auffassen und Messen der Persönlichkeit gegeben. Einige der besser bekannten Instrumente schließen Minnesota Multiphasic Persönlichkeitswarenbestand, das Fünf-Faktoren-Modell (oder "Große 5") und Werkzeuge wie Persönlichkeit und Vorzugswarenbestand und der Typ-Hinweis von Myers-Briggs ein. Einstellungen sind auch umfassend mit psychometrischen Annäherungen studiert worden. Eine übliche Methodik im Maß von Einstellungen ist der Gebrauch der Skala von Likert. Eine alternative Methode schließt die Anwendung von sich entfaltenden Maß-Modellen, das allgemeinste Wesen das Modell des Cosinus hyperbolicus (Andrich & Luo, 1993) ein.

Theoretische Annäherungen

Psychometricians haben mehrere verschiedene Maß-Theorien entwickelt. Diese schließen klassische Testtheorie (CTT) und Artikel-Ansprechtheorie (IRT) ein. Eine Annäherung, die mathematisch scheint, IRT ähnlich zu sein, sondern auch, in Bezug auf seine Ursprünge und Eigenschaften ziemlich kennzeichnend, wird durch das Modell von Rasch für das Maß vertreten. Die Entwicklung des Modells von Rasch und die breitere Klasse von Modellen, denen es gehört, wurden auf Voraussetzungen des Maßes in den physischen Wissenschaften ausführlich gegründet.

Psychometricians haben auch Methoden entwickelt, um mit großem matrices von Korrelationen und Kovarianzen zu arbeiten. Techniken in dieser allgemeinen Tradition schließen ein: Faktorenanalyse, eine Methode, die zu Grunde liegenden Dimensionen von Daten zu bestimmen; mehrdimensionales Schuppen, eine Methode, für eine einfache Darstellung für Daten mit einer Vielzahl von latenten Dimensionen zu finden; und das Datensammeln, eine Annäherung an die Entdeckung von Gegenständen, die einander ähnlich sind. Alle diese multivariate beschreibenden Methoden versuchen, große Datenmengen in einfachere Strukturen zu destillieren. Mehr kürzlich vertreten das Strukturgleichungsmodellieren und die Pfad-Analyse hoch entwickeltere Annäherungen an das Arbeiten mit der großen Kovarianz matrices. Diese Methoden erlauben statistisch hoch entwickelten Modellen, an Daten geeignet und geprüft zu werden, um zu bestimmen, ob sie entsprechend sind, passt.

Einer der Hauptmängel in verschiedenen Faktorenanalysen ist ein Mangel an der Einigkeit im Ausschnitt von Punkten, für die Zahl von latenten Faktoren zu bestimmen. Ein übliches Verfahren soll Factoring aufhören, wenn eigenvalues unter demjenigen fallen, weil der ursprüngliche Bereich zurückweicht. Der Mangel an den Schneidpunkten betrifft andere multivariate Methoden auch.

Schlüsselkonzepte

Schlüsselkonzepte in der klassischen Testtheorie sind Zuverlässigkeit und Gültigkeit. Ein zuverlässiges Maß ist dasjenige, das eine Konstruktion durchweg über die Zeit, Personen und Situationen misst. Ein gültiges Maß ist dasjenige, das misst, was es beabsichtigt ist, um zu messen. Ein Maß kann zuverlässig sein, ohne gültig zu sein. Jedoch ist Zuverlässigkeit notwendig, aber für die Gültigkeit nicht genügend.

Sowohl Zuverlässigkeit als auch Gültigkeit können statistisch bewertet werden. Die Konsistenz über wiederholte Maßnahmen desselben Tests kann mit dem Korrelationskoeffizienten von Pearson bewertet werden, und wird häufig genannt Test - testen Zuverlässigkeit wieder. Ähnlich kann die Gleichwertigkeit von verschiedenen Versionen desselben Maßes durch eine Korrelation von Pearson mit einem Inhaltsverzeichnis versehen werden, und wird gleichwertige Form-Zuverlässigkeit oder einen ähnlichen Begriff genannt.

Innere Konsistenz, die die Gleichartigkeit einer einzelnen Testform richtet, kann durch das Entsprechen der Leistung auf zwei Hälften eines Tests bewertet werden, der genannte Spalt-Hälfte der Zuverlässigkeit ist; der Wert dieses Produktmoment-Korrelationskoeffizienten von Pearson für zwei Halbtests wird mit der Vorhersageformel von Spearman-Brown angepasst, um der Korrelation zwischen zwei lebensgroßen Tests zu entsprechen. Vielleicht ist der meistens verwendete Index der Zuverlässigkeit der α von Cronbach, der zur bösartigen von der ganzen möglichen Spalt-Hälfte von Koeffizienten gleichwertig ist. Andere Annäherungen schließen die Intraklassenkorrelation ein, die das Verhältnis der Abweichung von Maßen eines gegebenen Ziels zur Abweichung aller Ziele ist.

Es gibt mehrere verschiedene Formen der Gültigkeit. Kriterium-zusammenhängende Gültigkeit kann durch das Entsprechen eines Maßes mit einem Kriterium-Maß bewertet werden, das bekannt ist, gültig zu sein. Wenn das Kriterium-Maß zur gleichen Zeit als das Maß gesammelt wird, das gültig wird macht, ist die Absicht, gleichzeitige Gültigkeit zu gründen; wenn das Kriterium später gesammelt wird, ist die Absicht, prophetische Gültigkeit zu gründen. Ein Maß hat Konstruktionsgültigkeit, wenn es mit Maßnahmen anderer Konstruktionen, wie erforderlich, durch die Theorie verbunden ist. Zufriedene Gültigkeit ist eine Demonstration, dass die Sachen eines Tests vom Gebiet gezogen werden, das wird misst. In einem Personalauswahl-Beispiel basiert Testinhalt auf einer definierten Behauptung oder Satz von Behauptungen von Kenntnissen, Sachkenntnis, Fähigkeit oder anderen bei einer Job-Analyse erhaltenen Eigenschaften.

Artikel-Ansprechtheorie modelliert die Beziehung zwischen latenten Charakterzügen und Antworten, um Sachen zu prüfen. Unter anderen Vorteilen schafft IRT eine Grundlage, für eine Schätzung der Position eines Testnehmers auf einem gegebenen latenten Charakterzug sowie dem Standardfehler des Maßes dieser Position zu erhalten. Zum Beispiel können Kenntnisse eines Universitätsstudenten der Geschichte aus seiner oder ihrer Kerbe auf einem Universitätstest abgeleitet werden und dann zuverlässig mit aus einem weniger schwierigen Test abgeleiteten Studentenkenntnissen der Höheren Schule verglichen werden. Durch die klassische Testtheorie abgeleitete Hunderte haben diese Eigenschaft nicht, und die Bewertung der wirklichen Fähigkeit (aber nicht Fähigkeit hinsichtlich anderer Testnehmer) muss durch das Vergleichen von Hunderten mit denjenigen einer "Norm-Gruppe bewertet werden, die" zufällig von der Bevölkerung ausgewählt ist. Tatsächlich sind alle Maßnahmen auf klassische Testtheorie zurückzuführen gewesen sind von der geprüften Probe abhängig, während, im Prinzip, diejenigen, die aus Artikel-Ansprechtheorie abgeleitet sind, nicht sind.

Standards der Qualität

Die Rücksichten der Gültigkeit und Zuverlässigkeit werden normalerweise als wesentliche Elemente angesehen, für die Qualität jedes Tests zu bestimmen. Jedoch haben Fachmann und Praktiker-Vereinigungen oft diese Sorgen innerhalb von breiteren Zusammenhängen gelegt, wenn sie Standards entwickeln und gesamte Urteile über die Qualität jedes Tests als Ganzes innerhalb eines gegebenen Zusammenhangs machen. Eine Rücksicht der Sorge in vielen Zweckforschungseinstellungen besteht darin, ob der metrische von einem gegebenen psychologischen Warenbestand bedeutungsvoll oder willkürlich ist.

Prüfung von Standards

In diesem Feld legen die Standards für die Pädagogische und Psychologische Prüfung Standards über die Gültigkeit und Zuverlässigkeit, zusammen mit Fehlern des Maßes und der verwandten Rücksichten unter dem allgemeinen Thema des Testaufbaus, der Einschätzung und der Dokumentation. Das zweite Hauptthema bedeckt Standards, die mit der Schönheit in der Prüfung, einschließlich der Schönheit im Probe- und Testgebrauch, den Rechten und Verantwortungen von Testnehmern, Prüfung von Personen von verschiedenen Sprachhintergründen und Prüfung von Personen mit Körperbehinderungen verbunden sind. Das dritte und endgültige Hauptthema bedeckt Standards, die mit der Prüfung von Anwendungen, einschließlich der Verantwortungen von Testbenutzern, psychologischer Prüfung und Bewertung, Bildungsprüfung und Bewertung verbunden sind, in der Beschäftigung und credentialing, plus die Prüfung in der Programm-Einschätzung und Rechtsordnung prüfend.

Einschätzungsstandards

Im Feld der Einschätzung, und in der besonderen Bildungseinschätzung hat das Gemeinsame Komitee auf Standards für die Bildungseinschätzung drei Sätze von Standards für Einschätzungen veröffentlicht. Die Personaleinschätzungsstandards wurden 1988 veröffentlicht, Die Programm-Einschätzungsstandards (2. Ausgabe) wurde 1994 veröffentlicht, und Die Studenteneinschätzungsstandards wurden 2003 veröffentlicht.

Jede Veröffentlichung präsentiert und arbeitet eine Reihe von Standards für den Gebrauch in einer Vielfalt von Bildungseinstellungen sorgfältig aus. Die Standards stellen Richtlinien für das Entwerfen, das Einführen, das Festsetzen und die Besserung der identifizierten Form der Einschätzung zur Verfügung. Jeder der Standards ist in eine von vier grundsätzlichen Kategorien gelegt worden, um Bildungseinschätzungen zu fördern, die richtig, nützlich, ausführbar, und genau sind. In diesen Sätzen von Standards werden Gültigkeit und Zuverlässigkeitsrücksichten unter dem Genauigkeitsthema bedeckt. Zum Beispiel helfen die Studentengenauigkeitsstandards sicherzustellen, dass Studenteneinschätzungen gesunde, genaue und glaubwürdige Auskunft über den Studenten geben werden, der erfährt und Leistung.

Siehe auch

  • Klassische Testtheorie
  • Konzeptwarenbestand
  • Das Alpha von Cronbach
  • Bildungsbewertung
  • Bildungspsychologie
  • Historiometry
  • Artikel-Ansprechtheorie
  • Liste der psychometrischen Software
  • Operationalisation
  • Quantitative Psychologie
  • Modell von Rasch
  • Klettern Sie (Sozialwissenschaften)
  • Begabung
  • Schulberater
  • Psychologischer Schulprüfer
  • Schulpsychologie
  • Standardisierter Test

Bibliografie

  • Michell, J. (1999). Maß in der Psychologie. Cambridge: Universität von Cambridge Presse.
  • Rasch, G. (1960/1980). Modelle von Probabilistic für etwas Intelligenz und Erreichungstests. Kopenhagen, dänisches Institut für die Bildungsforschung), hat Ausgabe (1980) mit dem Vorwort und Nachwort durch B.D. Wright ausgebreitet. Chicago: Die Universität der Chikagoer Presse.
  • Thurstone, L.L. (1929). Das Maß des psychologischen Werts. In T.V. Smith und W.K. Wright (Hrsg.). Aufsätze in der Philosophie durch siebzehn Doktoren der Universität Chicagos. Chicago: Offenes Gericht.
  • Thurstone, L.L. (1959). Das Maß von Werten. Chicago: Die Universität der Chikagoer Presse.
  • http://www.services.unimelb.edu.au/careers/student/interviews/test.html.Psychometric-Bewertungsuniversität Melbournes.

Referenzen

Weiterführende Literatur

Internationale
  • Paperback-Standardbuchnummer 0-7619-2605-4

Links


Pionier 11 / Philosophie der Ausbildung
Impressum & Datenschutz