Brauchbarkeitsprüfung

Brauchbarkeitsprüfung ist eine im Benutzer - Wechselwirkungsdesign verwendete Technik, um ein Produkt durch die Prüfung davon auf Benutzern zu bewerten. Das kann als eine unersetzliche Brauchbarkeitspraxis gesehen werden, da sie direkten Eingang darauf gibt, wie echte Benutzer das System verwenden. Das ist im Vergleich mit Brauchbarkeitsschaumethoden, wo Experten verschiedene Methoden verwenden, eine Benutzerschnittstelle zu bewerten, ohne Benutzer einzubeziehen.

Brauchbarkeitsprüfung konzentriert sich darauf, eine Kapazität eines Mensch-gemachten Produktes zu messen, seinen beabsichtigten Zweck zu entsprechen. Beispiele von Produkten, die allgemein aus Brauchbarkeitsprüfung einen Nutzen ziehen, sind Nahrungsmittel, Verbrauchsgüter, Websites oder Webanwendungen, Computerschnittstellen, Dokumente und Geräte. Brauchbarkeitsprüfung misst die Brauchbarkeit oder Bequemlichkeit des Gebrauches, eines spezifischen Gegenstands oder Satzes von Gegenständen, wohingegen allgemeine Wechselwirkungsstudien des menschlichen Computers versuchen, universale Grundsätze zu formulieren.

Geschichte der Brauchbarkeitsprüfung

Henry Dreyfuss gegen Ende der 1940er Jahre hat sich vertraglich verpflichtet, die Zustandzimmer für die Zwillingsüberseedampfer "Unabhängigkeit" und "Verfassung" zu entwerfen. Er hat acht Prototyp-Prunksäle gebaut und hat sie in einem Lager installiert. Er hat dann in einer Reihe von Reisenden gebracht, um in den Zimmern seit einer kurzen Zeit "zu leben", mit ihnen allen Sachen bringend, die sie normalerweise nehmen würden, wenn sie eine Kreuzfahrt machen. Seine Leute sind im Stande gewesen, mit der Zeit zum Beispiel zu entdecken, wenn es Raum für große Steamer-Stämme gab, wenn leichte Schalter neben den Betten hinzugefügt werden mussten, um Verletzung usw. zu verhindern, bevor Hunderte von Zustandzimmern ins Schiff eingebaut worden waren.

Ein Xerox-Angestellter von Palo Alto Research Center (PARC) hat geschrieben, dass PARC umfassende Brauchbarkeitsprüfung im Schaffen des Xerox-Sterns, eingeführt 1981 verwendet hat.

Das Innere Intuit Buch sagt (Seite 22, 1984), "... vor allem der Brauchbarkeit, die Prüft, ist das später Standardindustriepraxis geworden, hat LeFevre Leute von den Straßen rekrutiert... und hat ihren Kwik-Chek zeitlich festgelegt (Beschleunigen) Gebrauch mit einer Stoppuhr. Nach jedem Test... haben Programmierer gearbeitet, um das Programm zu verbessern. "http://books.google.com/books?id=lRs_4U43UcEC&printsec=frontcover&sig=ACfU3U1xvA7-f80TP9Zqt9wkB9adVAqZ4g#PPA22,M1) hat Scott Cook, Mitbegründer von Intuit, gesagt,"... haben wir Brauchbarkeit getan, die 1984 prüft, fünf Jahre, bevor irgendjemand anderer... es einen sehr großen Unterschied zwischen Tun davon und habenden Marktleuten gibt, die sie als ein Teil von ihrem... Design... ein sehr großer Unterschied zwischen Tun davon tun und sie zu haben, der Kern dessen sein, worauf sich Ingenieure konzentrieren.

Absichten der Brauchbarkeitsprüfung

Brauchbarkeitsprüfung ist eine Probetechnik des schwarzen Kastens. Das Ziel ist, Leute zu beobachten, die das Produkt verwenden, Fehler und Gebiete der Verbesserung zu entdecken. Brauchbarkeit, die allgemein prüft, schließt das Messen ein, wie gut Testthemen in vier Gebieten antworten: Leistungsfähigkeit, Genauigkeit, ruft und emotionale Antwort zurück. Die Ergebnisse des ersten Tests können als eine Grundlinie oder Kontrollmaß behandelt werden; alle nachfolgenden Tests können dann im Vergleich zur Grundlinie sein, um Verbesserung anzuzeigen.

  • Leistung - Wie viel Zeit, und wie viel Schritte, für Leute erforderlich ist, grundlegende Aufgaben zu vollenden? (Finden Sie zum Beispiel, dass etwas eine neue Rechnung kauft, zu schaffen, und den Artikel zu bestellen.)
  • Genauigkeit - Wie viel machten Fehler Leute? (Und waren sie tödlich oder mit der richtigen Information wiedergutzumachend?)
  • Rufen Sie zurück - An wie viel erinnert sich die Person später oder nach Perioden des Nichtgebrauchs?
  • Klebrigkeit - Wie viel Zeit gibt er/sie aus
  • Emotionale Antwort - Wie fühlt sich die Person über die vollendeten Aufgaben? Ist die Person überzeugt, betont? Würde der Benutzer dieses System einem Freund empfehlen?

Um die Brauchbarkeit des Systems unter der Brauchbarkeitsprüfung zu bewerten, müssen quantitative und/oder qualitative Brauchbarkeitsabsichten (auch genannt Brauchbarkeitsvoraussetzungen) im Voraus definiert werden. Wenn die Ergebnisse der Brauchbarkeitsprüfung die Brauchbarkeitsabsichten entsprechen, kann das System als verwendbar für die Endbenutzer betrachtet werden, deren Vertreter es geprüft haben.

Was Brauchbarkeitsprüfung nicht ist

Einfach das Sammeln von Meinungen auf einem Gegenstand oder Dokument ist Marktforschung oder qualitative Forschung aber nicht Brauchbarkeitsprüfung. Brauchbarkeit, die gewöhnlich prüft, schließt systematische Beobachtung unter kontrollierten Bedingungen ein zu bestimmen, wie gut Leute das Produkt verwenden können. Jedoch häufig werden sowohl qualitative Prüfung als auch Brauchbarkeitsprüfung in der Kombination verwendet, um die Motivationen/Wahrnehmungen von Benutzern zusätzlich zu ihren Handlungen besser zu verstehen.

Anstatt Benutzern eine Faustskizze und das Fragen zu zeigen, "Verstehen Sie das?" ist Brauchbarkeitsprüfung mit Beobachtungsleuten verbunden, die versuchen, etwas zu seinem beabsichtigten Zweck zu verwenden. Zum Beispiel, wenn man Instruktionen prüft, für ein Spielzeug zu sammeln, sollte den Testthemen die Weisungen und ein Kasten von Teilen erteilt werden und, anstatt gebeten zu werden, sich über die Teile und Materialien zu äußern, sie werden gebeten, das Spielzeug zusammenzustellen. Instruktionsphrasierung, Illustrationsqualität und das Design des Spielzeugs betreffen alle den Zusammenbau-Prozess.

Methoden

Die Aufstellung eines Brauchbarkeitstests ist mit sorgfältig dem Schaffen eines Drehbuches oder realistischer Situation verbunden, worin die Person eine Liste von Aufgaben mit dem Produkt durchführt, das wird prüft, während Beobachter zusehen und sich Notizen machen. Mehrere andere Testinstrumente wie Scripted-Instruktionen, Papierprototypen, und prä- und Posttestfragebogen werden auch verwendet, um Feed-Back auf dem Produkt zu sammeln, das wird prüft. Zum Beispiel, um die Verhaftungsfunktion eines E-Mail-Programms zu prüfen, würde ein Drehbuch eine Situation beschreiben, wohin eine Person eine E-Mail-Verhaftung senden, und ihn oder sie bitten muss, diese Aufgabe zu übernehmen. Das Ziel ist zu beobachten, wie Leute auf eine realistische Weise fungieren, so dass Entwickler Problem-Gebiete, und was Leute wie sehen können. Techniken haben populär gepflegt zu folgern, dass Daten während eines Brauchbarkeitstests einschließen, denken laut Protokoll, das Co-Entdeckungslernen und Augenverfolgen.

Gang-Prüfung

Gang-Prüfung (oder Saal-Abschnitt-Prüfung) sind eine allgemeine Methodik der Brauchbarkeitsprüfung. Anstatt eine innerbetriebliche, erzogene Gruppe von Prüfern gerade zu verwenden, werden fünf bis sechs zufällige Menschen gebracht in, das Produkt oder Dienst zu prüfen. Der Name der Technik bezieht sich auf die Tatsache, dass die Prüfer zufällige Leute sein sollten, die im Gang vorbeigehen.

Gang-Prüfung ist in den frühen Stufen eines neuen Designs besonders wirksam, wenn die Entwerfer "nach Backsteinmauern," so ernste Probleme suchen, dass Benutzer einfach nicht vorwärts gehen können. Jeder der normalen Intelligenz außer Entwerfern und Ingenieuren kann an diesem Punkt verwendet werden. (Sowohl Entwerfer als auch Ingenieure drehen sich sofort davon, Testthemen darin zu sein, "erfahrene Rezensenten zu sein." Sie sind häufig zu nahe zum Projekt, so wissen sie bereits, wie man die Aufgabe, dadurch fehlende Zweideutigkeiten und falsche Pfade vollbringt.)

Entfernte Brauchbarkeitsprüfung

In einem Drehbuch, wo Brauchbarkeitsschätzer, Entwickler und zukünftige Benutzer in verschiedenen Ländern und Zeitzonen gelegen werden, eine traditionelle Laboratorium-Brauchbarkeitseinschätzung führend, schafft Herausforderungen sowohl von den Kosten als auch von logistischen Perspektiven. Diese Sorgen haben zu Forschung über die entfernte Brauchbarkeitseinschätzung, mit dem Benutzer und den über die Zeit und Raum getrennten Schätzern geführt. Entfernte Prüfung, die Einschätzungen erleichtert, die im Zusammenhang der anderen Aufgaben und Technologie des Benutzers tun werden, kann entweder gleichzeitig oder asynchron sein. Gleichzeitige Brauchbarkeitsprobemethodiken schließen Videokonferenzführung ein oder verwenden entfernte sich teilende Anwendungswerkzeuge wie WebEx. Der erstere schließt Echtzeit ein auf einem Kommunikation zwischen dem Schätzer und dem Benutzer ein, während der Letztere den Schätzer und Benutzer einbezieht, der getrennt arbeitet.

Asynchrone Methodiken schließen automatische Sammlung der Klick-Ströme des Benutzers, Benutzerklotz von kritischen Ereignissen ein, die vorkommen, während sie mit der Anwendung und dem subjektiven Feed-Back auf der Schnittstelle durch Benutzer aufeinander wirken. Ähnlich einer Studie im Laboratorium ist ein asynchroner entfernter Brauchbarkeitstest Aufgabe-basiert, und die Plattformen erlauben Ihnen, Klicks und Aufgabe-Zeiten zu gewinnen. Folglich für viele große Gesellschaften erlaubt das Ihnen, WARUM hinter den Absichten der Besucher zu verstehen, wenn es eine Website oder bewegliche Seite besucht. Zusätzlich stellt dieser Stil des Benutzers, der auch prüft, eine Gelegenheit zur Verfügung, Feed-Back durch den demografischen, attitudinal und Verhaltenstyp zu segmentieren. Die Tests werden in der eigenen Umgebung des Benutzers ausgeführt (aber nicht Laboratorien) das Helfen täuscht weiter wahre Drehbuch-Prüfung vor. Diese Annäherung stellt auch ein Fahrzeug zur Verfügung, um Feed-Back von Benutzern in entfernten Gebieten schnell und mit niedrigeren organisatorischen allgemeinen Kosten leicht zu bitten.

Zahlreiche Werkzeuge sind verfügbar, um die Bedürfnisse nach beiden diesen Annäherungen zu richten. WebEx und gehen zu der Sitzung sind die meistens verwendeten Technologien, um einen gleichzeitigen entfernten Brauchbarkeitstest zu führen. Jedoch kann gleichzeitige entfernte Prüfung an der Unmittelbarkeit Mangel haben, und der Sinn "der Anwesenheit" hat gewünscht, einen zusammenarbeitenden Probeprozess zu unterstützen. Außerdem kann das Handhaben zwischenmenschlicher Dynamik über kulturelle und linguistische Barrieren Annäherungen verlangen, die zu den beteiligten Kulturen empfindlich sind. Andere Nachteile schließen ein, Kontrolle über die Probeumgebung und die Ablenkungen und Unterbrechungen reduziert, die von den Teilnehmern in ihrer heimischen Umgebung erfahren sind. Eine der neueren Methoden, die entwickelt sind, für einen gleichzeitigen entfernten Brauchbarkeitstest zu führen, ist durch das Verwenden virtueller Welten.

Erfahrene Rezension

Erfahrene Rezension ist eine andere allgemeine Methode der Brauchbarkeitsprüfung. Wie der Name darauf hinweist, verlässt sich diese Methode auf das Holen in Experten mit der Erfahrung im Feld (vielleicht von Gesellschaften, die sich auf die Brauchbarkeitsprüfung spezialisieren), die Brauchbarkeit eines Produktes zu bewerten.

Automatisierte erfahrene Rezension

Ähnlich erfahrenen Rezensionen stellen automatisierte erfahrene Rezensionen Brauchbarkeitsprüfung, aber durch den Gebrauch von Programmen gegeben Regeln für das gute Design und die Heuristik zur Verfügung. Obwohl eine automatisierte Rezension so viel Detail und Scharfsinnigkeit nicht zur Verfügung stellen könnte wie Rezensionen von Leuten, können sie schneller und durchweg beendet werden. Die Idee, Stellvertreter-Benutzer für die Brauchbarkeitsprüfung zu schaffen, ist eine ehrgeizige Richtung für die Gemeinschaft der Künstlichen Intelligenz.

Wie viele Benutzer, um zu prüfen?

Am Anfang der 1990er Jahre hat Jakob Nielsen, damals ein Forscher an Sonne-Mikrosystemen, das Konzept verbreitet, zahlreiche kleine Brauchbarkeitstests — normalerweise mit nur fünf Testthemen jeder — in verschiedenen Stufen des Entwicklungsprozesses zu verwenden. Sein Argument ist, dass, sobald es gefunden wird, dass zwei oder drei Menschen durch die Hausseite völlig verwirrt sind, wenig gewonnen wird, indem er mehr Menschen gesehen wird, durch dasselbe fehlerhafte Design leiden. "Wohl durchdachte Brauchbarkeitstests sind eine Verschwendung von Mitteln. Die besten Ergebnisse kommen daraus, nicht mehr als fünf Benutzer zu prüfen und so viele kleine Tests durchzuführen, wie Sie gewähren können.". Nielsen hat nachher seine Forschung veröffentlicht und hat den Begriff heuristische Einschätzung ins Leben gerufen.

Der Anspruch von "Fünf Benutzern ist genug" wurde später durch ein mathematisches Modell beschrieben, das für das Verhältnis von unbedeckten Problemen U festsetzt

wo p die Wahrscheinlichkeit eines Themas ist, das ein spezifisches Problem und n die Zahl von Themen (oder Testsitzungen) identifiziert. Dieses Modell taucht als ein asymptotischer Graph zur Zahl von echten vorhandenen Problemen auf (sieh Zahl unten).

In der späteren Forschung ist der Anspruch von Nielsen sowohl mit empirischen Beweisen als auch mit fortgeschritteneren mathematischen Modellen eifrig infrage gestellt worden. Zwei Schlüsselherausforderungen an diese Behauptung sind:

  1. da Brauchbarkeit mit dem spezifischen Satz von Benutzern verbunden ist, wird solch eine kleine Beispielgröße kaum die Gesamtbevölkerung vertretend sein, so werden die Daten von solch einer kleinen Probe mit größerer Wahrscheinlichkeit die Beispielgruppe widerspiegeln als die Bevölkerung, können sie vertreten
  2. Nicht jedes Brauchbarkeitsproblem ist ebenso easy-detect. Unnachgiebige Probleme verlangsamen zufällig den gesamten Prozess. Unter diesen Verhältnissen ist der Fortschritt des Prozesses viel seichter als vorausgesagt durch die Nielsen/Landauer Formel.

Es lohnt sich zu bemerken, dass Nielsen nicht empfiehlt, nach einem einzelnen Test mit fünf Benutzern anzuhalten; sein Punkt ist, dass, mit fünf Benutzern prüfend, die Probleme befestigend, sie aufdecken, und dann Prüfung der revidierten Seite mit fünf verschiedenen Benutzern ein besserer Gebrauch von beschränkten Mitteln ist als das Durchführen eines einzelnen Brauchbarkeitstests mit 10 Benutzern. In der Praxis werden die Tests einmal oder zweimal pro Woche während des kompletten Entwicklungszyklus, mit drei bis fünf Testthemen pro Runde, und mit den Ergebnissen durchgeführt, die innerhalb von 24 Stunden an die Entwerfer geliefert sind. Die Zahl von über den Kurs des Projektes wirklich geprüften Benutzern kann so 50 bis 100 Menschen leicht erreichen.

In der frühen Bühne, wenn Benutzer höchstwahrscheinlich auf Probleme sofort stoßen werden, die sie in ihren Spuren fast aufhören, kann jeder der normalen Intelligenz als ein Testthema verwendet werden. In der Bühne zwei werden Prüfer Testthemen über ein breites Spektrum von geistigen Anlagen rekrutieren. Zum Beispiel, in einer Studie, haben erfahrene Benutzer kein Problem mit jedem Design von Anfang an zum letzten gezeigt, während naiver Benutzer und Macht-Benutzer selbsterkannt hat, haben beide wiederholt gescheitert. Später, als das Design wegräumt, sollten Benutzer aus der Zielbevölkerung rekrutiert werden.

Wenn die Methode auf eine ausreichende Anzahl von Leuten über den Kurs eines Projektes, die Einwände angewandt wird, die über dem gerichteten gewordenen erhoben sind: Die Beispielgröße hört auf, klein zu sein, und Brauchbarkeitsprobleme, die mit nur gelegentlichen Benutzern entstehen, werden gefunden. Der Wert der Methode liegt in der Tatsache, dass spezifische Designprobleme, einmal gestoßen, wieder nie gesehen werden, weil sie sofort beseitigt werden, während die Teile, die erfolgreich scheinen, immer wieder geprüft werden. Während es wahr ist, dass die anfänglichen Probleme im Design von nur fünf Benutzern geprüft werden können, wenn die Methode richtig angewandt wird, werden die Teile des Designs, das in diesem anfänglichen Test gearbeitet hat, fortsetzen, von 50 bis 100 Menschen geprüft zu werden.

Siehe auch

  • ISO 9241
  • Software, die prüft
  • Bildungstechnologie
  • Universale Brauchbarkeit
  • Kommerzielles Auge, das verfolgt
  • Lassen Sie mich nicht denken
  • Softwareleistung, die prüft
  • System Usability Scale (SUS)
  • Testmethode
  • Baum, der prüft
  • RITUS-Methode
  • Teilbasierte Brauchbarkeit, die prüft
  • Crowdsource, der prüft

Links


Ukulele / Kabinett der Vereinigten Staaten
Impressum & Datenschutz