Usability-Fragebögen

Usability-Fragebögen können in drei Kategorien eingeordnet werden: zur Bewertung von Websiten, zur Messung der Zufriedenheit mit einem System im Anschluss an eine Produktstudie (sogenannte Test Level Satisfaction Measurements) und im Anschluss an eine Aufgabe (sogenannte Task Level Satisfaction Measurements).

Zu Test Level Satisfaction Measurements zählen unter anderem der AttrakDiff, PSSUQ, QUIS, SUMI, SUS, UMUX und UEQ. AttrakDiff hat zum Ziel, die pragmatische und hedonische Qualität eines Systems oder Produktes zu messen. Er besteht aus 23 Items semantischen Differentials, welche auf einer siebenstufigen Skala zu bewerten sind. Mithilfe der Items lassen sich die drei Subskalen Attraktivität, pragmatische und hedonische Qualität berechnen. Die Reliabilität der Skalen beträgt .73 bis .90, demnach teilweise nicht zufriedenstellend. Der Post-Study System Usability Questionnaire (PSSUQ) erfasst die Zufriedenheit der Nutzer per System-Usability. Seine 16 siebenstufigen Items bilden Werte zur generellen Nutzerzufriedenheit mit dem System, Systemnützlichkeit, Qualität der Informationen und der Benutzeroberfläche. Darüber hinaus existiert die Möglichkeit N/A (not applicable) anzukreuzen. Er weist eine gute globale Reliabilität von .94 auf und ist lizenzfrei zu erlangen. Ebenfalls die subjektive Zufriedenheit der Systemnutzer misst der Questionnaire for User Interface Satisfaction (QUIS). 90 Adjektivgegensatzpaare, davon fünf für eine generelle Bewertung und 85 für 20 verschiedene Konstrukte, werden auf einer zehnstufigen Skala plus „nicht bewertbar“ geratet. Es besteht eine Kurzversion mit fünf Items zur allgemeinen Einschätzung und 20 Hauptfragen. Die aktuelle Version QUIS 7.0 enthält sechs Skalen zur generellen Zufriedenheit und neun spezifische Faktoren (Terminologie und Systemfeedback, Lernen, Systemeigenschaften, Bildschirm, technische Anleitungen, Online Tutorials, Multimedia, Telefonkonferenzen, Software Installationen). Seine globale Reliabilität beträgt .94. Das Software Usability Measurement Inventory (SUMI) dient der Messung der Nutzungsqualität einer Software aus der Sicht des Benutzers. Seine 50 dreistufigen Items („stimme zu“, „weiß nicht“, „stimme nicht zu“) setzen sich aus den fünf Subskalen Effizienz, Affekt, Hilfe und Unterstützung, Kontrollierbarkeit und Erlernbarkeit zusammen. Ferner umfasst eine „Global“-Skala 25 Items zur hauptsächlichen Erfassung von Gebrauchstauglichkeit. Seine globale Reliabilität von .92 ist als gut zu bewerten. Die am häufigsten verwendete System Usability Scale (SUS) zeigt durch seine 10 Items die Benutzerfreundlichkeit eines Systems auf. Die Pole der fünfstufigen Skala lauten „stimme überhaupt nicht zu“ und „stimme vollständig zu“ und generieren Werte von 0 bis 100, wobei ein Score von 68 als überdurchschnittlich gilt. Wie beim SUMI liegt die Reliabilität bei .92, allerdings ist er lizenzfrei zu erhalten. Der ebenso lizenzfreie Usability Metric For User Experience (UMUX) erfasst die subjektive Zufriedenheit mit der wahrgenommenen Usability mithilfe von vier siebenstufigen Items, welche eine generelle Bewertung, Effektivität, Effizienz und Zufriedenheit widerspiegeln. Auch er weist eine gute Reliabilität von .94 auf, seine Kurzversion mit lediglich zwei Items noch von .82. Der User Experience Questionnaire (UEQ) deckt nicht nur klassische Usability-Aspekte wie Effizienz, Durchschaubarkeit und Verlässlichkeit, sondern auch User Experience-Fragen wie Attraktivität, Stimulation und Originalität ab. Er enthält 26 bipolare Items, die auf einer siebenstufigen Skala bewertet werden. Seine Kurzversion mit einer Länge von 8 Items nennt sich UEG-S. Er ist lizenzfrei erhältlich.

Task Level Satisfaction Measurements sind beispielsweise der ASQ, NASA-TLX, SEQ, SMEQ und UME. Der After Scenario Questionnaire (ASQ) wird nach der Bearbeitung eines Scenarios erhoben. Seine drei Items bilden die Konstrukte Leichtigkeit der Aufgabenerfüllung, Zufriedenheit mit der Durchführungszeit und mit den Begleitinformationen ab. Die Skala erstreckt sich siebenstufig von strongly agree zu strongly disagree exklusive N/A. Im Internet steht er lizenzfrei zur Verfügung. Die sechs Subskalen mentale, physische, temporale Anforderung, Leistung, Anstrengung und Frustration des NASA-TLX haben zum Ziel, die wahrgenommene Auslastung des Nutzers zu messen. Er hat eine 21-stufige Skala von „sehr gering“ bis „sehr hoch“. Wie der Name Single Ease Question (SEQ) bereits andeutet, besteht der Fragebogen lediglich aus einem Item („Overall, how difficult or easy was the task to complete?“). Die wahrgenommene Schwierigkeit soll auf einer Skala von eins bis sieben abgebildet werden. Ebenso nur ein Item haben der Subjective Mental Effort Questionnaire (SMEQ), welcher die mentale Anstrengung einer Aufgabe auf einer Skala von 0 bis 150 erfasst, und die Usability Magnitude Estimation (UME) für die Untersuchung der subjektiven Aufgabenschwierigkeit.

Bezüglich der Usability von Webseiten sind die Fragebögen ISOMetrics, ISONorm 10/110-S, SUPR-Q und WAMMI zu nennen. Die beiden erstgenannten beziehen sich auf die Gestaltungsgrundsätze derDIN EN ISO 9241, welche Richtlinien zur Ergonomie von interaktiven Systemen festlegt. Die sieben Grundsätze lauten Aufgabenangemessenheit, Selbstbeschreibungsfähigkeit, Erwartungskonformität, Fehlertoleranz, Steuerbarkeit, Individualisierbarkeit und Lernförderlichkeit. Darüber hinaus ist die ISO 14915 im Kontext der Entwicklung von Webseiten relevant. Sie postuliert die vier Grundsätze Eignung für das Kommunikationsziel, für Wahrnehmung und Verständnis, für die Exploration und für die Benutzungsmotivation. ISOMetrics enthält gemäß den Grundsätzen sieben Subskalen und insgesamt 75 Items. Zu unterscheiden sind die Formen S (short) für eine numerische und L (long) für eine numerische und qualitative, gestaltungsunterstützende Evaluation einer Software. Die ISONorm 10/110-S kommt mit 21 Items aus, welche auf einer siebenstufigen Skala von „sehr negativ“ über „unentschieden“ bis „sehr positiv“ abgebildet werden. Der Standardized User Experience Percentile Rank Questionnaire (SUPR-Q) untersucht die Bewertung einer Webseite aufgrund von 13 fünfstufigen Items. Die Attraktivität und Benutzerfreundlichkeit einer Webseite misst das Website Analysis and Measurement Inventory (WAMMI). Seine20 Items dienen der Erfassung der fünf Skalen Attraktivität, Kontrollierbarkeit, Effizienz, Nützlichkeit und Erlernbarkeit. Eine gute Konstruktvalidität und ein Cronbachs alpha von .90 gelten als gesichert.