Существует много способов форматирования оценочных шкал. Недавно мы исследовали
- Маркировку нейтральных точек
- Маркировку всех или некоторых вариантов ответа
- Изменение количества вариантов ответа
- Сравнение соглашения с метками конечных точек конкретных элементов
Многочисленные исследования выделяют как плюсы, так и минусы каждого из этих форматов. Наши исследования на эту тему в контексте измерения UX обычно не выявляют существенных различий в зависимости от формата. Когда есть статистически значимая разница, величина эффекта, как правило, незначительная. Заметное исключение в нашей недавней работе свидетельствует о том, что наличие только трех вариантов ответа в рейтинговой шкале явно недостаточно для точного определения отношений и настроений, таких как вероятность рекомендации товара.
До недавнего времени мы не исследовали различия в числовом и графическом форматах элементов (например, нажатие от одной до пяти звездочек, чтобы поставить оценку, или перетягивание слайдера). Теперь у нас есть данные, собранные с использованием UX-опросника из двух пунктов, UMUX-Lite с (1) стандартными шкалами Лайкерта (линейные цифры), (2) пятизвездочными элементами в стиле Amazon, и (3) слайдерами. В этой статье мы сосредоточимся на сравнении оценок с помощью цифр и слайдеров.
Что такое слайдеры?
На изображениях 1 и 2 показаны примеры числовой и слайдерной версий опросника UMUX-Lite.
Изображение 1: Пример числовой версии UMUX-Lite (созданной с помощью MUIQ)
Изображение 2: Пример слайдерной версии UMUX-Lite (созданной с помощью MUIQ)
Из-за своего дизайна, слайдеры (ползунки) требуют больше физического пространства, чем числовые шкалы. Слайдеры бывают разных форматов. Некоторые слайдеры отображают ограниченное количество вариантов ответа (например, пять), поэтому единственное отличие от стандартной числовой шкалы – это интерфейс, используемый для выбора варианта ответа (клик для числовой шкалы; перетаскивание для слайдера). Часто слайдеры охватывают широкий диапазон вариантов ответа (например, как показано на изображении 2, от 0 до 100). Некоторые слайдеры требуют перетаскивания регулятора в желаемое положение с помощью мыши, сенсорного экрана или другого указательного устройства. Этот дизайн интерфейса сложен для некоторых пользователей (например, Chyung et al., 2018).
Другие дизайны слайдеров позволяют, в дополнение к перетаскиванию регулятора, просто кликнуть по нужному положению, а затем выполнить точную настройку при необходимости комбинируя перетаскивание и клик (что характерно для слайдеров в MUIQ). Слайдеры этого типа также известны, как visual analog scales (VAS).
Что говорят исследования?
Публикации довольно противоречивы в отношении преимуществ слайдеров по сравнению с числовыми шкалами. В целом все высказываются за слайдеры, основанные на гипотетических преимуществах психометрии и вовлечения респондентов, но результаты на основе данных неоднозначны. Например:
- Joyce et al. (1975) выявили, что VAS оказался более чувствительным, чем четырех балльная числовая шкала.
- Sauro and Dumas (2009) обнаружили, что SMEQ (субъективные умственные усилия при заполнении опросника) 150-балльной VAS-образной шкалы были несколько более чувствительными, чем у SEQ из семи пунктов.
- Ряд исследователей сообщили о лучших результатах для числовых шкал по сравнению с VAS, относительно времени завершения (Couper et al., 2006; Rausch & Zehetleitner, 2014), коэффициентов завершения (Couper et al., 2006; Davey et al., 2007), и предпочтений респондента (van Laerhoven et al., 2004; van Schaik & Ling, 2007).
- Респонденты, особенно в клинических условиях, иногда испытывают больше проблем с физическим заполнением VAS, чем числовых шкал (Bolognese et al., 2003; Briggs & Closs, 1999; Jensen et al., 1986).
- Toepoel and Funke (2018) обнаружили, что пользователи реже взаимодействуют со слайдерами, чем с 4радиокнопками. Кроме того, они отметили более низкую производительность слайдеров, требующих перетаскивания регулятора, по сравнению с VAS слайдерами.
- В нескольких исследованиях, сравнивающих VAS с числовыми шкалами, имеющими от 4 до 20 вариантов ответа, не было выявлено значительного или практического различия в психометрических свойствах (Bolognese et al., 2003; Couper et al., 2006; Davey et al., 2007; Larroy, 2002; Lee et al., 2009; Lewis & Erdinç, 2017; Rausch & Zehetleitner, 2014; van Laerhoven et al., 2004; van Schaik & Ling, 2007).
Эксперимент по сравнению слайдеров и числовых шкал
Поскольку наш основной интерес заключается в том, как различия в формате элементов влияют на измерение восприятия пользователем, мы создали греко-латинский квадрат для поддержки внутри предметного сравнения оценок UMUX-Lite для различных стриминговых сервисов (Netflix, HBO Now, Amazon Prime Video, Hulu и Disney +). В частности, 335 участников из американского экспертного агентства оценивали услуги стриминговых сервисов с мая по июнь 2020 года. И из этой более крупной выборки 180 участников ставили оценки с помощью слайдеров и числовых шкал.
В этом экспериментальном проекте было три независимых переменных:
- Формат элемента (линейный числовой; VAS слайдер – см. изображения1 и 2)
- Контекст рейтинга (рейтинг самого последнего опыта работы с сервисом; рейтинг общего опыта работы с сервисом)
- Порядок представления (числовой/недавний, затем слайдер/общий; числовой/общий, затем слайдер/недавний; слайдер/недавний, затем числовой/общий; слайдер/общий, затем числовой/недавний)
Участники были случайным образом распределены по одному из четырех порядков, сформированных путем пересечения формата элемента, контекста рейтинга и порядка представления. Это позволяет на протяжении всего эксперимента контролировать «побочные» переменные (nuisance variables) контекста рейтинга и порядка представления. В дополнение к экспериментам, которые мы проводим для себя, мы также используем эти исследования дизайна для проектов наших клиентов, когда нам нужно эффективно контролировать «побочные» переменные и повысить точность дизайна.
На рисунке 3 показан ключевой результат эксперимента – практически идентичные средние значения для числовых оценок (83,9) и ползунков (83,7). Дисперсионный анализ, одновременно оценивающий статистическую значимость всех трех основных эффектов и их взаимодействий, показал отсутствие значимого влияния (все p> 0,20 с 176 ошибками df).
Рисунок 3: Значение UMUX-Lite (и 95% доверительный интервал) для числовых шкал и слайдеров в стриминговых сервисах
С учетом большого размера выборки эта разница (0,2) была незначительной (t (179) = 0,48, р = 0,64). 95% доверительный интервал разницы находится в диапазоне от -0,7 до 1,1, поэтому при 95% достоверности разница в 0 является вероятной, а разница, превышающая 1,1 – нет.
Выводы
Собирая данные при изучении пользовательского опыта может возникнуть соблазн использовать слайдеры вместо более стандартных линейных числовых шкал. Создается впечатление, что они должны лучше отражать чувства и отношение людей, ставящих оценки (слайдер должен казаться им круче).
Тем не менее, результаты опубликованных ранее исследований и нашего собственного исследования показывают, что слайдеры не дают конкретного преимущества измерения по сравнению с широко используемыми линейными числовыми шкалами, особенно, если линейная числовая шкала имеет, как минимум пять вариантов ответа.
Это не означает, что вы не можете использовать слайдеры в своих дизайнах. Но, если вы используете слайдеры, вы должны знать об их потенциальных недостатках по сравнению с числовыми шкалами. К ним относятся потребность в большем физическом пространстве, возможность более низких показателей завершения и большая сложность использования для некоторых групп населения (особенно, когда от пользователя требуется перетаскивание ползунка в желаемое положение). Всего этого можно избежать с помощью стандартных линейный числовых шкал.
Перевод статьи measuringu.com
Топ коментарі (0)