Текст книги "Человеко-компьютерное взаимодействие"
Автор книги: Валерий Магазанник
Жанр: Компьютеры: прочее, Компьютеры
сообщить о неприемлемом содержимом
Текущая страница: 17 (всего у книги 20 страниц)
Короткие видеоэпизоды, сопровождаемые комментарием либо музыкой, – весьма привлекательный способ представления информации. Видео более эффективно для демонстрации того, что физически движется (балетных сцен, например), чем для показа статических объектов. Видео исключительно удобно для показа каких-то реальных действий и должно использоваться для визуализации реального мира либо его имитации. Информация, не зависимая от механического движения и от какой-либо динамики вообще, экономнее и удобнее может быть представлена в виде изображений.
Видео – чрезвычайно динамическая среда, которая приковывает внимание пользователя (как всякий движущийся объект). Эффективность видео достигается использованием сравнительно коротких видеоэпизодов (клипов), которые представляют целостную информацию и включают обычно помимо видео текст, графику, цвет, звуковой фон (скажем, музыку) или звуковые сообщения (скажем, речь) и т.д. Это отличает их от фильмов, где развитие действия и составляет собственно содержание, т.е., кроме видео, там ничего нет. Рациональное использование видео предполагает выполнение ряда требований:
• время одной последовательности видео не должно превышать 40– 45 с, при большей длительности снижается концентрация внимания;
• видео должно сопровождаться звуком, что отвечает ожиданиям пользователей и позволяет дублировать видеоинформацию, либо передать дополнительную, которую передавать звуком удобнее;
• видео должно сопровождаться индикацией того, какая часть времени его демонстрации уже прошла и какая часть осталась;
• видео лучше показывать в небольшом окне, что позволяет ограничиться малым разрешением, сохраняя сравнительно хорошее качество изображения;
• следует предусмотреть клавиши (виртуальные) управления видео, которые должны быть подобны таковым в видеомагнитофонах: «вперед», «быстро вперед», «проигрывать», «повторно проигрывать», «проигрывать в обратном направлении», «быстрая перемотка», «пауза», «останов», «поиск». Однако наиболее важны клавиши «проигрывать», «пауза», «повторное проигрывание». Также следует предусмотреть клавиши регулировки качества изображения: яркости, контрастности, цвета и оттенков.
Анимация охватывает широкий круг медиатехнологий и средств – от объемных физических тел, «оживляемых» в фильмах, до образов искусственных, т.е. частично или целиком генерируемых с помощью компьютерных технологий. Анимация характеризуется быстрым и непрерывным изменением изображений, рисунков или графических образов. Как и видео, анимация нуждается в некотором смыслообразующем сюжете. Динамика анимации может использоваться, чтобы привлечь внимание пользователя к определенному объекту.
С помощью анимации могут быть визуализированы даже время или невидимые процессы, например работа алгоритма или программы, могут быть показаны опасные процессы или такие, которые трудны для непосредственного представления (в физике, химии, биологии, геометрии). Анимация весьма полезна при исследовании сложного окружения и является хорошим способом стимуляции интереса к обучению у молодых пользователей, особенно для образовательного программного обеспечения. Вместе с тем анимация может отвлекать внимание, если постоянно сопровождает фрагменты текста, которые пользователь должен прочитать. Она может быть также раздражающей, если ее темп превышает способность человека воспринять и понять смысл.
Продолжительность анимации должна быть небольшой: максимум 20-30 с. Анимация может быть подкреплена звуковым сопровождением. Например, звук хорошо дополняет такие характеристики, как положение объекта, направление, скорость и продолжительность его движения.
Существует множество анимационных методов для передачи общих изменений (к примеру, вырезание, постепенные переходы цветов и форм, поглощение, изменения фактуры, изменение углов обзора и др.) и изменений, относящихся к определенной области экрана (к примеру, показать зеркально, вращать, выпадать вниз, вверх, вставить либо вытащить и пр.). Но польза всех таких технологий может оказаться весьма сомнительной (даже отрицательной), если они будут отвлекать пользователя от содержательных аспектов.
Пользователь должен иметь возможность в любое время останавливать анимацию и повторять ее части, также контролировать скорость анимации, при необходимости прокручивая кадры быстро вперед или назад. Также весьма желательно обеспечить возможность прямой манипуляции объектами, например возможность протаскивать тот или иной объект по экрану, сохраняя индивидуальные особенности его движений и характер взаимодействия с другими объектами на экране.
Во всех центрах, известных разработкой новых интерфейсов (XEROX PARC, MIT Media Lab, Apple Computer, Carnegie Mellon Univ.), идут разработки разных концепций дизайна интерфейсов, опирающихся на возможности анимации. Здесь основной проблемой является синхронизация точки внимания пользователя и точки активности системы.
С одной стороны, пользователь должен уметь сказать системе, где и что он хочет изменить (обыгчно это делается щелчком мыши в нужном месте). С другой стороны, система должна уметь привлечь внимание пользователя к месту наиболее актуальных изменений. Это привлечение внимания достигается какой-то динамикой (изменением цвета, местоположения, яркости и т.д.). На этом же основаны многие способы привлечения внимания с помощью движущегося предмета. Созданы, например, две анимированные среды интерфейса (в той самой фирме XEROX PARC, которой мы обязаны появлением идеи «оконного» интерфейса).
Одна – «Конические деревья» – является визуализацией файловой системы компьютера и похожа на систему детских пирамидок, каждый уровень которой соответствует уровню файлового каталога. Сами файлы из каталога отображаются в виде трехмерной карусели под своим каталогом. Идея в том, что нужный файл можно приблизить поворотом карусели (может быть, не одной), идущим в режиме анимации.
Анимация за счет увеличения времени перехода от одной картинки к другой (а именно времени анимированного преобразования картинок) существенно сокращает время осознания новой картинки. В психологическом смысле новой картинки не существует, есть преобразованная старая, а так как все преобразования шли на глазах у изумленных зрителей, то пользователь практически немедленно готов к взаимодействию.
Существует еще одно свойство анимационного ПИ, которое заметно улучшает его полезность по сравнению с графическим интерфейсом, а именно – динамические визуальные сигналы, т.е. изменение изображения на экране с целью дать пользователю дополнительную информацию. Уже в стандартном «оконном» интерфейсе мы можем видеть примеры таких сигналов. При выполнении программой длительных действий курсор мыши приобретает форму песочных часов. Это сигнал о том, что на действия пользователя система временно реагировать не будет. Второй пример – изменение изображения кнопки при нажатии на нее мышью. Создавая анимационный интерфейс, надо закладывать систему динамических визуальных сигналов с самого начала, поскольку они являются столь же естественной, сколь и необходимой частью анимационного интерфейса.
В последние годы возможности 3D-анимации (3Dimension, т.е. трехмерной) и спецэффектов значительно расширились за счет создания очень мощного пакета Мауа, в который были интегрированы лучшие характеристики высококачественных пакетов Explore, Advanced Visualizer, Power Animator, Dynamation и Kinemation. Программа, изначально разработанная для Silicon Graphics, перенесена на новые платформы и может функционировать в различных ОС, в том числе в Windows NT, Windows 2000 и Linux. Пакет Мауа оброс хорошей инфраструктурой, включая встраиваемые модули, сценарии на языке MEL, книги и интернет-поддержку. Именно в Мауа появились многие решения, которые определили развитие современной компьютерной графики. К ним в первую очередь относятся:
• уникальная технология Artisan, позволяющая модифицировать поверхности виртуальных объектов почти так же, как скульптор работает над глиняной моделью. Выбрав инструмент нужной формы и размера, дизайнер может производить операции выдавливания, вытягивания, сглаживания и т.д. Artisan позволяет также управлять анимационными свойствами поверхностей (например, жесткостью), просто раскрашивая объекты различными оттенками серого цвета;
• сплайн-моделирование (с использованием кривых до седьмой степени), полигональное моделирование и моделирование при помощи поверхностей разбиения (SubDivision Surfaces);
• мощный модуль для работы с динамикой твердых и мягких тел, частицами и спецэффектами, который представляет собой полностью интегрированный в Мауа и расширенный пакет Dynamation;
• технология IPR (Interactive Photorealistic Render), которая позволяет обновлять единожды визуализированную сцену при изменении параметров материалов, текстур или освещения. При этом программа сама отслеживает связи между каждым элементом изображения и всеми параметрами, влияющими на его конечный вид;
• модуль Мауа Fur для имитации шерсти и меха;
• модуль Мауа Cloth для моделирования и анимации одежды и тканей;
• модуль Мауа Live, который помогает автоматизировать и ускорять чрезвычайно сложный процесс совмещения движений камеры и объектов из видеоматериала, отснятого реальной камерой, со сценой или анимацией, полученной средствами компьютерной графики.
Кроме того, в Мауа полностью интегрирована изящная парадигма нелинейной анимации (Non Linear Animation). В программе она реализована в виде инструмента TraX Editor, позволяющего монтировать и многократно использовать однажды сделанную анимацию, создавать библиотеки движений для существующих и будущих персонажей. Однако из-за разнообразия средств и своей мощности Мауа очень сложна в освоении. Огромный объем хорошо спланированной документации облегчает решение конкретных проблем, но не может служить учебным пособием.
Хороший пример грамотного применения анимационных эффектов – новая ОС Windows Vista. Во многих панелях этой ОС используются «живые» анимированные иконки, отображающие содержание файла. Такую иконку можно увеличить или уменьшить. Скриншот контрольной панели Windows Vista показан на рис. 6.7.
Окна отображаются в трехмерном пространстве, что также облегчает их обзор. Функции «Flip» и «Flip 3D» позволяют переключаться между открытыми окнами – первая с помощью сочетания клавиш «Alt+Tab» с отображением активного эскиза каждого окна, вторая с помощью колеса прокрутки мыши (рис. 6.8, 6.9).
Рис. 6.7. Скриншот Windows Vista – контрольная панель
Визуализация документов в Windows Vista также существенно улучшена, что позволяет их просмотреть без раскрытия документа (рис. 6.10, 6.11).
Рис. 6.8. «Живые» иконки Windows Vista – функция «Flip»
Рис. 6.9. Функция «Flip 3D» Windows Vista
Рис. 6.10. Скриншот Windows Vista – визуализация документов
Решая многие проблемы для пользователя, анимационный интерфейс, как это часто бывает, ставит проблемы перед программистом и дизайнером. Для использования анимационного интерфейса придется переходить к программам, управляемым временем. При этом, естественно, такая программа должна быть всегда доступной для взаимодействия, но, в отличие от многих сегодняшних мультимедиа-программ, не прерывать отображаемый поток, а плавно изменять его в соответствии с воздействием пользователя.
Рис. 6.11. Скриншот Windows Vista – визуализация документов
После выработки сквозного визуального решения необходимо прорисовать картинки, которые аниматоры называют фонами. Точнее было бы назвать их неподвижной составляющей подвижного изображения. На каждом фоне надо расположить анимированные элементы взаимодействия. И наконец, самое трудное – надо спроектировать визуальные переходы между существенно отличающимися состояниями. И все это сохраняя выбранный стиль!
Анимационный интерфейс – орудие очень мощное и поэтому требует особой осторожности. Попытки потрясти мир могут привести к быстрой утомляемости пользователя и как следствие к отторжению системы. Основной задачей дизайнера становится организация не неподвижного пространства, а целой серии пространств, неразрывно связанных между собой. Аналогия с созданием фильмов представляется здесь очень уместной.
6.3. Разработка акустической среды мультимедиа-приложений
6.3.1. Общие вопросы разработки акустических интерфейсовВ мультимедийных приложениях визуальная информация часто сопровождается акустической. Визуальная и аудиосреды дополняют друг друга и составляют единое целое. Термины «акустический» или «слуховой» применяются как обобщающие для речи, пения, музыки или любых иных звуков. Таким образом, можно говорить об акустическом интерфейсе пользователя (AUI), подобно тому как мы говорим о графическом интерфейсе пользователя (GUI). Информация, представляемая в акустической форме, используется для:
• обратной связи в форме музыки или каких-то звуков;
• сообщений о тех или иных событиях в системе;
• разного рода подсказок системы;
• речевой инструкции по конкретной задаче или ее компонентам;
• речевого отчета или комментариев одного человека или более;
• речевого диалога или обсуждения действий пользователя при решении задачи;
• речевой связи для задач, решаемых совместно в интерактивном режиме.
Акустическая форма представления информации особенно эффективна:
• для общей активизации внимания;
• для привлечения внимания пользователя к определенному месту;
• при одновременном завершении или старте ряда событий или процессов;
• при перегрузке визуального канала;
• для людей с нарушениями зрения или моторики, которые в ином случае были бы не способны к работе на компьютере.
Акустический интерфейс обеспечивает следующие функциональные возможности:
• ускоряет взаимодействие с пользователем, с помощью речевого ввода команд вместо ручного или речевого выхода информации вместо диалогового окна; голос особенно полезен, если пользователь по роду работы должен отходить от компьютера;
• минимизирует промахи и ошибки пользователя путем акустической инструкции, предупреждений и положительной обратной связи;
• уменьшает физическую и умственную нагрузку, добавляя речь и звук, где необходимо, или заменяет им ручное управление и визуальную информацию;
• улучшает обучаемость и память, используя устные объяснения (по запросу пользователя), слуховую навигацию и звуковую обратную связь;
• предлагает альтернативные средства взаимодействия при изменениях в окружении или требований задачи, предпочтений или ожиданий пользователей;
• приближает человеко-компьютерное взаимодействие к реальному миру.
Состав пользователей акустическим мультимедийным приложением может включать одного человека, нескольких известных лиц или большое количество неизвестных пользователей. В зависимости от профиля потенциальных пользователей формируются требования к такому интерфейсу. Типичные вопросы, возникающие при этом, могут быть следующими:
• Известны ли пользователю язык и словарь интерфейса?
• Требуется ли некоторая тренировка, пусть даже и небольшая?
• Может ли система быть мобильной?
Физическое пространство, где будет происходить взаимодействие, чрезвычайно важно для акустических характеристик интерфейса: будет ли это маленькая комната или рабочее место в большом зале; будет ли часто меняться местоположение интерфейса, предназначен ли интерфейс для личного либо общественного использования.
Пользователи должны иметь возможность включать и отключать звук, а также регулировать уровень громкости. Кроме того, необходимо предусмотреть органы управления характеристиками звука, такими, как баланс, басы и высокие звуковые частоты. Пользователь должен также иметь возможность вызвать повторение предыдущего сообщения, прерывать или останавливать текущее сообщение, временно отключать звук, а затем продолжать при прежних его характеристиках (mute-функ-ция). В целом разработка аудиокомпонентов в мультимедийном приложении должна проводиться весьма тщательно, с учетом социальных, организационных и физических аспектов среды, в которой это будет реализовано.
В настоящее время довольно мощным звуковым редактором является GoldWave. Он предназначен для проигрывания, редактирования, смешивания и анализа звуковых файлов, работает с большими файлами быстрее других программ, имеет много разных эффектов, понимает множество форматов, также умеет конвертировать из одного формата в другой, умеет записывать файлы с аудио-CD.
6.3.2. Речевой вводРечевой ввод позволяет пользователю непосредственно говорить компьютеру, без промежуточных клавиатурных или рукописных действий. Основные цели систем распознавания речи следующие: независимость от того, кто говорит, распознавание непрерывной речи, большие словари и способность к обработке естественных языков. Независимость от говорящего означает, что система может принимать и узнавать речь большого количества различных пользователей, включая голоса, которые не были частью обучающей последовательности. Такие системы не требуют предварительного обучения под конкретного пользователя. Система же, зависящая от говорящего, требует образцы речи конкретного пользователя для обучения и настройки.
Непрерывная речь означает, что система может обрабатывать слова так, как их обычно произносят в беглой речи. Другие разновидности систем распознавания речи – распознание отдельных слов и словосочетаний. Опознавательные устройства отдельных слов – наиболее простое (и дешевое) решение, но оно требует хотя бы короткой паузы между каждым словом. Опознавательные устройства определенных последовательностей слов находятся между опознанием отдельных слов и опознанием непрерывной речи. Они узнают слова при условии, что они не изменяются, бегут вместе, но это требует отчетливого произношения.
Система, способная распознавать большое количество различных слов, не всегда является оптимальным решением. Часто достаточным является набор небольшого, фиксированного количества слов. Однако такого рода системы, например система медицинской диагностики, могут потребовать достаточно много слов, иногда до 50 000.
Надежное распознавание произносимых слов, не зависящее от голоса и дикции конкретного человека и содержащее небольшой, ограниченный набор слов, является несложной технической задачей. Однако с увеличением количества распознаваемых слов и их многообразия существенно возрастают технические требования и, соответственно, стоимость распознающей системы. Распознавание свободной естественной речи ограничено пока четко определенной областью задач. Как следствие в процессе разработки системы следует оценить, какие компоненты задачи должны выполняться с использованием аудиовыхода и какие не должны. Речевой ввод наиболее предпочтителен в следующих ситуациях:
• при вводе простых команд (например – проигрывание, стоп, быстрая перемотка вперед и т.д.);
• для зачитывания простых, но хорошо структурированных данных;
• как альтернатива клавиатурному вводу для людей с физическими недостатками;
• для обнаружения голосовых звуков либо иной активности с использованием акустических датчиков;
• когда определенная функция требует использования акустических клавиш;
• для объектов или выбора опций, использующих акустическое меню;
• для речевого ввода данных или задач с речевым заполнением специальных форм;
• для речевых комментариев со стороны системы либо самого пользователя по поводу объектов задачи.
При использовании речевого ввода следует:
• структурировать словарь, чтобы ограничить число вводимых слов на каждой стадии (т.е. использовать по возможности малый коэффициент ветвления). Это улучшит точность распознавания;
• выбирать вводимые слова так, чтобы их акустические характеристики значительно разнились. Это упростит обучение и обеспечит более прочное узнавание;
• помнить, что слова, которые ясно различимы в текстовом виде или человеческим ухом, не обязательно столь же отчетливо различимы опознавательным устройством речи;
• дать пользователю возможность включать и отключать речевое распознавание и возвращаться к более традиционным видам ввода и вообще взаимодействия с компьютером. Запрограммируйте ключевое выражение, например «Звук, проснись», чтобы включить режим голосового ввода. Аналогично фраза «Звук, спи» могла бы тогда использоваться для остановки речевого ввода;
• запрограммировать ключевое слово, чтобы с его вводом можно было остановить или отменить неправильные действия;
• обеспечить адекватную обратную связь, информирующую вас о том, что система интерпретировала речевой ввод, можно со звуковым либо с визуальным сигналом;
• обеспечить пользователю, если необходимо, возможность исправлять ошибки перед утверждением ввода либо отменять предыдущий ввод. Однако даже низкий процент ошибок может оказаться неприемлемым в некоторых ситуациях, например в стрессовых или критических по отношению к безопасности.
Если мультимедийный продукт предназначается для разноязычной аудитории, язык взаимодействия должен выбираться пользователем. Пользователи должны иметь определенную степень контроля над размером и содержанием используемого словаря – например, он должен иметь возможность добавлять синонимы и имена, определяемые им самим. Иногда опознавательное устройство не может осуществить выбор одного из двух или более слов-кандидатов. В таких случаях они должны предоставляться пользователю для выбора и утверждения ввода. Чтобы улучшить точность распознавания, необходимо обеспечить пользователя ручным микрофоном (возможно, включаемым в малоприметном месте пульта). Слова речевого ввода должны быть тщательно отфильтрованы, с тем чтобы на каждой стадии требовались одна-две команды. Однако иногда может быть полезным включение одной-двух более длинных фраз, которые будут более четко отделять рабочий ввод от свободной речи во время отдыха, поскольку содержат больше информации.
Правообладателям!
Это произведение, предположительно, находится в статусе 'public domain'. Если это не так и размещение материала нарушает чьи-либо права, то сообщите нам об этом.