Электронная библиотека » Владимир Морозов » » онлайн чтение - страница 8


  • Текст добавлен: 28 мая 2015, 16:26


Автор книги: Владимир Морозов


Жанр: Социальная психология, Книги по психологии


Возрастные ограничения: +16

сообщить о неприемлемом содержимом

Текущая страница: 8 (всего у книги 44 страниц) [доступный отрывок для чтения: 14 страниц]

Шрифт:
- 100% +
3.14. Взаимодействие разных видов информации в системе речевого общения

Охарактеризованные выше различные виды невербальной информации: эмоциональная, эстетическая, индивидуально-личностная, биофизическая, социально-типологическая, психологическая, пространственная, медицинская и о физических помехах – не существуют изолированно в процессе общения, но находятся в теснейшем взаимодействии и взаимовлиянии друг на друга. В качестве примера можно привести влияние эмоциональной окраски голоса (эмоциональная информация) на восприятие возраста одного и того же человека (см. рисунок 18). Одну и ту же фразу актер (народный артист СССР О. Басилашвили) произносил по просьбе экспериментаторов с разными эмоциональными интонациями (радость, печаль, гнев, страх, нейтрально в случайном порядке 30 раз). Слушатели (17 чел.) существенно по-разному оценили возраст актера по голосу (в зависимости от выраженной эмоции), «омолодив» его на пять лет при выражении радости (по сравнению с нейтральным звучанием) и «состарив» на 8 лет – при выражении страха и еще больше при выражении гнева (см. рисунок 18).


Рис. 18. Оценки слушателями возраста человека по голосу существенно изменяются в зависимости от эмоциональной интонации говорящего (актер О. Басилашвили).

Обозначения эмоций: Ра – радость, Не – нейтрально, безразлично, Пе – печаль, Ст – страх, Гн – гнев (ориг.).


Столь же естественно и очевидно влияние медицинской информации (о состоянии здоровья) на эстетическую, или на индивидуально-личностную (опознавание знакомых по характерным особенностям речи), влияние оценок возраста говорящего на оценки его роста и веса (корреляции положительны) и т. д. и т. п. Можно легко экспериментально доказать, что каждый из обозначенных нами видов невербальной информации в той или иной степени влияет на каждый из этих видов. Особенно велико влияние эмоциональной, эстетической, медицинской информации на восприятие всех других видов.

Вместе с тем все виды невербальной информации влияют и на семантику речи, т. е. на собственно вербальную смысловую информацию. Особенно велико влияние эмоционально-эстетической информации на содержательную, смысловую сторону речи, что основано на стереотипах восприятия человека человеком («приятный голос» – значит, «приятный человек» – значит, от него следует ожидать нечто приятное. И наоборот: «неприятный голос» – «неприятный человек» – и, следовательно, от него следует ожидать неприятное сообщение). Напомним также, что в специальных сравнительных экспериментах слушатели наделяли актеров, обладающих эстетически совершенной речью, значительно большими деловыми партнерскими качествами и доверием (т. е. качествами, необходимыми для коммерсантов), чем даже самих коммерсантов, обладающих менее совершенной речью.

Наконец, взаимодействие разных видов информации осуществляется не только в пределах какого-то одного сенсорного канала, как, например, слухового (звуковая речь и звуковые виды невербальной информации), но и между разными сенсорными каналами, например, между вербальными и невербальными смыслами звуковой речи (фонация), с одной стороны, и зрительными формами невербальной информации, т. е. выразительными движениями, известными под термином «кинесика» (жест, поза, мимика). Зрительный канал особо значим, поскольку через него проходит около 80 % всей информации внешнего мира. Наряду с этим, немаловажны кожно-тактильный (например, при общении матери с ребенком и др.) и хеморецептивный (обоняние, вкус) информационные каналы (см. 2.1).

Физиологической основой взаимодействия вербально-невербальных смыслов является мощная система нервных связей между левым (вербальным) и правым (невербальным) полушариями головного мозга человека. Равным образом взаимодействие разных видов невербальной информации, например, слуховой (интонация голоса) и зрительной (жест, поза, мимика) обусловливается межанализаторными нервными связями и интегративными свойствами мозга, объединяющего все виды чувствований и сенсорные каналы в единый информационный комплекс.

Таким образом, невербальная коммуникация в целом предстает как исключительно сложная многоканальная и многоуровневая система параллельного воздействия на человека множества различных видов информации, находящихся в то же время и в постоянном взаимодействии с семантикой слова. На основании сказанного можно обозначить три основных типа информационного взаимодействия в процессе речевого общения:

• взаимодействие разных видов невербальной информации в пределах одного сенсорного канала (например, слухового);

• взаимодействие невербальных видов информации между разными сенсорными каналами (например, между слуховым и зрительным);

• взаимодействие всех видов невербальной информации с собственно речевым вербальным смыслом.

3.15. Психологический «детектор лжи»

Последний вид информационного взаимодействия представляется исключительно важным, поскольку в процессе речевого общения невербальные компоненты – подчеркнем это еще раз – оказывают сильнейшее влияние на смысл произносимых слов и вообще на всю психологическую сущность общения, в частности, на убедительность или неубедительность речи, действенность или не действенность ее на слушателя, искренность или неискренность высказывания.

Как уже упоминалось выше (см. 3.11), искренность высказывания характеризуется гармоническим единством вербальных смыслов и невербальных форм речевого поведения (интонация голоса, жест, мимика и др.). В случае же неискренности и тем более явной лжи обязательно проявится в той или иной степени дисгармония невербальных смыслов по отношению к вербальным; они стыдливо будут молчать или предательски противоречить, например, фальшивым уверениям в любви и преданности. «Слова даны нам, чтобы скрывать свои мысли», – утверждал Талейран и в своем деле дипломата-хамелеона был прав. Но подсознательная непроизвольная природа невербального поведения сплошь и рядом выдает неискренность человека.

Неискренность проявляется не только в дисгармонии невербальных выразительных движений по отношению к словам, но и в противоречиях элементов невербального поведения. Так, фальшивая улыбка выдает себя тем, что не гармонирует с холодным, безучастным, а то и прямо негативным выражением глаз. Ибо при искренней улыбке, прежде всего, улыбаются глаза, «светятся улыбкой». Кроме того, фальшивая улыбка, как «маска светской учтивости» характеризуется (по данным японских психологов) симметричным сокращением лицевых мышц, а при неискренней – несимметричным.

Искренность непроизвольно проявляется в гармоническом единстве жеста и интонации голоса. В этой связи известный кинорежиссер С. Эйзенштейн удачно назвал интонацию голоса «звуковым жестом», подчеркивая единонаправленную выразительную сущность этих двух видов невербального поведения человека. Поэтому дисгармонии вербально-невербальных смыслов, как фальшивые ноты в музыке, обязательно улавливаются слушателем-коммуникантом (сознательно или чаще интуитивно-подсознательно) в соответствии с его социальным опытом и природной предрасположенностью к адекватному восприятию невербальной информации. Даже дети, как известно, формируют по этим признакам свое отношение к взрослым. Известно, что К. С. Станиславский, наблюдая игру актеров на репетиции, нередко восклицал: «Не верю!» – требуя большей правдивости и естественности сценического воплощения образа героя пьесы (интонации голоса, поведение).

Таким образом, в психике человека существует своеобразный, созданный самой природой детектор лжи, основанный на обнаружении дисгармонии вербально-невербальных смыслов. Чувствительность нашего психологического «детектора лжи», естественно, разная, в зависимости от индивидуальных и типологических характеристик каждого конкретного субъекта восприятия. Следует ожидать (и это экспериментально подтверждается!), что такого рода «детектор лжи» лучше развит у людей с доминированием правополушарной активности мозга, т. е. в целом у представителей «художественного» типа личности (см. 3.13) по сравнению с «мыслительным» типом, а также у представительниц «слабого пола» по сравнению с «сильным», что в определенной мере и компенсирует фактор «слабости» «слабого пола».

Заключение

В отечественной литературе практически отсутствуют данные о систематических исследованиях голоса человека как средства невербальной коммуникации. Приведенный краткий обзор современных экспериментально-теоретических исследований и представлений о человеке как носителе различных видов невербальной информации – в основном по работам автора и его сотрудников, – существенно восполняет этот пробел. Вместе с тем за кадром остается кинесика – жест, поза, мимика, – а также проксемика – пространственные взаимоотношения людей в процессе общения. Данные этого рода, хотя также далеко недостаточно, но все же нашли отражение в литературе (см. Лабунская, 1986; Jandt, 1976; La France, Mayo, 1978, и др.). Из переведенных трудов можно указать на работы Ниренберг и Калеро (1992), а также Аллана Пиза (1992) эти издания, не претендующие на обстоятельное научно-теоретическое обоснование проблемы, тем не менее представляют определенный интерес для практического психолога, как собрание достаточно тонких наблюдений за непроизвольными выразительными движениями людей в разных психологических состояниях в процессе общения и, несомненно, важных для взаимопонимания людей.

Об особенностях невербальной коммуникации по сравнению с речью в данном обзоре говорилось неоднократно. В заключение подчеркнем еще одну весьма существенную особенность эволюционно-исторического характера: невербальная коммуникация носит в целом иконический (изобразительный) характер, в то время как вербальной речи присуща конвенциональность, т. е. условная знаково-символическая форма. Изобразительная иконическая сущность невербальной коммуникации проявляется в том, что ее коды и сигналы как бы отражают особенности предметов и событий, о которых они сигнализируют. Характерный пример – развитие речи ребенка. На определенной стадии ребенок изобретает свои словоформы для обозначения предметов и событий окружающего мира, изображая голосом предметы и события. Так, «машина» изображается звуками «би-би», молоток – «тук-тук», еда – «ням-ням», курица – «ко-ко», собачка – «гав-гав» и т. д. и т. п. И лишь впоследствии эти временные детские звукоподражательные «слова-изображения» постепенно будут замещены словами из языкового лексикона взрослых, параллельно с овладением ребенком грамматическими и фонетическими нормами, характерными для его родного языка. Таким образом, звукоподражательный язык ребенка по своей сути ближе к невербальной коммуникации, нежели к вербальной, характерной для детей более старшего возраста и взрослых.

Иконическая природа невербальной коммуникации лежит в основе всеобщей понятности невербальных средств общения, т. е. независимости их от языковых барьеров. В такой же мере конвенциональная сущность каждого из языков народов мира является причиной языковых барьеров.

Невербальная коммуникация – необъятное поле исследования. В этой книге мы лишь кратко коснулись ряда основных ее характеристик, связанных, как уже говорилось, с поистине удивительными свойствами звуковых волн, порождаемых голосом человека, передавать слушателю не только физический образ говорящего, но и его сложнейшие психологические свойства и состояния. Здесь еще много действительно загадочного и неизученного. Если процесс отражения в звуке голоса человека его психофизических состояний является на сегодня исследованным в определенной степени, то трансформация сложного узора речевых акустических колебаний в психический образ говорящего – т. е. в его психологический портрет в сознании слушателя, – представляется интереснейшей задачей дальнейших исследований. Это одна из сложнейших сторон, разрабатываемой Институтом психологии РАН проблемы субъекта (Брушлинский, 1996) – выяснение психологических механизмов отражения человеком объективной реальности.

В заключение следует отметить, что исследование невербальной коммуникации, помимо научно-теоретического, представляет несомненный практический интерес для решения целого ряда задач в области социальной психологии (типология человека), политики (психологический портрет политика по его голосу), искусства (профотбор лиц художественных профессий), средств массовой информации (эмоционально-эстетические свойства речи дикторов радио и ТВ), инженерной психологии (профотбор операторов по критерию адекватности восприятия невербальной информации), медицины (диагностика нарушений эмоциональной сферы с применением теста на эмоциональный слух), педагогики (ранняя профориентация), менеджмента (портрет коммерсанта по его голосу), криминалистики («фоторобот» по голосу) и др. Указанные прикладные аспекты обозначены практически во всех разделах настоящей монографии, а более подробно развиты нами в специальных публикациях, приведенных в списке литературы.

Раздел 2
Экспериментально-психологические исследования невербальной коммуникации

Раздел содержит тексты ряда основных статей автора и фрагментов монографий по проблемам вербально-невербальной коммуникации.

1 Психоакустические аспекты изучения речи[8]8
  По материалам ст.: Морозов В. П. Психоакустические аспекты изучения речи // Механизмы деятельности мозга человека. Л.: Наука, 1988. Ч. 1. С. 578–607.


[Закрыть]

Изучение речи как «инструмента» второй сигнальной системы имеет множество исторически сложившихся аспектов, обусловленных научными и прикладными задачами: эволюционно-антропологическими (Уайт, Браун, 1978), историко-лингвистическими (Якушин, 1984), акустическими (Fant, 1960, 1970), фонетическими (Бондарко, 1977; Зиндер, 1979; Брызгунова, 1984), физиологическими (Чистович, Кожевников, 1972; Физиология…, 1976), нейрофизиологическими (Бехтерева и др., 1977, 1985), акустико-физиологическими (Морозов, 1977), экспериментально-психологическими (Licklider, Miller, 1951; Соколов, 1968), психологическими (Леонтьев, 1965; Ломов, 1984), психолингвистическими (Исследование…, 1985), онтогенетическими (Lennenberg, 1967; Тонкова-Ямпольская, 1971), медицинскими (фониатрическими) (Ермолаев и др., 1970), инженерно-техническими (Сапожков, Михайлов, 1983; Ли, 1983) и многими другими. Все эти аспекты в той или иной степени взаимосвязаны, взаимодополняют и «перекрывают» друг друга, т. е. отражают разные стороны одного и того же речевого процесса.

Задача психофизики состоит в изучении связи между физическими свойствами стимула и его восприятием. Основной задачей настоящей главы является рассмотрение в общей форме связи между акустическими характеристиками речи и ее восприятием человеком, точнее – роли основных акустических характеристик (спектра, основного тона, амплитудно-временных характеристик и др.) в передаче слушателю различных видов речевой информации. Рассмотрены также такие психоакустические особенности восприятия речи слушателем, как информационная избыточность связной речи, влияние шума на восприятие речи, асимметрия слухового восприятия речи, восприятие собственной речи говорящим, особенности вокальной речи (пения), наконец – восприятие человеком так называемых экстралингвистических характеристик звуковой речи, изученных значительно меньше по сравнению с лингвистическими ее свойствами (слово), но значение которых в восприятии речевой информации весьма велико.

Система речевой коммуникации в общем виде включает в себя: 1) источник речевого сигнала (процесс формирования речевого высказывания и образования речи), 2) акустический речевой сигнал, 3) приемник речевой информации (слуховой анализатор и мозг слушателя), 4) шум, всегда присутствующий в системе речевой коммуникации и оказывающий существенное влияние как на процесс восприятия речевой информации, так и на ее образование.

Все звенья указанной системы речевой коммуникации являются взаимосвязанными и взаимосогласованными. Так, например, характеристики источника целиком определяют особенности сигнала. Слух человека в свою очередь хорошо адаптирован к восприятию акустических характеристик речи, выделению речевого сигнала на фоне наиболее вероятных акустических помех. Более того, психофизиологический процесс восприятия речи не ограничивается слуховым анализом акустических характеристик речевого сигнала, но простирается и на анализ слушателем механизмов речеобразования. Данное явление нашло отражение в моторной теории восприятия речи (Галунов, Чистович, 1965; Lieberman et al., 1962; Cooper, 1966), реально регистрируемых биопотенциалах речевых мышц при слушании речи (Соколов, 1968), представлениях об активной природе любого сенсорного процесса, в частности восприятия вокальной речи (Морозов, 1977) и музыки (Теплов, 1947; Леонтьев, 1965).

1.1. Различные акустические параметры речевого сигнала и их значение для восприятия

Разборчивость речи. Важнейшей психоакустической характеристикой речи является ее разборчивость, т. е. степень правильного восприятия слушателем ее фонетических элементов и семантического содержания, иными словами – внятность и понятность речи.

Изучение разборчивости речи исторически было связано с необходимостью оценить качество электроакустических трактов связи, в частности телефонных сетей. Такого рода исследования были проведены как за рубежом (French, Steinberg, 1947; Licklider, Miller, 1951), так и в нашей стране инженерами связи в содружестве с фонетиками (Покровский, 1962). Вместе с тем разработанные для этой цели методы нашли и более широкое применение, в частности – для изучения индивидуальных и групповых особенностей разборчивости речи людей (мужчин, женщин, детей) в различных условиях (Морозов, 1977).

Основной принцип исследования разборчивости состоит в прослушивании группой подготовленных слушателей того, что говорит человек, записи прослушанного и определении вероятности правильного восприятия по отношению ко всему переданному говорящими речевому материалу, согласно формуле: A = Wx/W, где А – разборчивость речи в процентах; W – число переданных говорящим лингвистических единиц, например слов; Wx – число правильно принятых слушателем слов.

Характер речевого материала при этом оказывает весьма существенное влияние на результаты восприятия речи слушателем. Так, показано, что при всех прочих равных условиях максимальная разборчивость наблюдается при восприятии связной речи в виде предложений (так называемая фразовая разборчивость). При тех же условиях процент разборчивости оказывается меньше, если передаются изолированные слова, и еще меньше – при передаче изолированных фонетических элементов речи типа слогов (или, как их иногда называют, логотомов). Указанное обстоятельство объясняется высокой информационной избыточностью речевого сигнала связной речи, обеспечивающей возможность слушателю догадываться о нечетко произнесенных и даже вовсе не произнесенных (редуцированных) звуках по смыслу речевого высказывания.

Зависимости между слоговой, словесной и фразовой разборчивостью для английской речи впервые определены Коллардом (Collard, 1929 – цит. по: Покровский, 1962). Для русской речи они обстоятельно были изучены коллективом инженеров Военной академии связи совместно с кафедрой экспериментальной фонетики Ленинградского университета (Покровский, 1962). Для этой цели были разработаны специальные тестовые фразы, слова и слоги, а также процедуры исследования. Данные формы речевого материала были разработаны с учетом статистических характеристик и фонетических закономерностей русской речи, составлено 100 слоговых таблиц по 50 слогов в каждой. Слоги эти закрытые (начинаются и оканчиваются согласными) и лишены смысла (не являются односложными словами).

Комплекс слоговых таблиц официально утвержден для исследования разборчивости русской речи (ГОСТ-7153–61). Составлен также комплекс из 50 лингвистически сбалансированных словесных таблиц (по 50 слов в каждой, служащих для тех же целей), а также материалы для определения фразовой разборчивости (Покровский, 1962).

Зависимости между слоговой, словесной и фразовой разборчивостями для английской и русской речи приведены на рисунках 1 и 2. На основании указанных закономерностей, зная слоговую разборчивость, всегда можно определить разборчивость слов и разборчивость фраз, т. е. связной речи. Так, например, 50 % разборчивости слогов соответствуют 90,5 % разборчивости слов и 96,5 % разборчивости фраз, что считается весьма удовлетворительным.


Рис. 1. Зависимость словесной разборчивости (W) от разборчивости слогов (S) (Покровский, 1970)


Рис. 2. Зависимость фразовой разборчивости (J) от разборчивости слогов (S) (Покровский, 1970)


Информационная избыточность связной речи, обусловливающая повышенную разборчивость осмысленных элементов речи (фраз и слов) по отношению к слогам, является важнейшим психоакустическим свойством речевого восприятия. Этот феномен свидетельствует, что процесс восприятия речи не является поэлементным. Он не сводится к последовательному восприятию отдельных речевых элементов (звуков или слогов), а в каждый данный момент является вероятностным, т. е. опирается на достаточно широкую ретроспективную (т. е. на то, что было произнесено раньше) и перспективную (что будет сказано) оценку воспринимаемого речевого материала. Решающим с этой точки зрения фактором является знание слушателем лингвистических вероятностных закономерностей языка, приобретаемых, разумеется, не в результате какого-либо специального обучения, а эмпирическим путем в процессе овладения языком, начиная с раннего детского возраста.

Трудности проблемы автоматического распознавания речи (существующие и по сей день) в значительной мере возникали в результате попыток исследователей ограничить процесс распознавания процедурой поэлементного, например пофонемного, анализа речевого потока. Но, поскольку многие звуки в живой разговорной речи неузнаваемо изменены (по отношению к своему среднестатистическому стандарту) или даже вовсе отсутствуют, данный алгоритм речевого распознавания заведомо не оптимален. Поэтому в современных теориях машинного распознавания речи все более и более начинает доминировать идея о необходимости обучения ЭВМ распознаванию речи на основе тех же принципов, что и овладение речью человеком в онтогенезе, т. е. на основе «усвоения» машиной всех необходимых вероятностных языковых закономерностей (Ли, 1983).

Спектральные характеристики речи. Наиважнейшей акустической характеристикой речи, обусловливающей восприятие слушателем речевой информации, является динамика спектрального состава звука во времени. Спектром звука принято называть представление сигнала в координатах «частота – амплитуда», иными словами – зависимость амплитуд обертонов от их частоты.

Голосовой источник (гортань, голосовые складки) формирует звук (см. рисунок 3а, б) с линейно падающей по мере увеличения частоты амплитудой обертонов (см. рисунок 3в). Резонаторная система речевого тракта (ротовая полость, глотка) обладает свойством усиливать отдельные полосы частот, значение которых определяется объемом и конфигурацией ротоглоточного резонатора, что в свою очередь обусловливается характерным для каждого речевого звука положением артикуляционных органов (см. рисунок 3 г). В результате прохождения звуковой волны от голосовых складок через ротоглоточный резонатор[9]9
  В формировании спектральных характеристик речевых звуков немаловажная роль принадлежит также и носовому резонатору, акустически связанному с системой ротоглоточного резонатора через носоглоточный проход, регулируемый активностью мягкого нёба.


[Закрыть]
спектр ее оказывается преобразованным, т. е. имеет максимумы акустической энергии (F1, F2) в частотных полосах, соответствующих резонансному усилению речевого тракта, и минимумы в соседних полосах, соответствующих поглощению (подавлению) речевым трактом акустической энергии (см. рисунок 3д).


Рис. 3. Схема преобразования спектра в речевом тракте (Сапожков, Михайлов, 1983).

а – звуковые импульсы голосовых связок; б – осциллограмма речевого звука; в – спектр источника (голосовых связок); г – резонансные характеристики речевого тракта; д – результирующий спектр речевого звука. А – амплитуда; Р – звуковое давление; t – время; L – относительный уровень спектральных составляющих; f – частота спектральных составляющих; F1 – первая форманта; F2 – вторая форманта.


Как установлено с параллельным применением кинорентгеносъемки и акустической техники, в процессе артикуляции звуков речи, т. е. перемещении языка, губ, челюсти, изменении объемов и конфигурации ротовой и глоточной полостей, резонансные характеристики речевого тракта меняются. Это соответственно приводит к изменению максимумов на спектрах речевых звуков, в частности гласных [А], [Э], [И], [О], [У], [Ы] (см. рисунок 4). Максимумы акустической энергии на спектрах звуков, получившие название формантных максимумов, или речевых формант, играют основную роль в опознавании речевых звуков слуховой системой человека. Формантные максимумы на спектрограммах обозначаются индексами F1, F2, F3 и т. д. (см. рисунок 3д) в соответствии с номером форманты (нумерация ведется от самой низкой, первой, форманты F1 к высоким).


Рис. 4. Представление шести русских гласных [А], [Э], [И], [О], [У], [Ы] в координатах «частота первой форманты F1 (по оси абсцисс) – частота второй форманты F2 (по оси ординат)» (Fant, 1965).

Характерное положение каждой гласной на плоскости F1 – F2 обозначено точкой. Рядом изображен характерный профиль речевого тракта при артикуляции данного звука и типичные для каждой гласной спектрограммы.


Согласно акустической теории речеобразования (Fant, 1960), каждый речевой звук характеризуется наличием ряда формант. Однако для эффективного узнавания звуков речи слушателем достаточно первых двух формант (F1 и F2). В отличие от гласных спектральные максимумы многих согласных (например, С, З, Ш) сильно сдвинуты в высокочастотную область вплоть до ультразвуковых частот 50–80 кГц (Мясников, Мясникова, 1970). Вместе с тем в спектре естественной речи обнаружены и низкочастотные составляющие в области инфразвуков (Морозов и др., 1972).

Приведенные на рисунке 4 значения формантных частот гласных звуков отнюдь не являются строго фиксированными (равно как и согласных) и у разных людей могут отклоняться в пределах до 20 % (в силу анатомо-физиологических различий речевых трактов у разных людей). Поскольку у женщин и детей речевые резонаторы в целом имеют меньшие объемы, формантные частоты их речи сдвинуты в высокочастотную область: у женщин на 17 %, у детей (до 10 лет) на 25 % по сравнению с таковыми у мужчин. Указанное обстоятельство тем не менее не вызывает особых затруднений у слушателей в восприятии детской и женской речи, хотя в целом разборчивость детской и женской речи оказывается несколько ниже, чем мужской, особенно в верхней части звуковысотного диапазона голоса (Морозов, 1964b, Morozov, 1980).

Выше упоминалось о среднестатистических распределениях формантных областей на стационарных участках речевых звуков. Однако естественная речь характеризуется более или менее плавными переходами от одного артикулируемого звука к другому, что отражается на спектрах в наличии переходных процессов, т. е. участков между звуками, в которых содержится информация как о предыдущем, так и последующем звуке.

С целью изучения динамики звуковых процессов, и в частности речевых спектров, применяются динамические спектрографы, известные также в литературе под термином «видимая речь». На динамических спектрограммах, полученных с помощью данного прибора, по горизонтальной оси регистрируется время, по вертикальной – частота спектральных составляющих, а их интенсивности соответствует степень потемнения линий (Potter et al., 1947). Пример регистрации речевой фразы: «Девушка, как тебя зовут?» – при помощи динамического спектрографа приведен на рисунке 5. Жирными линиями здесь обозначены формантные частоты, характерным образом изменяющиеся по частотной шкале в процессе речи. Для более точного определения речевых формант существуют специальные методы и автоматические устройства – так называемые формантоискатели (Сапожков, Михайлов, 1983).


Рис. 5. Динамическая спектрограмма фразы «Девушка, как тебя зовут?», синтезированной с помощью синтезатора «OVE-3» (Деркач и др., 1983).

В верхнем ряду «Девушка как», в нижнем – «тебя зовут». Хорошо видны первые три форманты – F1, F2, F3, частоты которых изменяются в процессе воспроизведения фразы.


Среднестатистический (усредненный) спектр русской речи, полученный методом интегрирования (в частотных полосах спектрометра) большого числа речевых сигналов, охватывает весьма широкую полосу частот, примерно от 100 до 10 000 Гц, с постепенным падением к высоким частотам. Это не означает, что весь указанный частотный диапазон необходим для удовлетворительного восприятия и понимания речи слушателем.

Исследования показали, что речевой сигнал сохраняет достаточно высокую разборчивость при условии ограничения его спектрального состава как сверху (подавление высоких частот спектра при помощи фильтров низкой частоты), так и снизу (подавление низких частот спектра при помощи фильтров высокой частоты). Слоговая разборчивость 80 % обеспечивается при ограничении высоких частот от 2 кГц и выше или при ограничении низких частот от 2 кГц и ниже. Напомним, что 80 % слоговой разборчивости соответс твует 98 % разборчивости с лов (см. рис унок 1) и 99,5 % фразовой разборчивости (см. рисунок 2). Таким образом, обе половины спектра речевого сигнала, разделенного по частоте 2 кГц, обеспечивают практически 100-процентную правильность восприятия слушателем фразовой речи.

Еще более устойчивыми к ограничению спектральной полосы оказываются некоторые виды экстралингвистической информации, в частности узнавание говорящего по голосу. Так, ограничение речевого спектра полосой всего лишь 0–400 Гц и ниже обеспечивает правильное узнавание диктора с вероятностью 0,7 (70 %). Однако эта же полоса спектра (400 Гц и ниже) дает лишь около 3 % правильного восприятия слогов. Ограничение низких частот (4 кГц и выше) дает 65 % узнавания диктора и лишь около 32 % правильного восприятия слогов.

Исходя из указанных исследований, частотно-спектральный диапазон в линиях телефонной связи установлен в пределах 300– 3000 Гц, что обеспечивает вполне удовлетворительное речевое общение. Однако для высококачественной передачи речи и особенно музыки (повышения натуральности ее звучания) необходима более широкая полоса частотного диапазона: 16–16000 Гц и шире. Так, некоторые фирмы в целях достижения особо высокого качества звучания выпускают электроакустическую аппаратуру (магнитофоны, усилители) с диапазоном частот, захватывающим инфразвуковые и ультразвуковые области.

Частота основного тона. Согласно миоэластической теории голосообразования (Морозов, 1977; Berd, 1958), голос, как уже указывалось, формируется в результате периодических колебаний голосовых складок под действием проходящего через их сомкнутые края тока воздуха, создаваемого в свою очередь экспираторной мускулатурой дыхательного аппарата и эластической тягой легких. Считается, что эластические свойства голосовых складок с участием эффекта Бернулли обеспечивают достаточно стабильные автоколебания голосовых складок.


Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 | Следующая
  • 4.6 Оценок: 5

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации