Электронная библиотека » Татьяна Черниговская » » онлайн чтение - страница 10


  • Текст добавлен: 19 апреля 2022, 00:48


Автор книги: Татьяна Черниговская


Жанр: Прочая образовательная литература, Наука и Образование


Возрастные ограничения: +12

сообщить о неприемлемом содержимом

Текущая страница: 10 (всего у книги 36 страниц) [доступный отрывок для чтения: 10 страниц]

Шрифт:
- 100% +
Изучение восприятия внутри– и межвидовой знаковой информации (обзор и возможные направления сравнительно-физиологических исследований)5

Основная трудность при описании эволюционных преобразований и взаимоотношений животных различных видов состоит в том, что действительную последовательность появления и развитие в процессе эволюции происходящих событий мы наблюдать не можем. Наши представления о них базируются на данных, полученных из множества источников, включающих сравнительную анатомию и физиологию, анализ ископаемых останков различных особей, археологические находки, онтогенетические данные, изучение генетических древ-карт. Объединенные, эти данные обеспечивают возможность определения физиологических соотношений, а материалы, собранные в результате изучения поведения животных, увеличивают возможность оценки и идентификации эволюционных внутри– и межвидовых отношений.

Некоторые исследователи обоснованно считают, что наряду с анатомическими и физиологическими характеристиками поведение в значительной степени реализуется по сходным закономерностям среди эволюционно взаимосвязанных особей, поскольку такое поведение является отражением последовательности генетической истории животных. Широко распространена точка зрения, что люди используют коммуникационную систему, основанную в значительной мере на общепринятых и общеизвестных знаках, и именно поэтому они способны говорить о прошлом и будущем предметов и объектов, которые в данный момент отсутствуют, и образовывать понятия, которые не имеют внешних референтов.

В то же время считается, что животные общаются с помощью малого количества вокализаций, жестов и поз для передачи информации в основном об их текущем эмоциональном состоянии [Вартанян, 1990]. Эта точка зрения поддерживается в первую очередь результатами полевых исследований коммуникационного поведения особей различных видов, а также минимальной способностью к усвоению языков, которую особи демонстрируют в виде восприятия только их наиболее простых акустических свойств. Мы полагаем, что изучение коммуникационного поведения – один из перспективных способов оценки внутри– и межвидовых эволюционных отношений [Вартанян, Черниговская, 1990].

Проблема взаимодействия слуха и голосовой коммуникации была четко определена в статье Г. B. Гершуни [Гершуни, 1968], где обсуждается удивительное сходство между слуховой чувствительностью и полосой наиболее значимых биоакустических сигналов, характерных как для голосового поведения животных, так и для сигнально значимых звуков окружающей среды.

Развитие идеи соответствия слуха и голоса привело к серии исследований общих и специфических особенностей акустических коммуникационных сигналов и их моделей [Гершуни, 1973; Гершуни, Мальцев, 1973; Гершуни и др., 1976]. C позиции такого подхода представляется важным знать, до какой степени человек может правильно определять значение и смысл коммуникационных знаков других животных. Мы полагаем, что более близкородственные виды животных будут легче распознавать сигналы друг друга, поскольку они участвуют в основных формах коммуникационного поведения, которые являются результатом разделения их на разные виды в прошлом.

Источники этого вопроса лежат в исследованиях, которые показали, что все коммуникационные системы животных содержат множество общих основных свойств [Bickerton, 1990; Chernigovskaya, 1993; Fossey, 1983; Goodall, 1986; Koch, 1992; Liska, 1986, 1990; Strum, 1987; Savage-Rumbaugh, 1986]. Некоторые из этих свойств не только сходны, но и связаны с типами знаков, используемых для коммуникации (см., например, [Liska, 1987, 1990, 1993], тогда как другие свойства соотносятся с тем, как различные кoммyникациoнные коды обрабатываются и опознаются [Chernigovskaya, Vartanian, 1991; Chernigovskaya, Rotenberg, Shapiro, 1991; Robinson, 1976; Walker, 1980]. Следует обратить внимание, например, на данные о том, что правое полушарие мозга в большей мере отвечает за обработку вокализаций, и особенно просодических особенностей звуковых отрезков, их эмоциональных интонаций, качество звучания. Это же полушарие превалирует в оценках эмоциональных качеств лицевой экспрессии, осязания, пространственного расположения раздражителей, а также положения головы и тела и ориентации в окружающем мире. Было обнаружено [Chernigovskaya, Vartanian, 1991; Chernigovskaya, 1992], что у человека биологически значимые просодические характеристики речи также лучше обрабатываются правым полушарием. Это неудивительно, если учесть, что просодические характеристики – наиболее древние, и потому можно думать, что их обработка связана с наиболее древними функциями и областями мозга, такими, например, как лимбическая система, строение и функции которой наиболее сходны у человека и животных. Следует заметить, что латерализация функций, связанных с коммуникационными знаками, найдена не только у человека, но и у животных [Miles, 1983; Premack, 1971, 1983].

Почти все животные проявляют определенную тенденцию к асимметрии функций мозга [Tattersall, Delson, Van Couvering, 1989], есть также данные и об эволюции лaтерaлизaции различных форм поведения [Бианки, 1985; MacNeilage, 1992; Nottebohm, 1979]. Все имеющиеся материалы предполагают, например, нейролингвистическую обработку видоспецифических коммуникационных форм поведения как левoлaтерaлизовaннyю форму у многих видов приматов, равно как у человека [Gardner, Gardner, Van Cantfort,1989; Miles, 1976; Morton, Page, 1992]. Латерaлизaция сенсорных и когнитивных функций человека, рассмотренная во многих исследованиях, сопоставима с рядом особенностей лaтеpaлизaции у приматов [Балoнoв, Деглин, Чeрниговскaя, 1986; Бару, 1977; Hикoлaенкo, Черниговская, 1989; Bradshaw, Nettleton, 1981; Chernigovskaya, Balonov, Deglin, 1983; Chernigovskaya, Deglin, 1986; Chernigovskaya, 1993; Efron, 1990; Le Doux, 1982; Levу, 1976; Moscovitch, 1979; Savage-Rumbaugh, 1990; Trevarthen, 1984].

Широко известно, что лимбичeскaя система играет важную роль в адаптации и эмоционально-мотивационном поведении [Robinson, 1976]. B случаях эмоционального стресса функции лимбической системы превалируют над торакальными процессами, повреждение лимбической системы влияет на тип и степень речевых нарушений у человека. Частотная модуляция голоса также обеспечивается лимбической системой. Это видно из того, что возрастание мотивационного компонента в поведении, которое сопровождается голосовой реакцией, выражается в увеличении высокочастотных составляющих голосовых сигналов [Вартанян, 1990; Вартанян, Черниговская, 1990]. B связи с этим интересно отметить полученные нами данные, что существуют прямые реципpoкные связи между слуховой и лимбической системами, особенно в области высокочастотного представительства тональных сигналов как на уровне среднего мозга [Вартанян, Жарская, 1985], так и в коре больших полушарий [Vartanian, Shmigidina, 1991]. Как и у животных, некоторые голосовые реакции человека имеют источником возбуждение лимбической системы. Некоторые авторы считают, что звуковая вокализация животных, вызванная раздражением лимбической системы, является базисом для дальнейшего развития человеческой речи; другие полагают, что человеческая речь возникла исключительно в результате развития новых специфических областей коры. Эволюционные модификации сенсорных систем в филогенетических линиях и видах определили изменения в физических и физиологических характеристиках звука и слуха, а также голосовых качеств и сложности коммуникативных сигналов.

Например, анализ данных сравнительной физиологии показывает, что область детектируемых звуков у млекопитающих шире, чем у рыб и амфибий (три – пять октав у рыб по сравнению с шестью – десятью октавами у млекопитающих). Это связано в первую очередь с возрастанием чувствительности и расширением диапазона воспринимаемых высокочастотных звуков за счет эволюции среднего уха. Есть основания предполагать, что высокочастотная зона слуха человека наиболее эффективна для обучения [Вартанян, 1986]. В пользу такого предположения свидетельствует тот факт, что дети особенно чувствительны к высокочастотным звукам, а трудности в формировании речи особенно выражены, когда нарушено восприятие высокочастотных звуков при патологии. Рядом авторов [Masali, Tarli, Maffei, 1992] проанализированы анатомические изменения в эволюции уха у приматов и затем соотнесены с возможными межвидовыми взаимодействиями. Наконец, оценки вокализаций, используемых приматами и другими животными, дают основания полагать, что они сходны в следующих аспектах:

1) приматы распознают друг друга на основании индивидуальных характеристик голоса [Вартанян, 1986];

2) все виды животных проявляют чувствительность к формантным частотам и способны к фонемическому распознаванию [Lieberman, 1984];

3) все виды животных чувствительны к звукам внутривидовой коммуникации.

Коммуникационными могут служить и зрительные сигналы, некоторые из которых сходны для животных многих видов, например когда открытый рот свидетельствует о зевании или кашле, что наблюдается у всех млекопитающих.

Ряд авторов считают, что зрительные сигналы предшествуют речи в эволюции [Hewes, 1973, 1991; Kendon, 1991]. Узоры окраски, положение тела, выражение лица, позы представляют собой различные сообщения о поле, возрасте, индивидуальности, состоянии, дружелюбности, эмоциональности и т. д. Считается, что восприятие этих форм поведения осуществляется преимущественно с участием правого полушария, поскольку известно, что именно оно отвечает за анализ эмоциональных проявлений и пространственных отношений. Возможно, однако, что, как и при вокализациях, имеются межполyшaрные различия в обработке видоспецифических визуальных знаков. Например, включение левого полушария в анализ и интерпретацию знаков может увеличивать возможность восприятия по сходству знаков при расширении их репертуара.

Приведенные выше данные можно использовать для исследования следующих задач:

1) выявить, до какой степени человек может правильно опознавать и понимать звуки других видов;

2) определить нервные структуры, ответственные за восприятие голосовых сигналов разной значимости и взаимодействие слуховых воспринимающих областей мозга с системами генерации коммуникaционных звуков;

3) определить различия по электрическим потенциалам мозга, которые могут проявиться в точности восприятия и в соответствующих восприятию источниках нейронной активности, связанной с сигналами разной значимости и модальности (зрительной или звуковой);

4) установить роль внимания и обучения в скорости и точности восприятия и воспроизведения коммуникационных сигналов.

Наиболее обширными являются исследования структур мозга приматов, ответственных за генерацию и модуляцию видоспецифических звуков [Jurgens, 1986; Jurgens, Lu, 1993; Jurgens, Ploog, 1988; Jurgens, Schriever, 1991]. Можно надеяться, что исследование перечисленных выше вопросов облегчит понимание эволюции акустической коммуникации.

Сравнительный анализ коммуникативного поведения, и в первую очередь восприятия и воспроизведения человеком коммуникативных сигналов, поможет выявить направление их эволюции, получившей свое окончательное выражение в звуковой речи и языке.

Зависимость восприятия низкочастотной амплитудной модуляции от возраста и тренировки у человека

Предыдущие исследования отчетливо показали существование области обостренного восприятия человеком амплитудно-модулированного (АМ) звука: это область частот модуляции порядка 4–8 Гц [Цвиккер, Фельдкеллер, 1971; Дубровский, Тумаркина, 1967; Черниговская, Морозов, 1974]. Есть основания считать, что такая избирательность в восприятии АМ-звука является результатом постоянной тренировки слуха при речевой коммуникации и, следовательно, настройки его на АМ-звук, характерный для речевого потока [Черниговская, Морозов, 1974; Морозов, Черниговская, 1975]. В связи с этим представлялось интересным посмотреть, как и когда формируется эта характеристика слуха и каким образом она развивается в процессе онтогенеза по мере увеличения слухового опыта. Для этого было обследовано три группы нормально слышащих детей: семи-восьми лет (восемь человек), девяти-десяти лет (пять человек), тринадцати-четырнадцати лет (пять человек).

Исследовалась чувствительность слуха к АМ тональным сигналам с частотой, несущей 1000 Гц при интенсивностях 40 дБ над порогом слышимости каждого испытуемого, с глубиной синусоидальной модуляции, плавно менявшейся от 0 до 100 %. Звуки предъявлялись испытуемым через калиброванные головные телефоны ТД-6. Модуляция тонального сигнала по амплитуде осуществлялась с помощью генератора инфразвуковых частот ГЗ-16, подключенного к модулятору. Исследование пороговой чувствительности производилось на частотах модуляции 1, 2, 4, 5, 6, 8, 16, 32, 64 Гц, причем для каждого испытуемого делалось от пяти до десяти измерений порогов на каждой частоте модуляции. Результаты измерений усреднялись с вычислением доверительных интервалов. Перед испытуемым ставилась задача указать на появление едва заметного колебания звука.

Результаты исследования представлены на рис 1. Кривая I демонстрирует среднестатистические значения порогов чувствительности слуха к АМ-звуку у детей семи-восьми лет. Ясно видна резкая избирательность в области 4–8 Гц. Фактически только эти частоты модуляции и воспринимались детьми данной возрастной группы: модуляция с частотами 1–2 Гц ощущалась лишь при индексе модуляции m > 20 %, модуляция же 32 и 64 Гц не воспринималась вообще. Кривая II характеризует пороговую чувствительность к АМ у тех же детей после некоторой тренировки. Как видно, порог восприятия частот 4–8 Гц не снижается, и область эта по-прежнему остается резко избирательной. Обращает на себя внимание то, что при тренировке понижаются пороги восприятия низких частот (1–2 Гц – до 10 % модуляции) и почти не понижаются пороги высоких (32–64 Гц). Отличие кривых I и II статистически достоверно на участках диапазона 1–2 и 16–20 Гц. Это вполне понятно, если иметь в виду, что так называемая область хрипов – в данном случае 50–64 Гц [Цвиккер, Фельдкеллер, 1971] – является затруднительной для восприятия амплитудных колебаний даже взрослыми людьми. Наличие такой отчетливой предпочтительности в восприятии АМ детьми семи – восьми лет, когда речь еще находится в стадии формирования, очень примечательно. Если исходить из того, что эта характеристика приобретается в результате тренировки, то совершенно естественно, что наибольшая тренированность слуха вырабатывается в диапазоне, соответствующем характеристикам речевого потока, в данном случае – амплитудной модуляции речи. Это очень ярко видно у детей семи-восьми лет, которые находятся в процессе интенсивного речевого обучения.


Рис. 1. Среднестатистические значения порогов слуховой чувствительности к восприятию АМ. m % – пороговая глубина обнаружения АМ слухом, Fмод – частота АМ (Гц); I – слуховые пороги восприятия у детей семи-восьми лет, II – пороги тех же детей после тренировки, III – пороги детей девяти-десяти, IV – тринадцати-четырнадцати лет; пороги взрослых нормально слышащих нетренированных (V) и тренированных (VI) людей [Черниговская, Морозов, 1974]


С возрастом, по мере увеличения общего слухового опыта более низкие и более высокие частоты модуляции начинают восприниматься лучше, постепенно приближаясь к порогам, характерным для взрослых людей с нормальным слухом, – кривая V [Черниговская, Морозов, 1974]. Кривая III демонстрирует пороговую чувствительность к АМ у детей девяти-десяти лет. Видно, что при сохранении избирательности статистически достоверно снижаются пороги на частотах модуляции 1–2 Гц (в среднем до 8–9 % модуляции) и 32–64 Гц (до 12–13 %). Это происходит, как можно полагать, вследствие того, что речевое обучение, сохраняясь, теряет свою преобладающую роль.

Пороги чувствительности к АМ у детей тринадцати-четырнадцати лет (кривая IV) снижаются примерно на 1 % модуляции в той же области предпочтительности, по-прежнему отчетливо выраженной, а сама кривая значительно уплощается за счет улучшения восприятия «боковых» частот (в среднем 7–8 % для 1–2 Гц и 8–10 % для 16, 32, 64 Гц). В отличие от более младших, подростки тринадцати-четырнадцати лет способны не только легко воспринимать «трудные» частоты модуляции, но отмечают, что на высоких частотах (около 64 Гц) звук не колеблется, как на других частотах, а слышен как бы параллельно с дополнительным звуком – факт, отмечаемый и взрослыми людьми. Все это говорит о значительно возросшем слуховом внимании и опыте. В то же время избирательность в области частот модуляции 4–8 Гц сохраняется при несущественном отличии порогов от данных других возрастных групп. Специальная тренировка на прослушивание АМ-звуков или тренировка в процессе профессиональной деятельности (работа со звуками широкого диапазона) приводят к еще большему уплощению кривой пороговой чувствительности (кривая VI) [Черниговская, Морозов, 1974]).

На основании полученных данных можно говорить о наличии отчетливо выраженной избирательной чувствительности у детей разных возрастных групп к АМ-звуку с частотой модуляции 4–8 Гц. Изменения, происходящие с возрастом, и специальная тренировка на восприятие АМ проявляются в незначительном снижении порогов в области избирательности и существенном снижении порогов на низких (1–2 Гц) и высоких (32–64 Гц) частотах модуляции. Такая избирательная настроенность на частоты АМ, соответствующие наиболее статистически вероятной частоте АМ речевого потока [Черниговская, Морозов, 1974; Морозов, Черниговская, 1975], согласуется с положением о взаимосвязи характеристик звукоизлучения и звуковосприятия, являющейся отражением эволюции биологических коммуникационных систем [Гершуни, 1973]. В этом смысле характерно, что наибольшая избирательность выявляется в возрасте семи-восьми лет, когда речевая функция еще формируется и процесс научения наиболее выражен. В меньшей степени избирательность свойственна группам более старших детей, у которых речь в процессе акустического научения утрачивает свою основную роль или, во всяком случае, в научение вовлекается больший диапазон звуковых сигналов.

Об избирательной чувствительности слуха человека к амплитудной модуляции речи6

Исследование чувствительности слуха человека к восприятию амплитудной модуляции (АМ) звука обнаруживает статистически достоверный минимум порогов для частот модуляции в области 4–6 Гц. Высказана гипотеза, что это явление эволюционно обусловлено настроенностью слуховой системы человека на восприятие речи, АМ которой является результатом артикуляции слогов. Проведенный акустический анализ речи разных дикторов подтвердил наличие статистически достоверного максимума АМ звукового потока именно в области 4–6 Гц. Таким образом, избирательно повышенная чувствительность слуха к восприятию этих частот АМ увеличивает надежность и помехоустойчивость системы «речь – слух».

* * *

Слух и речь, как известно, представляют две части единой биоакустической системы человека, и потому следует ожидать, что основные параметры слуха и речи являются хорошо согласованными. В процессе эволюции звуковая речь развилась позже слуха, однако ее появление, по-видимому, не могло не сказаться на функциональных параметрах слуха. В общей форме идея о повышенной избирательной чувствительности слуховой системы живых организмов к акустическим сигналам, имеющим жизненно важное значение, высказывалась неоднократно [Гершуни, 1968, 1973]. С этих позиций в настоящей работе рассматривается чувствительность слуха человека к амплитудной модуляции звука. По имеющимся литературным данным, пороги чувствительности слуха человека к низкочастотной амплитудной модуляции обнаруживают минимум в области около 4 Гц [Дубровский, Тумаркина, 1967; Цвиккер, Фельдкеллер, 1971]. Однако в литературе нет объяснений этому феномену с эволюционных позиций, то есть с точки зрения согласования параметров слуха с акустическими параметрами речи. Между тем есть все основания предположить влияние речи на происхождение этой особенности слуха.

В задачу настоящей работы входило сопоставление чувствительности слуха с амплитудно-модуляционными характеристиками речи. В связи с этим работа делится на две части, соответствующие исследованиям слуха и речи.

В первой части рассматривалась чувствительность слуха к амплитудной модуляции (АМ) тональных звуковых сигналов. Приводим схему экспериментальной установки. Тональный сигнал 1000 Гц от звукового генератора ГЗ-33 поступал на аттеньюатор и головные телефоны испытуемого (ТД-6). Модуляция по амплитуде тонального сигнала осуществлялась с помощью генератора инфразвуковых частот ГЗ-16, подключенного к модулятору. Глубина синусоидальной модуляции могла плавно изменяться от 0 до 100 %.7 Звуки испытуемому предъявлялись через калиброванные головные телефоны с плотными пористыми заглушками (рис. 1).


Рис. 1.


Поскольку в литературе имеются данные об определенной зависимости порогов обнаружения АМ-звука от уровня несущей [Цвиккер, Фельдкеллер, 1971] для каждого испытуемого, уровень несущей устанавливался равным 50 дБ над порогом. Процедура исследования была такова: вначале испытуемому предъявлялся немодулированный звуковой сигнал, а затем плавно вводилась АМ с постепенным увеличением ее глубины до тех пор, пока испытуемый не обнаруживал ее присутствия. Пороговая глубина АМ измерялась по общепринятой формуле (формула 1):



где m – индекс модуляции, Amax – максимальное значение амплитуды звука, Amin – минимальный уровень звукового сигнала.


Испытуемых было восемь человек в возрасте от тринадцати до сорока лет (трое женского, пятеро мужского пола), все с нормальным слухом. Исследование порогов AM производилось на следующих частотах (Гц): 0,1; 0,4; 1; 2; 3; 4; 5; 6; 7; 8; 10; 20; 50; 100. На каждой частоте для каждого испытуемого производилось от пяти до пятнадцати измерений порогов, результаты которых усреднялись.

Несмотря на наличие некоторых отклонений, у всех испытуемых имеется четко выраженное обострение чувствительности к AM с частотой от 3 до 8 Гц.

С целью выявления среднестатистических значений порогов результаты всех испытуемых были усреднены и подвергнуты статистической обработке для вычисления доверительных интервалов (формула 2):



где Σ – доверительный интервал, σ – среднеквадратичное отклонение, τα – доверительный критерий (по таблицам), n – число вариантов (в данном случае 8).

Результаты обработки материала представлены на рис. 2 (кривая I). Можно считать, что в целом наши результаты согласуются с имеющимися в литературе данными, хотя минимум порогов к AM, по нашим данным, располагается немного выше, а именно – в области 5–6 Гц.


Рис. 2. Среднестатистические значения порогов слуха (m%) человека к восприятию АМ (Fмод, Гц). I – до тренировки, II – после; вертикали – величины доверительных интервалов


Особый интерес для нас представляет характер изменения порогов слуха к AM в процессе тренировки. На рис. 3 (кривая II) представлены средние пороги слуха трех испытуемых после определенной тренировки по обнаружению AM-звука. Можно видеть, что пороговая кривая теряет свою избирательность, уплощается за счет опускания боковых ветвей, то есть повышения чувствительности слуха к другим частотам, в результате чего зона максимальной чувствительности расширяется. Пороги же слуха к частотам 4–6 Гц практически не изменяются. Этот факт наводит на мысль о том, что слуховая система человека априорно настроена на избирательное восприятие AM с частотой 4–6 Гц и в меньшей степени – на восприятие других частот.



Рис. 3. Вероятность встречаемости АМ разной частоты в речи русских дикторов. 1 – Левитан, 2 – Турчанинова, 3 – Яхонтов, 4 – Плятт, 5 – Ильинский, 6 – Андронников, 7 – Чуковский. p % – вероятность встречаемости АМ в речевом отрывке, Fмод – частота АМ (Гц)


Во второй части работы была поставлена задача измерения амплитудно-модуляционных характеристик речи.

С акустической точки зрения звуковая речь, как известно, представляет собой амплитудно-модулированный звуковой поток. С точки зрения речеобразования речевой поток может быть представлен как чередование открытых и закрытых слогов, в центре которых стоят слогообразующие фонемы с предшествующими и последующими согласными [Зиндер, 1960; Чистович и др., 1965]. С физиологической точки зрения распадение речевого потока на слоги обусловлено работой артикуляционного аппарата, то есть усилением или ослаблением мускульного напряжения при произнесении звуков, динамическими модуляциями речеобразующих органов. Поскольку акустическая мощность гласных значительно больше мощности согласных, акустическим коррелятом артикуляции слогов и является амплитудная модуляция.

По осциллограммам огибающих уровня звукового давления, записанным на шлейфном осциллографе К-115 с выхода микрофонного усилителя через детектор и сглаживающий фильтр с полосой прозрачности 0–80 Гц, было видно, что, хотя АМ речи очень сложна, чередование максимумов и минимумов звукового давления имеет определенную периодичность, а именно – максимумы, как правило, приходятся на гласные, а минимумы – на согласные.

Наша задача состояла в измерении амплитудно-временных характеристик речи, полученных с помощью логарифмического самописца уровня электроакустических колебаний типа Н-110. С этой целью осциллограмма огибающей речевого потока разбивалась на участки, соответствующие максимумам (пикам) амплитудной модуляции. При этом максимумы, имеющие уровень менее чем 2 дБ, в расчет не принимались. Далее межпиковые интервалы АМ измерялись, и составлялись гистограммы распределения межпиковых интервалов на всем отрезке речи каждого диктора.

Всего было исследовано восемнадцать дикторов: восемь русских, десять иностранных (четыре немецких, два шведских, четыре английских). Длительность анализируемых отрезков речи составляла три минуты. В гистограммах временные характеристики максимумов АМ были преобразованы в частотные согласно выражению F = 1/T, где F – частота (Гц), Т – величины межпиковых интервалов (с).

Результаты измерений представлены семейством кривых для русских дикторов на рис. 3, для иностранных – на рис. 4.

Кривые являются вероятностными характеристиками речи, то есть отражают вероятность появления в потоке речи пиков АМ с определенной частотой повторения. Несмотря на индивидуальные различия, в речи (как русской, так и иностранной) преобладает АМ с частотой 4–5 Гц, соответствующая средним временным интервалам 250–200 мс. Это приблизительно совпадает с областью средних длительностей ударных русских гласных – 230 мс между двумя мягкими согласными, 150 мс между двумя твердыми согласными [Бондарко, 1964]. Длительность же согласных примерно на порядок меньше длительности гласных. Таким образом, исследования подтверждают предположение, что АМ речи в общем виде является отражением процесса слогообразования.


Рис. 4. Вероятность встречаемости АМ разной частоты в речи иностранных дикторов. 1 – английский язык, 2 – немецкий, 3 – шведский. Остальные обозначения как на рис. 3


(Следует отметить, что слогоделение является одним из самых сложных вопросов фонетики и решение его существенно затрудняется зависимостью от лингвистических особенностей разных языков, при которых слоговая граница обнаруживается как необходимое условие восприятия речевого процесса. Невозможность механического рассечения речи на слоги без учета законов конкретных языков признается большинством исследователей [Зиндер, 1956; Miller, 1962; Бондарко и др., 1966] и порождает большие трудности при автоматическом распознавании речи. Поэтому мы отдаем себе отчет в том, что исследованные нами АМ характеристики речи следует рассматривать не как слоги или фонемы, выделяемые слухом в качестве минимальных единиц речевого потока, а как некоторый акустический коррелят процесса артикуляции, находящийся в определенной зависимости от слогообразования.)

С точки зрения задач настоящей работы представляет интерес сопоставление статистических характеристик АМ речи с чувствительностью слуха к АМ (рис. 5).


Рис. 5. Соответствие максимальной чувствительности слухового анализатора человека к восприятию АМ звука с областью наиболее вероятной частоты АМ речи. p % – вероятность встречаемости АМ разной частоты в речи, m % – пороговая глубина обнаружения АМ слухом, Гц – частота АМ; вертикали – доверительные интервалы. Коэффициент корреляции между кривыми m % и p % равен 0,78


Область минимума порогов, то есть наибольшая чувствительность слуха человека к АМ, 4–6 Гц (т %) совпадает с областью наиболее вероятной частоты АМ в речевом сигнале (4–5 Гц, р %). Был вычислен коэффициент корреляции между этими двумя кривыми, коэффициент оказался равным 0,78, что говорит о достаточно высокой степени корреляции между ходом этих двух кривых (формула 3):



где r – коэффициент корреляции, m – среднее значение чувствительности слуха к АМ (от 1 до 20 Гц), p – средняя величина вероятности АМ в речи (от 1 до 20 Гц), mi и pi – реальные значения указанных величин в диапазоне от 1 до 20 Гц.


Таким образом, результаты работы подтвердили высказанную в начале статьи мысль об определенной согласованности характеристик слухового анализатора с акустическими характеристиками речи. Естественная целесообразность такого согласования является достаточно очевидной ввиду наилучшего выделения и восприятия слухом речевого сигнала на фоне всевозможных акустических помех. Можно полагать, что подобное согласование явилось следствием длительного эволюционного развития человека и приспособления его слуха к акустике речи. Полученные результаты согласуются с данными о повышенной избирательной чувствительности анализаторных систем живых организмов к сигналам, имеющим для них жизненно важное значение [Гершуни, 1968, 1973].

Внимание! Это не конец книги.

Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!

Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 8 9 10
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации