«На музыке»: Как мозг воспринимает и различает звуки
В «Альпине нон-фикшн» при поддержке Института музыкальных инициатив вышла книга Дэниела Левитина «На музыке». Когда-то ее автор был рокером и саунд-продюсером, а теперь стал нейробиологом и изучает связи между музыкой и мозгом — например, что в голове у музыкантов и по какому принципу создаются хиты.
С разрешения издательства мы публикуем несколько страниц о восприятии музыки. Из них вы узнаете о том, как именно человек слышит разные звуки, почему мы можем отличать мяуканье кошки от Pink Floyd и чем нашей нервной системе так нравятся музыкальные записи.
Барабанная перепонка — простая мембрана, натянутая на ткани и кости. Это врата слуха. Практически все наши аудиальные впечатления основаны на том, как барабанная перепонка колеблется взад-вперед в ответ на удары молекул воздуха. (В какой-то степени ушная раковина — внешняя часть уха — тоже задействуется в слуховом восприятии, как и кости черепа, но по большей части основным источником всего, что мы узнаем о мире звуков, является барабанная перепонка.) Давайте рассмотрим типичное слуховое событие: человек сидит у себя в гостиной и читает книгу. Предположим, что в этой среде есть шесть источников звука, которые он способен идентифицировать: посвистывание вентилятора (или воздуховода), гудение холодильника на кухне, машины за окном (только здесь могут быть десятки различных звуков: двигатели, скрип тормозов, гудки и так далее), шелест листьев на ветру, мурлыканье кошки в соседнем кресле и прелюдии Дебюсси в проигрывателе. Каждый из них можно рассматривать как слуховой объект или источник звука, и мы способны их идентифицировать, потому что у каждого собственное отличительное звучание.
Звук передается по воздуху молекулами, колеблющимися на некоторых частотах. Эти молекулы бомбардируют барабанную перепонку, заставляя ее тоже колебаться определенным образом в зависимости от того, насколько сильно они по ней ударяют (согласно громкости, или амплитуде звука), и от того, насколько быстро они колеблются (согласно тому, что мы называем высотой звука). Однако в молекулах нет ничего, что подсказывало бы барабанной перепонке, откуда взялся звук и какие из молекул с каким объектом связаны. На молекулах, которые пришли в движение из-за мурлыканья кошки, нет табличек с надписью «кошка», а столкнуться с барабанной перепонкой они могли в то же самое время и в том же самом месте, что и звуки холодильника, вентилятора, музыки Дебюсси и всего остального.
Представьте себе, что вы плотно натягиваете наволочку на ведро и люди кидают в нее шарики для пинг-понга с разного расстояния. Каждый человек может бросать столько шариков и делать это так часто, как ему нравится. Ваша задача состоит в том, чтобы, глядя на одну только наволочку и ее движение, определить, сколько вокруг людей, кто они, движутся они к вам или от вас или вообще стоят на месте. Это аналогия того, какие задачи выполняет слуховая система при идентификации звуков, используя в качестве ориентира лишь колебание барабанной перепонки. Как по движениям этой беспорядочной массы молекул, ударяющихся в мембрану, мозгу удается понять, что нас окружает? И, в частности, как он решает задачу с музыкой?
Это происходит через извлечение признаков, за которым следует процесс их интеграции. Мозг извлекает из музыки основные, низкоуровневые характеристики с помощью специальных сетей нейронов, которые разделяют информацию о звуковом сигнале на высоту, тембр, расположение в пространстве, громкость, реверберацию, длительности нот и время начала их звучания (а также на различные компоненты нот). Эти операции выполняются параллельно сетями, которые вычисляют нужные значения и могут работать более или менее независимо друг от друга, то есть сети, отвечающей за высоту звука, не нужно ждать, пока сработает сеть, ответственная за длительность, чтобы начать собственные вычисления. Такой процесс — когда сети нейронов принимают во внимание только информацию, содержащуюся в стимуле, — называется восходящей обработкой данных. В окружающем мире и в нашем мозге перечисленные выше свойства музыки существуют раздельно. Мы можем изменить одно, не меняя другого, точно так же как можем изменить форму визуальных объектов, не меняя их цвета.
Низкоуровневая восходящая обработка основных элементов происходит в периферических и филогенетически более старых частях нашего мозга; термин «низкоуровневая» относится к восприятию элементарных, или базовых, свойств сенсорного стимула. Высокоуровневая обработка происходит в более продвинутых частях мозга, которые принимают проекции от сенсорных рецепторов и от ряда низкоуровневых процессорных единиц. Происходит объединение низкоуровневых элементов в цельную картину. Высокоуровневая обработка — это как раз та стадия, когда все собирается вместе и наш разум приходит к пониманию формы и содержания. С помощью низкоуровневой обработки мозг получает информацию о том, что на странице, которую вы сейчас читаете, есть пятна типографской краски, и, возможно, даже узнает какие-то базовые формы, например букву «и». Но только на стадии высокоуровневой обработки буквы собираются вместе, чтобы вы прочитали слово «искусство» и создали мысленный образ того, что оно означает.
Одновременно с тем как в улитке, слуховой коре, стволе мозга и мозжечке происходит извлечение признаков звука, центры высокоуровневой обработки в мозге получают постоянный поток данных о проделанной на данный момент работе. Эти данные постоянно перезаписываются по мере поступления более актуальной информации. Когда высшие мыслительные центры — в основном в префронтальной коре — получают обновления, они начинают трудиться изо всех сил, стараясь предсказать, куда музыка пойдет дальше, основываясь на нескольких факторах:
● на том, что уже было в музыкальном произведении, которое мы слышим;
● на том, что, как мы помним, будет дальше, если музыка знакомая;
● на том, что, как мы ожидаем, будет дальше, если нам знаком этот жанр или стиль, на основании прошлого опыта прослушивания подобной музыки;
● на любой дополнительной информации, какую удастся получить, например когда мы читаем краткое изложение музыкального произведения, когда исполнитель совершает внезапное движение или когда стоящий рядом человек толкает нас в бок.
Такие вычисления, производящиеся в лобной доле, называются нисходящей обработкой информации и могут оказывать влияние на модули уровнем ниже, пока те выполняют восходящие вычисления. Ожидания, возникшие в результате нисходящих процессов, могут привести нас к неправильному восприятию вещей, перенастроив некоторые сети в восходящих процессорах. Отчасти они составляют нейрональную основу перцептивного завершения и других иллюзий.
Нисходящие и восходящие процессы постоянно обмениваются информацией. В то же время, когда анализируются отдельные признаки, части мозга более высокого уровня, то есть филогенетически более развитые и получающие информацию от нижних отделов мозга, работают над их интеграцией в целостную картину. Мозг строит представление о реальности, основываясь на этих компонентах, подобно тому как ребенок строит крепость из кубиков «Лего». В процессе мозг делает ряд умозаключений на основе неполной или неоднозначной информации. Иногда они оказываются ошибочными, и зрительные и слуховые иллюзии как раз и являются примерами того, что наша система восприятия сделала неправильный вывод о реальном положении вещей.
В попытке идентифицировать слуховые объекты мозг сталкивается с тремя трудностями. Во-первых, информация, поступающая к сенсорным рецепторам, недифференцированна. Во-вторых, она неоднозначна: разные объекты могут одинаковым или похожим образом приводить в движение барабанную перепонку. В-третьих, информация редко бывает полной. Части звука иногда скрываются за другими звуками или теряются. Мозг должен вычислить, что за звук мы услышали на самом деле. Это происходит очень быстро и обычно подсознательно. Иллюзии, которые мы уже рассмотрели, как и данные перцептивные операции, не поддаются осознанию. Например, я могу вам сказать, что причина, по которой вы видите треугольники в фигуре Канизы там, где их нет, связана с перцептивным завершением. Но, даже понимая задействованные принципы, мы не можем взять и отключить их. Мозг обрабатывает информацию, как и прежде, и вы продолжаете удивляться.
Гельмгольц назвал этот процесс бессознательным умозаключением. Рок назвал его логикой восприятия. Джордж Миллер, Ульрих Найссер, Герберт Саймон и Роджер Шепард описывали восприятие как «конструктивный процесс». Все это — разные формулировки идеи, что видимое и слышимое нами является результатом длинной цепочки происходящих в уме событий, которые все вместе создают впечатление, мысленный образ физического мира. Многие особенности функционирования нашего мозга, включая восприятие цвета и вкуса, обоняние и слух, возникли в результате эволюции под давлением факторов, которых по большей части уже нет. Когнитивный психолог Стивен Пинкер и другие высказывали предположение, что наша система восприятия музыки, по существу, оказалась эволюционной случайностью, а также что при стремлении к выживанию и под давлением полового отбора у нас сформировалась система языка и коммуникации, которую мы научились использовать в том числе и для музыкальных целей. В сообществе когнитивных психологов этот вопрос по-прежнему считается спорным. Археологические находки дали нам несколько подсказок, но явные доказательства, которые помогли бы раз и навсегда решить эти вопросы, попадаются редко. Феномен завершения, который я описал, — не просто лабораторная диковинка. Этот принцип используют и композиторы, поскольку знают, что в нашем восприятии мелодическая линия продолжается, даже если ее часть заглушают другие инструменты. Когда мы слышим самые низкие ноты фортепиано или контрабаса, мы не воспринимаем частоту в 27,5 или 35 Гц, потому что эти инструменты, как правило, не могут производить много энергии на сверхнизких частотах, — на самом деле наши уши достраивают недостающую информацию и дают нам иллюзию, что звук и правда такой низкий.
В музыке мы поддаемся и другим иллюзиям. В фортепианных произведениях, таких как «Шелест весны» Синдинга или «Фантазия-экспромт» Шопена в до-диез минор, соч. 66, ноты сменяются так быстро, что в них слышится мелодия. Если сыграть их медленно, то она исчезнет. Из-за разделения потоков звука мелодия словно отделяется, когда ноты звучат достаточно близко друг к другу во времени, — перцептивная система соединяет их вместе, — а когда они расходятся во времени, мы не слышим мелодию. Бернар Лорта-Жакоб из парижского Музея человека пришел к выводу, что Квинтина (буквально «пятая») в вокальной сардинской музыке «а капелла» тоже иллюзия: из четырех мужских голосов словно возникает пятый — женский, если верно подобрать гармонию и тембр. (Певцы верят, что это голос Девы Марии, пришедшей вознаградить их, если они достаточно благочестивы и поют правильно.)
В песне «One of These Nights» («В одну из этих ночей») группы Eagles вступление исполняют бас и гитара, звучащие как один инструмент: бас играет одну ноту, а гитара добавляет глиссандо, но в нашем восприятии скользит бас, согласно гештальт-принципу продолжения. Джордж Ширинг создал новый тембральный эффект, заставив гитару (или в некоторых случаях виброфон) повторять то, что он играет на пианино, настолько точно, что слушатели задаются вопросом: «Что это за новый инструмент?» — тогда как на самом деле звучат два отдельных инструмента, которые в нашем восприятии сливаются. В песне «Lady Madonna» («Леди Мадонна») четверо участников группы The Beatles поют в сложенные ладони во время инструментальной паузы, а мы готовы спорить, что это звучат саксофоны — как раз благодаря необычному тембру, который им удается получить, в сочетании с нашими ожиданиями (нисходящими) о том, что в песне такого жанра должны звучать саксофоны (не следует путать этот трюк с настоящим саксофонным соло, также звучащим в песне).
В большинстве современных записей полно и других слуховых иллюзий. Благодаря искусственной реверберации вокал и соло-гитары звучат так, словно их звук доносится с противоположной стороны концертного зала, даже когда мы слушаем их в наушниках и источник звука находится в паре сантиметров от барабанной перепонки. С помощью микрофона можно записать гитару так, словно она размером в три метра, а наши уши прямо у нее в резонаторном отверстии, чего в реальности проделать никак нельзя (потому что струны натянуты прямо над отверстием, и, если бы мы приложили к нему ухо, гитарист бил бы не по струнам, а нам по носу). Мозг использует сигналы о спектре звука и типе эха, чтобы сформировать представление о слуховом мире, который нас окружает, подобно тому как мышь узнает о физическом мире с помощью усов. Звукорежиссеры научились имитировать эти сигналы, чтобы придать записям реалистичное звучание, даже если они создаются в стерильной звукозаписывающей студии.
Вот одна из причин, почему стольких людей сейчас привлекают музыкальные записи, особенно когда так легко стало носить плеер с собой и слушать музыку в наушниках. Звукорежиссеры и музыканты научились создавать специальные эффекты, которые дают мозгу приятные ощущения, воздействуя на сети нейронов, чья функция — различать важные особенности звуковой среды. Такие спецэффекты в принципе похожи на трехмерное искусство, кино или оптические иллюзии — и все это существует недостаточно давно, чтобы мозг успел развить специальные механизмы для восприятия подобных вещей. Скорее здесь работают системы, предназначенные для других целей. Поскольку в этих изобразительных средствах сети нейронов используются по-новому, нам они особенно интересны. То же самое можно сказать и о том, как создаются современные записи.
Наш мозг способен оценить размер замкнутого пространства на основе реверберации и эха, присутствующего в звуковом сигнале, который попадает к нам в уши. Пусть немногие из нас понимают уравнения для расчета объема того или другого помещения, все мы можем определить на слух, находимся мы сейчас в маленькой ванной с кафельными стенами, в концертном зале средней величины или в церкви с высоким потолком. То же мы можем сказать и о голосе в записи: мы знаем, в каком помещении находится вокалист или оратор. Звукорежиссеры создают то, что я называю гиперреальностью, — эквивалент кинотрюка, когда камера установлена на бампере несущегося автомобиля. От прослушивания записей мы переживаем сенсорные впечатления, которых не испытываем в реальном мире.
Наш мозг чрезвычайно чувствителен к измерению времени. Мы способны определить расположение объектов в окружающем мире, основываясь на разнице всего в несколько миллисекунд между тем, когда звук придет в одно ухо, и тем, когда дойдет до другого. Многие спецэффекты, которые нам нравятся в записанной музыке, основаны на этой чувствительности. В звучании гитар Пата Мэтини или Дэвида Гилмора из Pink Floyd используются многократные задержки сигнала для ощущения чего-то потустороннего, призрачного, стимулирующего области мозга, которые мы в реальной жизни еще не задействовали. Этот эффект имитирует звук замкнутой пещеры со множеством отражений, не существующий в реальности, — слуховой эквивалент бесконечно отражающих друг друга парикмахерских зеркал.
Пожалуй, величайшая иллюзия в музыке — иллюзия структуры и формы. В самих сменяющих друг друга нотах нет ничего, что создавало бы богатые эмоциональные ассоциации, которые вызывает у нас музыка. Нет ничего такого в гамме, аккорде или последовательности аккордов, что заставляло бы нас ожидать разрешения. Наше понимание музыки зависит от опыта и от нейрональных структур, которые способны учиться и видоизменяться с каждым прослушиванием новой песни и с каждым прослушиванием уже знакомой. Наш мозг усваивает своего рода музыкальную грамматику, специфичную для музыки нашей культуры, точно так же, как он обучается языку.
Изображения: Руди Лин
все материалы