Eötvös Loránd Tudományegyetem Bölcsészettudományi Kar
DOKTORI DISSZERTÁCIÓ DANCZI CSABA LÁSZLÓ
A ZENEI TÉR
Esztétika Doktori Iskola Témavezetô: Dr. Radnóti Sándor Budapest, 2004.
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
TARTALOMJEGYZÉK Tartalomjegyzék Sextus Empiricus: A szaktudósok ellen Bevezetés 1. Az auditoros rendszer 1.1 Akusztikus információ 1.2 Az auditoros rendszer vázlata 1.2.1 A fül 1.2.2 Auditoros átalakítás 1.2.3 Cochleáris nucleus 1.2.4 Oliva superior 1.2.4.1 Az oliva superior mediális nucleusa 1.2.4.2 Az oliva superior laterális nucleusa 1.2.5 Lemniscus laterale 1.2.6 Colliculus inferior 1.2.7 Talamusz 1.2.8 Az auditoros kéreg 1.2.8.1 Az elsôdleges auditoros kéreg 1.2.8.2 További auditoros kérgek 1.2.9 Centrifugális auditoros pályák 1.2.9.1 Olivo-cochleáris nyaláb 1.2.10 Kérgi dinamika 1.3 Térbeli hallás 1.3.1 Az akusztikus tér 1.3.1.1 Térbeli hallás egyetlen hangforrás esetén 1.3.1.2 Térbeli hallás több hangforrás esetén 1.3.1.3 Auditoros kiterjedtség 1.3.2 A hanglokalizáció pontossága 1.3.3 Az akusztikus tér kulcsingerei 1.3.3.1 „Klasszikus” binaurális kulcsingerek és a duplex-elmélet 1.3.3.2 Spektrális kulcsingerek 1.3.4 Receptív mezô 1.4 Térészlelés az auditoros rendszerben 1.4.1 Oliva superior 1.4.2 A dorzális lemniscus laterale 1.4.3 Colliculus inferior 1.4.3.1 A colliculus inferior kapcsolata a lemniscus lateraleval 1.4.3.2 Precedencia-hatás a colliculus inferiorban 1.4.4 Colliculus superior 1.4.4.1 Receptív mezô egyezés és/vagy megfelelés 1.4.4.2 Térbeli megfelelés a colliculus superior rétegei között 1.4.4.3 A colliculus superior motoros és figyelmi szerepe 1.4.4.4 A colliculus superior szenzoros tulajdonságai 1.4.4.5 Multiszenzoros integráció a colliculus superiorban 1.4.4.5.1 A multiszenzoros integráció fejlôdése a colliculus superiorban 1.4.5 Lokalizációs kulcsingerek és fajok közötti hasonlóság
1 5 9 11 11 12 12 13 14 14 15 15 16 17 18 19 19 20 20 21 21 22 22 22 23 24 24 25 25 26 28 29 29 29 30 30 32 33 37 38 39 40 41 42 43
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.4.5.1 A gyöngybagoly aszimmetrikus fülei 1.4.5.2 Az idô-pálya 1.4.5.3 Az intenzitás-pálya 1.4.6 A colliculus superior és inferior kapcsolata 1.4.7 Fajok és struktúrák közötti hasonlóság a multimodális integrációban 1.4.8 Koordinátarendszerek 1.5 Multiszenzoros integráció 1.5.1 Heteromodális területek 1.5.2 Kérgi multiszenzoros sejtek 1.5.3 Multiszenzoros kérgi területek 1.5.3.1 Frontális szemmezô 1.5.3.2 Laterális intraparietális kéreg 1.5.3.3 Anterior ecto-Sylvius sulcus 1.5.3.3.1 Izgalmi és gátló multiszenzoros integráció 1.5.3.3.2 A multiszenzoros konvergencia más formái 1.5.3.4 Premotoros kéreg 1.5.4 Multimodális feladatok 1.5.4.1 Modalitásközi illesztés 1.5.4.1.1 Nyelvi információt felhasználó tanulmányok 1.5.4.1.2 Nem-nyelvi információt felhasználó tanulmányok 1.5.4.2 Modalitásközi lokalizáció 1.5.4.3 Modalitásközi tanulás 1.5.5 Multimodális integráció a kéregben 1.6 Idôészlelés 1.6.1 Hang-tartam észlelés 1.6.1.1 A felbontás-integráció paradoxon 1.6.2 Észlelés és produkció 1.6.3 Agyi struktúrák az idôészlelésben 1.6.3.1 A kisagy 1.6.3.2 A striatális rendszer 1.6.3.3 Kérgi területek 1.6.4 Temporális figyelem 1.6.5 Többszörös temporális feldolgozás 1.6.5.1 Intervallum-tartomány 1.6.5.2 Figyelem és tartam 1.6.5.3 Motoros rendszer és tartam 1.6.5.4 Kognitív kontrol 1.6.5.5 Automatikus idôzítési rendszer 1.6.5.6 Kognitívan kontrolált idôzítés 1.6.6 Idôvel kapcsolatos feldolgozás az auditoros rendszerben 1.6.6.1 Jeffress lokalizációs modellje 1.6.6.2 Licklider hangmagasság-modellje 1.6.6.3 Meddis és Hewitt magánhangzó-hangszín modellje 1.6.6.4 Binaurális és periodikus szegregációs-modellek 1.6.6.5 Megosztott csatornák 1.6.6.5.1 Durlach modellje 1.6.6.5.2 Culling és Summerfield modifikált modellje 1.6.6.5.3 A magánhangzó-szegregáció kitörléses modellje 1.6.6.5.4 Többszörös periódus-becslés 1.6.6.5.5 A késleltetési-vonalak kérdése 1.6.6.6 A perifériás szûrés szerepe 1.6.6.7 A kitörlés
43 43 45 47 49 51 53 54 55 57 57 57 58 60 61 61 62 62 63 65 67 69 70 71 71 72 72 73 73 75 76 77 78 78 79 79 80 80 80 81 82 83 83 83 84 84 85 85 85 86 86 86
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2. A zene észlelése Meyer a textúráról 2.1 Auditoros felismerés 2.2 Az akusztikus szignál átalakítása 2.3 Auditoros csoportosítási folyamatok 2.3.1 Csoportosítási alapelvek 2.3.2 Az auditoros vonás-elemzés 2.3.2.1 Mikrotemporális jellemzôk elemzése 2.3.2.2 Makrotemporális jellemzôk elemzése 2.3.3 A „koktélparti-helyzet” 2.3.3.1 A hangösszetevôk modulációja 2.3.3.2 A hangösszetevôk harmonicitása 2.4 Zenei folyamatok 2.4.1 Értékek és kapcsolatok kódolása 2.4.2 Memóriabeli reprezentáció 2.4.3 Invariancia és átalakítás 2.4.4 Mintázat-lexikon 2.4.5 Akusztikus elvárás 2.4.5.1 Absztrakt és aperiodikus akusztikus elvárás 2.4.5.2 Többszörös szabály 2.4.6 Láncra-bontás (dallamvonalakra szakadás) 2.4.6.1 Frekvencia-közelség és a temporális relációk észlelése 2.4.6.2 Csoportosítás a jó folytatás alapján 2.4.6.3 Hangszín-különbség és temporális kapcsolatok 2.4.7 A hangkörnyezeti modell 2.4.8 Interakciók az akusztikus paraméterek között 2.4.8.1 A skála-illúzió 2.4.8.2 Maszkolás alóli felszabadítás zajjal 2.4.8.3 Az oktáv-illúzió 2.4.8.4 A kezesség hatása 2.4.8.5 Shepard-hangok 2.4.8.6 Hangmagasság 2.4.8.7 A tritonusz-paradoxon 2.4.8.7.1 Mozgási-utóhatás a tritonusz-paradoxonban 2.4.8.8 Mintázat-felismerés perceptuális láncokon belül és azok között 2.4.8.9 Galopp-mintázatok ritmusa 2.4.8.10 A két hangból álló célinger felszabadítása a maszkoló hangok elragadásával 2.4.8.11 A harmonikusok alcsoportjának párhuzamos mozgására alapozott fúzió 2.4.8.12 Ritmikus maszkolás alóli felszabadítás 2.4.8.13 Egy glissando-összetevô elragadása a glissando-keverékbôl 2.4.8.14 Dallamészlelés eltolt fázisú hangokkal 2.4.9 Zenei szervezôdés 2.4.9.1 Absztrakt tudásstruktúrák és mintázatok 2.4.9.2 Skálák 2.4.9.2.1 Merev hangmagasság-skála 2.4.9.3 Zenei hierarchiák 2.4.9.3.1 Tonális hierarchia 2.4.9.3.2 Harmonikus hierarchia 2.4.9.4 Kategóriák 2.4.9.4.1 Ciklikus hangmagasság-dimenzió
87 87 89 90 91 91 91 92 93 95 95 97 99 100 101 101 102 103 104 104 105 106 106 107 107 109 109 110 110 111 111 112 113 114 115 115 116 116 117 117 118 119 120 121 122 123 123 124 125 125
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.5 Új zenei dimenziók és formák létrehozása 2.5.1 Hangszín-struktúrák 2.5.2 Temporális struktúrák 2.6 A ritmus 2.6.1 Rekurzió 2.6.2 A ritmus-memória 2.6.3 Mérôütés-követés 2.6.4 Temporális csoportosítás 2.6.5 Metrum 2.6.5.1 Természetes tempó 2.6.5.2 A metrum-észlelés mint figyelmi mechanizmus 2.6.5.3 Metrikus szintek 2.6.5.3.1 Beethoven: Örömóda 2.6.5.3.2 Csajkovszkij hatodik szimfónia második tétel 2.6.5.3.3 Berstein, Amerika 2.6.5.3.4 A metrikus szintek kapcsolódása 2.6.6 Struktúra és kifejezés 2.6.6.1 Mikroidôzítés 2.6.6.2 Idôzítés a nyugat-afrikai ütôhangszeres zenében 2.6.6.3 Temporális fluktuációk a zenei elôadásban 2.6.6.4 Aszinkrónia 2.6.6.5 Swing 2.6.6.6 A metrum kulcsingerei 2.6.6.6.1 Perceptuális kulcsingerek a zenei metrum észleléséhez 2.7 Idôzítési modellek 2.7.1 Metrum-észlelési modellek Záró gondolatok Köszönetnyilvánítás Hivatkozások
127 129 130 131 132 132 133 133 133 135 136 139 139 140 141 142 143 144 145 146 147 147 148 148 149 151 155 158 159
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Mottó SEXTUS E MPIRICUS: A SZAKTUDÓSOK ELLEN A zene megnevezést háromféle értelemben használják. Az egyik szóhasználat szerint a melódiával, a hangzásokkal, a ritmus-szerkesztéssel és a rokon kérdésekkel kapcsolatos tudomány... Más használat szerint a musiké a zeneszerszámokban való jártasság,... Nem eredeti jelentésében ugyanezzel a névvel szoktuk végül olykor illetni a valami dologban való kiválóságot. Így például azt mondjuk, hogy valami „múzsai munka” (memusómenon ergon: mozaik), holott az a festészet körébe tartozik, s a festôrôl, aki ebben kiemelkedôt alko tott, azt állítjuk, hogy a múzsai mesterségekbe beavatott... Kezdjük elôször is azzal, amit a zene védelmében a tömeg szokott fecsegni: Ha elfogadjuk a filozófiát, ami az emberi életet józanná és erkölcsössé teszi és a lelki indulatokat lecsillapítja, úgy sokkal inkább elfo gadjuk a zenét, hiszen nem erôszakos rendszabályokkal, hanem a rábeszélés valamiféle bûbájával éri el ugyanazokat a hatásokat, mint a filozófia. Pythagoras egyszer amikor bortól megrészegedett suhancokat látott, ... megparancsolta az aulos-játékosnak - aki a részeg menetben volt -, hogy a spondeiakon dallamot fújja nekik. Mikor ez megtette amit Pythagoras mondott, tüstént olyan józanok lettek, mintha sose lettek volna részegek.... A kiemelkedô filozófusok, mint Platón is, azt mondják, hogy a bölcs hasonló a muzsikushoz, mert a lelket harmóniában tartja. Ezért Szókratész is, bár ugyancsak öreg ember volt, nem restellte, hogy Lampónhoz, a kithara-játékoshoz járjon, s mikor ôt ezért valaki gáncsolta, azt mondta, hogy jobb, ha valakinek azt vetik a szemére, hogy késôn tanul, mint ha azt, hogy tanulatlan. Nem szabad ugyanis - mond ják - a mostani rafinált és széttöredezett zene alapján a régit ócsárolni, hiszen az athéniak, akik a józan erkölcsre nagy gondot fordítottak és a zene méltóságához ragaszkodtak, azt a legszükségesebb ismeretként adták át utódaiknak. Ennélfogva ha manapság a zene elaprózott dallamokkal és nôies ritmusokkal teszi is a gondolkodást elpuhulttá, ennek semmi köze a régi és férfias zenéhez. Ha tehát a költészet hasznos - s úgy lát szik, hogy a zene is ezt ékesíti azáltal, hogy tagolja és énekelhetôvé teszi - úgy a zene is szükséges. Egyébként a költôket dalköltôknek nevezik és hajdan Homérosz költeményeit is lyra mellett énekelték... Így a zene védelmében. Ezzel szemben viszont elôször is azt mondják, hogy egyáltalán nincs közvetlenül adva az, hogy a dallamok (melos) közül egyesek természettôl fogva serkentôleg, mások pedig fékezôleg hatnak a lélekre. A mi véleményünk szerint... ahogyan a mennydörgés csattanása, mint az epikureusok mondják, nem valamely isten megjelenése, hanem csak a hozzá nem értô és babonás emberek hiszik ezt..., ugyanígy a zenében is a dallamok (melos) nem természettôl fogva ilyenek vagy olyanok, hanem csak mi képzeljük hozzájuk ezt vagy azt a tulajdonságot. De még ha ilyenek volnának is a zenei dallamok, ettôl még nem lenne a zene hasznos. Mert nem azért csillapítja a gondolkodást, mert józanító és erkölcsössé tevô, hanem mert figyelem-elterelô ereje van. Így ha az ilyen dallamok valahogyan elcsendesednek, az ész - mint amelyet már többé nem gyógyítanak - vissza kanyarodik eredeti gondolkodásmódjához... Pythagoras elsôsorban ostoba volt, mikor a részegeket alkalmatlan idôben józanokká akarta tenni ahelyett, hogy kitért volna az útjukból. Azután meg ha így kijózanítot ta ôket, ezzel is csak azt ismeri el, hogy az erkölcsök rendbehozásában az aulosz-játékosok többet érnek, mint a filozófusok... A muzsikusokkal szemben felhozható ellenérvek elsô csoportja tehát ez. A második, ami a zene alapelveit érinti, szakszerûbb vizsgálódást igényel. Ha ugyanis a zene a dallamszerkesztésben használhatók (emmeles) és a dallamszerkesztésben nem használhatók (ekmeles), a jó ritmusok és a ritmustalanságok tudománya, úgy amennyiben kimutatjuk, hogy sem a dallamok (melos) nem létezô dolgok, sem a ritmusok nem tartoznak a valóságosan létezôk közé, úgy a zenét is nem létezônek fogjuk tartani. Beszéljünk tehát elôször a dallamokról és ezek lényegérôl, egy kicsit távolabbról kezdve a dolgot. A hangzás vitathatatlan meghatározása a következô: a hallás sajátlagos érzéklete. Ahogyan egyedül a látás feladata, hogy a színeket felfogja és egyedül a szaglásé, hogy a jó és rossz szagokat befogadja, végül pedig az ízlelésé, hogy az édest és keserût érzékelje, úgy a hallás sajátlagos érzéklete a hangzás. A hangzá sok részben élesek (magasak), részben súlyosak (mélyek). Mindkettô a tapintással kapcsolatos érzékletekrôl 5
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
nyerte átvitt értelmû nevét... Ha azonos erôvel és azonos magasságban hallatszik a hangzás - úgy, hogy az érzékelésben sem az élesebb, sem a súlyosabb irányban nincs kilengés -, akkor az ilyen hangzást hangnak nevezzük, ezért a muzsikusok szerint a hang: a dallamszerkesztésben használható hangzásnak az azonos magasság határai közé való esése. A hangok részben azonos hangzásúak, részben nem azonos hangzásúak. Az azonos hangzásúak azok, amelyek magasság és mélység szempontjából nem térnek el egymástól, a nem azonos hangzásúak azok, ame lyek eltérnek. Az azonos hangzásúak közül csakúgy, mint a nem azonos hangzásúak közül némelyeket magasaknak, némelyeket mélyeknek nevezünk, a nem azonos hangzásúak közül viszont némelyeket disszonánsok nak (diaphónos) mondunk, némelyeket pedig összhangzóknak (symphónos). Disszonánsoknak azokat, ame lyek érdesen és szaggatottan hatnak a hallásra, összhangzóknak azokat, melyek egyenletesen és egyöntetûen hatnak a hallásra. Mindkét válfaj sajátsága világosabb lesz, ha az ízleletek minôségeitôl átvett képpel élünk. Ahogy ugyanis az ízleletek közül egyesek olyan összetételûek, hogy egységes jellegû és sima érzetet keltenek - mint például a mézbor vagy a mézszörp -, mások pedig nem egyformát és nem is hasonlót - mint például az ecetes méz (mert e két összekevert anyag mindegyike a saját minôségét juttatja érvényre az ízlelésnél) -, ugyanúgy a hangok közül is disszonánsak azok, amelyek a hallásra érdes és szaggatott hatást gyakorolnak, összhangzók, amelyek egyenletesebbet. A zenetudósok szerint viszont a hangok közti különbség kérdése így valahogy áll: Meg vannak határozva a hangok közt bizonyos távközök, melyeknek megfelelôen a hangzás vagy a magasság irányában emelkedve vagy a mélység irányában ereszkedve mozog. Ennek alapján e hangközök arányának megfelelôen közülük némelyeket összhangzónak neveznek, másokat disszonánsoknak, éspedig összhangzóknak azokat, melyek összhangzó hangokból állnak, disszonánsoknak azokat, melyek disszonánsokból... Mégis, ahogyan minden hangköznek a zenében az alapja és lényege a hangokban van, úgy minden éthosnak is, azaz a dallam bizonyos fajtájának is. Ahogyan ugyanis az emberi jellemek (éthos) közül egyesek mogorvák és kemények, amilyeneknek a régiekét mondják, mások könnyen engednek a szerelmeskedésnek, iszákosságnak, siránkozásnak vagy jajveszékelésnek, úgy van dallam, mely fenséges és nemes indulatokat kelt a lélekben, s van, amely alacsonyabb rendûeket és nemteleneket. Az ilyen dallamokat (melódia) a muzsikusok általában éthosnak nevezik azon az alapon, hogy éthos formálója... Már ebbôl is nyilvánvaló, hogy a dallammal kapcsolatos egész elmélet alapja... a hangokon nyugszik. Ennélfogva ha kiküszöböljük a hangokat, az egész zene semmivé lesz. De hogyan mondhatja valaki, hogy nincsenek hangok? Azt mondjuk erre, hogy eredetüket tekintve a hangzások közé tartoznak, márpedig szkep tikus iratainkban kimutattuk, hogy a hangzás a valóságban a dogmatikusok tanúsága szerint sem létezik. A kyrénéi filozófusok szerint tudniillik egyes-egyedül a benyomások (pathos) léteznek, más semmi. Mivel pedig a hangzás nem benyomás - csak benyomás okozója -, nem tartozhat a valóban létezôk közé. Démokritosz és Platón, akik tagadnak minden érzékletet, ezzel együtt tagadják a hangzást is, hiszen ez nyilvánvalóan érzékelt dolog... Hangzás tehát nincs. Ezen kívül a hangzást nem teljesültségében és nem is lényegében gondoljuk el, hanem keletkezésében és idôbeli kiterjedésében. Amit keletkezésében gondolunk el, az keletkezik és semmiképpen sem „van”, ahogyan a keletkezô házról vagy hajóról vagy bármi másról sem állíthatjuk teljes mértékben, hogy van. Ennélfogva hangzás sincs... Viszont ha hangzás nincs, úgy hang sem lehet, ami - mint mondtuk - azonos magasság határárai közé esô hangzás. Ha pedig nincs hang, úgy zenei hangköz sem, sem összhangzat (symphónia), sem dallam (meló dia), sem ezek válfajai. Ezért tehát zene sincs, hiszen ezt úgy határoztuk meg, mint a dallamszerkesztésben használhatók és nem használhatók tudományát. Ezért más elv alapján kell kimutatnunk, hogy... a ritmusalkotással kapcsolatban tárgyalásra kerülô kétely folytán is valóban nem létezô a zene. Ha ugyanis a ritmus egyáltalán nem létezik, akkor nincs ritmus sal kapcsolatos tudomány sem. Ritmus pedig éppenséggel nem létezik... Nincs tehát semmiféle ritmussal kapcsolatos tudomány sem... A ritmus verslábakból álló szerkezet, a versláb pedig arsisból és thesisbôl áll. Az arsist és a thesist az idômennyiség alapján állapíthatjuk meg, hogy tudniillik bizonyos idôegységet a thesis, bizonyos idôegységet az arsis foglal el. Ahogyan tudniillik a betûkbôl szótagok, a szótagokból pedig szavak tevôdnek össze, úgy az idôegységekbôl lábak, a lábakból pedig ritmusok lesznek. Ha tehát kimutatjuk, hogy idô egyál talában nincs, úgy ezzel együtt azt is kimutatjuk, hogy verslábak sem léteznek és ezért ritmusok sem, hiszen 6
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
ezek amazokból tevôdnek össze. Ebbôl viszont az következik, hogy nincs egyáltalán semmiféle ritmussal kapcsolatos tudomány sem... Ha van idô, úgy az vagy véges, vagy végtelen. Azonban nem véges, mert ezzel azt mondanók, hogy volt idô, amikor nem volt idô és lesz idô, amikor nem lesz idô. De nem is végtelen, hiszen van benne múlt és van benne jövô, amelyek közül ha bármelyik nincs, véges az idô, ha van, akkor pedig a jelenben van a múlt is meg a jövô is, ami képtelenség. Idô tehát nincs. Azután pedig a nem létezôkbôl összetevôdô maga is nem létezô lesz. Az idô viszont egyfelôl a múltból - a már nem létezôbôl - másfelôl a jövôbôl - a még nem létezôbôl - tevôdik össze és így nem létezô. Másképpen: ha az idô nem tagolódik részekre, hogyan nevezünk belôle valamit múltnak, mást jelennek, ismét mást pedig jövônek? Ha viszont részekre tagolódik - minthogy minden, ami részekre tagolódik, valamely részével mérhetô -, ... úgy az idô is szükségképpen mérhetô kell, hogy legyen valamelyik részével. Azonban sem a jelennel nem mérhetjük a többi idôket, mert ha egyszer a jelen szerintük alakul, akkor ugyanaz lesz, azaz múlt és jövô: múlt, mivel a múlt idôt méri, jövô, mivel a jövôt. Ez azonban képtelenség. De ugyanezért a jelent sem lehet a másik kettôvel mérni. Ezért ezen az alapon sem mondhatjuk, hogy valamiféle idô volna. Ezen kívül az idô három részre tagolódik: múltra, jelenre és jövôre. Ezek közül viszont a múlt már nem létezik, a jövô még nem létezik, a jelen pedig vagy nem tagolódik részekre, vagy tagolódik. De részekre nem tagolódó nem lehet. A részekre nem tagolódásban ugyanis nem mehet végbe semmi, ami részekre tagolódó ahogy Timón mondja - mint például keletkezés vagy pusztulás. Vagyis ha az idôben a jelen részekre nem tagolódó, akkor nincs kezdete sem amitôl kezdôdjék, sem vége ahol megszûnjék és ezért nem lehet közepe sem. És így nem fog létezni jelen idô. Ha pedig részekre tagolható, úgy ha nem-létezô idôkre tagolható, akkor nem lesz idô, ha létezô-idôkre, akkor nem lesz egész-idô, mivel részei részben léteznek, részben nem léteznek. Így hát idô egyáltalán nincs, s ezért nincsenek sem verslábak, sem ritmusok, sem a ritmusokkal kapcsolatos tudomány (RITOÓK , 1982, 457-479. oldal).
7
DANCZI CSABA LÁSZLÓ : A ZENEI
8
TÉR
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
BEVEZETÉS Sextus Empiricus idôszámításunk kezdete után 200 körül a zene és a zenével kapcsolatos tudományok valótlansága mellett érvelt, ám ha érvelésében a „nem létezô“ kifejezést a „képzelt“ (vagy észlelt) szóval helyettesítjük, akkor - mint látni fogjuk - a zenével kapcsolatos problémakör meglepôen pontos és maihoz hasonló leírását adta. A hangmagasság, a hangszín, az összetett hangok, a konszonancia és a disszonancia meghatározása, a benyomások eredete, valamint az idô problémája ma is kurrens kérdés. Hogyan hat a zene az emberre? Sextus Empiricus válasza erre a kérdésre az, hogy eltereli a figyelmet. A legérdekesebb azonban Sextus Empiricus ritmusról és ennek kapcsán az idôrôl való fejtegetése: a probléma magva a múlt és a jövô összevetése a jelennel, az idô folyamat-jellege. Az alábbi írásban - kissé átfogalmazva (poszt-modernizálva) - ugyanezek a kérdések foglalkoztatnak: Hogyan jön létre a hang-észlelet az akusztikus szignálból? Az észlelt hangot illetve hangsor(oka)t milyen mértékben határozza meg a belsô reprezentáció és milyen mértékben az „objektív” inger? Mi a lehetséges zenei formák határa (azaz mit nevezünk zenének)? Hogyan észleljük az idôt, különösen pedig a zenei idôt: a mérôütemet, a metrumot, a ritmust, a nagyobb egységeket és persze a zenei formát? Hogyan jön létre a zenei „tér“? Az írás két fô részbôl áll: az elsôben az akusztikai és neurológiai adatokat szembesítem egymással. A tárgyalás „alulról-fölfelé” történik, azaz az akusztikus (pszichofizikai) adatokból kiindulva a periférián át az egyre magasabb idegrendszeri központokig. Az elsô néhány fejezet az akusztikus jellemzôk és az auditoros rendszer áttekintését adja. Errôl a témáról számos jó könyv olvasható, ezért nem bocsátkozom részletekbe (én fôként PICKLES, 1988-ra építettem). Alaposabb áttekintésre törekedtem azokon a területeken, ahol - legalábbis magyar nyelven - nem létezik elég jó összefoglaló mû. Ezért szántam nagyobb figyelmet a térbeli hallásra és az idôészlelésre. A legrészletesebb tárgyalást a multimodális integráció (fôként pedig a colliculus superior) kapta részben újdonsága, részben pedig relevanciája miatt: Sextus Empiricus is a tapintással, a látással és az ízleléssel kapcsolta össze az össszetett hangokat. Ahogy a látás, a hallás és a tapintás (mostanában fedezik fel, hogy az ízlelés is) összehangolódik az észlelésben, a hang, a dallam, a harmónia, a tartam, a metrum, a hangsúly és a ritmus észlelésére szakosodott rendszerek is összehangolják mûködésüket (ahogy azt a második részben látjuk majd). Az „egységes” (téridô) rendszer feladata az objektumok és események észlelése. Az objektumok és események reprezentációk és nem külsô szignálok, ezért Sextus Empiricus-nak igaza van abban, hogy nem létezik „hang“, vagy zene: az észlelt hangok és ritmusok, az észlelt zene kultúránk és zenehallgatási szokásaink terméke (interakcióban természetesen az „akusztikus“ - és más modalitásbeli - jellemzôkkel): az észlelés hermeneutikai körbe zárul. Az elsô rész utolsó témája az idôészlelés. A jelen, a múlt és a jövô összeegyeztetéséhez az idôt egyidejûséggé kell alakítani: az idô térré (egyidejû, térben elrendezett intenzitásmintázatokká) alakul az észlelési rendszer(ek)ben. Az auditoros rendszer különösen érzékeny a szignál(ok) idôbeli változására: a hangmagasság, a hangszín, a konszonancia és disszonancia, valamint a hangtartam, a metrum és a ritmus egyaránt idôbeli (periodikus) változások. Az anatómiai struktúrák megnevezésében a magyar szabványhoz tartottam magam (ahol ez lehetséges volt), míg rövidítések esetén az angolszász elnevezéseket használtam. A második fô rész témája a zeneészlelés. A (zenei) hangok valamilyen háttérbôl (környezetbôl) emelkednek ki. MEYER 1956-ban a zenei textúra kifejezést használta erre a jelenségre. Zenei textúrában a háttérbôl több hang(objektum) is kiemelkedhet. Ilyenkor a (nyilvánvaló) idô szól bele a (látszólagos) egyidejûségbe: a hangok elkülönülését és összeolvadását a (zenei) események sorozata határozza meg: ezt nevezik dallamvonalakra szakadásnak (auditory stream segregation) - a zenei hangok zenei kontextusba ágyazódnak be. A kontextus a teljes környezet dinamikus modellje, zene esetén beleértve ebbe a zenei kultúrát és az esetleges stílusismeretet is. A tárgyalás az egyszerûtôl az összetett felé, a hierarchia alacsonyabb szintjeitôl a magasabbak felé halad. A zenei környezet (kulturális hatások illetve szociálpszichológia) és a nyugati tonális zene pszichológiájának tárgyalásába nem bocsátkozom, mivel ezekrôl alapos összefoglaló tanulmányok születtek az angolszász szakirodalomban (például HARGREAVES ÉS NORTH, 1997; valamint LERDAHL ÉS JACKENDOFF, 1983, 1996). A második fô rész ugyanúgy az idô-észleléssel zárul, mint az elsô: a két rész egymás tükörképe illetve 9
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
analógja: az elsô fôként neuro-pszichológiai leírását a második rész kognitív-pszichológiai megközelítése mintegy „megismétli”. A második fô részben az auditoros rendszer mûködésének leírására az információ-elméleti és az ökológiai pszichológiát váltogatom: A tudat felôl szemlélve a perifériás szignál a tudatosulás (kognitív cimkézés) felé halad. A (hallgató-környezet) rendszer felôl szemlélve az idegrendszer azonban „ráhangolódik“ a környezeti ingerekre. A ráhangolódáshoz nincs szükség tudat(osság)ra: a tudatról egyetlen szó sem esik az alábbi írásban, ez a kérdés messze túllépné kereteit. A második fô rész a A rendszerelméleti megközelítés - az analitikussal szemben a rendszer összes elemét vizsgálja interakcióikkal és összefügdinamikus rendszerelmélet géseikkel egyetemben. A rendszer fogalma gyakran metaforikus. néhány eredményével zárul. A Az analógiákon túllépve a megközelítés a legkülönbözôbb renddinamikus rendszerelmélet alapja szerek közös vonásait fedezi fel. Nem redukálja az egyik rendaz a feltevés, hogy „ahogy fent, szert egy másik, ismertebb rendszerre vagy alkalmazza az úgy lent” (Hermész- ismereteket alacsonyabb komplexitási szintekrôl magasabbakra. Triszmegisztoszt parafrazeálva), Az invariánsokat keresi: az általános, strukturális elveket, amevagyis a bizonyos szempontból lyeket egyik rendszerben és a másik rendszerben is alkalmazhat. dinamikus rendszerelmélet [talán szerencsésebb lenne a egységes rendszer valójában systemsAdynamics kifejezést rendszerek dinamikájának fordítani, alrendszerekbôl épül fel, ame- de tudtommal ez a kifejezés terjedt el magyar nyelven] a dollyek szintén alrendszerekbôl gokat a maguk egészében szemléli. Azt kívánja megérteni, hogy épülnek fel ad infinitum. a rendszer objektumai hogyan lépnek egymással interakcióba. A Ráadásul ez a bizonyos rendszer lehet gôzgép, bankszámla, kosárlabdacsapat, bármi. A objektumai és az emberek “visszacsatolási hurkokon” nézôpontból egységes rendszer rendszer keresztül lépnek interakcióba: egy változó idôvel megváltoztatvoltaképpen egy nagyobb rend- ja egy másik változó értékét, amely idôvel megváltoztatja az szer része, ami egy még nagyob- eredeti változót és így tovább. Két jellemzôtípussal lehet általánosságban leírni a terbé ad infinitum. A rendszerek mészetben megfigyelhetô rendszereket. Az elsô csoport a strukkommunikációja sematizálható turális aspektus, a másik a funkcionális. A strukturális aspektus és így általános rendszer-kom- a rendszer elemeinek térbeli elrendezôdésére vonatkozik; ez a munikációs stratégiákat lehet térbeli szer vezôdés. A funk cionális aspektus fo ly amatok ra kidolgozni. vonatkozik, vagyis az idôtôl függô jelenségekre (csere, átvitel, Az egyik alapvetô analó- áramlás, növekedés és evolúció); ez a temporális szervezôdés. A nyílt rendszer folytonos kapcsolatban van környezetégia a fizikai oszcilláció és rezovel, vagy általánosabb kifejezéssel ökoszisztémájával. Energiát, nancia. A neuronok spontán anyagot és információt cserél, amelyet szervezôdésének fentüzelést végeznek, a beérkezô ntartására használ. A rendszeren belüli energiaáramlás miatt - és inger ezt a spontán aktivitást vál- az entrópia környezetbeli felhalmozódása ellenére - az entrópia toztatja meg: a neuron tüzelése a nyitott rendszerben viszonylag alacsony szintû marad. A nyílt „rezonanciába” kerül az ingerlés- rendszerek lokálisan csökkenthetik az entrópiát vagy komállapotba juthatnak. A zárt rendszer sem energiát, sem sel. Magasabb szinteken az audi- plexebb anyagot, sem pedig információt nem cserél környezetével, el van toros rendszer sokszoros szi getel ve k örny ezetétôl : s aj át, b els ô en er giatar talékát vissszacsatolással kerül „rezo- használja. A komplex rendszer nagyszámú elembôl áll, amelyeknek nanciába” az ingerrel (minden specializált funkcióik vannak. Az elemek belsô hierarchia-szinegyes alrendszer „rezonanciába“ tekbe szervezôdnek; a különbözô szinteket és elemeket különkerül az inger valamilyen tulaj- bözô kapcsolatok tartják össze, azaz nagyszámú belsô kapdonságával). Az érzékelô rend- csolódással rendelkeznek. szerben alrendszerek alkotnak A komplex rendszer elemei közötti interakciók nemlineáris interakciók. A nem-lineáris interakciókban a változók bizonyos nézôpontból egységes koefficiensekkel szorzódnak vagy osztódnak, amelyek maguk is rendszert. Az idegrendszer (a más változók függvényei. A nem-lineáris modellek alkotói nem az test) és környezete újabb okozati lánc teljes feltárására törekednek, hanem azokat a egységes(nek tûnô) rendszert csomópontokat keresik, ahol a visszacsatolási hurkok kapcsolódalkot (ad infinitum). nak és próbálják a lehetô legtöbb hurkot leírni. A két könyv, valamint az egyes fejezetek önállóan is olvashatóak, ezért a fejezetek olvasási sorrendje - tetszés szerint - választható meg: az itt talált elrendezés nagyrészt idôrendi (az egyes fô részeken belül), bár - az önálló egység kedvéért - friss adatokat is közöltem a régi témák tárgyalásakor. A képek illusztrációk: nem szorosan a szöveghez kapcsolódnak, hanem annak mondanivalóját valamilyen más oldalról világítják meg. 10
DANCZI CSABA LÁSZLÓ : A ZENEI
1. AZ AUDITOROS
TÉR
RENDSZER
1.1 AKUSZTIKUS INFORMÁCIÓ
Az észlelési rendszerek a környezet eseményeirôl szolgáltatnak információt és így lehetôvé teszik az észlelt eseményekre való reagálást. Az auditoros rendszer még a nagy távolságban lévô hangforrásokról is részletes információt ad. Az auditoros rendszer kizárólagos bemenete a dobhártya rezgése a fej két oldalán, a környezeti források által létrehozott összetett akusztikus tér két „pontja”. A fej mozgása ezt a két pontot a térben mozgatja, ami egyrészt megkönnyíti az észlelést a szolgáltatott információ megnövelésével - az emberek erôsen függenek a hangtérben való mozgástól -, másrészt a vonatkoztatási rendszerek mozgása miatt szükségessé teszi a komputációs követést. A környezetben számos hangforrás van. A hangforrások keltette hanghullámok összekeverednek a hangtérben és ami a dobhártyára jut, az több független szignál keveréke. Nem létezik olyan fizikai törvény, ami alapján ezt a keveréket az egyes hangforrások szignáljára lehetne bontani. A hangforrások által kibocsátott hanghullámok különbözô közvetítô közegeken haladnak át, mielôtt a dobhártyához érkeznének, így a bemenetre érkezô szignált nem csak a többi szignál torzítja, annak amplitúdója és fázisa már eleve kvázi-véletlen lineáris torzításokon esett át a különbözô közegek miatt. Nem létezik olyan fizikai törvény, amely alapján ezeket a torzításokat le lehetne választani a szignálról. Az egyetlen esélyt a torzítások ellensúlyozására a környezet reprezentációja adja: a zavaró szignálok ismeretében a „zaj“ leválasztható a figyelt szignálról és a közeg ismerete lehetôvé teszi a lineáris torzítások kompenzálását. A hangok szétválogatása mechanikus úton nem lehetséges, egyedül a szignálok intelligens értelmezésével, „auditoros tudással” arról, hogy milyen hangforrások (és közegek) léteznek a külvilágban, illetve azok milyen tényezôkkel járulnak hozzá a fülbe érkezô kevert szignálhoz. A hangmintázatok idôbeli változása további nehézséget okoz. Mivel a hangforrások idôben változó szignálokat (tranzienseket) adnak ki és ráadásul maguk a hangforrások is - többnyire - mozgásban vannak (ami a szignálok modulációjával jár), ezért az auditoros rendszernek követnie kell a hangforrásokra és a hangforrások (valamint a test - a koordinátarendszer -) mozgására jellemzô változásokat is. Ez megköveteli a szignál-összetevôk jellemzô idô-intervallumának az ismeretét. Az auditoros rendszernek tehát „auditoros tudással” kell rendelkeznie a környezetben lehetséges hangforrások frekvencia-összetételérôl (spektrum), illetve a frekvencia-összetevôk idôbeli (tranziens) változásáról (a lehetséges hang-objektumokról), valamint a hangobjektumok lehetséges mozgásának köszönhetô változásokról (a lehetséges hang-eseményekrôl). Az értelmezés nem függhet a szignálok olyan jellemzôitôl, amelyek érzékenyek a lineáris torzításokra, ezért az auditoros rendszer olyan paramétereket dolgoz fel, amelyek ellenállnak az amplitúdó és a fázis kvázi-véletlen torzításainak. Míg a hangrezgések amplitúdója és fázisa változik a dobhártyáig megtett úton, a rezgések frekvenciája viszonylag állandó marad. További elônye a frekvencia-elemzésnek az, hogy nem csupán az akusztikus átviteli pálya lineáris torzításainak problémájára ad megoldást, hanem a másik probléma megoldását is elôsegíti, azaz a hangobjektumok auditoros szétválogatását. A frekvencia-öszetevôk elkülönítése - a Fourier-elemzés - már szétválasztás, bár még nem forrás-szignálokra; ehhez további - intelligens - értelmezés szükséges (TERHARDT , 1998 nyomán).
11
DANCZI CSABA LÁSZLÓ : A ZENEI 1.2 AZ AUDITOROS 1.2.1 A FÜL
TÉR
RENDSZER VÁZLATA
Az auditoros és a vesztibuláris rendszerek egymással szoros kapcsolatban vannak. Mindkét rendszer receptorai a temporális csontban találhatóak, egy kürtôsen csavart kamrában, amelyet csontos labirintusnak neveznek. Egy vékony hártya van felfeszítve a csontos labirintuson belül, amely egy második kamrát hoz létre az elsôben: ez a kamra a hártyás labirintus. Az egész folyadékkal töltött - struktúra a belsô fül. A belsô fülnek két hártyával borított kijárata van a levegôvel telt középfülre: az ovális és a kerek ablak. Az ovális ablakot a kengyelcsont talpa tölti ki, ami a harmadik középfül csontocska (a három csontocska: kalapács, üllô és kengyel). A kengyelcsontok átveszik a dobhártya rezgéseit és mozgatják a belsô fül folyadékát (perilimfa). A kerek ablak nyomáskiegyenlítôként szolgál: kidudorodik amikor a nyomás növekszik a belsô fülben. Az ovális ablak egy nagy központi területre nyílik a belsô fülön belül, amit vestibulumnak neveznek. A belsô fül összes szerve ebbôl a központi kamrából ágazódik el. Egyik oldalán van a csiga (cochlea), a másikon a fél-körös csatornák. A félkörös csatornák fontos szerepe a szemek fixációs pontjának mozdulatlanul tartása a térben amikor a fej mozog. A félkörös csatornák közvetlenül kontrolálják a szem mozgásait, így ellensúlyozzák a fejmozgásokat. A szemet három izompár mozgatja, a rectus medialis és lateralis, a rectus superior és inferior, valamint az oblique inferior és superior, amelyek pontosan illeszkednek a félkörös csatornák három síkjára, egy-egy csatorna egy-egy izompárral van kölcsönös kapcsolatban. A vesztibuláris ideg az agytörzsbe lép be és a vesztibuláris nucleuson van szinapszisa. Azok a sejtek, amelyek a bal vízszintes félkörös csatornából kapnak információt, a jobb oldali nucleus abducensre küldenek projekciót, hogy a rectus lateralist ingereljék. A bal oldali oculomotoros nucleusra is küldenek projekciót, hogy a rectus lateralist ingereljék. Projekciót küldenek a bal oldali oculomotoros nucleusra is, hogy a rectus medialist ingereljék. Ugyanazok a vesztibuláris sejtek az ellenkezô oldali izmokat gátolják (ebbben az esetben a jobb rectus medialist és a bal rectus lateralist). A fej másik oldalán fordított az elrendezés. Az egész ellensúlyozó reflexet vesztibulo-okuláris reflexnek nevezik (VOR). A vesztibulo-okuláris-reflex axonok nagy része egy rostkötegben halad, amit mediális longitudinális fasciculusnak (MLF) neveznek.
12
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.2.2 AUDITOROS ÁTALAKÍTÁS A hang neurális szignállá alakítása a csigában történik. A kengyelcsontok rezgésbe hozzák az ovális ablakot, a perilimfa lötyögését pedig kiegyenlíti a kerek ablak mozgása. A hártyás labirintus - ami a perilimfában lebeg - fel-le csapódik a perilimfa mozgásától. A hártyás labirintus endolimfával van tele, ez a scala media. A scala mediában van a Corti-szerv, a receptor. Az auditoros ideg a csiga alján lép ki és a temporális csonton keresztül halad az agytörzs felé. Az auditoros receptorsejtek a Corti-szervben találhatóak. A belsô szôrsejtek elsôsorban auditoros receptorok, míg a külsô szôrsejtek emellett a csiga „hangolását” is végzik. A belsô szôrsejtek szenzoros sztereocíliái fölött a tektoriális membrán van. Az alaphártya rezgásekor a sztereocíliák elôrehátra hajlanak a tectoriális membrán alatt. Ha a sztereocília a megfelelô irányba mozdul, a szôrsejt depolarizálódik. Ez a szignál jut el az idegnyúlványhoz, ami a Corti-szerv alatt van. A neuron, amelyhez a nyúlvány tartozik, a szignált az auditoros idegen (VIII. agyideg) keresztül az agytörzs felé továbbítja. Amint majdnem minden szenzoros neuronnak (kivétel a retina), ennek a neuronnak a sejtteste is a központi idegrendszeren kívül, egy ganglionban van. A ganglion a csiga spirális középtengelye mentén található, ezért spirális ganglionnak nevezik. Az alaphártya vékonyabb és keskenyebb a csiga alapjánál (bázis) mint a csúcsánál (apex), ahol ez fordítva van, minthogy a csiga az alapnál a legszélesebb. Az alaphártyán haladó-hullámok alakulnak ki (lásd B ÉKÉSY, 1960): magas frekvenciákra a csiga alapjánál rezeg, míg ala-csony frekvenciákra a csúcsánál. A szôrsejtek a csiga alapjánál inkább a magas frekvenciákra reagálnak, mivel az alattuk fekvô alaphártya e frekvenciákra rezeg leginkább. Bár az alaphártyán a szôrsejtek is magas-mély frekvencia alapján szervezôdnek, az alaphártya és nem a szôrsejtek tulajdonságai a meghatározóak a létrejövô tonotópiában. Az a képességünk, hogy megkülönböztessünk két hasonló frekvenciát, valójában sokkal jobb, mint az az alaphártya mechanikája alapján elvárható lenne. Annak köszönhetô ez, hogy a külsô szôrsejtek segítenek „élesíteni a hangolást”. A külsô szôrsejtek összehúzódnak és kifeszülnek az idegi ingerlés következtében. Mivel az alaphártyát föl-le tudják mozgatni, erôsítik vagy elnyomják a szignálokat azzal, hogy a belsô szôrsejteket nagyobb vagy kisebb mozgásra késztetik. Az auditoros ideg (a VIII. agyideg auditoros része) sejttestei a spirális ganglionban találhatóak. E sejtek perifériás nyúlványai a csigában vannak, ahol egy vagy több szôrsejttel lépnek kapcsolatba (a belsô és a külsô szôrsejtek eltérô számú neuronnal kapcsolódnak).
13
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.2.3 COCHLEÁRIS NUCLEUS Minden egyes auditoros rost elágazódik: az egyik ág rostrálisan (az orr/csôr felé) halad, a másik caudálisan (a farok/far felé): a rostrális ág az anteroventrális cochleáris nucleusra (AVCN), míg a caudális ág a posteroventrális cochleáris nucleusra (PVCN) és a dorzális cochleáris nucleusra (DCN) küld projekciót. A cochleáris nucleusok (CN) a nyúltagyban (medulla) találhatóak. A nyúltagy mindkét oldalán két cochleáris nucleus van, a ventrális (VCN) és a dorzális nucleus (DCN). A cochleáris nucleusokat további részekre osztják, amelyeket morfológiai jegyek alapján különítenek el: a dorzális, a caudális és a mediális részek mind a VCN-ben, mind pedig a DCN-ben magas frekvenciájú hanghullámokra, míg a ventrális, a rostrális és a laterális részek mindkét cochleáris nucleusban alacsony frekvenciájú hanghullámokra reagálnak. A cochleáris nucleusok tonotopikusan szervezôdnek. A VCN-hez érkezô audiotoros idegrostok szinapszisaihoz óriási végbunkók érkeznek. Ez a szoros kapcsolat teszi lehetôvé, hogy a szignál idôzítése mikroszekundumos pontossággal ôrzôdjék meg (ami nem kis dolog, hiszen az akciós potenciálok milliszekundumos nagyságrendûek). A VCN az oliva superior komplexumba küld projekciót, ahol megkezdôdik a temporális elemzés. A kétoldali VCN-bôl érkezô rostok konvergálnak a kétoldali mediális oliva superioron (MSO). A cochleáris nucleusból a kontralaterális oliva superiorba irányuló kapcsolat a trapéz testen (corpus trapezoideum) keresztül valósul meg. A DCN közvetlenül a lemniscus lateraleba és a colliculus inferiorba küld projekciót. A cochleáris nucleusok és más, az auditoros kéreghez vezetô pályán található struktúrák között minden projekció bilaterális. A cochleáris nucleusok sejtjeinek többsége keskeny-sávú hangfrekvenciákra reagál. Ez alól kivétel a cochleáris nucleusok posteroventrális részének (PVCN) egy neuron-csoportja, amit polip-sejteknek neveznek, ezek széles-sávú ingerekre reagálnak. 1.2.4 OLIVA SUPERIOR Az oliva superior nucleus-csoportját általában oliva superior komplexumnak (SOC) nevezik. Mindkét oldali SOC bilaterális projekciót kap az ipszilaterális (ugyanazon oldali) és a kontralaterális (ellenkezô oldali) cochleáris nucleusból, amibôl a kontralaterális projekció az erôsebb. Az oliva superior a mediális nucleusból (MSO), a laterális nucleusból (LSO) és a trapéz test (corpus trapezoideum) mediális nucleusából (MTB) áll, valamint számos pre- és peri-oliváris nucleusból, amelyek
14
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
fôként efferens innervációt kapnak. Az MTB passzív átkapcsoló állomás, ami a kontralaterális cochleáris nucleus információját továbbítja. Az anteroventrális cochleáris nucleusból (AVCN) származó rostok (és némely rost a PVCN-bôl) az ipszilaterális LSO-ba és MSO-ba, valamint a kontralaterális MSO-ba és - a kontralaterális MTB-n keresztül - a kontralaterális LSO-ba küldenek projekciót. A dorzális cochleáris nucleus (DCN) rostjai és némely posteroventrális cochleáris nucleusból (PVCN) érkezô rost kikerüli a SOC-ot. Az MSO-ban és az LSO-ban kétféle neuron található: az izgalmi-izgalmi (EE) sejteket mindkét fül szignálja izgatja; míg az izgalmi-gátló (EI) sejteket az ipszilaterális fül szignálja izgatja, míg a kontralaterális fül szignálja gátolja. Az MSO és LSO a hang-lokalizációban játszik szerepet. Az MSO-ban található neuronok a két fülbe jutó ingerek idôkülönbségére reagálnak (EE), míg az LSO-ban található neuronok a két fülbe jutó hanghullám intenzitáskülönbségére reagálnak (EI). 1.2.4.1 AZ OLIVA SUPERIOR MEDIÁLIS NUCLEUSA A mediális oliva superior (MSO) az ipszilaterális és a kontralaterális anteroventrális cochleáris nucleusból (AVCN) is kap bemenetet. Az MSO tonotopikus szervezôdésû és az alacsony frekvenciákat preferálja. Ez elôsegíti az MSO interaurális idôkülönbség-elemzését, mivel az alacsony frekvenciák jobban megôrzik a fázis-információt. Az MSO neuronok többsége izgalmi-izgalmi (EE) neuron, de - bár kevesebb, ám jelentôs számú izgalmi-gátló (EI) neuron is van itt. Az MSO izgalmi-izgalmi neuronjai az interaurális idôkülönbségek (fázis) alapján határozzák meg az irányt, ahonnan a szignál jön. Az EE-neuronoknak különbözô „jellemzô késleltetése” van és akkor reagálnak a legerôsebben, ha a két fül közötti fáziskésés megfelel ennek a késleltetésnek: ha a két fül közötti fáziskülönbség megfelel a sejt jellemzô késleltetési idejének, a jelek erôsítik egymást. 1.2.4.2 AZ OLIVA SUPERIOR LATERÁLIS NUCLEUSA A laterális oliva superior (LSO) fôként az ipszilaterális és a kontralaterális anteroventrális cochleáris nucleusból (AVCN) kap bemenetet. A kontralaterális AVCN-bôl származó bemenet az ipszilaterális MTB-n keresztül érkezik. Az LSO-ban a legtöbb sejt izgalmi-gátló. Az LSO tonotopikus szervezôdésû és a magas frekvenciákat preferálja (az intenzitáskülönbségek inkább magas frekvenciákon hasznosak). Az LSO izgalmi-gátló neuronjai az interaurális intenzitáskülönbségeket elemzik: amikor az interaurális intenzitáskülönbség kicsi (a szignál a mediális - a fejet az orrnál átszelô - síkon van) a kontralaterális fül szignálja az ipszilaterális fül szignálját gátolja. Az LSO-sejtek az interaurális idôkülönbségekre is szenzitívek. Az oliva superior a colliculus inferiorba küld projekciót egy rostkötegen át, amelyet lemniscus lateralenak neveznek.
15
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.2.5 L EMNISCUS LATERALE Az oliva superiort elhagyó rostok a lemniscus lateralen (LL) haladnak fölfelé, hogy belépjenek az ipszilaterális középagyi colliculus inferiorba (IC). Néhány - fôként a dorzális cochleáris nucleusból eredô - rost az oliva superior (SOC) után átkel a középvonalon rostrális elhajlással és a kontralaterális LL-be lép be. Kisebb számú rost azonban a SOC után nem keresztezi a középvonalat, hanem az ipszilaterális LLbe lép be. Így mindkét oldali LL hordoz némi információt mindkét fülbôl. A lemniscus laterale a rostrális hídban (pons) egy lapos szalagot alkot (lemniscus: szalag) a tegmentum laterális felszínén. Az LL majdnem összes rostja az IC-n végzôdik. A felszálló auditoros rostokból néhány axon azonban, amely a kontralaterális fület reprezentálja, közvetlenül a mediális geniculatumba (MGB) tart anélkül, hogy az IC-t érintené. Az LL-nek két fô nucleusa van. A ventrális nucleus (VNLL) bemenete a kontralaterális SOC, kimenete pedig az ipszilaterális IC. A dorzális nucleus (DNLL) bilaterális bemenete a kétoldali SOC, bilaterális kimenete pedig a kétoldali IC. A SOC-ból származó affe-rens bemeneteknek megfelelôen az alacsony frekvenciájú neuronok legtöbbje a két fül szignáljainak az idôkülönbségére szenzitív, míg a magas frekvenciájú neuronok aktivitását a fülek közötti intenzitáskülönbségek befolyásolják.
16
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.2.6 C OLLICULUS INFERIOR A colliculus inferior (IC) a középagyi tectum (tectum: fedél) része a colliculus superiorral (SC) együtt. Az IC fontos eleme az inferior brachium (BIN; brachium: kar). Ez az IC felszínérôl indul és a mediális geniculatumon (MGB) végzôdik. Az IC auditoros átkapcsoló állomás és auditoros reflex-központ. Három részre osztják: a centrális nucleusra (ICC), a dorzális cortexre (DC) és a pericentrális nucleusra (gyakran externális nucleusnak nevezik, ICX). Az ICC a specifikus-auditoros pálya része: kombinálja a dorzális cochleáris nucleus (DCN) komplex frekvencia-elemzését az oliva superior (SOC) hang-lokalizációs képességével. A DC-nek auditoros és szomatoszenzoros bemenete is van, ezért a diffúz-auditoros pálya részét képezi. Az ICX szintén kap az auditoros mellé szomatoszenzoros beidegzést, ezért ez is a diffúz-auditoros pályához tartozik. Az ICC izo-frekvenciás rétegekbôl áll (lásd PICKLES, 1988). A rétegek mindegyike egyetlen jellemzô frekvenciát (CF) reprezentál. Az alacsony jellemzô-frekvenciájú rétegek rostrálisan, a magas jellemzô-frekvenciájú rétegek caudálisan helyezkednek el. A frekvenciák többszörösen, párhuzamosan reprezentálódnak és egy háromdimenziós mátrixba rendezôdnek, amiben az egyik dimenzió (caudálistól-rostrálisig) frekvenciát reprezentál, míg a másik két dimenzió valamilyen más paramétert (például a szignál irányát). A DC és az ICX a specifikus vagy „mag” auditoros rendszert körülvevô diffúz (nem specifikus) auditoros rendszerhez tartoznak. A diffúz-auditoros rendszernek auditoros és nem auditoros bemenetei is vannak. Pickles a colliculus inferior (és különösen az ICC) funkciójáról a következôképpen spekulál: „A hang interaurális idôzítéskülönbségek alapján történô lokalizációja a pontos idôzítési viszonyok megôrzésén alapul, ami elveszik a dorzális cochleáris nucleusok kapcsolódásai miatt, amelyekre a komplex amplitúdó- és frekvencia-elemzéshez van szükség. Így érthetô, hogy a hang-irány elkülönülten dolgozódik fel. Az IC a két forrásból származó információ kombinálásával képes arra, hogy egyidejûleg kódolja a hangok komplexitását és térbeli irányultságát” (PICKLES, 1988 194. oldal).
17
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.2.7 TALAMUSZ A mediális geniculatum (corpus geniculatum mediale, MGB) a talamusz auditoros nucleusa, ami a colliculus inferiorból (IC) kap afferenseket és az agykéregbe küld projekciókat. Az MGB három területre osztható. A ventrális MGB (MGv) specifikus auditoros átkapcsoló állomás, aminek a bemenete az IC-bôl származik és fôként az ipszilaterális elsôdleges auditoros kéregre (AI) küld projekciót. Az MGv tonotopikusan szervezett. Némely neuronnak komplex temporális tulajdonságai vannak, más neuronok binaurálisan szenzitívek, néhány neuron az interaurális intenzitás-különbségekre (magas frekvenciákra), míg más neuronok az interaurális idô-különbségekre (alacsony frekvenciák) szenzitívek. A dorzális MGB (MGd) diffúz auditoros terület auditoros (az IC-bôl) és nem auditoros (például szomatoszenzoros) bemenetekkel és a másodlagos auditoros kéregre (AII) küld projekciót. A MGv és MGd külön pályán kap projekciót az IC-bôl. A mediális MGB (MGm) diffúz auditoros terület auditoros (az ICX-bôl származó) és nem auditoros (szomatoszenzoros) bemenetekkel. Az MGm-nek nem-specifikus projekciói vannak az auditoros kéregre. Meglehetôsen átfogó kutatási program vizsgálta az MGB projekcióit a szubkortikális elôagy két struktúrájába, a dorzális amygdala laterális nucleusába és a posterior neostriatumba. Ez a kutatás azt mutatja, hogy e kapcsolatoknak szerepe van az auditoros ingerekre adott emocionális reakciók közvetítésében (HENNEVIN ÉS MUNKATÁRSAI, 1998; POREMBA ÉS GABRIEL, 1997).
18
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.2.8 AZ AUDITOROS KÉREG 1.2.8.1 AZ ELSÔDLEGES AUDITOROS KÉREG Az utolsó átkapcsoló állomás az elsôdleges auditoros pályán az auditoros kéregben van. Az auditoros kérget - mint más neokortexeket is - hat rétegre osztják. A IV. réteg az MGv-bôl kap bemenetet, az I. réteg az MGm-bôl. A IV. réteg sejtjei projekciókat küldenek a III. réteg piramis-sejtjeihez. A III. rétegbôl az auditoros információ számos különbözô helyre ágazódik, beleértve az elsôdleges auditoros kéreg (AI) más rétegeit, a kontralaterális elsôdleges auditoros kérget (a corpus callosumon keresztül) és más elsôdleges auditoros kéreg rétegeket (I, II, IV és V.). Az V. és VI. réteg projekciókat küld az auditoros kérgen kívülre. Az elsôdleges auditoros kéreg (AI) a temporális kéreg ventrális felszínén, a laterális sulcuson belül van. A másodlagos auditoros kéreg (AII) - ami az elsôdleges auditoros kéregbôl és a diffúz auditoros rendszerbôl (MGd és MGm) kap projekciókat - a temporális lebeny laterális felszínének superior szélén fekszik, az elsôdleges kéreg körül. Az auditoros kéreg egyes területein különbözô hangfrekvenciák reprezentálódnak (a magasabb frekvenciák mediálisan helyezkednek el), ezt tonotopikus reprezentációnak nevezik. Az auditoros kéreg leginkább mediális területe a belsô-fülbeli alaphártya alapjának (az ovális ablaknál) reprezentációját tartalmazza, míg az alaphártya csúcsa az auditoros kéreg laterális területén reprezentálódik. Ezt az elrendezést helykódnak nevezik. Valószínû, hogy több tonotopikus térkép is reprezentálódik a kéregben, mindegyik specifikus funkciókkal a beszéd és más hangok kódolására. Egy spatio-topikus térkép is létezik, amelyben inkább a kontralaterális féltekérôl származó hangok izgatóak az adott féltekén. Specifikus temporálisan-szenzitív reakcióval rendelkezô területeket is találtak itt, ami a hangészlelés több jelenségében szerepet játszhat, például a virtuális hangmagasság észlelésben (olyan hangmagasságot hallunk ilyenkor, ami nem szerepel az inger frekvencia-összetevôi között), a hangszín megkülönböztetésben, a térbeli lokalizációban és a zajszûrésben. Az AI neuronjai pontos frekvenciákra hangolt reakciókat mutatnak és binaurálisak (RESER ÉS MUNKATÁRSAI , 2000; SCHREINER ÉS MUNKATÁRSAI , 2000). Némelyiket mindkét fül izgatja (EE), míg másokat az egyik fül ingerlése izgatja, a másik ingerlése pedig gátolja (EI). Az AI neuronjai függôleges oszlopokba (kolumna) rendezôdnek, amiben a sejtek az egyes oszlopokban ugyanarra a fôbb hangfrekvenciára szenzitívek. A szomszédos oszlopok tonotopikusan szervezôdnek (alacsonyabbtól magasabb frekvenciák felé posteriortól-anterior irányban). A szomszédos oszlopok a laterálistól-mediális irányba haladva váltakozó EE és EI-sejtek. Ez az elrendezôdés hasonló az elsôdleges vizuális kéregben található okuláris-dominanciához. Az auditoros kéreg bilaterális sérülése a hang-detekció permanens elvesztésével jár, kiterjedt sérülései pedig gyakran okoznak auditoros agnóziát. Az auditoros agnóziát az jellemzi, hogy a személy képtelen azonosítani a verbális és nem verbális hangokat. Az auditoros kéreg sérülése után romlik az egyszerû hangok sorrendjének az észlelése azt sugallva, hogy a hang idôbeli feldolgozása is sérül.
19
DANCZI CSABA LÁSZLÓ : A ZENEI 1.2.8.2 TOVÁBBI AUDITOROS
TÉR
KÉRGEK
Az auditoros területek tonotopikus elrendezésérôl keveset tudunk, de úgy tûnik, hogy a mély hangok mindenhol posterior reprezentálódnak, míg a magas hangok anterior irányban. A másodlagos auditoros pálya a hang detekciójában és lokalizációjában játszik szerepet. Ez a pálya a nyúltagy dorzális (DCN) és ventrális cochleáris nucleusaiból (VCN) indul és a középagyi colliculus inferioron (IC) keresztül halad, ami a releváns információkat a másodlagos auditoros kéregbe továbbítja. Az auditoros kéreg további területei: a másodlagos szomatoszenzoros terület (SII); az insulo-temporális terület (I-T); az anterior auditoros mezô (AAF); a ventrális mezô (VF); a posterior mezô (PF); a ventrális posterior mezô (VPF); és az ecto-Sylvius tekervény (Ep). 1.2.9 CENTRIFUGÁLIS AUDITOROS
PÁLYÁK
A centrifugális auditoros pályák efferens vagy leszálló pályák, amelyek az auditoros rendszer magasabb szintjeirôl a periférikusabb szintekre továbbítanak információt. Az auditoros centrifugális pályák az auditoros afferens pályákhoz közel, ám általában azokon kívül haladnak. Az efferens pályák lehetôvé teszik, hogy a centrális folyamatok befolyásolják a periférikusabb folyamatokat. Az ilyen efferensek közé tartozhatnak visszacsatolási hurkok - amik a bemeneti szignálokra reagálva lépnek mûködésbe - és centrális befolyás - például a figyelem hatása - a periférikus érzékelésre. A cochleáris nucleusok (CN) efferens rostokat kapnak: az oliva superior komplexumból (SOC, ez az efferens rostok többségének forrása), amelyek a pre- és peri-oliváris nucleusokból származnak; a lemniscus lateraleból (DNLL és VNLL); a reticuláris formációból; és a colliculus inferiorból (IC).
20
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.2.9.1 OLIVO -COCHLEÁRIS NYALÁB Az agytörzs oliva superior komplexumából (SOC) induló efferens rostok eredete az ipszilaterális és kontralaterális afferens nucleusok (MSO, LSO, MTB) körül - de nem azokon belül -, a pre- és peri-oliváris nucleusokban van. Hatása a cochleáris nucleusokra izgalmi és gátló is lehet. Az olivo-cochleáris nyaláb sejtjeit különbözô típusokra osztják: a kis sejtek (az LSO körül) a belsô szôrsejtek alatti idegrostokra küldenek projekciót; a nagy sejtek (az MSO körül) pedig a külsô szôrsejtekre . Az olivocochleáris nyaláb tonotopikusan szervezôdik. Az olivo-cochleáris nyaláb neuronjai redukálják a szôrsejt membrán-ellenállását, megnyitva a K+ és Ca 2+- csatornákat. Gátolják a külsô szôrsejtek reakcióit és így a mechanikus hangolás élességével közvetve a belsô-szôrsejt reakciókat is befolyásolják. Az inger utáni 10-30 ms latenciával lehetôvé teszik, hogy az egyik cochlea aktivitása befolyásolja a másik reakcióját (amelyek csupán az olivo-cochleáris nyalábokon keresztül kapcsolódnak). Mindegyik cochlea képes befolyásolni a másik cochlea hangolási görbéjét (lásd PICKLES, 1988, 242. oldal) az olivo-cochleáris nyalábon keresztül. Az olivo-cochleáris nyaláb neuronjai erôsítik a szignáldetekciót zajban: az olivo-cochleáris ingerlés elnyomja a folyamatos háttérzajt. A cochlea mechanikai állapotát is kompenzálhatják, ellensúlyozva az öregedéssel járó változásokat. További leszálló pályákat azonosítottak: az auditoros kéregbôl a mediális geniculatumba (MGB, a centrifugális rostok a tonotopikusan megfelelô afferens rostokon végzôdnek), ami egy szoros visszacsatolásihurkot képez; az auditoros kéregbôl különbözô középagyi nucleusokba, beleértve az IC-t is; az MGB-bôl az IC-be; az IC-bôl a SOC-ba (legvalószínûbb, hogy a pre- és peri-oliváris nucleusokba); és az IC-bôl a DCNbe. Ezek a leszálló pályák izgalmiak és gátlóak is. Pickles szerint: „Tehát van egy rendszer, amelyben reflexek valósulhatnak meg több szinten és amelyben a kéreg kontrolálja a reflexeket a leszálló befolyások révén” (PICKLES , 1988, 253. oldal). 1.2.10 KÉRGI
DINAMIKA
A kéreg alatti feldolgozással kapcsolatos idô-konstansok jelentôsen különböznek a kérgiektôl. Az auditoros periféria feldolgozásával kapcsolatba hozott sebességgel és pontossággal összehasonlítva az elsôdleges auditoros kéreg (A1) neuronjainak temporális reakciói meglepôen lassúak, a talamo-kortikális átalakításában a temporális finom-struktúra nagy része elveszik (CREUTZFELDT ÉS MUNKATÁRSAI, 1980). Az AIben mérhetô preferált amplitúdó-modulációs frekvenciák általában 15 Hz alatt vannak (SCHREINER ÉS URBAS , 1988) és a maszkoló hatás a teszthangra egészen 400 ms-al a maszk eltûnése után kimutatható (BROSCH ÉS SCHREINER, 1997). Az elôre-ható maszkolásra nem hat a GABA-antagonista (BROSCH ÉS SCHREINER, 1997), azaz nem gátlási folyamat eredménye. A kérgi szinapszis-dinamika fontos tényezô a neuronok viselkedésében (MARKRAM ÉS MUNKATÁRSAI , 1997; M ARKRAM ÉS TSODYKS, 1996; ABBOTT ÉS MUNKATÁRSAI,1997; THOMSON ÉS DEUCHARS, 1994; REYES ÉS MUNKATÁRSAI , 1998). Ha a szinapszisokat ismételten aktiválják, nem egyformán reagálnak a bejövô impulzusokra: az egyes impulzusok rövid-távú elnyomást vagy erôsítést hozhatnak létre a pre- és poszt-szinaptikus sejtek természetétôl és persze az adott szinapszis jellemzôitôl függôen (THOMSON ÉS DEUCHARS, 1994; REYES ÉS MUNKATÁRSAI , 1998). Az újabb kísérleti munkák próbálták meghatározni a kortikális szinapszisok dinamikus tulajdonságait, ami - úgy látszik - jelentôsen befolyásolja a kortikális neuron-hálózatok temporális szenzitivitását. A dinamikus szinapszis-modell a kísérleti megfigyelések meglepôen széles körét magyarázza (DENHAM, 2001). 21
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.3 TÉRBELI HALLÁS 1.3.1 AZ AKUSZTIKUS TÉR Kissé leegyszerûsítve az auditoros rendszert úgy tekinthetjük, mint egy számítógépet két bemenettel. A bemeneti szignálok hanghullámok, amelyek a bal és a jobb dobhártyát érik. A dobhártya felé haladtukban ezek a szignálok a külsô fülön haladnak át. Elôször elhajlanak és részben árnyékolja ôket a koponya, majd belépnek a fülkagyló-fülcsatorna rendszerbe, ahol spektrumuk speciális módon megváltozik: a spektrális változások rátelepednek a beérkezô hangszignálokra. Ezek a torzítások különösen fontosak a térbeli halláshoz. A lineáris torzítások - a hangszignál változása, amikor áthalad a külsô fülön (illetve a koponyán) elemzése azt mutatja, hogy az ilyen torzítások a hangok elôfordulási irányától és a hangforrás távolságától függenek. A külsô fül tehát speciális kódoló szerkezet, ami az irányokat és távolságokat spektrális információvá alakítja át, amiket aztán az auditoros rendszer a hangforrások irányára és távolságára vonatkozó információként dekódol. A két fülhöz érkezô bemeneti szignál-jellemzôk - amelyeket az auditoros rendszer elemez - két kategóriáját lehet megkülönböztetni: a monaurális (a szignálok azonos energia-spektruma a két fülnél) és az interaurális jellemzôket (a két bemeneti szignál szintjének és beérkezési idejének, valamint spektrális összetevôinek különbségei). 1.3.1.1 TÉRBELI HALLÁS EGYETLEN HANGFORRÁS
ESETÉN
A hangsugárzás legegyszerûbb esete az, amikor csak egyetlen hangforrás van és nincs hangvisszaverôdés mondjuk a falakról. Nézzük azt az esetet, amikor a hangforrás a medián síkon van! (Ez az a sík, amely függôlegesen szeli át a fej közepét.) Ha az emberi fejet szimmetrikusnak tekintjük, ilyen ingerlés esetén mindkét fül szignálja azonos, azaz az interaurális különbségek nullák. A hangforrás irányának medián síkon belüli eltérései tehát fôként a monaurális fül-szignál jellemzôket befolyásolják. A legtöbb hangforrást azonban még a medián síkon belül is jól lokalizáljuk a külsô fül spektrális kódolásának köszönhetôen: amikor a hangszignál áthalad a külsô fülön, bizonyos spektrális tartományokban felerôsödik vagy lehalkul a hangforrás irányától függôen. A monaurális jellemzôk - különösen a szignálok spektrális intenzitásmintázata a dobhártyán - fontos szerepet játszanak az auditoros események irányának és távolságának észlelésében a medán síkon kívül is. A hangforrás - zene esetében hangszer vagy énekhang - szignáljának spektrumformája nemcsak a hallott hang hangszínéhez, hanem térbeli észleléséhez is hozzájárul. Az olyan szignálokat, amelyeknek intenzív összetevôi vannak a körülbelül 2-7 kHz-es tartományban, különösen jelenlevônek és elölrôl jövônek észleljük. Az olyan szignálokat, amelyeknek erôs összetevôi vannak 1 kHz körül, olyan auditoros eseményeknek észleljük, amelyek meglehetôsen diffúzan hangzanak a térben, vagy a hallgató mögött szólnak. Az olyan szignálokat pedig, amelyeknek intenzív összetevôi vannak 8 kHz körül, olyan auditoros eseményekként észleljük, amelyek a vízszintes sík felett vannak (BLAUERT , 1983). A fül-szignálok interaurális jellemzôi lényegesek az auditoros események irány-észleléséhez. Az interaurális jellemzôk - különösen a szint- és idôkülönbségek - határozzák meg az auditoros események medián síktól való laterális eltérését. Az interaurális jellemzôk segítségével képesek vagyunk a medián síktól csupán 1 foknyi laterális eltérés felismerésére is. A medián síkú hangforrás-eltéréseket - amelyeket fôként a monaurális fül-szignál jellemzôk alapján ismerünk fel - akkor észleljük, amikor azok túllépik a kb. 10 fokot 22
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
(BLAUERT, 1983). 1.3.1.2 T ÉRBELI HALLÁS TÖBB HANGFORRÁS
ESETÉN
Egyetlen hangforrás - méghozzá visszaverôdésmentes környezetben - aligha fordul elô a gyakorlatban. Majdnem mindig vannak olyan felületek, amelyek visszaverik a hangot, különösen zárt térben. Az ember általában meg tudja különböztetni a visszaverôdött hangot az elsôdleges hangforrástól. Az elsôdleges szignálok és a visszavert szignálok ilyenkor tökéletes korrelációban vannak. A következô jelenségek figyelhetôek meg két korreláló hangforrás esetén: lokalizáció-összegzés (summing localization); precedencia-hatás (korábban az elsô hullámfront törvényének is nevezték); és visszhang-hatás. Lokalizáció-összegzéskor az egyidôben bemutatott szignálok egyetlen auditoros eseménnyé olvadnak össze, amelynek a helyzetét a két hangforrás együttesen határozza meg. Amikor a szignálok közötti késleltetés körülbelül 1 ms-ra növekszik, az észlelet a korábban észlelt hangforrástól elmozdul. Körülbelül 1 ms felett a precedencia-hatás következik: egyetlen auditoros eseményt észlelünk, amelynek a helyzetét kizárólag az elsô hangforrás határozza meg. Ez a hatás egészen 50-80 ms-os késleltetési idôig is kitart. A hangszórók közötti késleltetés további növelésekor az auditoros esemény észlelése kettészakad egy elsôdleges hangra az egyik hangszóró irányában és egy visszhangra a másik hangszóró irányában. A visszhang-hatás megjelenési határértéke a szignáltípustól függ, általában magasabb a zenében, mint a beszédben. A visszhang határértéke alatt az auditoros esemény térbeli kiterjedése növekszik a késleltetés növekedésével (BLAUERT, 1983). Változóan - 0 %-tól 100 %-ig - korreláló két szignál hozható létre három forrásból származó zaj megfelelô keverésével. Az auditoros esemény, amit pontosan lokalizáltnak és térben meghatározottnak észlelünk akkor, amikor a hangszóró-szignálok teljes korrelációban vannak, csökkenô korreláció esetén kiterjed a térben, gyenge korreláció esetén pedig kitölti a két hangszóró közötti teljes teret. Teljesen korrelálatlan szignálok esetében független auditoros eseményeket észlelünk a hangszórók irányában (BLAUERT, 1983). Ha több hangforrás van - amelyek korreláló szignálokat sugároznak (például több hangszóró vagy az eredeti hangforrás és visszaverôdései), gyakran csak egy hangot észlelünk az elsô hangforrás irányában. Amikor a sugárzott hangszignálok korrelációja csökken, megnô az auditoros esemény térbeli kiterjedése. Több korrelálatlan szignál esetén általában több auditoros eseményt észlelünk, például akkor, amikor egy zenekart hallgatunk, amiben a hangszerek egymással gyengén korrelálnak. Fontos az egyes hangszerek megkülönböztetése a globális auditoros képen belül: a zenekarnak áttetszôen kell hangzania, az egyes hangszerek nem maszkolhatják egymást. A különbözô forrásból származó szignálok akkor maszkolják a legkevésbé egymást, ha a bemeneti szignálok világosan különböznek egymástól interaurális jellemzôik tekintetében. Vagyis amikor a források azimutja (irányszög a horizontális síkon: 0 azimut egyenesen elöl, 900 azimut az egyik vagy a másik fül irányában).különbözô, a maszkolás elhanyagolható; azaz áttetszô hallási mintázat nyeréséhez a különbözô hangforrásokat elkülönült azimuttal kell elhelyezni a hallgatókhoz képest. Az auditoros perspektíva létrehozása tehát jobb auditoros áttetszôséget is jelent.
23
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.3.1.3 AUDITOROS KITERJEDTSÉG Sok koncertteremben figyelték meg azt, hogy amikor a hangerô növekszik, az auditoros események térbeli kiterjedése is növekszik - különösen oldalirányban, mélységben és fölfelé. Az auditoros kiterjedtség meredeken növekszik a hangintenzitással: ezt az auditoros rendszer nem-lineáris hangosság jellemzôjével magyarázzák, azonban észlelésünket az is befolyásolja, hogy az intenzitás növelésével egyre nagyobb mennyiségû visszavert hang érkezik a maszkolási határon felül, azaz válik hallhatóvá a háttérzaj felett. BLAUERT ÉS L INDEMANN (1987) szerint az auditoros tágasság nem egy-dimenziós jellemzôje az auditoros eseményeknek, a hallgatók a térbeli hatás két összetevôjét különböztetik meg. Az egyik összetevô akkor válik perceptuálisan dominánssá, amikor a korai laterális visszaverôdések jelentôs energiát tartalmaznak 3 kHz felett, ez nagyjából az auditoros esemény szélessége. A második összetevô a korai laterális visszaverôdések alacsony frekvenciájú részein alapul és az auditoros események mélységéhez járul hozzá. 1.3.2 A HANGLOKALIZÁCIÓ PONTOSSÁGA Talán a legrészletesebb tanulmány az emberi irány-észlelés pontosságáról a horizontális (vízszintes) síkon MILLS-é (1958) volt, aki a „minimális hallható-szöget” - azaz a legkisebb észlelhetô/detektálható különbséget két hangforrás azimutja között - vizsgálta a hangfrekvencia és az azimut függvényében. Mills szerint a minimális hallható szög 250 és 1000 Hz között a legkisebb, 2 kHz körül és 3-6 kHz között van maximuma, majd 8 kHz-nél újabb maximumot ér el. A legkisebb hallható szög 750 Hz-es hangoknál mérhetô és körülbelül 10 fok középvonalhoz (0 azimut) közeli hangszóróhelyzetek esetén. Laterálisabb helyzetekben (750 fokos azimutnál) a minimális hallható szög körülbelül 70-re növekszik és végül meghatározhatatlanná válik, amikor a hangszóró az egyik fül irányában van (900 fokos azimut). A térbeli pontosság a horizontális síkon jobb alacsony frekvenciákon, a legjobb pedig mediálisan elhelyezkedô hangforrások esetében. Az ember, a majom és a macska térbeli észlelésérôl szóló tanulmányok két pontos lokalizációs területet mutatnak ki a horizontális síkon az alacsony és a magas frekvenciatartományban, amelyeket egy közepes frekvenciájú, gyengén megkülönböztethetô terület választ el. Ezt a tényt STEVENS ÉS NEWMAN (1934) fedezte fel embernél és azóta úgy értelmezik, mint a horizontális hanglokalizáció duple- elméletének bizonyítékát. A függôleges lokalizáció embereknél általában kevésbé pontos, mint a horizontális lokalizáció (GARDNER ÉS GARDNER, 1973). Magas frekvenciájú szignálok, különösen komplex hangok - mint például sávszûrt zaj a 8 kHz feletti frekvenciák erôs képviseletével - viszonylag jól lokalizálhatóak (GARDNER ÉS GARDNER, 1973; ROFFLER ÉS BUTLER, 1968), de az alacsonyabb frekvenciájú szignálok - tiszta hangok vagy alacsony frekvenciájú sávszûrt zaj - észlelt helyzete nem változik a hangforrás megemelésével (ROFFLER ÉS BUTLER, 1968). A fülkagyló takarása rontja a mediális síkon belüli lokalizációt (GARDNER ÉS GARDNER, 1973).
24
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.3.3 AZ AKUSZTIKUS TÉR KULCSINGEREI 1.3.3.1 „K LASSZIKUS”
BINAURÁLIS KULCSINGEREK ÉS A DUPLEX-ELMÉLET
Az oldalról a fejhez érkezô hang az egyik fülbe elôbb érkezik, mint a másikba. A fej is visszaverheti és diffraktálhatja a hang egy részét, csökkentve a távolabbi fül amplitúdóját. Ugyanaz a hang középrôl a két fülbe érkezve egyszerre, azonos amplitúdóval érkezik. Az interaurális idô- (ITD) és intenzitáskülönbségek (IID) a lokalizáció fontos kulcsingerei. Azonban csak a hang magas frekvencia-összetevôi hoznak létre IID-t, mivel a fej nem képvisel számottevô akadályt a fej átmérôjénél sokkal nagyobb hullámhosszak számára. RAYLEIGH (1909) szerint ember esetében csak az 1 kHz-nél magasabb frekvenciák hoznak létre használható interaurális intenzitáskülönbségeket, míg a pszichofizikai mérések azt jelzik, hogy 2 kHz vagy ennél is magasabb frekvenciákra van szükség az interaurális intenzitáskülönbségek alapján történô lokalizációhoz (MILLS, 1972). Az ITD-kulcsingerek fôként a mély frekvenciákból származnak. Az auditoros rendszer a bejövô hangot - a csigánál - frekvencia-összetevôire bontja és az auditoros idegrostok kódolják ezeknek az összetevôknek az idôzítését „idôzárral”, azaz úgy, hogy tüzelésüket az összetevôk fázisával szinkronizálják. A folytonos idôkülönbségek a két fül szignáljában így interaurális fáziskülönbségként kódolódnak. A csiga szôrsejtjeinek membránkapacitása felsô határt szab azoknak a frekvenciáknak, amelyeknél a fázis-zár lehetséges (R USSELL ÉS SELLICK, 1983). Emlôsök esetében ez a határ 4 kHz körül van (JOHNSON , 1980). De még alacsonyabb frekvenciák esetében is úgynevezett „fázis-ambiguitások” korlátozzák a fáziskülönbség-információ használhatóságát. Például egy negyed-fázisnyi különbség jelentheti azt, hogy az egyik fül „vezet” negyed periódussal, de azt is, hogy ugyanez a fül késik háromnegyed periódussal. Ugyanaz a fáziskülönbség származhat 1,25 vagy 2,25 periódusnyi különbségbôl és így tovább, 1,75 vagy 2,75 periódusnyi késésbôl stb. Ha a frekvenciák alacsonyak - azaz a periódusok hosszúak - sok alternatíva kizárható, mivel az ilyen idôkülönbségek hosszabbak, mint a leghosszabb fiziológiai interaurális idôkülönbség. Ha a szignál periódusa nagyobb, mint a maximális interaurális idôkülönbség kétszerese, az összes fázis-ambiguitás kizárható. Ezért az emberek a hangfrekvenciákat egészen 1,5 kHz-ig képesek lateralizálni az interaurális idôkülönbségek alapján (MILLS, 1972). Az ingerek fázis-kódolt alacsony-frekvenciájú összetevôi nem az idôkülönbség egyetlen forrásai. HENNING kimutatta, hogy az emberek képesek észlelni az interaurális idôkülönbségeket olyan amplitúdómodulált ingerekben is, amelyek nem tartalmaznak információt az alacsonyabb frekvenciákon. (Az alacsony frekvenciájú csatornákat szûrt zajjal maszkolták ebben a kísérletben.) Habár a magas-frekvenciájú rostok képtelenek fázis-zárni az inger vivô-frekvenciájára, reakcióik képesek kódolni az inger burkológörbéjének modulációit és így továbbítani a kezdet (onset) és burkológörbe-idôkülönbség információt (HENNING, 1974).
25
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.3.3.2 SPEKTRÁLIS KULCSINGEREK A hanglokalizáció úgy tûnik, hogy nagyrészt a nem egyértelmû kulcsingerekbôl való információnyerés mûvészete. Már találkoztunk a fázis-ambiguitásokkal, de van más, alapvetôbb és súlyosabb ambiguitás is, amivel meg kell bírkóznia a halllórendszernek. Tegyük fel, hogy auditoros rendszerünk mért egy interaurális idôkülönbség-értéket és ezt most arra szeretné felhasználni, hogy meghatározza a hangforrás helyét. Az interaurális idôkülönbség-érték a hangforrástól a fülekig megtett utak hosszának különbsége, ami a hangforrás interaurális tengelyéhez (ami a két fület összeköti) mért szögtôl függ. Tehát meg kell becsülnünk a hangforrás szögét egy adott interaurális idôkülönbségbôl. Azonban végtelenül sok irány van a fej elôtt, mögött, felett vagy alatt, ami az interaurális tengellyel ugyanolyan szögben áll. Az interaurális intenzitáskülönbség-értékek is a hangforrás szögétôl függenek. Ha a fejet megközelítôleg gömbnek tekintjük, egy adott frekvenciára az összes olyan hangforrás-helyzet, ami a „tévesztési kúpra” esik - amit az interaurális tengelyhez mért szög határoz meg - ugyanazt az interaurális idô- és intenzitáskülönbség értékeket adja és így lehetetlen megkülönböztetni azokat. Ám legtöbbünk mégis könnyedén megkülönbözteti az elölrôl és hátulról érkezô hangokat még becsukott szemmel is. Ez a megkülönböztetési képesség azonban leromlik, ha arra kérnek bennünket, hogy szinusz-hangokat lokalizáljunk és külsô fülünk szerepét lerontják például a fülkagyló tekervényeinek elzárásával (OLDFIELD ÉS PARKER, 1984), vagy egy csôt szúrnak a füljáratba, ezzel kiiktatva a fülkagyló átviteli szerepét (FISHER ÉS FREEDMAN , 1968). Az igazi fejek igazi fülkagylókkal jelentôsen különböznek a gömb alakú fej modelljétôl, amit a tévesztési kúp meghatározásához használnak. A füljáratban végzett akusztikus mérésekbôl származó izointeraurális-szintkülönbség profilok azt sugallják, hogy csak viszonylag alacsony frekvenciák esetén létezik a koncentrikus kúpok sorozata (MUSICANT ÉS MUNKATÁRSAI , 1990; CARLILE, 1990a). Magasabb frekvenciákon ezek a kúpok egyre jobban torzulnak a külsô-fül irány-függô spektrális szûrése miatt. Egészen magas frekvenciákon az izo-interaurális-szintkülönbség profilok nagyon összetett mintázata figyelhetô meg és a kúpok már nem felismerhetôek. A külsô fül (kisebb mértékben a fej és a test) által végzett akusztikus átalakítás iránytól-függô jellegét általában „fejjel-kapcsolatos átalakítási-görbének” (HRTF: head related transfer function) nevezik. Fejjelkapcsolatos átalakítási-görbét mértek már számos fajban, beleértve macskákat, menyéteket és embereket is (MUSICANT ÉS MUNKATÁRSAI , 1990; CARLILE ÉS KING, 1994; CARLILE ÉS PRALONG, 1994; WIGHTMAN ÉS KISTLER, 1989; RICE ÉS MUNKATÁRSAI, 1992). Az iránytól-függô szûrés önmagában nem oldja fel az interaurális szintkülönbség-kulcsingerek ambiguitását egyetlen frekvencia esetében sem, ám az ambiguitások már nem szimmetrikusan helyezkednek el az interaurális tengely körül és az aszimmetrikus elrendezés lehetôvé teszi a széles-sávú hang irányának egyértelmû meghatározását számos frekvenciatartomány interaurális intenzitáskülönbség-információjának kombinálásával. Az erre vonatkozó kísérleti adatok BUTLER-tôl (1986) származnak, aki arra kérte kísérleti alanyait, hogy különbözô sávszélességû hangokat lokalizáljanak és úgy találta, hogy az „elöl-hátul tévesztések” száma csökkent a sávszélesség növelésével. A külsô fül spektrális szûrése nem csak a binaurális kulcsingerek ambiguitását segíti feloldani. Úgy tûnik, hogy felelôs a hanginger perceptuális „externalizációjáért” is (CARLILE ÉS KING, 1993) és önmagában is lokalizációs kulcsinger. Az egyik fülükre megsiketített alanyok bár nem olyan jól lokalizálják a hangokat mint a binaurális hallgatók, mindazonáltal viszonylag jól lokalizálják a széles sávú hangokat (MUSICANT ÉS 26
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
BUTLER, 1984; BUTLER, 1986; SLATTERY ÉS MIDDLEBROOKS , 1994), kizárólag a spektrális kulcsingerek alapján. Azonban a „monaurális spektrális-kulcsinger” felhasználása sajátos problémát jelent. Az iránytólfüggô spektrális átalakítás felismeréséhez az auditoros rendszernek ismernie kell a szignál eredeti spektrumát, vagy némi feltételezéssel kell élnie ezzel kapcsolatban. Az eredeti spektrum „elôzetes ismeretének” szükséglete a monaurális hallgatási feltételek problémája. Binaurális feltételek közepette az auditoros rendszer képes a két fülbe érkezô spektrum összehasonlítására és komputál egy „fülkagyló-eltérési” vagy interaurális spektrum-különbség (ISD) függvényt, ami független az eredeti spektrumtól (SEARLE ÉS MUNKATÁRSAI, 1976). Azonban ez csak akkor lehetséges, ha a lokalizálandó szignál elegendôen nagy intenzitású, azaz egyértelmûen a két fül detekciós határértéke felett van a teljes frekvenciatartományban. A maximális fiziológiai interaurális intenzitáskülönbségeknél alacsonyabb intenzitású ingerek monaurális hallgatási feltételeket hoznak létre még tökéletesen normális hallású alanyoknál is. Egy - a pszichofizikai irodalomban leírt - auditoros illúzió némi belátással szolgál arra vonatkozóan, hogy az auditoros rendszer hogyan mûködik olyan esetekben, amikor az eredeti spektrumról nincs megbízható információnk. Ha arra kérik a kísérleti alanyokat, hogy keskeny sávú zajokat lokalizáljanak, a beszámolt pozíciók gyakran a szignál középfrekvenciájának függvényében és nem a tényleges hangszóró-elhelyezéstôl függôen változnak (BLAUERT , 1969-70; BUTLER ÉS HELWIG, 1983). Ez az eredmény azt sugallja, hogy az auditoros rendszer egyszerûen minden „kiugró spektrális jellemzôt” spektrális kulcsingerként értelmez. Ilyenkor a hangot olyan helyen észleljük, amely maximális hangintenzitást produkál az adott frekvencián (MUSICANT ÉS BUTLER, 1984; B UTLER, 1987). Ez a stratégia azonban csak akkor mûködik jól, amikor az eredeti hangfrekvencia-spektrum burkológörbéje meglehetôsen egyenletes abban a sávban, ahol a spektrális kulcsingerek elôfordulnak. A hallgatók képtelenek lokalizálni az olyan széles-sávú szignálokat, amelyeknek a spektrumából kiszûrték az adott hangforrás-pozícióhoz kapcsolódó frekvenciákat (BUTLER ÉS MUSICANT, 1993). RICE ÉS KOLLÉGÁI (1992) úgy vélik, hogy a frekvenciaspektrum-burkológörbe mélypontjai is fontos lokalizációs kulcsingerek. Macskák fejjel-kapcsolatos átalakítási-görbe (HRTF) mérései alapján arra következtettek, hogy a különbözô frekvenciatartományok különbözô akusztikus kulcsingerek ebben a fajban. 2-5 kHz-es frekvenciák esetén („∆L régió”) az alaphártya közelében mért spektrum-intenzitások nagyrészt a gömb-alakú-fej modell alapján változnak. A szerzôk az 5-18 kHz-ig terjedô frekvenciatartományt „elsô fogazat” (FN: first notch) sávnak nevezték el. Ezt a tartományt egy éles minimum jelzi a spektrum amplitúdójában. Ez az úgynevezett „frontális fókuszon” belüli hangforrás-irányok kódolására szolgál (ipszilaterális 60 foktól kontralaterális 45 fokig és az interaurális tengely alatti 30 foktól 45 fokkal fölé terjedô területen) és a frekvencia, ahol a fogazat elôfordul, szisztematikusan változik a hangforrás helyzetétôl függôen. Csak kevés pozíció produkál fogazatot egy adott frekvencián és a két fül fogazat-frekvenciájának független meghatározásával az állat képes a hangforrás egyértelmû lokalizációjára. Ám ilyen szisztematikusan változó fogazatok nem keletkeznek olyan hangforrás-helyzetek esetén, amelyek a frontális fókuszon kívül esnek és a macska kénytelen a magas frekvenciájú sávból (HF) származó információt használni az ilyen, sávon kívüli pozíciók meghatározására. A HF tartomány spektruma - 18 kHz felett - általában nagyon összetett, számos minimumot és maximumot tartalmaz változó amplitúdóval és frekvencián. A macska fülkagylója mennyire hasonló más emlôsök füléhez? A szisztematikus hangerô-változások nagyjából a gömb-alakú-fej modell predikciói alapján az ember (CARLILE ÉS PRALONG , 1994) és a menyét (CARLILE ÉS KING, 1994) HRTF alacsony frekvenciájú tartományának is jellemzôi, csakúgy mint az összetett, erratikusan változó spektrális mintázatok a magas frekvenciákon. A „∆L” és a „HF-régió” az emlôs külsô fül meglehetôsen általános jellemzôjének látszik, azonban a menyét és az ember fülkagylója esetén - bár szintén jelentôs spektrális fogazatokat produkál a frontális hangforrás-helyzet - a fogazatok közel vannak a hallási tartomány felsô határához. Menyétnél a fogazat-frekvencia szisztematikusan növekszik a hang-azimuttal, ám embernél a fogazat sokkal kevésbé változik a pozícióval ezért nem világos, hogy a macskánál leírt „elsô fogazat” milyen mértékben használható más emlôsök számára is.
27
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.3.4 RECEPTÍV MEZÔ Emlôsök észlelésekor az inger térbeli helyzetét a neuronok egy populációjának aktivitása reprezentálja. A vizuális rendszer egy neuronja aktiválódik, amikor a fény a retina egy adott területére esik, amit a bizonyos térbeli helyzetben elhelyezkedô tárgyról érkezô fénysugarak okoznak. A szomatoszenzoros rendszer akkor reagál, ha mechanikus inger éri a testfelszín egy körülhatárolt területét. Az aktivált populációk szétválasztását és az elkülönült receptív mezôk kialakulását mindkét rendszerben az elsôdleges afferens rostok erôsen specifikus kapcsolatai a receptorokhoz, a laterális gátlási mechanizmusok és az agyon belüli topografikus kapcsolatok biztosítják. A neuron receptív mezôjét a szenzoros érzékelô felület azon részével lehet meghatározni, amelyet ingerelve az ingerlés változást hoz létre a neuron aktivitásában. A szomatoszenzoros és a vizuális rendszerben a neuron receptív mezôje egy térbeli területnek felel meg. Az auditoros rendszerben a fenti meghatározású receptív mezô egy frekvenciatartománynak felel meg, mivel a frekvencia képzôdik le a (receptor)térre.
28
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.4 T ÉRÉSZLELÉS AZ AUDITOROS RENDSZERBEN 1.4.1 OLIVA SUPERIOR A laterális oliva superior (LSO) neuronjai ipszilaterális izgalmi bemenetüket az anteroventrális cochleáris nucleus (AVCN) középsô részébôl kapják, kontralaterális gátlásukat pedig a trapéz test (corpus trapezoideum) mediális nucleusán (MTB) keresztül az ellenoldali anteroventrális cochleáris nucleusból (AVCN). Az izgalmi-gátló kapcsolatok (EI) és az LSO-neuronok ipszilaterális ingerekre adott monoton, kitartott tüzelési mintázata miatt (BOUDREAU ÉS TSUCHITANI, 1968), valamint azért, mert az LSO-neuronok többségének magas a preferált frekvenciája és a fej által vetett akusztikus árnyék magas frekvenciákon nagyobbá válik (WIENER ÉS MUNKATÁRSAI, 1966; M OORE ÉS IRVINE , 1979A ) igen valószínû, hogy az LSO-nak az interaurális intenzitáskülönbségek (IID) kódolásában van szerepe, ami a legtöbb információt biztosítja a magas-frekvenciájú hangok lokalizációjához. Ezt az elképzelést alátámasztják a különbözô fajok összehasonlító vizsgálatai is: sok magas-frekvenciára érzékeny fajban az LSO hipertropizált, míg a mediális oliva superior (MSO) kicsiny; míg fordított a helyzet azoknál az állatoknál, amelyek alacsony frekvenciákra érzékenyek (IRVING ÉS HARRISON, 1967; MASTERTON ÉS MUNKATÁRSAI, 1975). Az MSO-neuronok bilaterális projekciót kapnak az AVCN anterior területérôl. Az MSO-neuronok általában alacsony preferált frekvenciával rendelkeznek, gyakran binaurálisan izgatottak (EE) és az ingerhez fázis-zárt tüskéket produkálnak, azaz feltehetôen interaurális idôkülönbséget (ITD) elemeznek. GOLDBERG ÉS BROWN (1969) elemezte az MSO-ban kiváltott tüskék idôzítését az ingerlô monaurális hangok fázisához képest és úgy találta, hogy a tüskék a ciklus különbözô részeihez fázis-zártak ipszilaterális és kont-ralaterális ingerek esetén. Binaurális ingerlésnél maximális az MSO-neuronok tüzelése amikor a két fülbe fázisban érkezik a bemenet és minimális, amikor a bemenetek 180 fokos fáziseltéréssel érkeznek (GOLDBERG ÉS BROWN, 1969). 1.4.2 A DORZÁLIS LEMNISCUS LATERALE A lemniscus laterale dorzális nucleusának (LLD) nagyrésze binaurálisan ingerelhetô (AITKIN ÉS 1970) és az LLD nagyrészt oliva superiorból származó afferens bemeneteinek megfelelôen az alacsony preferált-frekvenciájú neuronok legtöbbje az ITD-re szenzitív, míg a magas preferált-frekvenciájú neuronok aktivitását az IID befolyásolja (GLENDENNING ÉS MUNKATÁRSAI, 1981). MUNKATÁRSAI ,
29
DANCZI CSABA LÁSZLÓ : A ZENEI 1.4.3 COLLICULUS
TÉR
INFERIOR
A felnôtt macskák centrális colliculus inferior (ICC) neuronjai az akusztikus szignálok széles körére szenzitívek, különösen az idô (ITD) és intenzitás (IID) interaurális különbségeire, amik a hang-azimut elsôdleges kulcsingerei ebben a fajban (HIND ÉS MUNKATÁRSAI, 1963; KUWADA ÉS YIN , 1983; ROSE ÉS MUNKATÁRSAI , 1966; SEMPLE ÉS A ITKIN, 1979; Y IN ÉS K UWADA, 1983). Az auditoros neuron irányítottságát az a térbeli receptív mezô határozza meg, ahonnan kisülések válthatóak ki belôle. MIDDLEBROOKS ÉS PETTIGREW (1981) háromféle auditoros receptív mezôt figyelt meg (alacsony intenzitású ingerekkel). Az egységek egyik osztályát - az „omni-direkcionális” neuronokat - a frontális térben bárhol elhelyezkedô ingerek aktiválják. A másik két osztály a „hemi-direkcionális” - amely neuronokat a kontralaterális térben elhelyezkedô ingerek aktiválnak - és az „axiális”, ahol a neuronok térbeli receptív mezôi az interaurális tengelyen kontralaterális fül irányában helyezkedtek el. Az inferior colliculus (IC) egységeire hasonló osztályozást használtak SEMPLE ÉS MUNKATÁRSAI (1983), valamint MOORE ÉS MUNKATÁRSAI (1984). Az ICC-ben található neuronoknak több mint a fele omni-direkcionális, a fennmaradó neuronok pedig változó mértékû irány-érzékenységet mutatnak. A legtöbb neuronnál az azimut-tartomány, amelyben tüzel növekszik az ingerintenzitással, az ipszilaterális térfél nagy részére is kiterjed nagyobb intenzitások esetében. Néhány neuron preferált azimut-tartománya alig változik az intenzitás változásával; ezek azimut-szelektív egységek és úgy tûnik, hogy alkalmasak a hangforrás elhelyezkedésének intenzitástól független kódolására (AITKIN ÉS MUNKATÁRSAI , 1984). Az azimut-helyzet a tonotopikus tengelyre merôlegesen reprezentálódik. Az egyes neuronok azimutgörbéi általában nem pontosan a térre hangoltak, hasonló térbeli hangolódás található a szomszédos neuronpopulációkban (AITKIN ÉS MUNKATÁRSAI , 1984). 1.4.3.1 A COLLICULUS INFERIOR KAPCSOLATA A LEMNISCUS
LATERALEVAL
A felszálló auditoros rendszerben a nucleusok párhuzamos pályákon kapcsolódnak. A pályák az auditoros idegtôl indulnak, ami elágazódik, hogy az információt elossza a különbözô sejt-csoportokba a cochleáris nucleusban (CN). A CN átalakítja a beérkezô tüske-sorozatokat, majd elosztja ezt az információt egy sor párhuzamos pálya között, milliónyi auditoros nucleushoz a medullában és a hídban. A medulla és a híd nucleusai közül némelyik binaurális - mindkét oldali CN-bôl kap bemenetet -, másokat csupán egyoldali CN innervál és így monaurálisak. Az összes binaurális és monaurális nucleus rostja konvergál a középagyi colliculus inferioron (ROSS ÉS MUNKATÁRSAI , 1988; ROTH ÉS MUNKATÁRSAI, 1978; OLIVER ÉS MUNKATÁRSAI , 1992). A colliculus inferior (IC) adja a mediális geniculatum (MGB) elsôdleges bemenetét (CALFORD ÉS MUNKATÁRSAI , 1983, W INER, 1992) és így közvetve az auditoros kéreg információját is. Az IC feldolgozza és integrálja majdnem az összes felszálló akusztikus információt az alacsonyabb központokból és meghatározza azt a formát, amiben az információ továbbítódik az elôagy magasabb szintjeihez. A hangok, zaj, vagy más hagyományos szignál által kiváltott IC neurális reakciók - csupán kevés kivétellel - nagyon hasonlóak az olyan alacsonyabb szintû nucleusok reakcióira, amelyekbôl az IC bemenetét kapja (DAVIS ÉS MUNKATÁRSAI, 1999; RAMACHANDRAN ÉS MUNKATÁRSAI, 1999; D AVIS, 2002; BURGER ÉS MUNKATÁRSAI , 1998; KLUG ÉS MUNKATÁRSAI , 1995; POLLAK ÉS MUNKATÁRSAI, 2002), ám jelentôsen megváltoznak, ha a colliculus inferior gátló bemenetei blokkolódnak (POLLAK ÉS MUNKATÁRSAI , 2002; KLUG ÉS MUNKATÁRSAI , 1999; YANG ÉS MUNKATÁRSAI , 1992; KOCH ÉS MUNKATÁRSAI , 1998; PARK ÉS MUNKATÁRSAI, 1998; MCALPINE ÉS MUNKATÁRSAI , 2002; FAINGOLD ÉS MUNKATÁRSAI, 1991; L EBEAU ÉS MUNKATÁRSAI, 2001). Azok a neuronok, amelyeket izgat az egyik fül ingerlése és gátol a másiké (EI), interaurális intenzitáskülönbségeket (IID) kódolnak, amit az állatok a magas frekvenciájú hangok lokalizálásához használnak (ERULKAR, 1972). Az EI-tulajdonságokat úgy mérik, hogy egy rögzített intenzitású hangot adnak az izgalmi fülbe és ezzel egyidôben egyre intenzívebb hangokat a másik, azaz a gátló fülbe. Az izgalmi fülbe érkezô hang izgatja a neuront, ám aktivitását egyre jobban gátolja a növekvô intenzitás a gátló fülben. Az a minimális interaurális intenzitáskülönbség (a legkisebb intenzitás a gátló fülben), ami maximális tüske-elnyomást produkál az egyes EI-neuronokban, a neuron maximálisan gátló interaurális intenzitáskülönbsége. 30
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
A neuronoknak elôször a laterális oliva superiorban (LSO) van EI-tulajdonsága (BOUDREAU ÉS MUNKATÁRSAI , 1968; MOORE ÉS MUNKATÁRSAI , 1983). Azonban EI-neuronok vannak az LSO felett is, különösen a lemniscus laterale dorzális nucleusában (DNLL, BURGER ÉS MUNKATÁRSAI , 2001; BRUGGE ÉS MUNKATÁRSAI , 1970; COVEY, 1993; KELLY ÉS MUNKATÁRSAI, 1998; YANG ÉS MUNKATÁRSAI , 1994), ami tisztán GABA-erg (gátló) nucleus és bilaterális projekciót küld az IC-be (COVEY, 1993; KELLY ÉS MUNKATÁRSAI , 1998; YANG ÉS MUNKATÁRSAI , 1994; WINER ÉS MUNKATÁRSAI , 1995; ADAMS ÉS MUGNAINI , 1984). Az EI-sejtek vannak többségben az IC olyan területein, amelyek az LSO-ból és a DNLL-bôl kapnak bemenetet (ROTH ÉS MUNKATÁRSAI , 1978; ROSS ÉS MUNKATÁRSAI , 1989; SHNEIDERMAN ÉS MUNKATÁRSAI, 1993, 1988; W ENSTRUP ÉS MUNKATÁRSAI , 1986; LI ÉS MUNKATÁRSAI , 1992; VAN ADEL ÉS MUNKATÁRSAI , 1999). Mivel az LSO erôs, izgalmi projekciót küld az ellenoldali LLD-be és IC-be lehetséges, hogy az LSOban kialakult EI-jellemzôk egyszerûen öröklôdnek az LLD-ben és az IC-ben és valóban sok neuron EI-tulajdonsága így alakul ki az IC-ben (DAVIS ÉS MUNKATÁRSAI, 1999; KLUG ÉS MUNKATÁRSAI, 1995, 1999; PARK ÉS MUNKATÁRSAI , 1994). A DNLL - mint az IC is - sok bemenetet kap az alacsonyabb szintû nucleusokból (SHNEIDERMAN ÉS MUNKATÁRSAI , 1988, 1993; W ENSTRUP ÉS MUNKATÁRSAI , 1986, 1988; LI ÉS MUNKATÁRSAI , 1992; VAN A DEL ÉS MUNKATÁRSAI , 1999; PARK ÉS MUNKATÁRSAI , 1993, 1994, 1996, 1997; FAINGOLD ÉS MUNKATÁRSAI, 1993; PARK, 1998; SAINT MARIE ÉS MUNKATÁRSAI, 1997; G LENDENNING ÉS MUNKATÁRSAI, 1981; YANG ÉS MUNKATÁRSAI , 1996) és azok a neuronok, amelyek magas-frekvenciákra hangoltak, fôként - ha nem is kizárólag - EIneuronok (BRUGGE ÉS MUNKATÁRSAI , 1970; KELLY ÉS MUNKATÁRSAI, 1998; YANG ÉS MUNKATÁRSAI, 1994; MARKOVITZ ÉS MUNKATÁRSAI, 1994). A kontralaterális (izgalmi) fül ingerlése általában erôs, fenntartott kisülés-sorozatot vált ki (BURGER ÉS MUNKATÁRSAI, 2001; M ARKOVITZ ÉS MUNKATÁRSAI, 1993; YANG ÉS MUNKATÁRSAI , 1994). A kisülés-sorozat tartama megfelel az inger tartamának és sosem hosszabb annál. Ezzel szemben az ipszilaterális (gátló) fül ingerlése hosszan tartó gátlást vált ki, ami 5-80 ms-al hosszabb, mint a létrehozó szignálok tartama (Burger és munkatársai, 2001; Yang és munkatársai, 1994; Pollak, 1997). POLLAK ÉS MUNKATÁRSAI (2003) szerint amikor két - idôben egymáshoz közeli - hangot mutatnak be, megváltozik bizonyos denevér IC-neuronok reakciókészsége a második hangra az elsô hang miatt, aminek az interaurális intenzitáskülönbsége erôsen izgalmi az IC-sejtre, ám gátló az ellenoldali DNLL-re. Az elsô hang érkezése tartósan gátolja a NDLL-t és így az IC az ipszilaterális fülbôl nem kap gátlást, azaz az egyébként gátolt ingerek izgatják az IC-t. Ezekben a sejtekben a DNLL inaktivációja - kynuretikus savval, ami széles spektrumú glutamát transzmitter-blokkoló - megszûnteti a gátlást és az IC-neuront - ami funkcionális DNLL-nél izgalmi-gátló volt - monaurálissá (EE) alakítja. Olyan colliculus inferior EI-sejtek is vannak, amelyek nem kapnak bemenetet az ellenoldali DNLLbôl (BURGER ÉS MUNKATÁRSAI , 2001). A második hangra adott reakciók ezekben ugyanolyanok, mint az elsô hangra adottak, ráadásul a DNLL inaktivációjának sincs hatása a sejtek EI-jellemzôire ami valószinûsíti, hogy ezeknek a sejteknek az EI-jellemzôi az LSO-ban alakulnak ki és a gátló projekció viszi át ôket az ICre (POLLAK ÉS MUNKATÁRSAI , 2002).
31
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.4.3.2 PRECEDENCIA-HATÁS A COLLICULUS INFERIORBAN Az IC-neuronok jellemzôi, amiket a dorzális lemniscus laterálisból (DNLL) származó innverváció hoz létre, hozzájárulnak a precedencia-hatáshoz (POLLAK ÉS MUNKATÁRSAI, 2002; B URGER ÉS MUNKATÁRSAI, 2001; POLLAK , 1997). A precedencia széles körû - ha nem éppen univerzális - jelensége az auditoros rendszereknek. Precedencia-hatást találtak férgeknél (W YTTENBACH ÉS HOY, 1993), madaraknál (KELLER ÉS MUNKATÁRSAI, 1996) és számos emlôsnél (WALLACH ÉS MUNKATÁRSAI, 1949; LITOVSKY ÉS MUNKATÁRSAI, 1999; KELLY, 1974; LITOVSKY ÉS MUNKATÁRSAI, 1998; F ITZPATRICK ÉS MUNKATÁRSAI , 1995; ZUREK , 1987). A precedenciahatás neurológiai korrelátumairól végzett tanulmányokat anesztetizált macskákon végezték (YIN, 1994) valamint éber nyúlon (FITZPATRICK ÉS MUNKATÁRSAI, 1995) és éber baglyon (KELLER ÉS TAKAHASHI, 1996). Ezekben a tanulmányokban a precedencia-hatást klikk- vagy zajpárok bemutatásával szimulálják, változó interaurális idôkülönbségekkel. Mindhárom fajban kimutatták, hogy a legtöbb colliculus inferior neuron a precedencia-hatás fiziológiai megfelelôjét mutatja, azaz a késlekedô ingerre adott reakciók elnyomást szenvednek rövid interaurális idôkülönbségeknél; hasonló idôbeli lefutással, mint a pszichofizikában megfigyeltek. A colliculus inferior centrális nucleusában (ICC) a precedencia-hatás több közvetlen korrelátumát kimutatták, például az elnyomás változását az inger intenzitásával, idôtartamával és helyzetével, valamint interaurális spektrumkülönbségével. 2 ms-os interaurális késlekedéseknél a neurális reakciók lokalizációösszegzést mutatnak (YIN , 1994; YIN ÉS LITOVSKY, 1995): az emberek (BLAUERT, 1997) és a macskák (POPULIN ÉS YIN, 1998) olyan hangforrást észlelnek ilyenkor, ami a vezetô és a késlekedô hangforrások között van. A fejlôdéstani tanulmányok azt sugallják, hogy a precedencia-hatás nem nyilvánul meg az újszülött emberi csecsemôk viselkedésében (CLIFTON ÉS MUNKATÁRSAI , 1981; MUIR ÉS MUNKATÁRSAI , 1989; BURNHAM ÉS MUNKATÁRSAI, 1993), sem kutyáknál (A SHMEAD ÉS MUNKATÁRSAI, 1987). Habár az újszülött csecsemôk és kutyák képesek azonosítani azt a féltekét, amin belül az egy-forrásos hang található (egyetlen helyrôl kibocsátott egyetlen hang esetében), a precedencia-hatás feltételei közepette a vezetô forrás nem dominálja úgy a percepciót és a lokalizációt, ahogy felnôttek esetében (lásd LITOVSKY ÉS ASHMEAD, 1997). A precedenciahatás viselkedésesen elôször körülbelül 4-5 hónapos korban jelenik meg embereknél, azonban ebben az életkorban még nem teljesen érett (CLIFTON, 1985; MUIR ÉS MUNKATÁRSAI , 1989). Valójában a precedenciahatás bizonyos aspektusai még 5 éves gyerekeknél sem teljesen érettek (LITOVSKY, 1997; LITOVSKY ÉS ASHMEAD, 1997).
32
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.4.4 C OLLICULUS SUPERIOR A colliculus superior (SC) az auditoros középagyban található és fontos szerepet játszik a vizuális, az auditoros és a szomatoszenzoros ingerekre adott reakciókban (áttekintésükhöz lásd STEIN ÉS MEREDITH , 1993) mély-réteg kimeneti neuronjain keresztül, amelyek közül sok képes arra, hogy különbözô szenzoros modalitásokból integrálja az információt (MEREDITH ÉS STEIN, 1983, 1986a; MEREDITH ÉS MUNKATÁRSAI , 1992). Ezek a neuronok az agytörzsbe és a gerincvelô olyan területeire küldenek projekciókat, amelyek a szem-, fül-, fej- és végtagmozgásokat kontrolálják (GRANTYN ÉS GRANTYN , 1982; HUERTA ÉS HARTING , 1984, 687-773. oldal; MOSCHOVAKIS ÉS KARABELAS, 1985). Az SC felszíni rétegei a pretectumba (BEHAN ÉS APPELL , 1992) és a colliculus inferior brachiumába (BIN) küldenek projekciókat (KING ÉS MUNKATÁRSAI , 1998a; JIANG ÉS MUNKATÁRSAI , 1993). Az emlôs SC hét egymással váltakozó rostos és sejtes rétegbôl áll (KANASEKI ÉS SPRAGUE, 1974). Az afferens és efferens kapcsolatokra (HUERTA ÉS HARTING , 1984), léziók különbözô hatására (CASAGRANDE ÉS MUNKATÁRSAI , 1972), valamint számos fiziológiai különbségre (F ELDON ÉS MUNKATÁRSAI, 1970; G ORDON, 1973; STEIN ÉS MUNKATÁRSAI, 1976) hivatkozva a hét réteget felszíni és mély csoportokba osztják. A felszíni csoport a „stratum zonale”-bôl (SZ), a „stratum griseum superficiale”-bôl (SGS) és a „stratum opticum”-ból (SO) áll; a mély csoportba a közbülsô rétegeket: a „stratum griseum intermediumot” (SGI), a „stratum album intermediumot” (SAI); valamint a „mély” rétegeket: a „stratum griseum profundumot” (SGP) és a „stratum album profundumot” (SAP) sorolják. Térbeli megfelelés van a mély rétegekben található neuronok gyakran polimodális szenzoros receptív mezôje és a felettük található felszíni rétegek sejtjeinek vizuális receptív mezôje között (DRÄGER ÉS HUBEL, 1975; STEIN ÉS MUNKATÁRSAI, 1976; CHALUPA ÉS RHOADES , 1977). A mély rétegek ingerlése szakkadikus szemmozgásokat vált ki, amiknek az iránya és kiterjedése megfelel a felettük lévô felszíni-rétegek vizuális térképének (STRASCHILL ÉS HOFFMANN, 1970; SCHILLER ÉS STRYKER, 1972). Habár a gyöngybagoly SC-ben a legtöbb neuron bimodális (KNUDSEN , 1982), az emlôs SC felszíni rétegei kizárólag vizuális funkciójúak. Az SC felszíni szürke rétegében (SGS) a neuronok a retino-tectális projekción keresztül a retinából (GRAYBIEL, 1975; HARTING ÉS GUILLERY, 1976), valamint a cortiko-tectális projekción keresztül a striatumból (KAWAMURA ÉS MUNKATÁRSAI, 1974; GILBERT ÉS KELLY, 1975; W ICKELGREN ÉS STERLING, 1969; MCILWAIN ÉS FIELDS , 1971; ROSENQUIST ÉS PALMER , 1971; STEIN ÉS ARIGBEDE, 1972; BERMAN ÉS CYNADER , 1975; MIZE ÉS MURPHY, 1976; OGASAWARA ÉS MUNKATÁRSAI , 1984; MOHLER ÉS WURTZ, 1976; GRAHAM ÉS MUNKATÁRSAI , 1981; HUBEL ÉS MUNKATÁRSAI , 1975; ITOH ÉS MUNKATÁRSAI , 1981) kapnak bemenetet. Ezek a sejtek a vizuális ingerlésre reagálnak és receptív mezôik a vizuális mezô retinotopikus térképét alkotják (CYNADER ÉS BERMAN, 1972; LANE ÉS MUNKATÁRSAI, 1971). Viszonylag kicsi receptív mezôkbôl áll össze a térkép (APTER, 1945; FELDON ÉS MUNKATÁRSAI, 1970; MCILWAIN ÉS BUSER, 1968; BERMAN ÉS CYNADER, 1975; MCILWAIN, 1975). Az éber felnôtt majmok vizsgálatai szerint a colliculus superior felszíni-réteg neuronok a figyelem elmozdulásában vesznek részt (ROBINSON ÉS KERTZMAN, 1995) - ami megfelel azoknak a megfigyeléseknek, hogy a vizuális inger sokkal hatékonyabb a felszíni neuronok aktiválásában, ha az jutalommal társul (GOLDBERG ÁS W URTZ, 1972), valamint ezek a neuronok a figyelemben szerepet játszó talamikus neurális hálózatok részét képezik (KAAS ÉS HUERTA, 1988; L UPPINO ÉS MUNKATÁRSAI , 1988; RAFAL ÉS POSNER , 1987). A striatumból származó cortiko-tectális projekció megszüntetése vagy idôleges inaktivációja alaposan megváltoztatja a felszíni-réteg vizuális neuronok jellemzôit és reakciókészségét (W ICKELGREN ÉS STERLING, 1969; STEIN ÉS ARIGBEDE, 1972; BERMAN ÉS CYNADER, 1975; STEIN ÉS MAGALHAES-CASTRO , 1975; HARDY ÉS STEIN , 1988), ám kevés kimutatható hatással van a mély-réteg vizuális neuronokra (OGASAWARA ÉS MUNKATÁRSAI, 1984). Az anatómiai tanulmányok azt sugallják, hogy a felszíni réteg sejtek monoszinaptikus és poliszinaptikus pályákon is küldenek projekciókat a közbülsô rétegekbe (L EE ÉS HALL, 1995; HALL ÉS L EE, 1997; BEHAN ÉS APPELL , 1992; GRANTYN ÉS MUNKATÁRSAI, 1984; MOONEY ÉS MUNKATÁRSAI, 1988; MOSCHOVAKIS ÉS MUNKATÁRSAI , 1988a, b). BEHAN ÉS A PPELL (1992) szerint a felszíni rétegekben levô neuronok izgalmi hatása a közbülsô-réteg sejtekre funkcionálisan kolumnáris. Anatómiai leírások is alátámasztják ezt a feltételezést, mivel kolumna-szerû kapcsolatokat tártak fel az erdei cickány colliculus superior rétegek között (L EE ÉS HALL , 1995; HALL ÉS LEE, 1997): az alsóbb felszíni - a szürke (SGS) és az optikus (SO) - réteg neu33
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
ronjainak axonbokrai és a közbülsô réteg sejtjeinek dendritmezôi vertikális elhelyezkedésûek. A Golgi-festéses tanulmányok a macska colliculusáról olyan neuronokat mutattak, amelyek dendritjei a felszíni vagy a mély rétegeken, vagy akár egyetlen colliculáris rétegen belül maradnak (VICTOROV, 1968; LANGER, 1975). Azonban az intracelluláris festési eljárások bebizonyították, hogy a mély-réteg neuronok a macskában kiterjednek a stratum opticumig (SO) és a stratum opticum (SO) neuronok dendritjei a stratum griseum intermediumig (SGI) is kinyúlnak (GRANTYN ÉS GRANTYN, 1982; GRANTYN ÉS MUNKATÁRSAI , 1984; MOSCHOVAKIS ÉS KARABELAS , 1985). Az elsô axon-projekciókat a felszínitôl a mély rétegekig Sprague és munkatársai (lásd INGLE ÉS SPRAGUE, 1975) demonstrálták. Az intracelluláris festési eljárások kimutattak olyan axonokat a felszíni rétegekben, amelyek a mély rétegekig nyúlnak (GRANTYN ÉS MUNKATÁRSAI , 1984; MOSCHOVAKIS ÉS KARABELAS , 1985). A PHA-L tracert használva BEHAN ÉS APPELL (1987) talált projekciót a mélytôl a felszíni rétegekig a macskában, Moschovakis és kollégái pedig kimutatták, hogy kiterjedt belsô kollaterálisok vannak a majmok mind felszíni, mind pedig mély rétegeiben (MOSCHOVAKIS ÉS MUNKATÁRSAI, 1988a, b). RHOADES ÉS MUNKATÁRSAI (1989) a hörcsögben írtak le - laza topografikus szervezôdésû - projekciót a felszínitôl a mély rétegekig. Anatómiai (GRANTYN ÉS MUNKATÁRSAI , 1984; M OONEY ÉS MUNKATÁRSAI, 1984, 1988; MOSCHOVAKIS ÉS MUNKATÁRSAI, 1988a, b; BEHAN ÉS APPELL , 1992; HALL ÉS LEE, 1997) és fiziológiai (MOONEY ÉS MUNKATÁRSAI , 1992; LEE ÉS MUNKATÁRSAI , 1997) adatok kolumnáris kapcsolatokat jeleznek a felszíni vizuális és a mélyebb multiszenzoros rétegek között. Behan és Appell (felszíni rétegbôl eredô) PHA-L festett axonokat és bouton-okat talált minden egyes rétegben a SC egész területén, különösen az injekciós helyhez vetrális stratum griseum intermediumban (SGI), továbbá a kontralaterális SC-ban. A felszíni-mély projekció laza topografikus szernvezôdést mutat (BEHAN ÉS APPELL , 1992). Kontralaterális kapcsolatok fôként colliculus superior közbülsô és mély rétegeiben vannak (BEHAN ÉS APPELL, 1992; ALTMAN ÉS CARPENTER , 1961; EDWARDS, 1977), de találtak a felszíni rétegekben is (GRANTYN ÉS MUNKATÁRSAI, 1984; JEN ÉS AU, 1986). GRANTYN ÉS MUNKATÁRSAI (1984) olyan neuronokat találtak a kismacska felszíni rétegeiben, amelyeknek az axonjai kollaterálisokat adnak ki a felszíni és közbeesô rétegekbe. Ezeknek a neuronoknak nagyon nagy dendrit-mezôik vannak, aminek köszönhetôen a sejtek a vizuális mezô nagy területérôl kapnak vizuális információt. A sejtek kollaterálisai - gátló mechanizmusaikkal - befolyásolhatják a felszíni réteg neuronok receptív mezôjét (MCILWAIN ÉS BUSER, 1968; GRANTYN ÉS MUNKATÁRSAI , 1984). Nagy távolságokat átszelô kollaterálisok állhatnak a RIZZOLATTI ÉS MUNKATÁRSAI (1974) által leírt jelenség mögött is: az SC-neuron vizuális ingerre adott reakciója elnyomható egy másik - az elsôtôl bármilyen távolságban vagy helyzetben bemutatott - vizuális ingerrel. A PHA-L festési eljárással feltérképezték az SC melletti nucleusokra - pretectum, periaqueductus szürkeállománya, valamint a parabigeminális nucleus - kiterjedô axonokat is (BEHAN ÉS APPELL , 1992). Az SC-tôl a pretectumig tartó projekciók topografikusan szervezôdnek (KAWAMURA, 1974; KUBOTA ÉS MUNKATÁRSAI ., 1989; BEHAN ÉS A PPELL, 1992). M ANTYH (1982) leírt egy kiterjedt projekciót az SC közbülsô és mély rétegeirôl a periaqueductális szürkeállományába majomban, macskában és patkányban, RHOADES ÉS MUNKATÁRSAI (1989) pedig az SC felszíni rétegeibôl a periaqueductus szürkeállományába tartó projekcióról számoltak be hörcsögnél. BEHAN ÉS APPELL (1992) nem talált következetes topografikus kapcsolatot a colliculus superior és a parabigeminális mag között. GRAHAM (1977) korábban azonban talált egy topografikusan szervezett projekciót, amiben a rostrális colliculus superior a rostrális parabigeminális magra, míg a posteromediális colliculus superior a caudális dorsolaterális parabigeminális magra küld projekciót. Az alsóbb felszíni-réteg (SG) neuronok több kortikális vizuális területrôl, valamint a retinából kapnak projekciót (GRAHAM ÉS MUNKATÁRSAI, 1979). Közvetlen retinális projekciókról számolt be a colliculus középsô rétegeihez BECKSTEAD ÉS FRANKFURTER (1983) valamint MOONEY ÉS RHOADES (1990). Monoszinaptikus reakciókat mértek a mély-rétegekben az optikus ideg ingerlését követôen (BERSON ÉS MCILWAIN, 1982), ám a közvetlen retinális projekció a stratum opticumhoz ritka (MIZE, 1983a, b), így észerûnek látszik feltételezni, hogy a vizuális információt a felette levô felszíni rétegek is közvetítik. Fiziológiai kísérletek kimutatták, hogy sok mély-réteg neuron aktiválható egy közvetett Y-sejt pályával a vizuális kérgen keresztül, ráadásul a kiterjedt kortikális léziók sok vizuális ingerlésre adott colliculáris reakciót megszüntetnek (STEIN ÉS ARIGBEDE, 1972; HOFFMAN ÉS CYNADER , 1976; BERSON ÉS MCILWAIN, 1982, 1983). Fôemlôsökben a felszíni szürke (SGS) és az optikus réteg (SO) sejtei erôsebben reagálnak a szakká34
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
dok céljaként szelektált ingerekre (MOHLER ÉS WURTZ, 1976). A közbülsô szürke réteg (SGI) a substantia nigrából, a kisagyból, a frontális szemmezôbôl (SCHLAG-REY ÉS MUNKATÁRSAI, 1992; SEAGRAVES ÉS GOLDBERG, 1987), valamint több szenzoros rendszerbôl kap bemenetet (HUERTA ÉS HARTING, 1984; LEE ÉS HALL, 1995; MAY ÉS PORTER, 1992; SCHLAG-REY ÉS MUNKATÁRSAI, 1992; SEAGRAVES ÉS MUNKATÁRSAI , 1987) és fôként a szakkádokat irányító agytörzsi neurális hálózatokba küld projekciót (Lee és Hall, 1995). A frontális szemmezôbôl eredô pálya, ami közvetlenül a közbülsô rétegbe érkezik (SCHLAG-REY ÉS MUNKATÁRSAI , 1992; SEAGRAVES ÉS GOLDBERG, 1987) a szakkádok szelekciójában vesz részt (SCHLAG-REY ÉS MUNKATÁRSAI , 1992; MAYS ÉS SPARKS, 1980; S CHALL, 1995). A közbülsô szürke réteg (SGI) neuronok szenzoros reakciókat vagy pre-szakkadikus parancsszignálokat küldenek projekciós céljaikhoz (SPARKS ÉS NELSON, 1987; MOHLER ÉS W URTZ, 1976; SPARKS, 1978). A premotoros sejtek által indított szakkád-vektorok a közbülsô-rétegen belüli helyzettôl függôen változnak (PARÉ ÉS MUNOZ, 1996) és olyan motoros térképet alkotnak, ami egyezésben van a felette levô felszíni réteg vizuo-szenzoros térképével (MOHLER ÉS W URTZ, 1976; SCHILLER ÉS STRYKER, 1972). A felszíni rétegek aktivitása azonban nem elég a parancs-szignál végrehajtásához az alattuk levô premotoros sejtekben (MAYS ÉS SPARKS, 1980), a rétegek közötti kapcsolatot a substantia nigrából származó tonikus gátlás modulálja (HIKOSAKA ÉS WURTZ, 1983, 1985; MUNOZ ÉS WURTZ, 1992). A felszínitôl a közbülsô rétegekhez tartó pálya részvételét a szakkádok kiváltásában valószinûsíti az a megfigyelés, hogy a colliculus superior vagy a geniculo-striatális rendszer léziója megszünteti a szakkádokat (SCHILLER ÉS MUNKATÁRSAI , 1987). A menyét colliculus superior felszíni-rétegei topografikusan projektálnak az inferior colliculus brachiumába (BARON ÉS MUNKATÁRSAI , 1998), az SC mély rétegek elsôdleges auditoros bemeneti forrásába (SCHNUPP ÉS KING, 1997). Menyéteknél az ipszilaterális brachium (BIN) és a pericentrális nucleus (ICX) biztosítja az alapvetô auditoros bemenetet. A BIN-bôl érkezô projekció topografikusan szervezôdik az SC rostro-caudális tengelye mentén (KING ÉS MUNKATÁRSAI , 1998a; JIANG ÉS MUNKATÁRSAI, 1993). Az anterográd nyomkövetési eljárások egereknél (WALLACE ÉS FREDENS, 1989) és macskáknál (KUDO ÉS MUNKATÁRSAI , 1984) is kimutatták, hogy a BIN-bôl érkezô afferens rostok behálózzák az SC mély rétegeit, de fôként az SGI-be és SGP-be küldenek projekciókat (KING ÉS MUNKATÁRSAI , 1998a). Baglyoknál a prizmaviselés (a vizuális receptív mezôk átalakítása) megváltoztatja az interaurális idôkülönbség (ITD) hangolást mind az SC-ben, mind pedig az ICX-ben (BRAINARD ÉS KUNDSEN , 1993). Lehet, hogy az emlôs BIN hang-azimut térképe, ami az SC alapvetô, térben elrendezett auditoros bemenetét adja (KING ÉS MUNKATÁRSAI, 1998b), szintén befolyásolható a megváltozott vizuális tapasztalattal, mivel a menyét BIN bimodális neuronokat tartalmaz (SCHNUPP ÉS KING, 1997) és térben szervezôdô projekciót kap az SC mind felszíni, mind pedig mély rétegeibôl (BARON ÉS MUNKATÁRSAI, 1998). Az újszülött menyétek retinális projekciói a talamuszba és az SC-be topografikus szervezôdésûek (JEFFREY, 1985; SNIDER ÉS CHALUPA , 1993) és az abberáns rostok nagyrészt eltûnnek a colliculus superior (SC) retinális végzôdési területein a születés utáni 7. napig (SNIDER ÉS CHALUPA, 1993). Megközelítôleg egy hónappal a születés után már felnôtt-szerû topográfia mutatható ki a felszíni rétegek vizuális térképében (KING ÉS CARLILE, 1994). Az NMDA-receptorok más rendszerekben játszott szerepe azt sugallja, hogy aktivitásuk a colliculus superiorban elôsegíti az ugyanazon térrészrôl érkezô vizuális és auditoros ingerekbôl származó, temporálisan egybeesô aktivitások észlelését. Az auditoros szinapszisok akkor stabilizálódnak, amikor aktivitásuk koordinálódik a konvergáló vizuális afferensekkel. Ezt az elképzelést támasztja alá az a megfigyelés, hogy a vizuális receptív mezôk deviációja - a fiatal menyét szemeinek elmozdításával (KING ÉS MUNKATÁRSAI, 1988) vagy a gyöngybagoly prizma-szemüveggel való felnevelésével (KNUDSEN ÉS BRAINARD, 1991) - kompenzációs elmozdulásokat hoz létre az auditoros reprezentációban, valamint az, hogy az NMDA-receptorok blokkkolása vagy a mintázott vizuális kulcsin-
35
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
gerek deprivációja megnöveli az olyan auditoros egységek számát, amelyek többértelmûen (több mint egy pozícióra) hangoltak (KING ÉS CARLILE, 1993). Az elképzelés ellen szól azonban az, hogy valamilyen kezdetleges auditoros topográfia megmarad a felnôtt állatokban az újszülött korban végrehajtott binokuláris szemhéj-összevarrás után is (KNUDSEN ÉS MUNKATÁRSAI , 1991; WITHINGTON, 1992; KING ÉS CARLILE, 1993) és az NMDA receptor-blokád sem szünteti meg teljesen az auditoros reprezentáció topográfiáját (bár az auditoros egységek azimut-preferenciái erôsen szóródnak, a normális auditoros térképnek megfelelô pozíció körül szóródnak (SCHNUPP ÉS MUNKATÁRSAI, 1995). Az NMDA-receptorok más szerepet is játszhatnak az auditoros térkép fejlôdésében. A monaurális fülkagyló kulcsingerek felelôsek a neuronok auditoros-térbeli szelektivitásáért a neuronok detekciós határértékéhez közeli hangerô szinteken (KING, ÉS MUNKATÁRSAI, 1994), míg az interaurális intenzitáskülönbségek és a külsô fül által létrehozott spektrális kulcsingerek tartják fenn a hangolást növekvô hangintenzitásoknál (CARLILE ÉS KING, 1994; KING ÉS MUNKATÁRSAI, 1994). A fülkagyló eltávolítása után - felnôtt állatoknál - az auditoros reprezentáció topográfiája megmarad, bár sok detekciós határ-érték feletti azimutprofil bilaterálissá válik, tükrözve az interaurális intenzitáskülönbség-kulcsingerek térbeli többértelmûségét (CARLILE ÉS KING, 1994). Azonban ha ugyanazt a sebészeti eljárást fiatal menyéteken végzik el, az auditoros térkép nem fejlôdik ki (KING ÉS CARLILE, 1989). Aktivitás-függô folyamat - feltehetôen az NMDA-receptorok részvételével - játszik szerepet tehát a colliculus superior sejtek adott térrésznek megfelelô monaurális és binaurális lokalizációs kulcsinger-szelektivitásában. Számos fajban azonosítottak olyan neuronokat a colliculus superiorban, amelyek több mint egy modalitás ingerére reagálnak, például a macskában (GORDON, 1973; MEREDITH ÉS STEIN , 1983; PECK, 1987), a majomban (JAY ÉS SPARKS, 1984) és a menyétben (KING ÉS PALMER , 1985). Minden egyes multiszenzoros neuronnak többszörös receptív mezôje van (például egy bimodális vizuális-auditoros neuronnak van egy vizuális és egy auditoros receptív mezôje is). A mély rétegekben a vizuális mellett megtalálható a testfelszín (CHALUPA ÉS RHOADES, 1977; DRAGER ÉS HUBEL , 1976; MEREDITH ÉS MUNKATÁRSAI, 1991; STEIN ÉS MUNKATÁRSAI , 1976; TIAO ÉS BLAKEMORE, 1976) és az auditoros tér (KING ÉS PALMER , 1983; M IDDLEBROOKS ÉS K NUDSEN, 1984; W ISE ÉS IRVINE, 1985) reprezentációja is, amelyeket az agytörzsbôl és a nem elsôdleges szenzoros kérgekbôl (HARTING ÉS MUNKATÁRSAI, 1977; HUERTA ÉS HARTING , 1984; MEREDITH ÉS CLEMO, 1989; WALLACE ÉS MUNKATÁRSAI, 1993a) érkezô afferensek alkotnak. Az SC mély-réteg - ahol a multiszenzoros neuronok találhatóak - afferensei fôleg két kérgi területrôl érkeznek: egy nem-elsôdleges vizuális területrôl a supra-Sylvius sulcus körül, amit laterális supra-Sylvius területnek neveznek (LS; HEATH ÉS JONES, 1971) valamint egy poliszenzoros területrôl, az anterior ectoSylvius sulcusból (AES). A mély-réteg vizuális neuronok bemeneteiket nagyrészt az „elsôdleges” talamo-corticális rendszeren kívüli projekciókból kapják (STEIN ÉS MUNKATÁRSAI, 1983; CLEMO ÉS STEIN , 1984, 1986; MEREDITH ÉS CLEMO , 1989). Csupán csekély retinából és striatumból származó cortico-tectális projekció éri el a mély réteg neuronokat (BERSON ÉS MCILWAIN, 1982; B ECKSTEAD ÉS FRANKFURTER, 1983), ám elsôdleges jelentôségû „extra-striatális” bemenetük a laterális supra-Sylvius kéregbôl (LS; OGASAWARA ÉS MUNKATÁRSAI., 1984; HARDY ÉS STEIN, 1988) és az ecto-Sylvius sulcus vizuális területérôl (MUCKE ÉS MUNKATÁRSAI , 1982). Habár a különbözô multiszenzoros és unimodális neuronok nem mutatnak nyilválvaló elrendezôdési mintázatot a mély rétegekben, szenzoros bemeneteik topografikus elrendezôdést mutatnak számos fajban (GORDON,1973; DRAGER ÉS HUBEL , 1975; STEIN ÉS MUNKATÁRSAI , 1976; TIAO ÉS BLAKEMORE, 1976; CHALUPA ÉS RHOADES , 1977; FINLAY ÉS MUNKATÁRSAI , 1978; STEIN ÉS DIXON, 1979; GRAHAM ÉS MUNKATÁRSAI , 1981; KNUDSEN , 1982; K ING ÉS PALMER, 1983; MIDDLEBROOKS ÉS K NUDSEN, 1984; MEREDITH ÉS S TEIN, 1986a). Az SC mély rétegeiben (a stratum opticumhoz ventrálisan) a vizuális, auditoros és szomatoszenzoros ingerekre, csakúgy mint számos kombinációjukra reagáló neuronok összekeverednek és egyetlen folytonos szövetréteg sincs, amely egyetlen, különálló szenzoros modalitás reprezentációjára szentelôdne. A legtöbb colliculus superior (SC) auditoros receptív mezônek van gátló környezete (Kadunce és munkatársai, 1994; Wallace és munkatársai, 1994), azonban a szenzoros tér legcentrálisabb területein kívül az auditoros izgalmi receptív mezôk igen naggyá válnak. A középvonaltól mediálisan 20-30 fokkal eltérô izgalmi receptív mezôk már olyan laterális határokkal rendelkeznek, amik 120-180 fokra nyúlnak a perifériás szenzoros térbe (Knudsen, 1982; Middlebrooks és Knudsen, 1984; Meredith és Stein, 1986a, 1986b; King és 36
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Hutchings, 1987; Wallace és munkatársai, 1993; Kadunce és munkatársai, 1994). Habár minden vizuális, auditoros és szomatoszenzoros receptív mezônek van izgalmi területe, nem minden modalitás-specifikus receptív mezônek van gátló környezete. Ez a különbség magyarázza azt, hogy az auditoros inger gyakran gátolja a vizuális és a szomatoszenzoros reakciókat, de a fordítottja csak ritkán figyelhetô meg (MEREDITH ÉS STEIN, 1990). Az auditoros receptív mezôknek gyakran van gátló környezete, de a vizuális és a szomatoszenzoros receptív mezôket ritkán veszik körül ilyen zónák (MEREDITH ÉS STEIN , 1990). Valószínû, hogy az auditoros inger gátolja a más modalitásból származó izgalmi bemeneteket. Az auditoros inger, ami gátolja a vizuális vagy a szomatoszenzoros ingerekre adott reakciót, a saját receptív mezôjének izgalmi részére bemutatott auditoros ingerekre adott reakciókat is gátolja (MEREDITH ÉS STEIN , 1990).
1.4.4.1 R ECEPTÍV MEZÔ EGYEZÉS ÉS/ VAGY MEGFELELÉS Az egyes colliculus superior (SC) neuronok vizuális, auditoros és taktilis receptív mezôinek egymáshoz viszonyított helyzete alapján a térbeli egyezés (spatial registry) azt jelenti, hogy az SC-neuron a különbözô modalitásokban ugyanazon térbeli helyrôl származó ingerekre reagál. A térbeli megfelelés ezzel szemben azt jelenti, hogy a multimodális neuronok unimodális receptív mezôi szisztematikus kapcsolatban vannak egymással, de nem szükégképpen a tér ugyanazon pontjának felelnek meg (például amikor a taktilis neuron receptív mezôje a hátsó végtagon van - azaz a látótéren kívül esik - és a vizuális receptív mezôk a vizuális környezet alsó végletén találhatóak, akkor a taktilis és a vizuális receptív mezôk nem véletlenszerûen 37
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
helyezkednek el, de mivel nem azonos térbeli helyen vannak, nincsenek egyezésben). Érzéstelenített macskáknál a vizuális és az auditoros receptív mezôk általában téri egyezésben vannak. A vizuális és az auditoros receptív mezôk térbeli átfedésének területe átlagosan a kisebb receptív mezô 86%-a. A taktilis receptív mezôk az arcon általában a centrális vizuális receptív mezôkkel, míg a lágyék vagy a hátsó testrész taktilis receptív mezôi a periferikus vizuális receptív mezôkkel vannak megfelelésben (MEREDITH ÉS STEIN, 1996). Ezek a reprezentációk topografikusan szervezôdnek és a vizuális, auditoros és taktilis környezet térképeit alkotják. A rostrális részen az auditoros és a vizuális receptív mezôk centrálisan, míg a szomato-szenzoros receptív mezôk az arcon vagy az elsô végtagokon vannak. A caudálisan elhelyezkedô neuronok receptív mezôi periferikusan helyezkednek el a kontralaterális térben, a taktilis receptív mezôk a háton, hátsó végtagokon vagy a farkon vannak. A szenzoros térképek általában megfelelésben vannak a szemmozgások motoros térképével is. 1.4.4.2 TÉRBELI MEGFELELÉS A COLLICULUS SUPERIOR RÉTEGEI KÖZÖTT Az emlôsökben leírt különbözô receptív mezôk közötti térbeli megfelelés (lásd például DRAGER ÉS HUBEL 1975; STEIN ÉS MUNKATÁRSAI, 1976; FINLAY ÉS MUNKATÁRSAI 1978; MCHAFFIE ÉS MUNKATÁRSAI, 1989; MEREDITH ÉS MUNKATÁRSAI , 1991; WALLACE ÉS MUNKATÁRSAI, 1996a; BENEDETTI ÉS FERRO 1995) jellemzô még a hörcsögre (TIAO ÉS BLAKEMORE 1976; CHALUPA ÉS RHOADES 1977; FINLAY ÉS MUNKATÁRSAI , 1978; STEIN ÉS DIXON 1979), az egérre (DRAGER ÉS HUBEL 1975), a patkányra (MCHAFFIE ÉS MUNKATÁRSAI , 1989) és a tengerimalacra is (KING ÉS PALMER 1985). A nem-emlôs fajok optikus tectumában (ami ezeknél a fajoknál az SC homológja) is leírták, beleértve a madarakat (KNUDSEN 1982; K NUDSEN ÉS BRAINARD 1995), a csúszómászókat (HARTLINE ÉS MUNKATÁRSAI , 1978; STEIN ÉS GAITHER 1981) és a halakat (lásd BULLOCK 1984). A receptív mezôk térbeli megfelelésének meghatározásával minden reprezentáció egy neuronpopulációban „letérképezhetô” egy másik modalitás térbeli koordinátáira (STEIN ÉS MUNKATÁRSAI , 1975; KING ÉS PALMER, 1985). Mivel az SC multiszenzoros neuronok domináns természete izgalmi, izgalmi-izgalmi (EE) multiszenzoros konvergencia-formát képviselnek. A szenzoros térképek megfelelésben vannak az SC premotoros térképével is (ROUCOUX ÉS CROMMELINCK 1976; HARRIS 1980; STEIN ÉS MUNKATÁRSAI , 1980; STEIN ÉS CLAMANN 1981; MCILWAIN 1986, 1990), azaz a modalitásközi információ közvetlen orientációs reakciókba fordítható (például szakkadikus szemmozgásokként, lásd HUGHES ÉS MUNKATÁRSAI, 1994; FRENS ÉS MUNKATÁRSAI , 1995): sok SC-neuron szenzoros és motoros reprezentációval is rendelkezik, mivel szenzoros és premotoros jellemzôik vannak (MUNOZ ÉS GUITTON 1985; PECK 1987; GUITTON ÉS MUNOZ 1991; HARTLINE ÉS MUNKATÁRSAI , 1995; PECK ÉS MUNKATÁRSAI , 1995; lásd még WURTZ ÉS ALBANO 1980; S PARKS 1986).
38
DANCZI CSABA LÁSZLÓ : A ZENEI 1.4.4.3 A COLLICULUS
TÉR
SUPERIOR MOTOROS ÉS FIGYELMI SZEREPE
A figyelmi és orientációs rendszerek mûködését megalapozó integráció helye az SC mély réteg (FRENS ÉS MUNKATÁRSAI , 1995; HUGHES ÉS MUNKATÁRSAI, 1994). Fôemlôsöknél a mély-réteg elektromos ingerlése szakkadikus szemmozgásokat vált ki és az itteni neuronokról kimutatták, hogy a szem- és tekintetkontrolhoz kapcsolódó premotoros kapcsolataik vannak (MOHLER ÉS W URTZ, 1976; ROBINSON, 1972; SCHILLER ÉS KOERNER, 1971; SCHILLER ÉS STRYKER, 1972; SPARKS, 1978; WURTZ ÉS GOLDBERG , 1972; HARTING, 1977; M AY ÉS PORTER, 1992; MOSCHOVAKIS ÉS MUNKATÁRSAI, 1988A , B; MEREDITH ÉS STEIN, 1985, 1986B; MEREDITH ÉS MUNKATÁRSAI , 1992; ÁTTEKINTÉSÉHEZ LÁSD HUERTA ÉS HARTING , 1984). Feltehetô, hogy az efferens neuronok reakcióinak erôsítése és gátlása fontos szerepet játszik az orientációs reakció erôsítésében és gátlásában különbözô szenzoros ingerek kombinációi esetében (STEIN ÉS MUNKATÁRSAI , 1988, 1989) és a szenzoros bemenetek konvergenciája hatékony eszköze a különbözô szenzoros rendszerek közös motoros pályákhoz való hozzáférésének (STEIN ÉS MUNKATÁRSAI, 1976; J AY ÉS SPARKS, 1987a, b). Az(SC felszíni rétegében a neuronok jellemzô tüzelési mintázata élénk aktivitás, amit éppen a szakkádok elôtt generálnak. Az aktivitás a szakkád irányától és amplitúdójától függ. A legélénkebb aktivitás akkor mutatkozik, amikor a szakkád oda irányul, ami a sejt úgynevezett mozgási mezôjének középpontja. A mozgási mezôk topografikusan szervezôdnek, az adott helyrôl származó inger által kiváltott szakkád irányának és amplitúdójának megfelelôen. A felszíni SC-léziók - ha frontális szemmezô (FEF) lézióval párosulnak - teljesen megszüntetik a szakkádokat. Azokat az SC-neuronokat, amelyek aktivitást mutatnak nagyjából a szakkádok idején, szakkáddalösszefüggô kitörés-neuronoknak nevezik. Azokat a neuronokat, amelyeknek vizuális és motorossal összefüggô aktivitása van, vizuo-motoros neuronoknak nevezik. Azokat a neuronokat, amelyeknek fenntartott és motoriummal összefüggô aktivitása is van, elô-kitörôknek (prelude-burster) nevezik. Azokat a neuronokat, amelyek valamilyen aktivitást mutatnak a szakkádokkal kapcsolatos aktivitás elôtt, felépítô neuronoknak (buildup neuron) nevezik. Az utóbbi kifejezés azonban nem különösebben találó, mivel tüzelésük állandó szinten marad addig, amíg a szakkáddal kapcsolatos tüzelés be nem következik. A különbözô neurontípusok egymással átfedésben lévô SC neuron-populációk. A mély-réteg (beleértve a közbülsô réteget is) multiszenzoros neuronok alkotják az SC kimeneti neurális hálózatának legfontosabb összetevôjét az agytörzsi és gerincvelô területek felé, amik a szem, a fül, a száj és a fej mozgását kontrolálják (lásd STEIN ÉS MEREDITH 1991). Majdnem minden neuron, ami a keresztezett leszálló projekciós pályán az agyörzsbe és a gerincvelôbe küld szignált, reagál a szenzoros ingerekre is és a legtöbbjük multiszenzoros-integratív tulajdonságokkal rendelkezik (MEREDITH ÉS MUNKATÁRSAI , 1992; WALLACE ÉS MUNKATÁRSAI , 1993b). Az SC-ben a mikro-ingerlés szakkadikus szemmozgásokat vált ki igen rövid latenciával. A kiváltott mozgás iránya és amplitúdója az SC-n belüli ingerlés helyétôl függ. Emlôsök esetében a bal SC jobbra, a jobb SC pedig balra kódol szemmozgásokat. A mozgás mértéke növekszik rostrális-caudális irányban: az SC rostrális pólusán a neuronok a fixációban vesznek részt, az egyre caudálisabb neuronok a szemet, a fület és a fejet egyre kontralaterálisabban irányítják. A felülre irányuló mozgások mediálisan reprezentálódnak, míg a lefelé irányuló mozgások laterálisan. Ésszerû feltételezésnek tûnik, hogy azok az inger-konfigurációk, amelyek megnövelik az inger kiemelkedését az SC-ben, erôsítik a figyelmi és orientációs viselkedéseket is és azok, amelyek csökkentik az inger feltûnôségét, fordított hatással járnak. Macskákat - több kísérleti elrendezésben - arra képeztek, hogy egy célkeresztet nézzenek egyenesen elôttük, majd orientálódjanak egy körpályán rövid idôre felvillanó fényinger felé és azonnal közelítsék meg azt. Néhány állatot arra képeztek ki, hogy közelítsenek meg egy rövid, alacsony intenzitású széles-sávú auditoros ingert, míg másokat arra, hogy ignorálják a hangokat. Amikor a vizuális és az auditoros inger ugyanazon a térbeli helyen volt, az állatok sokkal több helyes választ adtak, mint az a statisztikai predikciók vagy az egyedül bemutatott ingerekre adott helyes válaszok összege alapján elvárható. A helyes válaszok száma szignifikánsan megnôtt minden állatnál, a kiképzés típusától függetlenül. Azonban ha az auditoros ingert úgy mutatták be, hogy az térben eltért a vizuális ingertôl, gátolta a helyes válaszokat és nem csupán az olyan állatoknál, amelyek megtanulták az auditoros inger ignorálását, hanem az olyan állatoknál is, amelyeknek nem mutattak be auditoros ingert a képzés során (GROH ÉS WERNER -REISS, 2002). 39
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.4.4.4 A COLLICULUS SUPERIOR SZENZOROS TULAJDONSÁGAI A colliculus superior (SC) nem csupán motoros struktúra. Az SC közbülsô és mély rétegei három különbözô szenzoros modalitás szenzoros eseményeire reagálnak: a látásra, a hallásra és a tapintásra. Ezek a reakciók szenzorosak abban az értelemben, hogy a szenzoros inger kezdetéhez idô-zártan történnek és nem váltanak ki szemmozgásokat (szakkádokat), azaz a neurális reakciók akkor is lezajlanak, ha az állatot elôzôleg arra képezték, hogy késleltesse szakkádját az inger felé addig, amíg valamiféle „rajta” kulcsingert nem kap. Habár a reakciók leválaszthatóak a szakkádokról, a reakciók sokkal erôsebbek akkor, amikor az állat ezután szakkádot végez az inger irányába, mint amikor az állatot arra utasították, hogy ne vegye figyelembe az ingert. Így a tüzelés a tisztán szenzoros és a tisztán motoros között van: az egyes neuronok szenzoros és motoros tulajdonságokkal is rendelkeznek. A térben elöl elhelyezkedô kulcsingerek (a test elején) a rostrális SC-neuronokat aktiválják, míg a hátsó térbeliek (azaz perifériásak) a caudális SC-neuronokat. Az állat feletti, vagy felsôtestén levô kulcsingerek a mediális SC-neuronokat aktiválják, míg az alsó szenzoros térbeliek a laterális SC-neuronokat. A neuronok multiszenzoros tulajdonságait vizsgáló kísérleteket általában érzéstelenített, lebénított állatokon végezték. Ilyen körülmények között a sejtek motoros tulajdonságai nem határozhatóak meg pontosan. Az adatok azonban azt jelzik, hogy az érzéstelenített állatokban tanulmányozott multimodális sejtek részét képezik azon sejtpopulációknak, amelyek motoros aktivitást mutatnak az éber állatokban (GROH ÉS WERNER -REISS, 2002):
40
DANCZI CSABA LÁSZLÓ : A ZENEI 1.4.4.5 MULTISZENZOROS INTEGRÁCIÓ A COLLICULUS
TÉR
SUPERIORBAN
A colliculus superior (SC) sok (de nem mindegyik, lásd JONES ÉS POWELL , 1970) multiszenzoros neuronja képes arra, hogy az egyes szenzoros bemeneteket egyetlen integrált produktummá alakítsa - ezt a jelenséget nevezik multiszenzoros integrációnak. Az integráció számos tényezô komplex kapcsolatától függ, többek között az ingerek relatív idôzítésétôl: a túl nagy idôeltéréssel bemutatott ingerek független eseményeknek minôsülnek. Azonban a „temporális ablak”, amelyen belül a multiszenzoros interakciók elôfordulnak, meglepôen hosszú (MEREDITH ÉS MUNKATÁRSAI , 1987; WALLACE ÉS S TEIN 1994): a legtöbb SC-neuron az ingerkezdetek 100 ms-os aszinkróniáit is tolerálja, némelyik a 200 ms-os aszinkróniát is megengedi, sôt van olyan is, ami több mint fél szekundumos temporális ablakkal rendelkezik (MEREDITH ÉS MUNKATÁRSAI , 1987). Az ingerkombináció térbeli viszonyai is meghatározóak a multiszenzoros integrációban. Mivel a multiszenzoros neuronok különbözô receptív mezôi térbeli megfelelésben vannak egymással (KADUNCE ÉS MUNKATÁRSAI , 1997; MEREDITH ÉS S TEIN, 1986b, 1996; WALLACE ÉS MUNKATÁRSAI, 1996), azok az ingerkombinációk, amelyek térben egybeesnek, az izgalmi receptor-területekre esnek és így reakció-növekedést hoznak létre. Amikor kettô, vagy annál több különbözô modalitású szenzoros inger szoros temporális és térbeli közelségbe kerül, az ingerkombináció a multiszenzoros SC-neuronok aktivitásának jelentôs növekedésével jár (amiben az impulzusok számának 10-szeres vagy még nagyobb megnövekedése is elôfordul az egyedül bemutatott ingerekhez képest, lásd KING ÉS PALMER 1985; KADUNCE ÉS MUNKATÁRSAI, 1997; M EREDITH ÉS STEIN, 1983, 1986a, 1996; WALLACE ÉS MUNKATÁRSAI , 1996) és olyan viselkedésekhez vezet, amikhez a neuronok aktivitása hozzájárul (STEIN ÉS MUNKATÁRSAI , 1989; FRENS ÉS MUNKATÁRSAI, 1995; W ILKINSON ÉS MUNKATÁRSAI , 1996). A reakció integrálásának ezt a formáját multiszenzoros növekedésnek nevezik (MEREDITH ÉS STEIN , 1986a). A jelentôs térbeli eltéréssel bemutatott ingerek azonban multiszenzoros reakcióelnyomást váltanak ki. Ilyenkor az élénk válasz az unimodális ingerre jelentôsen lecsökken, vagy akár meg is szûnik egy más modalitásban bemutatott inger jelenlétében (MEREDITH ÉS STEIN 1996; WALLACE ÉS MUNKATÁRSAI, 1996; K ADUNCE ÉS MUNKATÁRSAI, 1997). Multiszenzoros elnyomás váltható ki sok olyan neuronban, amely multiszenzoros növekedést mutat és az elnyomással a nyílt viselkedések is eltûnnek (STEIN ÉS MUNKATÁRSAI , 1989; W ILKINSON ÉS MUNKATÁRSAI , 1996). De mi történik akkor, ha a multiszenzoros neuronok különbözô receptív mezôi nincsenek egymással fedésben? Habár ez különösen ritka jelenség a normális állatokban, találtak multiszenzoros neuronokat a majom SC-ában nem-átfedô receptív mezôvel (STEIN, 1998). A neuron nem-átfedô szomatoszenzoros-auditoros receptív mezôi lehetetlenné tették, hogy a térben egyezô szomatoszenzoros és auditoros ingerek egyidejûleg essenek receptív mezôin belülre: amikor az egyik inger a receptív mezôn belülre esik, a másik azon kívül kerül. A térben egybeesô multiszenzoros ingerlés ezeknél a neuronoknál nem eredményez reakciónövekedést. Amikor azonban a két ingert úgy helyezik el (térben elválasztva egymástól), hogy mindkettô a megfelelô receptív mezôre essen, a neuronok nem ingernövekedést, hanem ingerelnyomást mutatnak. Ez a mechanizmus biztosítja, hogy az olyan ingerek, amelyek térben eltérnek (nem összefüggôek), elnyomják egymást még olyankor is, amikor véletlenül ugyannak a multiszenzoros neuronnak az egymással nem-átfedô izgalmi receptív mezôire esnek. A temporális és térbeli korlátok szûrôként, vagy „ablakként” mûködnek, amelyen keresztül csupán a megfelelôen konfigurált ingerkombinációk jutnak a multiszenzoros reakció-erôsítést kiváltó neurális hálózatokhoz. Jellemzô, hogy a növekedés akkor a legnagyobb, amikor az unimodális ingerek gyengék vagy többértelmûek, azaz nehéz az észlelésük. Az inverz-hatékonyság elvének megfelelôen (MEREDITH ÉS STEIN 1986A ; STEIN ÉS MEREDITH , 1993) azok az ingerek, amelyek maximálisan hatékonyak amikor egyedül mutatják be ôket, gyakran kevés, vagy semmilyen reakció-erôsítést nem váltanak ki, míg az olyan ingerek, amik önmagukban alig detektálhatóak, a legnagyobb reakció-növekedést produkálják. Befolyásolják még a multiszenzoros integrációt a neuron(ok) modalitás-specifikus reakció-tulajdonságai is (például irány- vagy sebességpreferencia, intenzitás stb., lásd STEIN ÉS MUNKATÁRSAI , 1993). Ezek a meghatározó tényezôk nem csak aSC-neuronokban meghatározóak, hanem az agykéreg neuronjaiban is és talán minden más olyan területen, ahol izgalmi-izgalmi multiszenzoros konvergenciát dokumentáltak 41
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
(WALLACE ÉS MUNKATÁRSAI, 1992). Ugyanazok a tényezôk, amelyek a neuronok szintjén meghatározzák a multiszenzoros integrációt, a multiszenzoros viselkedésekben is mûködnek (például a detekcióban, az orientációban és a figyelemben; STEIN ÉS MUNKATÁRSAI , 1988, 1989). 1.4.4.5.1 A MULTISZENZOROS INTEGRÁCIÓ FEJLÔDÉSE A COLLICULUS SUPERIORBAN A multiszenzoros neurális folyamatok és az általuk kiváltott viselkedések csak fokozatosan fejlôdnek ki. A kismacskák csupán kevés olyan viselkedéses készséget mutatnak a multiszenzoros kulcsingerekkel kapcsolatban, amilyenek a felnôtt macskákat jellemzik. Születésekor az állat nem reagál a vizuális vagy auditoros ingerekre. Habár az arc taktilis ingereit használják a szopás beindítására (LARSON ÉS STEIN 1984), a taktilis ingerekre dezorganizált reakciót mutatnak. A colliculus superior (SC) neuronjai nem reagálnak a vizuális vagy az auditoros ingerekre és csupán kevés reagál közülük a szomato-szenzoros kulcsingerekre (STEIN ÉS MUNKATÁRSAI ,. 1973). A szenzoros reakcióra kész SC-neuronok elôfordulási gyakorisága azonban fokozatosan nô macskáknál. A születés után nagyjából 5 nappal néhány neuron már reagál az auditoros kulcsingerekre és körülbelül a születés utáni 3. héten a multiszenzoros-réteg neuronjai reagálnak a vizuális bemenetekre is (WALLACE ÉS STEIN 1997). Ezeknek a korai szenzoros neuronoknak kivételesen nagy receptív mezôik vannak és nagyon kevés multiszenzoros neuron van közöttük. Az ilyenkor található néhány multiszenzoros neuron képtelen a különbözô szenzoros bemenetek integrálására, azaz a reakciók növelésére vagy csökkentésére. Habár a majom sokkal érettebb születésekor mint a kismacska, az újszülött majom SC multiszenzoros neuronjai sem képesek normális multiszenzoros integrációra és meglehetôsen hasonlóan reagálnak, mint az éretlen SC-neuronok a macskában (lásd WALLACE ÉS MUNKATÁRSAI , 1995). A szenzoros kulcsingerek kombinációira adott reakciók az újszülött SC-neuronokban csak kevéssé térnek el a modalitás-specifikus komponenseikre adott reakcióktól (WALLACE ÉS STEIN 1997), az SC által kiváltott viselkedések felerôsödése a multiszenzoros kulcsingerekre még nem jelenik meg fiatal állatokban. Macskáknál a helyzet az elsô hónap végén változik meg. Ilyenkor már legalább néhány SC-neuronnak térben behatárolt receptív mezôje van és egészen úgy integrálja a modalitásközi kulcsingereket, mint a felnôtt, azaz jelentôs reakciónövekedést mutat, amikor az ingerek térben egybeesnek és ingercsökkenést, amikor a kulcsingerek térben eltérnek. A következô két hónap során az ilyen neuronok elôfordulási gyakorisága fokozatosan megnô egészen addig, amíg felnôtthöz hasonló arányokat nem érnek el. A majdnem-felnôtt multiszenzoros integrációval rendelkezô neuronok abban különböznek az érett neuronoktól, hogy az integráció temporális ablaka jóval kisebb (a szenzoros ingerek nagyon szoros idôbeli közelségben kell, hogy legyenek), ám reakciónövekedésük/-csökkenésük nagysága, valamint a multiszenzoros integráció tér- és fordított-hatékonyság-elvének alkalmazása meglehetôsen fejlettnek tûnik náluk. A multiszenzoros integráció gyors kialakulását a neuronokban a funkcionális anterior ecto-Sylvius sulcus (AES) és az SC közötti kapcsolatok fejlôdése teszi lehetôvé. Más cortiko-tectális hatásokról is kimutatták, hogy hirtelen indulnak be (lásd STEIN ÉS GALLAGHER 1981); ráadásul a hasonlóság az éretlen multiszenzoros SC-neuronok és az AES befolyásától megfosztott felnôtt állatok multiszenzoros neuronjai között szintén ezt az elképzelést támasztja alá.
42
DANCZI CSABA LÁSZLÓ : A ZENEI 1.4.5 L OKALIZÁCIÓS KULCSINGEREK ÉS FAJOK KÖZÖTTI
TÉR
HASONLÓSÁG
A gyöngybagoly pericentrális nucleusának (ICX) térbeli térképe volt az elsô topografikus auditoros tér reprezentáció, amit felfedeztek (KNUDSEN ÉS KONISHI 1978), több évvel a gyöngybagoly optikus tectumának (KNUDSEN 1982) és a tengerimalac colliculus superiorának (PALMER ÉS KING 1982) leírása elôtt. Az évek során a neurális kapcsolódások összes lényeges elemét - ami meghatározhatja a tér-reprezentációkat a gyöngybagolyban - kinyomozták és jellemezték. Ez a siker inspirált sok kísérletet arra, hogy párhuzamot találjanak a gyöngybaglyok és az emlôsök között. Ám miközben nyilvánvaló párhuzamok léteznek, sok fontos különbség is van, ami komolyan korlátozza a gyöngybagoly modellként való használhatóságát az emlôs hanglokalizációra. 1.4.5.1 A GYÖNGYBAGOLY ASZIMMETRIKUS
FÜLEI
A gyöngybaglyok és emlôsök közötti különbség az akusztikus periférián kezdôdik. Míg a legtöbb állatnak szimmetrikus külsô fülei vannak, a gyöngybagoly fülei aszimmetrikusak. Ez az aszimmetria azt okozza, hogy az interaurális intenzitáskülönbségek (magas frekvencia) lényegében a hangforrás magasságától függenek és csak kevéssé változnak az azimuttal. Az interaurális idôkülönbség kulcsingereket kevésbé befolyásolja az aszimmetria, így ezek az azimut függvényében változnak. Az elrendezésnek köszönhetôen az interaurális idô- és intenzitáskülönbség kulcsingerek gyakorlatilag egy rácsszerû, két-dimenziós koordináta rendszert alkotnak. Az interaurális idô- és intenzitáskülönbségek a bagolyban egymástól függetlenül dolgozódnak fel, független neurális pályákon. Az emlôsök is mutatják az interaurális idô- és intenzitáskülönbség feldolgozási pályák némi szétválását, de a pályák specializációja nem olyan egyértelmû és csupán a gyöngybagoly esetében jelenti ez a munkamegosztás az auditoros tér különbözô dimenzióinak külön feldolgozását. 1.4.5.2 AZ IDÔ-PÁLYA A gyöngybagoly nucleus magnocellularisából - amit az emlôs anteroventrális cochleáris nucleus (AVCN) homológjának tartanak (KONISHI 1988) - a neuronok továbbítják a fázis-információt a kétoldali nucleus laminarishoz. A két fülbôl érkezô fázis-információk konvergálnak a laminaris neuronokon, amelyek szenezitívek az interaurális idôkülönbségekre (MOISEFF ÉS KONISHI 1983). Az interaurális idôkülönbség-preferenciák topografikusan képezôdnek le a laminaris dorzo-ventrális tengelye mentén (CARR ÉS KONISHI 1990). Az interaurális idôkülönbség-reprezentáció az agy két oldalán található magnocellularisból származó axonok geometriájából származik. Az ipszilaterális magnocellularis axonok a dorzális, a kontralaterális axonok a ventrális oldalból indulnak ki. Ez az elrendezés hasonló a JEFFRESS (1948) által proponált „késésvonal- és koincidencia-detektor modellhez” (lásd késôbb). A laminaris neuronjait „EE” neuronokként osztályozzák, azaz mindkét fül ingerlése izgatja ôket: erôs binaurális erôsítést mutatnak és leginkább a két fülbôl származó bemenet pontos szinkronjára reagálnak. Mivel az ipszilaterális fül impulzusai késnek - mert a ventrális oldalhoz átkapcsolás után jutnak -, a ventrális neuronok legjobban a viszonylag nagy interaurális idôkülönbségekre reagálnak, ahol az ipszilaterális fül „sietését” kiegyenlíti a nagyobb axonális késés. A dorzális pozíciók felé haladva az axonális késés - és ennek következtében a preferált interaurális idôkülönbség is - csökken. Emlôsöknél az interaurális idôkülönbségekrôl azt tartják, hogy majdnem pontosan ugyanígy dolgozódnak fel a mediális oliva superiorban (MSO), ami mind fiziológiájában, mind pedig kapcsolatrendszerében hasonlít a laminarisra (GOLDBERG ÉS BROWN 1969; Y IN ÉS CHAN 1990). A mediális oliva superior szintjén felül azonban a bagoly és emlôs között a homológia kevésbé találó. Gyöngybagolyban a lamináris idôkülönbség-információja - topografikus projekción keresztül - arra a területre vetül, amit eredetileg nucleus mesencephalicus laterale pars dorsalisnak (MLD) neveztek. KNUDSEN (1983) anatómiai alapon amellett érvelt, hogy ez a nucleus az emlôs colliculus inferior (IC) megfelelôje és azóta ezt a területet általában így is nevezik. TAKAHASHI ÉS KONISHI (1988) kimutatta, hogy az IC (azaz az MLD) centrális nucleusa (ICC) a kontralaterális laminarisból kapja bemenetét. Következésképpen az ICC is tartalmazza az interaurális-idôkülönbség-hangolás reprezentációját, ami a tonotopikus reprezentációra 43
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
merôleges. A központ az IC laterális héjára, a laterális héj pedig egy olyan területre küld projekciót, amit eredetileg „az MLD térbeli térkép régiójának” neveztek. KNUDSEN (1983) szerint ez a régió az emlôs IC pericentrális nucleusának (ICX) homológja és ma az emlôs kifejezést (ICX) használják széles körben a baglyokról szóló irodalomban. Azonban kétség is felmerült a feltételezett homológiával kapcsolatban (CALFORD ÉS MUNKATÁRSAI , 1985; IRVINE 1992). A projekciók mentén - az ICC-bôl a laterális héjon át az ICX-be (azaz az MLD térbeli térkép régiójába) - az idôkülönbség-információ a különbözô izo-frekvenciás laminákból konvergál (KNUDSEN 1983; TAKAHASHI 1989) és a fázis ambiguitások feloldódnak (WAGNER ÉS MUNKATÁRSAI , 1987), részben a frekvenciacsatornák konvergenciája miatt, részben pedig egy „nem lineáris” folyamat miatt, amiben GABA-erg gátlás is szerepet játszik (TAKAHASHI ÉS KONISHI 1986; FUJITA ÉS KONISHI 1991). Az ICX (azaz az MLD térbeli térkép régiója) végül topografikus projekciót küld az optikus tectumba (KNUDSEN ÉS KNUDSEN 1983), ami a colliculus superior homológja. Emôsökben is van egy projekció a mediális oliva superiorból (MSO) az IC-be, de az emlôs projekció ipszilaterális, míg gyöngybagolyban a projekciók a laminarisból keresztezettek. Ráadásul, bár interaurálisidôkülönbség-szenzitív neuronokat találtak az emlôs ICC-ben (AITKIN ÉS MUNKATÁRSAI, 1985; YIN ÉS MUNKATÁRSAI , 1986), egyetlen beszámoló sem létezik topográfiájukról. A gyöngybagolyokról tudjuk, hogy fázis-zárnak teljes frekvenciatartományukban, egészen 9 kHz-es frekvenciáig. Az emlôsök ezzel szemben az ingerkezdet- és burkológörbe-idôkülönbségek információját használják az interaurális idôkülönbségek komputálásához a magas frekvenciájú összetevôk esetében. Némely magas-frekvenciájú neuron az ICC-ben képes a burkológörbe interaurális idôkülönbségét detektálni. Egy olyan mechanizmust használnak, ami hasonló ahhoz, amit a fázis-szenzitív izgalmi-izgalmi (EE) neuronok használnak az MSO-ban vagy a laminarisban, de ez inkább az inger burkológörbe-modulációiban detektálja az egybeesést és nem az egyes frekvenciaösszetevôk fázisában (YIN ÉS MUNKATÁRSAI, 1984; BATRA ÉS MUNKATÁRSAI, 1989). Talán a legfontosabb interaurális idôkülönbség-feldolgozási eltérés a gyöngybagoly és az emlôsök között az, hogy az interaurális idôkülönbség az azimut domináns kulcsingere a gyöngybagoly optikus tectumában, ám lehet, hogy semmilyen szerepet sem játszik az emlôs SC receptív mezôinek formálásában. Interaurális-idôkülönbség-szenzitív neuronokat találtak a macska SC-ben (HIRSCH ÉS MUNKATÁRSAI, 1985), ám ezek a neuronok általában csak jócskán a normális fiziológiai sávon kívüli idôkülönbségekre szenzitívek.
44
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.4.5.3 AZ INTENZITÁS -PÁLYA A bagoly intenzitás-pályája a nucleus angularisról indul, ami a hangintenzitás kódolására specializálódott. Az innen érkezô axonok a kontralaterális ventralis lemniscus laterális pars posterior nucleus hoz (VLVp) küldenek projekciót. A kétoldali VLVp-k kölcsönös gátló kapcsolódást alkotnak (TAKAHASHI ÉS KELLER 1992), ami „EI” binaurális neuronokat eredményez, azaz az ipszilaterális fül ingerlése gátolja, míg a kontralaterális fül ingerlése izgatja ôket, vagyis csak akkor reagálnak, ha az izgalmi szint a kontralaterális fülbôl meghaladja a gátlásét az ipszilaterális fülbôl. Más szóval ezek a neuronok interaurális intenzitáskülönbség-szenzitívek és az a minimális interaurális intenzitás-különbség, aminél reagálni kezdenek, az izgalom és a gátlás kölcsönhatásától függ. A VLVp-ben a neuronok topografikusan szervezôdnek (MANLEY ÉS MUNKATÁRSAI , 1988). A VLVp nucleus bilaterális gátló projekciót küld a gyöngybagoly IC (azaz MLD) laterális héjához, ahol az intenzitás- és az idôpálya konvergál. A bilaterális bemenet miatt némelyik neuron interaurális intenzitáskülönbség-görbéje a laterális héjon csupán az interaurális intenzitás-különbségek viszonylag kis tartományára reagál (ADOLPHS 1993). Az emlôs intenzitás-pálya elsô pillantásra hasonlónak tûnik a bagolyban leírthoz. A laterális oliva superior (LSO) hasonló szerepet játszhat a VLVp-hez, elsô integráló központként egy interaurális intenzitáskülönbség-feldolgozási pályán (MOGDANS ÉS KNUDSEN 1994), mivel sok olyan neuront tartalmaz, ami gátló-izgalmi (IE) binaurális interakciókat mutat és szigmoid interaurális intenzitáskülönbség-szenzitivitási profilja van. Ám számos különbség van az LSO és a VLVp között. Az LSO és a VLVp hasonlóságai inkább a párhuzamos evolúcióból származnak és nem valódi filogenetikai homológiák. A VLVp valódi homológja az emlôsben a lemniscus laterális dorzális nucleusa (DNLL) is lehet, ami szintén túlnyomórészt EI neuronokat tartalmaz (BRUGGE ÉS MUNKATÁRSAI , 1970) és reciprok módon kapcsolódik az ellenoldali DNLL-el (GLENDENNING ÉS MUNKATÁRSAI , 1981). Az interaurális intenzitáskülönbség-szenzitivitás topográfikus térképét sem demonstrálták még az LSO-rban vagy a DNLLben. A VLVp bemenetét olyan cochleáris nucleusokból kapja, amik a hangintenzitás - és nem a fázis kódolására specializálódtak. Az emlôs LSO bemenetei - csakúgy mint az MSO-é - az anteroventrális cochleáris nucleus (AVCN) gönbszerû bozótos (spherical bushy) sejtjeirôl származnak. A gömbszerû bozótos sejtek nagyon nagy, biztonságos szinapszisokon - a „Held-féle végbunkókon” - keresztül kapják auditoros idegrost bemeneteiket és arra specializálódtak, hogy pontosan továbbítsák az idôzítési információt. Az LSO izgalmi bemenetét az ipszilaterális és nem a kontralaterális cochleáris nucleusból kapja, míg a gátló bemenet egy speciális átkapcsoló nucleus, a trapéz test (corpus trapezoideum) mediális nucleusán (MTB) keresztül, nem a kontralaterális LSO-n keresztül érkezik. Az MTB átkapcsoló neuronjaira illeszkedô szinapszisok - a „Held-féle kelyhek” - még nagyobbak, mint az AVCN végbunkói. A két bemeneti forrás ezért feltehetôen a tüskék idôzítését továbbítja az LSO-nak az auditoros idegrostokban. Ám az IE neuronok reakcióját nemcsak az izgalmi és gátló bemenetek viszonylagos ereje szabályozza. Ha az izgalmi bemenet idôben megelôzi a gátlót, még akkor is képes a sejt aktiválására, ha a gátlás egyidejû érkezésekor a reakció legátlódna. Az LSO-neuronok az interaurális intenzitáskülönbségekre és az interaurális idôkülönbségekre is szenzitívek. CAIRD ÉS KLINKE (1983) olyan LSO-neuronokat talált a macskában, amiknek az interaurális intenzitáskülönbség görbékhez hasonló, szigmoid interaurális intenzitáskülönbség görbéi voltak. Ezek a neuronok szignifikáns reakcióváltozásokat mutatnak az interaurális idôkülönbségek fiziológiai sávján belül. Az idô- és intenzitás-pályák szétválása az emlôsben tehát nem olyan egyértelmû, mint amilyenrôl a gyöngybagolynál beszámoltak. Jó oka lehet ennek. Bagolyban az interaurális idô- és intenzitáskülönbség fôként mint elkülönült kulcsingerek szolgálnak az auditoros tér különbözô dimenzióihoz; emlôsnél azonban együtt változnak az azimut és eleváció (a vízszintes síktól való eltérés) függvényében. Az LSO - mint a gyöngybagoly VLVp-je is - az ipszilaterális IC-be küld projekciót, míg emlôsben ez a projekció túlnyomórészt kontralaterális. Az emlôs colliculus inferior EI-neuronjai gyakran szigmoid interaurális intenzitáskülönbség görbével rendelkeznek, de némelyik csak korlátozott sávú interaurális intenzitáskülönbséget preferál. Interaurális intenzitáskülönbség görbéik maximuma a kontralaterális izgalmi bemenetre adott nem-monoton reakciószint 45
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
és az ipszilaterális gátlás összejátékából származik (IRVINE, 1987), ami nagyon különbözô mechanizmus a gyöngybagoly-IC laterális héjánál feltételezettôl. Az emlôs intenzitás pálya úgy tûnik, hogy komplikáltabb és kevésbé specializiált, mint a gyöngybagolyban leírt. Habár az LSO az IC-be küld projekciót, némely interaurális intenzitáskülönbség-szenzitivitás, amelyet itt látunk, lokálisan is keletkezhet (IRVINE ,1992). Ráadásul emlôsben az interaurális intenzitáskülönbség kulcsingerek feldolgozása nem csupán az EI-interakciókat mutató sejtek feladata. Olyan sejteket is leírtak az IC-ben (BENEVENTO ÉS MUNKATÁRSAI, 1970) és az SC-ben (WISE ÉS IRVINE , 1984), amik erôs preferenciát mutatnak a nullához közeli interaurális intenzitáskülönbségek felé. Az interaurális intenzitáskülönbség-szenzitivitás topografikus térképét leírták a bajszos denevér (moustache bat) IC-jének megnagyobbodott 60 kHz-es régiójában (W ENSTRUP ÉS MUNKATÁRSAI , 1985), ám semmilyen hasonló topográfiáról nem számoltak még be a „konvencionálisabb” auditoros rendszerû emlôsök IC-jében.
46
DANCZI CSABA LÁSZLÓ : A ZENEI 1.4.6 A COLLICULUS
TÉR
SUPERIOR ÉS INFERIOR KAPCSOLATA
Az érzékelô rendszerek fontos feladata jelezni, hogy hol helyezkedik el az észlelt inger. A vizuális rendszer számára a feladat - legalábbis kezdetben - egyszerû. A vizuális-tér két-dimenziós retinális térre vetül és e térnek a topográfiája megmarad a retinától a talamuszba és a középagyba tartó projekciókban. A laterális geniculatum a retinális tér térképét - emlôsök esetében - a vizuális kéregbe továbbítja, ahol a retina-központú koordinátarendszer számos vizuális területen megmarad. Hasonló közvetlen kapcsolat van a receptorok elrendezése és az inger-helyzet között legalábbis a szomatoszenzoros feldolgozás korai szakaszán. Azokat a térképeket, amelyek az inger helyzetére vonatkozó információt a perifériás receptorok elrendezésének megfelelôen tartalmazzák, projekciós térképeknek nevezik (KING AND SCHNUPP, 1999). Ezzel szemben az auditoros tér nem jelenik meg közvetlenül az auditoros receptorok elrendezésében, ami következetesen az auditoros inger frekvencia-összetevôi alapján történik. A hangok térben való elhelyezkedése számos kulcsingerbôl komputálódik, különösen a binaurális intenzitás- és fázis-különbségekbôl, valamint a fül irányfüggô szûrésébôl származó spektrális kulcsingerekbôl (lásd COHEN ÉS KNUDSEN , 1999). Ezeket a kulcsingereket használja az auditoros rendszer az auditoros-tér komputációs térképének kialakítására (KNUDSEN ÉS MUNKATÁRSAI, 1987) az inferior colliculus pericentrális magjában (ICX) ami madarak esetében az optikus tektumba (OT), emlôsök esetében a superior colliculusba (SC) küld projekciót. Az auditoros térkép általában megfelel a retinális (de nem a fej-helyzet) térképnek (KNUDSEN ÉS BRAINARD, 1995; KING ÉS SCHNUPP, 1999). Az SC-mély-rétegek premotoros térképet alkotnak a reflexes szem- és fejmozgások irányítására, amelyek a vizuális, az auditoros vagy a tapintási ingerekre irányuló vizuális fixációt eredményeznek. A motoros-viselkedés gyorsan kalibrálódik a vizuális térképhez egy visszacsatolással (hibajelek segítségével), úgyhogy a vizuális fixáció, hozzányúlás és más motoros viselkedések pontosak (pl. lásd CLOWER ÉS MUNKATÁRSAI , 1996). Az auditoros-tér komputációs térképét - ami a fej és a fülek, nem a szem helyzetének megfelelôen változik - olyan auditoros térképpé kell átalakítani, ami megfelel a retina térképének. Ez a feladat egyszerûnek látszik némely specializált vizuális ragadozó - például a baglyok - számára, mivel a szemek mozgása erôsen korlátozott és így a teintet iránya csak a fejmozgásoktól függ (KNUDSEN , 1999). Azonban kisebb szemmozgások náluk is elôfordulnak és az auditoros térképet ilyenkor a vizuális térképhez kell illeszteni. A kalibráció tulajdonképpen két különbözô folyamatból áll. Elôször az auditoros térképet össze kell hangolni a vizuális térképpel és ez úgy tûnik, hogy lassú fejlôdési folyamat eredménye. Ráadásul ezt az illeszkedést gyakran és gyorsan frissíteni kell, amikor a szem mozog. A baglyok ICX-ében van egy auditoros-tér térkép és ezt a térképet használják az optikus tectummal és más struktúrákkal való kapcsolaton keresztül, hogy a fejet és a szemeket úgy orientálják, hogy az a fontos hangokra fixáljon. HYDE ÉS KNUDSEN (2000) szerint az optikus tectum (madarak) vagy a SC (emlôsök) felszíni rétegei rendezett topografikus bemeneteket kapnak a kontralaterális - és fajtól függôen az ipszilaterális - retinából, ami a vizuális tér retinotopikus térképét alkotja. Az optikus tectum (vagy az SC) mély rétegei multimodális premotoros térképet hoznak létre, ami reflexes fej és szemmozgásokat indít a változó vizuális tárgyak, hangok és testi érintkezések vizuális követésére. Az auditoros bemenetek az ICX-ben súlyozódva alkotják az auditoros-tér komputációs térképét. Az ICX projekciókat küld az optikus tectum (vagy SC) mélyebb, vizuo-motoros rétegeibe. Az optikus tectum (vagy SC) felszíni rétegeibôl at információ a mély- rétegeket rendezett mintázatban éri és vizuo-motoros térképet alakít ott ki, amelynek a kimenete az agytörzsi motoros és premotoros neuronok felé szem- és fejmozgásokat indít, hogy a szemet arra a térbeli helyre fixálja, ahol az aktivitás központját jelezték a a vizuomotoros rétegek. Az ICX-ben az auditoros-tér térképét alkotó neuronok topografikus projekciót küldenek az optikus tectum (vagy SC) mélyebb rétegeibe, ahol az auditoros tér térképe fedésbe kerül a vizuomotoros térképpel. A térbeli hangok észlelése ugyanolyan tekintet-elmozdulásokkal jár, mint a vizuális objektumoké, amennyiben az auditoros tér-térképe pontosan illeszkedik a vizuális-tér térképéhez. HYDE ÉS KNUDSEN (2000) szerint a kalibrációs jelzés az optikus tectum (vagy SC) középsô rétegeibôl származik, ahonnan a neuronok projekciót küldenek az ICX-be. A középsô-réteg-neuronok radiális dendrit47
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
jei elérnek a felszíni rétegekig (a retinális vizuális-térképig), valamint a mélyebb rétegekig (a multimodális vizuo-audio-motoros térképig). Mivel az auditoros és vizuális térképek egyezésére és eltérésére szenzitívek, a középsô-rétegek neuronjai olyan szignálokat biztosítanak, amelyek megváltoztatják az auditoros térképet az ICX-ben, hogy az illeszkedjen a vizuális térképhez az optikus tectum (vagy SC) felszíni rétegében. Az ICX-ben az auditoros-térkép-összehangolás nagyrésze a fejlôdés korai állomásán megtörténik (KUDSEN ÉS BRAINARD, 1995; KNUDSEN , 1999). Amikor a fiatal baglyok olyan prizmát hordanak, ami eltolja a vizuális térképet, az auditoros térkép egy hét alatt átállítódik, hogy illeszkedjen az eltolt vizuális térképpel az optikus tectumban. Ugyanaz a vizuális eltolás felnôtt bagyolynál nem vezet az auditoros térkép hasonló eltolódásához. Azokban a fiatal baglyokban, amiket prizmával neveltek fel, az eredeti auditoros térképet közvetítô kapcsolatok megmaradnak az új kapcsolatokkal együtt, amik a megváltozott auditoros térképet közvetítik, mivel az ilyen baglyok vissza tudnak térni a normális auditoros viselkedéshez, miután a prizmákat eltávolították, ráadásul késôbb gyorsan alkalmazkodnak az újra alkalmazott prizmához még felnôttkorban is (KNUDSEN, 1998). Az auditoros középagy nem az egyetlen hely, ahol a hang helyzetérôl szóló információ feldolgozásra kerül. Az IC projekciói eljutnak az auditoros talamuszig, ahol átkapcsolódnak - emlôsök esetén - az auditoros kéreg elsôdleges területeire, madarak esetében a megfelelô struktúrákra. Az auditoros kéreg kiterjedt bilaterális lézióiról régóta tudjuk, hogy súlyosan lerontja a hang-lokalizációs viselkedéseket macskáknál (lásd JENKINS ÉS MERZENICH, 1984 áttekintésükre) és majmoknál (HEFFNER ÉS HEFFNER , 1990). Ezek az eredmények azt sugallják, hogy az ilyen lézión átesett állatok többé nem úgy észlelik a hangokat, mint amelyeknek térbeli helyzetük van (lásd HEFFNER ÉS HEFFNER , 1990). A macskák azonban az auditoros kéreg bilaterális léziói után is orientálódnak az auditoros ingerek felé, bár kevésbé következetesen és pontosan (T HOMPSON ÉS MASTERTON, 1978; BEITEL ÉS KAAS, 1993), ezért úgy látszik, hogy a hang-helyzet észlelésének a neurális mechanizmusai nagymértékben - de nem teljesen függetlenek azoktól a mechanizmusoktól, amelyek az olyan mozgásokat közvetítik, amelyek a látást a hangforrásra fixálják. Az auditoros kéreg hozzájárul a középagyi orientációs mechanizmushoz - feltehetôleg az IC-be tartó közvetlen projekció révén (például FITZPATRICK ÉS IMIG, 1978; ANDERSEN ÉS MUNKATÁRSAI , 1980; LUETHKE ÉS MUNKATÁRSAI , 1989). Meglepô, hogy nem tudunk semmilyen auditoros-tér térképrôl az auditoros kéregben. Azonban léteznek hang-helyzetre érzékeny neuronok, ezért MIDDLEBROOKS (1999) szerint a hang-lokalizációs információt olyan neuron-populációk tartalmazzák, amelyek el vannak osztva az elsôdleges auditoros kéregben, azaz az auditoros tér szisztematikus reprezentációja nem feltétlenül szükséges egy auditoros terület számára ahhoz, hogy részt vegyen a hangok lokalizációjában. Az inger-helyzetre vonatkozó információt elosztott neuronok populációja kódolja például a majmok magasabb-rendû szomatoszenzoros területein (NICOLELIS ÉS MUNKATÁRSAI , 1998). Lehetséges azonban, hogy az elsôdleges auditoros kéreg területei nem vesznek közvetlenül részt a hangok lokalizációjában, ám ez az információ magasabb, kérgi területeken komputálódik az auditoros kéregbe érkezô bemenetekbôl. A vizuális feldolgozás „dorzális” nyalábjáról - az elsôdleges vizuális kéregtôl a posterior parietális kéregbe - feltételezik, hogy egy „hol” pályát képvisel, amely a térbeli látást szolgálja (például UNGERLEIDER ÉS MISHKIN, 1982). Többen is felvetették, hogy az auditoros feldolgozásnak hasonló dorzális nyalábja létezik az auditoros ingerek lokalizálására (ROMANSKI ÉS MUNKATÁRSAI, 1999; RAUSCHECKER ÉS MUNKATÁRSAI , 1997). A majmok laterális intraparietális kérgének neuronjai szenzitívek a hangok, valamint a vizuális ingerek helyzetére és multimodális lokalizációs térképként funkcionálhatnak (lásd COHEN ÉS WESSINGER, 1997). Ráadásul az auditoros információ - különösen a kérgi feldolgozás második (ROMANSKI ÉS MUNKATÁRSAI , 1999) és harmadik (H ACKETT ÉS MUNKATÁRSAI, 1999) szintjérôl átkapcsolódik a frontális kéreg olyan területeire is, amelyek az auditoros ingerek lokalizációjában játszanak szerepet. Mind a frontális szemmezô, mind pedig a posterior parietális kéreg küld projekciókat a colliculus superiorba, ahol befolyásolhatják az auditoros ingerekre irányuló vizuális fixáció mechanizmusait. A madarak természetesen nem rendelkeznek a fôemlôsök kérgi feldolgozó rendszereivel, de a madaraknak elôagyi struktúráik vannak az auditoros információ feldolgozására (lásd COHEN ÉS KNUDSEN, 1999). Az egyik terület, az archi-striatális tekintet mezô (AGF) szerepet játszik a madár tekintetének mind az auditoros, mind pedig a vizuális ingerek felé való orientálásában, ráadásul az archi-striatális tekintet mezô (AGF) az optikus 48
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
tectumba küld projekciót, igen hasonlóan ahhoz, ahogy a frontális szemmezô küld projekciókat a superior colliculusba. 1.4.7 FAJOK ÉS STRUKTÚRÁK KÖZÖTTI
HASONLÓSÁG A MULTIMODÁLIS INTEGRÁCIÓBAN
A multiszenzoros neuronok receptív mezôinek térbeli megfelelése jellemzô a kéregre is (például DUHAMEL ÉS MUNKATÁRSAI , 1991; WALLACE ÉS MUNKATÁRSAI, 1992; RAMACHANDRAN ÉS MUNKATÁRSAI , 1993; STEIN ÉS MUNKATÁRSAI , 1993; GRAZIANO ÉS MUNKATÁRSAI , 1994), ahol a neuronoknak valószínûleg nagyon különbözô funcionális szerepük van, mint a colliculus superiorban (SC). A receptív-mezô átfedésen túl a multiszenzoros kortikális neuronok némely más integratív tulajdonságáról is (pl. fordított hatékonyság, reakciónövekedés ami meghaladja az unimodális reakciók összegét stb.) kimutatták, hogy nagyon hasonló az SCben megfigyeltekhez (WALLACE ÉS MUNKATÁRSAI , 1992). Ezek a közös vonások azt jelzik, hogy a multiszenzoros integráció alapelvei általánosak. Ez nem azt jelenti, hogy nincsenek jelentôs különbségek különbözô fajok vagy struktúrák között. Kétségtelen, hogy vannak a különbözô fajok multiszenzoros neuronjainak olyan szenzoros tulajdonságai (pl. a magas frekvenciájú hangok hatékonyabbak a rágcsálók mint fôemlôsök számára), amelyek ökológiai specializációjukkal függenek össze. Ugyanez áll a különbözô struktúrákra is (például a multiszenzoros elnyomás kevésbé gyakorinak és kevésbé erôsnek tûnik a kéregben mint az SC-ben, lásd STEIN ÉS WALLACE 1996), ám valószínû, hogy a specializált jellemzôk a közös tulajdonságok alapján állnak. WALLACE ÉS MUNKATÁRSAI (1993a) szerint a multiszenzoros integráció hasonló módon történik legalább három független rendszerben. Az egyik rendszerben az unimodális cortico-tectális neuronok biztosítják azt a szenzoros információt, ami az SC-neuronok multiszenzoros integrációjához szükséges. Ezek a kérgi bemenetek túlnyomórészt monoszinaptikusak és fôként az SC fô keresztezett leszálló kimeneti rendszerét célozzák meg, a TRS (tractatus reticulo-spinalis) pályát. Mivel a TRS-traktátus olyan agytörzsi és gerincvelôi helyekre projektál, amelyek a szemek, fülek és fej orientációs mozgásaiban játszanak szerepet (GRANTYN ÉS GRANTYN , 1982; GUITTON ÉS MUNOZ, 1991; MOSCHOVAKIS ÉS KARABELAS, 1985; M UNOZ ÉS GUITTON, 1991; MUNOZ ÉS MUNKATÁRSAI, 1991), az anterior ecto-Sylvius (AES) és a laterális supra-Sylvius (LS) kérgek hatást gyakorolnak a külsö ingerekre adott, középagy által közvetített reakciókra. A második SC multiszenzoros neurális hálózatba olyan neuronok tartoznak, amelyek nem kapnak konvergáló kortikális bemeneteket és nem küldenek projekciót a TRSpályára. A harmadik rendszer multiszenzoros kérgi neuronokból áll, amelyek nem projektálnak az SCbe. Ezek a neuronok szerepet játszhatnak a percepcióhoz és kognícióhoz szorosabban kapcsolódó magasabbrendû funkciókban (WALLACE ÉS MUNKATÁRSAI, 1993a). Ennek a neurális hálózatnak az anatómiáját még nem ismerjük, mivel a kortikális multiszenzoros neuronok afferensei és projekciós céljai is 49
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
ismeretlenek. A multiszenzoros neuronok - a különbözô területeken - úgy látszik, hogy ugyanazokat az integrációs folyamatokat használják fel (MEREDITH ÉS MUNKATÁRSAI, 1991). A fejlettebb organizmusok idegrendszere mind rendelkezik a szenzoros tér vagy receptor epithelia szervezett, térképszerû reprezentációjával. A neuraxis egyes szintjein a különbözô szenzoros modalitások térben elkülönülô területeket foglalnak el, amelyek funkcionálisan és cytoarchitectonikusan körülhatároltak. A kéregben és a talamusz bizonyos területein a különbözô elsôdleges szenzoros reprezentációk területei tovább különülnek egymástól „másodlagos” térképekre (valamint „asszociációs” területekre). A másodlagos térképeket megkülönbözteti szomszédos „elsôdleges” párjuktól a receptív mezôk tükörképszerû megfordítása és az, hogy általában különbözô szub-modalitás jellemzôire specializálódnak (MEREDITH ÉS STEIN, 1990). Az SC csak egy a sok központi idegrendszeri struktúra közül, ami multiszenzoros sejteket tartalmaz. Különbözô szenzoros modalitásból (exteroceptív, enteroceptív, vagy mindkettô) származó bemenetekrôl demonstrálták, hogy konvergálnak sejteken az agykéregben (BENEVENTO ÉS MUNKATÁRSAI, 1977; BENTHAL ÉS MUNKATÁRSAI , 1968; BERMAN, 1961; BUISERET ÉS M AAFFEI, 1983; BUSER ÉS BORENSTEIN, 1959; CLEMO ÉS STEIN, 1983; DUBNER ÉS RUTLEDGE , 1964; DUBNER ÉS RUTLEDGE, 1965; FALLON ÉS BENEVENTO , 1977; FISHMAN ÉS MICHAEL, 1973; HORN, 1965; I TO, 1982; J UNG ÉS MUNKATÁRSAI, 1963; L ANDGREN ÉS MUNKATÁRSAI , 1967; LOE ÉS BENEVENTO , 1969; ROBERTSON ÉS MUNKATÁRSAI, 1975; RUTLEDGE, 1963; SCHNEIDER ÉS DAVIS , 1974; SPINELLI ÉS MUNKATÁRSAI , 1968; THOMPSON ÉS MUNKATÁRSAI, 1963; TOLDI ÉS FEHER , 1984; TOLDI ÉS MUNKATÁRSAI, 1981; W ESTER ÉS MUNKATÁRSAI , 1974; ZARZEKI ÉS MUNKATÁRSAI, 1983), a talamuszban (ALBE-FESSARD ÉS GILLETT, 1961; AVANZINI ÉS MUNKATÁRSAI , 1977; BERKELEY, 1973; BORENSTEIN ÉS MUNKATÁRSAI, 1959; C HALUPA ÉS FISH , 1978; CHALUPA ÉS MUNKATÁRSAI , 1975; H OTTA ÉS K AMEDA, 1963; HOTTA ÉS TERASHIMA, 1965; HUANG ÉS LINDSLEY, 1973; P OGGIO ÉS MOUNTCASTLE, 1960; WESPIC , 1966), hipothalamusban (DAFNEY ÁS FELDMAN , 1970), a bazális ganglionokban (HIKOSAKA ÉS W URTZ, 1983; SCHNEIDER ÉS MUNKATÁRSAI , 1982; STECKER ÉS MUNKATÁRSAI., 1985; WILSON ÉS MUNKATÁRSAI, 1983), hippokampuszban (RANCK , 1973), colliculus inferiorban (AITKIN ÉS MUNKATÁRSAI., 1978; TAWIL ÉS MUNKATÁRSAI , 1985), retikuláris formációban (A MASSIAN ÉS DEVITO, 1954; BELL ÉS MUNKATÁRSAI ., 1964; S CHEIBEL ÉS MUNKATÁRSAI , 1955), kisagyban (AMAT, 1983; A MAT ÉS MUNKATÁRSAI , 1984; A ZIZI ÉS W OODWARD, 1984; FREEMAN, 1970) és az elsôdleges szenzoros nucleusokban (BRICOUT-BERTHOUT ÉS MUNKATÁRSAI, 1984; HORN ÉS MUNKATÁRSAI, 1983; JABBUR ÉS MUNKATÁRSAI, 1971).
50
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.4.8 KOORDINÁTARENDSZEREK A perceptuális világ integritása megköveteli az összes szenzoros rendszer pozíciós szignáljának a korrelációját, különösen a szem és fül üzeneteivel kapcsolatban. Az állatnak tudnia kell, hogy a tárgy, amit lát és hall, egyetlen dolog, egyetlen térbeli helyen; az auditoros és a vizuális kulcsingerek által kiváltott reakciókat koordinálni kell. Az emlôs colliculus superior (SC) mély rétegei ideálisan fel vannak vértezve a térbeli kulcsingerek korrelációjára a szembôl és a fülbôl, mivel egymásra szuperponált auditoros és vizuális reprezentációk vannak itt (T IAO ÉS BLAKEMORE, 1976; W ICKELGREN, 1971; GORDON, 1973; D RAGER ÉS HUBEL , 1975). Az az elképzelés azonban, hogy az SC-rétegek mechanikusan koordinálódnak - bár vonzóan egyszerû, mégis - paradox. Az auditoros ingerek helye az interaurális idôzítési és szintkülönbségekbôl, valamint spektrális adatokból komputálódik, ami fej- és fül-központú kordinátarendszert eredményez. Ha a hangforrás jobbra található, a hang elôször a jobb fülbe érkezik és hangosabb is lesz ebben a fülben. Ezeket az interaurális idôzítési és szintkülönbségeket lehet felhasználni a hang-helyzet komputációjához a fej és a fül helyzetéhez viszonyítva. A vizuális receptív mezôk pozíciója azonban a retinához képest határozódik meg (a tekintet irányához képest). Mivel a szemek mozognak a szemüregben, a bimodális neuronok által használt vizuális és auditoros tér koordinátái - ahogy PÖPPEL (1973) kimutatta - minden egyes alkalommal változnak egymáshoz képest, amikor a szem mozog. A szem mozgatása - anélkül, hogy a fej is mozogna - befolyásolja a retinális aktiváció helyét anélkül, hogy befolyásolná az adott tárgyról érkezô auditoros kulcsingereket. Másrészt a fej mozgatása, amikor a szem a tér egy stabil pontjára fixál, megváltoztatja az interaurális akusztikus kulcsingereket a retinális aktivitás helyének befolyásolása nélkül. Így a vizuális receptív mezô - amely a retinához van lehorgonyozva - és az auditoros receptív mezô - ami a fej és a fülek helyzetéhez van lehorgonyozva - csupán akkor illeszkedik, ha a szemek mereven elôre néznek. Amikor a multiszenzoros integráció nagy jelentôséggel bír, az állat fontosabb érzékszerveit egymással megfelelésben tartja (HARRIS 1980; STEIN ÉS MEREDITH 1993), ezáltal biztosítva a multiszenzoros receptív mezôk teljes populációjának normális téri átfedését. Szerencsére úgy tûnik, hogy a szemmozgások (amelyek eltolják a vizuális receptív mezôket) némely SC-neuron nem-vizuális receptív mezôjének „kompenzációs” eltolódását okozzák (talán egy „efferenciamásolat” mechanizmus segítségével), ezáltal fenntartva a modalitásközi megfelelést és az attól függô integrációt. JAY ÉS SPARKS (1984) - az éber majom SC-ben - vizsgálta a szem helyzetének hatását a colliculáris receptív mezôkre. Majmokat arra képeztek, hogy szakkádokat végezzenek az auditoros ingerek felé különbözô kezdeti szem-helyzetekbôl. Az állatok fejét rögzítve tartották, hogy a szemmozgásokat függetlenítsék a fejmozgásoktól. A szerzôk szerint a legtöbb auditoros receptív mezô eltolódott, amikor a szem mozgott. A receptív mezôk azonban nem tolódtak el annyira, amennyire ahhoz kellene, hogy fenntartsák a hangok tökéletes szem-központú reprezentációját: a receptív mezôk átlagosan csupán a szemmozgások felét tették meg, ami megszünteti a vizuális receptív mezôvel való egyezést. Következtetésük az volt, hogy az auditoros receptív mezôk dinamikusak és elmozdulnak, hogy újrarendezzék a vizuális és auditoros térképeket a struktúrában. Az ilyen neuronok egy szubpopulációját figyelték meg a macska SC-ben mások is (HARTLINE ÉS MUNKATÁRSAI , 1995; PECK ÉS MUNKATÁRSAI , 1995). A taktilis szignálok koordinátarendszerét az SC-ben GROH ÉS SPARKS (1996) vizsgálta. Majmokat képeztek ki arra, hogy szakkádokat végezzenek számos különbözô kezdeti szem helyzetbôl a vibro-taktilis ingerek felé, amelyeket a tenyerükre kaptak. A szomatoszenzoros ingerek pozícióját a bôrfelszínen, valamint a végtagok helyzetét állandónak tartották. Ilyen feltételek között a szem-pozíció sok SC-neuron taktilis ingerekre adott reakcióját befolyásolta. A szem-pozíció hatása szem-központú koordinátarendszerre utal: a sejtek általában akkor reagáltak maximálisan a taktilis ingerre, amikor a szem kezdeti helyzete a taktilis ingert a neuron vizuális receptív vagy mozgási mezôjébe hozta. Habár a vizuális és a szakkádddal összefüggô koordinátarendszer az SC-ben valóban szem-központú, pontosabb lenne inkább motoros hiba vagy felfrissített szem-központú koordinátarendszernek nevezni és nem retinális koordinátarendszernek. Ezt MAYS ÉS SPARKS (1980) demonstrálta. Az SC olyan neuronjainak aktivitását mérték, amelyek vizuális ingerekre reagálnak a szokványos vizuális szakkád feladatban. Arra 51
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
képeztek ki majmokat, hogy végezzenek szakkádokat két röviden felvillantott vizuális inger sorozatára. Mindkét ingert megvilágították majd kioltották, még mielôtt az elsô szakkád elkezdôdött, így a szakkád iránya és amplitúdója a második célra disszociálódott a cél eredeti retinális helyétôl. A majmok meglehetôsen jól el tudták végezni ezt a feladatot. Ha az elsô és második célinger közötti szakkád vektor megfelelt a receptív mezô helyzetének, sok sejt tüzelt az elsô és a második szakkád között még olyankor is, amikor a retinális hely, ami normálisan a megfelelô szakkád-vektorral kapcsolódott volna, nem aktiválódott. Bár a sejtek a vizuális ingerekre reagálnak, valójában a vizuális inger emlékbeli helyzetét is reprezentálják a szemhez lehorgonyzott koordinátarendszerben, ami felfrissítôdik, ha a szem elmozdul. Ezen jellemzôik miatt kvázi-vizuális sejteknek nevezték el ezeket a sejteket (MAYS ÉS SPARKS, 1980).
52
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.5 MULTISZENZOROS INTEGRÁCIÓ Legtöbbünk implicit módon hisz érzékei pontosságában és a valóságnak megfelelésében. Így néha szórakoztató, néha viszont bosszantó rájönni, hogy milyen könnyen átvernek bennünket. A perspektíva és a kontraszt ügyes használatától a kis tárgyak nagynak tûnnek vagy nagy tárgyak kicsinek, avagy tárgyak közelinek látszanak, amikor valójában messze vannak vagy éppen fordítva (Ames-szoba). A kontraszt és a perspektíva használata az észlelés megváltoztatására lényeges részét képezi a festészetnek és a filmmûvészetnek, amik viszont segítettek megtapasztalni érzékszervi ítéleteink viszonylagosságát. Habár a modalitásközi hatások az észlelésben és a viselkedésben valószínûleg ugyanolyan gyakoriak, mint modalitáson belüli megfelelôik, az a tény, hogy egy rövid hang jelentôsen megváltoztatja az ember fényintenzitás ítéletét (STEIN ÉS MUNKATÁRSAI , 1996) általában nagyobb meglepetést kelt, mint az a megfigyelés, hogy az ember karcsúbbnak látszik amikor függôleges, mint amikor vízszintes csíkok vannak a ruháján. A környezetünkrôl szóló tudás különbözô érzékekbôl származik. Az emberek - csakúgy mint más organizmusok - többszörös szenzoros renszerekkel vannak felszerelve a környezet észelésére (STEIN ÉS MEREDITH, 1993). Szemünk a fénymintázatokat kutatja, fülünk a légnyomásváltozásokat detektálja, bôrünk az érintkezésbe kerülô tárgyakról informál, míg orrunk és szánk a környezet kémiai összetételét méri. Mindegyik érzékszerv környezetünk minôségileg különbözô szubjektív benyomását adja: a színnek és a hangmagasságnak például nincs szomatoszenzoros megfelelôje és a csiklandozásnak sincs auditoros vagy látványbeli párja. Ezért látszik úgy, hogy különbözô szenzoros rendszerek mûködnek független birodalmakban és ezért nehéz elhinni, hogy befolyásolhatják egymást. Azonban nemcsak hogy meglehetôsen gyakran teszik ezt, hanem néha meglepô következményekkel is. Kiváló példája ennek az úgynevezett „McGurk-hatás” (MCGURK ÉS MAC DONALD , 1976), amiben a beszédhez kapcsolódó hang és látvány (ajak-mozgások) nem illenek egymáshoz, mégis egyetlen észleletbe integrálódnak. Ha például az ember a „bows” angol szót hallja, de azt látja, hogy a száj a „goes”-t formálja, az észlelet sem az elôbbi, sem az utóbbi, hanem „doze” vagy „those”, a kettô szintézise. Egy másik gyakori példája a modalitásközi illúziónak a „hasbeszélô-hatás” (HOWARD ÉS T EMPLETON, 1966), amiben a vizuális kulcsingerek arra késztetnek bennünket, hogy az auditoros kulcsingereket máshová lokalizáljuk (ez a magyarázata annak, hogy amikor a moziban ülünk, a hangokat a szereplôk szájából halljuk és nem a hangszórókból). Ehhez hasonlóan a taktilis és/vagy vesztibuláris kulcsingerek arra késztethetnek, hogy a vizuális kulcsingereket máshová lokalizáljuk (lásd WELCH ÉS WARREN, 1986; S TEIN ÉS MEREDITH , 1993 a modalitásközi illúziók részletesebb tárgyalásához). A modalitásközi illúziók a szenzoros kulcsingerek közötti normális viszonyok felborulásának következményeit illusztrálják, ugyanis az érzékek azért fejlôdtek ki, hogy együttmûködjenek információik szinergikus felhasználásában. A szinergia attól függ, hogy a különbözô szenzoros kulcsingerek szorosan illeszkednek-e térben és idôben (azaz ugyanabból az eseménybôl származnak). Ezért ha látjuk a beszélô arcát, a mondott üzenet érthetôbbé válik, különösen zajos teremben (SUMBY ÉS POLLACK , 1954). A térben egybeesô multiszenzoros kulcsingerekre adott viselkedéses reakcióknak alacsonyabb a küszöbértéke és az ilyen ingerek sokkal gyorsabb reakciókat váltanak ki, mint unimodális összetevôik (ZAHN ÉS MUNKATÁRSAI, 1978; STEIN ÉS MUNKATÁRSAI , 1989; PERROTT ÉS MUNKATÁRSAI , 1990; HUGHES ÉS MUNKATÁRSAI , 1994; FRENS ÉS MUNKATÁRSAI , 1995). Viszont a jelentôsen össze nem illô (pl. térben eltérô) modalitásközi kulcsingerek ellenkezô hatásúak: elnyomják a reakciókat (STEIN ÉS MUNKATÁRSAI, 1989). A modalitásközi képességek jelentôs viselkedéses elônyökkel járnak. Amellett, hogy a szenzoros információkat egymással egyenértékûekként lehet használni - például egy tárgy formáját detektálhatjuk vizuálisan és tapintással is - és így megôrizni a tárgyfelismerési képességet akkor, amikor egy érzék kiesik, a szenzoros bemenetek modalitások közötti kombinálása jelentôsen javítja a környezeti ingerek detekcióját és diszkriminációját is, jelentôsen gyorsítva a rájuk adott reakciókat. A szenzoros bemenetek modalitásközi integrálása olyan információval is szolgálhat a környezetrôl, amilyent egyik érzék sem szolgáltat, például az íz szubjektív tapasztalata a gusztatoros és az olfaktoros kulcsingerek kombinációjából jön létre (O’H ARE, 1991). A kötés-problémát (binding) alaposan vizsgálták a látás szenzoros területén. A látással foglalkozó kutatások azt vizsgálták, hogy a tárgy-észlelés hogyan szintetizálódik az elkülönült neuron-populációkból, amelyek individuális vizuális vonásokat kódolnak (például szín, kontúr és mozgás). A multiszenzoros 53
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
kötéshez az információ különbözô szenzoros rendszerekbôl érkezik, ezért feltehetôen multiszenzoros konvergenciát követel meg.
1.5.1 HETEROMODÁLIS TERÜLETEK A fôemlôsök neuroanatómiai tanulmányai számos területet azonosítottak, ahol a különbözô érzékekbôl származó afferensek összefutnak. Kérgi szinten az ilyen heteromodális területek közé tartoznak a superior temporális sulcus (STS) zónái, az intraparietális sulcus (IPS), a parieto-preoccipitális kéreg, a posterior insula és frontális területek, mint a premotoros, a prefrontális és az anterior cingulatum (AC) kérgek (JONES ÉS P OWELL, 1970; CHAVIS ÉS PANDYA, 1976; S ELTZER ÉS PANDYA , 1978, 1980; MESULAM ÉS M UFSON, 1982; PANDYA ÉS YETERIAN , 1985). Anatómiai konvergencia-zónákat találtak kéreg alatti struktúrákban is, mint a claustrum, a colliculus superior, a talamusz suprageniculatum és mediális pulvinar nucleusai, valamint az amygdaláris komplexumon belül a rhinális kéregben és a hippocampusban (TURNER ÉS MUNKATÁRSAI , 1980; MESULAM ÉS MUFSON, 1982; PEARSON ÉS MUNKATÁRSAI ., 1982; F RIES, 1984; M UFSON ÉS MESULAM, 1984). A különbözô szenzoros rendszerekbôl származó projekciók konvergenciája bizonyos agyi területeken nem jelenti szükségszerûen a neuronális szintû konvergenciát. Azonban az elektrofiziológiai tanulmányok számos fajban kimutatták azt, hogy ezek közül a heteromodális területek közül sok tartalmaz olyan sejteket, amelyek több mint egy modalitás ingerlésére reagálnak (BENEVENTO ÉS MUNKATÁRSAI , 1977; DESIMONE ÉS GROSS, 1979; BRUCE ÉS MUNKATÁRSAI , 1981; RIZZOLATTI ÉS MUNKATÁRSAI , 1981A, B; ITO, 1982; VAADIA ÉS MUNKATÁRSAI , 1986; BAYLIS ÉS MUNKATÁRSAI, 1987; HIKOSAKA ÉS MUNKATÁRSAI , 1988; DUHAMEL ÉS MUNKATÁRSAI , 1991).
54
DANCZI CSABA LÁSZLÓ : A ZENEI 1.5.2 KÉRGI
TÉR
MULTISZENZOROS SEJTEK
Számos multiszenzoros perceptuális hatásról dokumentálták, hogy kérgi alapú (pl. HILLYARD ÉS 1984; IRIKI ÉS MUNKATÁRSAI, 1996; SAMS ÉS MUNKATÁRSAI , 1991). Ráadásul az egy-egységes mérések a fôemlôsök (pl. DUHAMEL ÉS MUNKATÁRSAI, 1991; GRAZIANO ÉS GROSS , 1993, 1997; SCHROEDER ÉS MUNKATÁRSAI , 2001), a patkány (BARTH ÉS MUNKATÁRSAI , 1995), a macskák (pl. BENEDEK ÉS H ICKS, 1988; HICKS ÉS MUNKATÁRSAI , 1988; JIANG ÉS MUNKATÁRSAI , 1994; WALLACE ÉS MUNKATÁRSAI, 1992; WESPIC , 1966; W ILKINSON ÉS MUNKATÁRSAI , 1996), a rágcsálók (pl. RAMACHANDRAN ÉS MUNKATÁRSAI , 1993) és a majom (MISTLIN ÉS PERRETT, 1990; D UHAMEL ÉS MUNKATÁRSAI , 1991; GRAZIANO ÉS GROSS , 1998) kérgében, sub-cortexében és talamuszában tártak fel bimodális és trimodális neuronokat. A kérgi multiszenzoros sejteknek a tulajdonságai sok szempontból hasonlóak a colliculus superioréhoz, habár jelentôs különbségek vannak a térbeli érzékenységben, ami talán a kombinálódó információk eltérô jellegét (térbeliség vagy azonossság) tükrözi a colliculáris és kérgi multimodális sejtekben (WALLACE ÉS MUNKATÁRSAI , 1992). A colliculus superior (SC) és az agykéreg független integrációjának valószínûségét növelik azok a tanulmányok, amelyek macskákon demonstrálták, hogy a szenzor-specifikus és nem a multiszenzoros neuronok küldenek projekciókat a kéregbôl az SC multiszenzoros sejtjeihez (WALLACE ÉS MUNKATÁRSAI , 1993a). Az elektrofiziológiai adatok fényében, amelyek demonstrálják a multimodális sejtek jelenlétét a heteromodális kéregben különös, hogy a léziós tanulmányok a nem emberi fôemlôsöknél alig találtak bizonyítékot a heteromodális területek szerepére a modalitásközi képességekben (áttekintésükre lásd E TTLINGER ÉS WILSON, 1990; M URRAY ÉS MUNKATÁRSAI, 1998). ETTLINGER ÉS WILSON (1990) a releváns irodalom áttekintése alapján arra következtetett, hogy egyik struktúráról sem mutatták ki - amelyrôl tudjuk, hogy konvergáló bemenetet kap több, mint egy szenzoros rendszerbôl -, hogy különösebben lényeges lenne a modalitásközi teljesítmény fejlôdéséhez és megnyilvánulásához. E TTLINGER ÉS WILSON (1990) szerint a szenzoros modalitásokból származó információk nyilvánvaló szintézise a szenzor-specifikus kérgek közötti szinkronizált aktivitáson keresztül valósul meg (kérgi dinamika). Szerintük a kérgi szinkronizációt egy olyan átkapcsoló állomás koordinálja, mint a claustrum, amely több szenzoros rendszerrel van kölcsönös összeköttetásben (PEARSON ÉS MUNKATÁRSAI, 1982). Egy másik léziós adat azonban a rhinális kéreg prominens szerepét sugallja, legalábbis a modalitásközi inger-inger asszociációk kialakulásában és tárolásában (MURRAY ÉS MISHKIN, 1985). Az eltérés az elektrofiziológiai és a léziós adatok között lehet, hogy csak látszólagos. A léziós tanulmányok általában a modalitásközi teljesítményben mérték a heteromodális kéreg szerepét modalitásközi illeszkedés, transzfer és felismerési feladatokban (MURRAY ÉS MUNKATÁRSAI , 1998). A sejt-vizsgálatok azonban a modalitásközi integráció során megjelenô neurális aktivitásra koncentráltak. ETTLINGER ÉS WILSON feltételezésével szemben, hogy minden modalitásközi viselkedés egyetlen megalapozó folyamatot követel meg (1990), elméleti és pszichológiai bizonyítékok sugallják azt, hogy a különbözô modalitásközi feladatok meglehetôsen különbözô modalitásközi folyamatokon alapulnak (STEIN ÉS MEREDITH, 1993; RADEAU , 1994; CALVERT ÉS MUNKATÁRSAI , 1998). Például a modalitásközi illesztés feladata azzal jár, hogy meghatározzuk azt, hogy az elôzôleg asszociált jellemzô (vagy valamilyen közös paraméter, mint a forma vagy a méret) két különbözô tárgyon azonos, míg a multimodális integráció attól függ, hogy két vagy több szenzoros kulcsingert ugyanattól a tárgytól származónak észlelünk-e (STEIN ÉS MEREDITH , 1993; RADEAU, 1994). További különbséget jelent az összehasonlítandó és/vagy integrálandó információ természete. Az általános jellemzôk, mint amilyen az intenzitás, a térbeli helyzet, a sebesség, a ritmus-struktúra, a forma és a textúra - hogy csak néhányat említsünk - intermodális invariánsok, azaz az információ analóg attól a szenzoros modalitástól függetlenül, amiben éppen észleljük (LEWKOWICZ, 2000). A szenzoros modalitások invarianciájának detektálása korán megjelenik a fejlôdés során (ROSE ÉS RUFF, 1987; LEWKOWICZ ÉS LICKLITER, 1994) és az elsajátítás után generalizálható a szenzoros bemenetek minden releváns kombinációjára. Ezzel szemben a tárgyat meghatározó modalitásközi tulajdonságok közötti asszociációkat minden egyes prototípus esetében meg kell tanulni. Eôzetes tapasztalat nélkül a banán illata semmilyen információval sem szolgál vizuális megjelenésére vonatkozóan. Ráadásul ha megtanultuk az unimodális jellemzôk közötti asszociációt, az nem ad semmilyen információt más gyümölcsök illat-külsô MUNKATÁRSAI ,
55
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
kapcsolatát illetôen (a téma alaposabb tárgyalásához lásd LEWKOWICZ, 2000). Miközben az elektrofiziológiai tanulmányok fôként a térbeli információ (ami az érzékek közötti invariáns információ egy példája) modalitásközi integrálásának neurális mechanizmusait vizsgálták, a léziós tanulmányok általában olyan agyi területekre koncentráltak, amelyek a tetszôleges modalitásközi asszociációk tanulásában és elôhívásában játszanak szerepet (GAFFAN ÉS HARRISON , 1991; MURRAY ÉS MUNKATÁRSAI, 1998).
56
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.5.3 MULTISZENZOROS KÉRGI TERÜLETEK 1.5.3.1 FRONTÁLIS SZEMMEZÔ A frontális szemmezô (FEF) egy olyan kérgi terület, amely a szakkadikus szemmozgások kontroljában játszik szerepet. A FEF több szempontból is hasonlít a colliculus superiorra (SC). Éber majmokban sok FEF-neuron tüzel a szakkádokkal összefüggésben. A sejteknek mozgási mezôik vannak és legélénkebben akkor tüzelnek, amikor a szakkád a mozgási mezô közepére irányul. A FEF mikroingerlése szakkádokat vált ki, míg a FEF és az SC kombinált léziója teljesen megszünteti a szakkádokat (GROH ÉS W ERNER-REISS , 2002). Mint az SC-rôl is, feltételezik, hogy a FEF a hangok és a vizuális ingerek által kiváltott szakkádokat is kontrolálja. RUSSO ÉS BRUCE (1994) a neuronok motóriummal kapcsolatos aktivitását vizsgálta a FEF-ben, hogy meghatározza, hogy akvitálódnak-e auditoros és vizuális ingerek felé irányuló szakkádokra. Majmokat arra képeztek, hogy szakkádokat végezzenek a fények és a hangok térbeli helyzete felé. A szerzôk szerint az általuk vizsgált minden sejt reagált még a szakkádok elôtt, mindkétféle célra. Továbbá mindkettônek a mozgási mezôje a szem kezdeti helyzetéhez volt lehorgonyozva. Ezek az eredmények hasonlóak JAY ÉS SPARKS (1984) fôemlôs-SC eredményeihez. A FEF neuronjai reagálnak a szenzoros eseményekre: sok neuron reagál a vizuális ingerekre, ám kevés reagál hangokra. Azok a neuronok, amelyek hangokra reagálnak, különbözô hanginger-típusokkal ingerelhetôek és receptív mezôik általában a kontralaterális oldalon vannak. Az auditoros neuronoknak körülbelül a fele reagál vizuális ingerekre is. Az akusztikusan reakciókész sejteket fôként a FEF olyan területein találták, amelyek nagy amplitúdójú mozgást reprezentálnak (RUSSO ÉS BRUCE, 1994). 1.5.3.2 L ATERÁLIS
INTRAPARIETÁLIS KÉREG
A posterior parietális kéregrôl azt tartják, hogy a téri figyelemben és a szemmozgásokban játszik szerepet. Embereknél a parietális lebeny léziói után a páciensek ignorálják a kontralaterális térfélen elhelyezkedô ingereket, ezt a jelenséget „neglect”-ként ismerjük. Mi a neglectnek a koordinátarendszere? Egy érdekes kísérletet végzett BISIACH ÉS LUZZATTI (1978) a kérdés eldöntésére. Arra kértek parietális-lebeny-léziós pácienseket, hogy képzeljék el magukat, amint a katedrálissal szemben állnak a Piazza del Duomo-n Milánóban és számoljanak be minden látványról amit fel tudnak idézni. Ebbôl a képzeletbeli látószögbôl a páciensek fôként a piazza azon oldalán neveztek meg látnivalókat, ami ipszilaterális a lézió oldalával. Aztán arra kérték ôket, hogy képzeljék el magukat, amint a katedrális lépcsôjén állnak, ellenkezô irányban. Ebbôl az ellentétes látószögbôl a deficit megfordult: most fel tudták idézi a piazza ellenkezô oldalán levô látnivalókat, de nem tudtak megnevezni a másik oldal látnivalóit - azokat a dolgokat, amiket képesek voltak felidézni az elsô képzeletbeli látószögbôl. Majmoknál a posterior parietális kéreg laterális intraparietális területérôl (area LIP) azt tartják, hogy szerepet játszik a szakkádok irányításában a vizuális, auditoros és emlékezeti ingerek helyzete felé. Többen vitatkoztak arról, hogy az area LIP funkciója inkább figyelmi (amely áttekinti az ingerek szenzoros feldolgozását egy adott helyen), vagy inkább „intencionális” (ami felkészíti a motoros áramkört a szakkadikus szemmozgás végzésére egy inger felé ezen a lokáción; lásd MAZZONI ÉS MUNKATÁRSAI , 1996). Az area LIP neuronjai hasonlítanak mind a colliculus superior (SC), mind pedig a frontális szemmezô (FEF) neuronokra abban, hogy szenzoros és motoros aktivitást is mutatnak. Sok area LIP neuron vizuális reakciója nem csak az inger retinán levô helyzetétôl függ, a szem-pozíció is fontos számukra. ANDERSEN ÉS MUNKATÁRSAI (1983) szerint a vizuális ingerek egy adott retinális lokáción különbözô reakciókat váltanak ki attól függôen, hogy az állat szeme merre néz. A szem-pozíció hatását növekedési mezônek (gain field) nevezték el, mivel a vizuális reakció intenzitását befolyásolta a szem pozíciója. A receptív mezô helyzete a retinához horgonyzott marad, amikor a szem mozog, ám a sejt reakciókészsége változik. Így a vizuális aktiv57
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
itás koordinátarendszere nem szigorúan retinális, hanem a retinális és a szem-helyzet koordinátarendszer kombinációja. SNYDER ÉS MUNKATÁRSAI (1998) tovább vizsgálták a növekedési mezôket, hogy meghatározzák, a szemek helyzete a fejhez, a testhez, vagy a környezethez képest a döntô tényezô. Változtatták a szem helyzetét a fejhez képest, a fej helyzetét a testhez képest és a test helyzetét a környezethez képest, miközben a vizuális ingert a retinához rögzített helyzetben tartották. Ezek a manipulációk feltárták, hogy a reakció egy adott retinális ingerre a szem testhez viszonított helyzetétôl függ. Az area LIP neuronjaiban keveset számított azonban, hogy a tekintet-elmozdulások a testhez képest nagyrészt szem-a-fejben mozgásokkal, vagy fej-a-testen mozgásokkal valósultak meg (a közeli Br. 7a területen azonban több sejtet befolyásolt a szem helyzete a környezethez képest, mint a szem helyzete a testhez képest.) Mi a helyzet az auditoros szignálokkal az area LIP neuronjaiban? MAZZONI ÉS MUNKATÁRSAI (1996) megvizsgálták, hogy az area LIP neuronjai hogyan reprezentálják a hang helyét. Két hangszóróból mutattak be hangokat, az egyik a kontralaterális, a másik az ipszilaterális mezôben volt. A vizsgált neuronoknak körülbelül a fele mindkét helyzet hangjaira reagált. A legtöbb élénkebben reagált az egyik hangszóróra, mint a másikra. A legtöbb neuron vizuális ingerekre is reagált és általában a preferált hangszóróhoz közeli vizuális ingereket preferálta. Az auditoros szignálok koordinátarendszerét vizsgálták STRICANNE ÉS MUNKATÁRSAI (1996). Arra képeztek majmokat, hogy szakkádokat végezzenek öt hangszóróhelyzet felé, amelyek 12 fokra voltak egymástól vízszintesen. Három fixációs helyzetet - 12 fokra egymástól - használtak. A variancia-analízis megerôsítette, hogy a hang pozíciója fontos meghatározója a neurális aktivitásnak: a hang helyzete a fejhez képest, a hang helyzete a szemhez képest vagy e tényezôk együttesen határozták meg az egyes neuronok reakcióját. A tanulmány szerint a szem-helyzet az area LIP auditoros neuronjai közül néhánynak befolyásolta a reakcióját. 1.5.3.3 ANTERIOR
ECTO -S YLVIUS SULCUS
Az izgalmi-izgalmi (EE) multiszenzoros konvergencia nem képes magyarázatot adni néhány perceptuális jeleségre. Például a nem-figyelt ingerre adott reakció elnyomása szelektív modalitásközi figyelem esetén (FOXE ÉS MUNKATÁRSAI, 1998; H ILLYARD ÉS MUNKATÁRSAI , 1984; TEDER -SALEJARVI ÉS MUNKATÁRSAI, 1999) nem tulajdonítható izgalmi hatásoknak. Amikor az alany azt az utasítást kapja, hogy a vizuális ingerre figyeljen egy adott helyen, csökkent reakciót mutat, amikor egy auditoros inger helyettesíti a vizuális ingert ugyanazon a helyen. A sok közül egy szenzoros modalitásra irányuló figyelem különbözteti meg az ingert ilyenkor. Ehhez a reakciók olyan aktív elnyomására van szükség a nem-figyelt modalitásokban, amit modalitáson belüli figyelemelterelô (disztraktor) ingerekkel demonstráltak már (MORAN ÉS DESIMONE, 1985; REYNOLDS ÉS MUNKATÁRSAI , 1999; WORDEN ÉS MUNKATÁRSAI, 2000). Szelektív figyelmi folyamatok közben az egyik modalitás izgalmi és a másik modalitás gátló bemenetének a konvergenciáját figyelték meg a macska asszociációs kérgében (CLEMO ÉS MUNKATÁRSAI, 2000; D EHNER ÉS MUNKATÁRSAI, 2000). Macskában a colliculus superiorba (SC) leszálló bemenet legfontosabb forrása az anterior ectoSylvius sulcus (AES). Az AES az „asszociációs kéreg” része és az SC multiszenzoros rétegeibe küld projekciót (STEIN ÉS MUNKATÁRSAI, 1983). Ez a leszálló bemenet különösen fontos, mivel az AES (aminek emberi homológját nem ismerjük) különbözô szenzoros modalitású területeket tartalmaz. Vizuális reakciókat az vizuális területén (AEV), szomatoszenzoros aktivitást az area SIV-ben (az úgynevezett negyedik szomatoszenzoros kéregben, kiejtése „S4”; CLEMO ÉS STEIN 1982), auditoros reakciókat pedig az AES auditoros területén (field AES; Clarey és Irvine 1986) találtak. Az unimodális területek között multimodális neuronok vannak (CLEMO ÉS MUNKATÁRSAI , 1991), amelyek nem küldenek közvetlen projekciót a colliculus superiorba (WALLACE ÉS MUNKATÁRSAI, 1993b). Az összes AES-neuron egyharmada auditoros, negyede szomatoszenzoros és ötöde vizuális. A maradék neuron bimodális vagy - ritkán - trimodális (leggyakoribb a vizuális-auditoros). Az unimodális bemenetek különbözô kombinációkban konvergálnak az egyes SC-neuronokon. Az AES-bemenetek fontosak a multiszenzoros integrációhoz (WALLACE ÉS STEIN 1994). WILKINSON ÉS MUNKATÁRSAI (1996) úgy vizsgálták az AES funkcionális szerepét a multiszenzoros 58
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
információ integrálásában, hogy inaktiválták azt és a macskák teljesítményét tesztelték egy olyan feladatban, amiben multiszenzoros kulcsingerek játszanak szerepet. Amikor a vizuális cél eléggé homályos volt ahhoz, hogy a detekciós határhoz közeli legyen, az orientációs teljesítményt meg lehetett javítani a vizuális ingerhez ugyanazon a helyen társított hanggal. Az AES farmakológiai inaktivációja (lidokaint fecskendeztek a beépített AES-csövecskékbe) megakadályozta a párosított auditoros kulcsinger erôsítését, míg az elsôdleges auditoros kéreg (AI) inaktivációjának nem volt semmilyen hatása. Az egyedül bemutatott vizuális ingerre történô orientációt nem befolyásolták az inaktivációk. Ezek az eredmények azt sugallják, hogy az AES fontos szerepet játszik az orientációs mozgások auditoros erôsítésében, ami azért meglepô, mert a projekció az AESbôl au SC-be az unimodális neuronokból indul és nem a terület multimodális neuronjaiból. Habár nem küldenek projekciót az SC-be, az AES multimodális neuronjainak sok közös vonása van az SC multimodális neuronjaival. A különbözô szenzoros modalitások receptív mezôi térbeli megfelelésben vannak. Az elsô végtagoknak megfelelô taktilis receptív mezôkkel rendelkezô vizuális-szomatoszenzoros neuronok olyan vizuális receptív mezôkkel rendelkeznek, amelyek az alsóbb térnegyedben vannak és így tovább. Ez a megfelelés meglepô, mivel úgy tûnik, hogy az AES unimodális részei nem topografikus szervezôdésûek. Ahogyan az SC-ben is, a multimodális sejtek reakció-növekedést mutatnak, ha az ingereket egyidôben és egy helyen mutatják be. A macska AESében területi multiszenzoros konvergencia (különbözô unimodális neuronok keverednek ugyanazon a területen belül anélkül, hogy megosztanák a modalitással összefüggô információkat) van az auditoros field AES és a szomatoszenzoros SIV között (DEHNER ÉS MUNKATÁRSAI , 2000), ám nincs konvergencia a szomatoszenzoros területen belüli neuronokon mivel nem találtak auditoros-szomatoszenzoros (bimo-dális) neuronokat ezen a területen (CLEMO ÉS STEIN, 1982, 1983). Az SIV-neuronok nem aktiválódnak önállóan bemutatott auditoros ingerekre és így tisztán szomatoszenzorosnak látszanak (CLEMO ÉS MUNKATÁRSAI , 2000). Ráadásul ezeket a neuronokat a field AES elektromos ingerlése sem aktiválja. Azonban amikor az egyébként hatékony taktilis ingert kombinálják a field AES elektromos ingerlésével, az SIV neuronjainak majdnem 70 %-ában szignifikánsan lecsökken az izgalmi reakció a taktilis ingerlésre (CLEMO ÉS MUNKATÁRSAI , 2000). A field AES gátló hatása az SIV szomatoszenzoros reakcióira blokkolható bicuculline methiodide alkalmazásával, ami a gátló GABA-transzmitter antagonistája (CLEMO ÉS MUNKATÁRSAI , 2000). Tehát az SIV-en belüli szomatoszenzoros-auditoros konvergencia gátló, pontosabban a multiszenzoros neuronális konvergencia (konvergencia az egyes neuronokon belül) ‚izgalmi-gátló’ (EI) formája.
59
DANCZI CSABA LÁSZLÓ : A ZENEI 1.5.3.3.1 IZGALMI
TÉR
ÉS GÁTLÓ MULTISZENZOROS INTEGRÁCIÓ
Úgy tûnik, hogy legalább két formája van a multiszenzoros konvergenciának a neuronális szinten. Az egyik - és legismertebb - formába azok a neuronok tartoznak, amelyeket nyíltan izgat több mint egy modalitás ingere. A bimodális (és trimodális) neuronok a konvergencia ‚izgalmi-izgalmi’ (EE) formáját mutatják. Azonban a superior colliculus (SC) multiszenzoros neuronjai gátló bemeneteket kapnak extrinzik (áttekintésükre lásd HUERTA ÉS HARTING , 1984) és intrinzik forrásokból is (MEREDITH ÉS RAMOA, 1998; M UNOZ ÉS ISTVAN, 1998). Sok mély-réteg bimodális neuronnak van gátló receptív mezô környezete (KADUNCE ÉS MUNKATÁRSAI, 1997; M EREDITH ÉS S TEIN, 1996) és mutat reakció-elnyomást, miközben bizonyos viselkedések is legátlódnak. ha az inger temporális (MEREDITH ÉS MUNKATÁRSAI, 1987; QUESSY ÉS MUNKATÁRSAI , 2000) vagy térbeli viszonyai (M EREDITH ÉS STEIN , 1986b, 1996) nem megfelelôek (BELL ÉS MUNKATÁRSAI , 2000; MEREDITH ÉS RAMOA, 1998; M UNOZ ÉS ISTVAN, 1998). A gátló szignálok talán a fôként izgalmi projekciók összetevôiként jutnak a multiszenzoros SC-neuronokra. Ezért az EE-konvergencia pontosabb leírása az, hogy az izgalom domináns szerepet játszik a térbenidôben egybeesô szenzoros ingerek reakció-erôsödésében. Mivel a viselkedés szempontjából fontos multiszenzoros ingerek összefüggôek (például egy zuhanó szikla által kibocsátott különbözô ‚energiák’) és általában azonos idôben azonos helyrôl származnak világos, hogy az izgalmi multiszenzoros konvergencia megfelelô az ilyen jelenségekre adott reakciók erôsítésére a detekciós, lokalizációs és orientálódó/menekülô viselkedésekhez (GUITTON ÉS MUNOZ, 1991; S TEIN ÉS MUNKATÁRSAI, 1988, 1989). A hasbeszélô-hatás és a koktélparti-hatás is erôs térbeli és temporális korlátok között jön létre. Mivel a konvergáló modalitások szignáljai egy integrált és jelentôsen átalakult produktumba ötvözôdnek, az izgalmi hatások valószínûleg nem az ingerek finom-elemzésében, hanem az ingerek térbeli detekciójában és lokalizációjában játszanak szerepet. A negyedik szomatoszenzoros terület (SIV) neuronok túlnyomó többségében (majdnem 70 %) izgalmi-gátló (EI) multimodális konvergencia van (CLEMO ÉS MUNKATÁRSAI, 2000; DEHNER ÉS MUNKATÁRSAI, 2000). Izgalmi-gátló multiszenzoros konvergencia van a modalitás-specifikus kérgekben is (pl. EBNER ÉS ARMSTRONG-JAMES, 1990; G ILBERT, 1993, 1998; RICHTER ÉS MUNKATÁRSAI, 1999; WANG ÉS MUNKATÁRSAI, 2000). A konvergáló EI multiszenzoros neurális kapcsolatrendszerek valószínûleg összetettebbek annál, hogy csupán a domináns hatásokat integrálják. Mivel a legtöbb cortico-corticális projekciós-neuronnak piramis morfológiája van és izgalmi, a gátló hatások valószinûleg közvetve, gátló interneuronok közvetítésével jönnek létre, azaz a kérgi neurális kapcsolat-rendszerekben a gátló összetevô közvetett. Az EI-konvergencia gátlással és gátlásoldással modulálja az izgalmi-modalitás aktivitását. Ezek a modulációk a percepció minôségét befolyásolják. Valószínû, hogy izgalmi-gátló konvergencia esetén a térben egybeesô ingerek gátolják (és nem növelik) a multiszenzoros reakciót.
60
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.5.3.3.2 A MULTISZENZOROS KONVERGENCIA MÁS FORMÁI Az SC-ben a multiszenzoros EE-neuronok egy csoportja nem integrálja a multiszenzoros reakciókat (JONES ÉS POWELL, 1970): ugyan több modalitás ingereire reagálnak, de a modalitások különösebben nem befolyásolják egymást. Az ilyen SC-neuronoknak nincsenek kérgi bemeneteik, amelyek az integrációhoz szükségesek (JONES ÉS POWELL , 1970; WALLACE ÉS MUNKATÁRSAI, 1993a; WALLACE ÉS STEIN, 1994). Az SCneuronok kérgi bemenetei NMDA-függôek (BINNS ÉS SALT, 1996b) és az integrált multiszenzoros reakcióik az NMDA-kapu csatornáktól függenek (BINNS ÉS SALT, 1996a). Tehát a multiszenzoros neuronoknak legalább kétféle izgalmi bemenetük van: az egyik izgalmi bemeneteket szállít a modalitásokból, a másik - amit a kéreg közvetít - pedig ezeket az izgalmi bemeneteket az integratív szintre erôsíti. 1.5.3.4 PREMOTOROS KÉREG Kísérletek a premotoros kéregben feltárták, hogy a multiszenzoros integráció alapelvei közül sok érvényes különbözô modalitású szenzoros ingerekre indított vázizomzat-mozgások neurális kontroljára is. A premotoros kéreg neuronjai a vizuális vagy a szomatoszenzoros ingerekre, vagy mindkettôre reagálnak. Auditoros reakciók is léteznek, bár ennek még nem tárták fel a részleteit. GRAZIANO ÉS GROSS (1998) szerint a bimodális vizuális-szomatoszenzoros neuronok receptív mezôi térbeli megfelelésben vannak, mert a vizuális receptív mezôk többnyire egy körülhatárolt három dimenziós térbeli területet foglalnak el a taktilis receptív mezônek megfelelô testfelületnek a közvetlen közelében. Azok a neuronok, amelyeknek a taktilis receptív mezôi a végtagon vannak, vizuális receptív mezôik pedig a végtag körül, végtag-központú koordinátarendszert használnak. A vizuális receptív mezôk térben elmozdulnak, amikor mozog a végtag. Ha a szem mozog, de a végtag nem, a vizuális receptív mezôk az eredeti helyzetben maradnak annak ellenére, hogy a retina receptív mezôjét az errôl a helyrôl származó ingerek már nem tudják aktiválni. Az ilyen neuronok számára az inger retinális helyzete lényegtelen; csak a végtaghoz viszonyított helyzet fontos. Amikor a vizuális receptív mezôk az archoz vagy fejhez közel helyezkednek el, elmozdulnak amikor a fej mozog még akkor is, ha a fixáció térben állandó. Vagyis a vázizomzat motoros pályája - ahogy az okulomotoros pálya is - olyan koordinátarendszereket használ, amelyek a kiváltó inger modalitásától függetlenül irányítják az egyes testrészek mozgását.
61
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.5.4 MULTIMODÁLIS FELADATOK 1.5.4.1 MODALITÁSKÖZI ILLESZTÉS Az egyik legkorábbi kísérlet az érzékek közötti aktivitás koordinálásában szerepet játszó kérgi területek azonosítására funkcionális leképezô eljárás felhasználásával PET tanulmány volt a vizuo-taktilis illeszkedésrôl (HADJIKHANI ÉS ROLAND , 1998). A mérés során arra kérték a kísérleti alanyokat, hogy döntsék el azt, hogy az ellipszis formájú gömb-párok - amelyeket vizuálisan, taktilisen, vagy egy modalitásközi vizuo-taktilis feladatban mutattak be - formája illeszkedik-e egymáshoz. Elkülönülô aktivitási területet azonosítottak a jobb insula-claustrumban (a PET felbontása kizárja a szomszédos struktúrák pontos megkülönböztetését). A szerzôk egyetértettek ETTLINGER-EL ÉS WILSON -al (1990) abban, hogy a heteromodális kérgi területeknek nincs szerepe a modalitásközi (legalábbis a vizuális és taktilis információ közötti) illeszkedésben és a modalitásközi jellemzôk összehasonlítását a claustrum koordinálja a modalitás-specifikus területeken. BANATI ÉS MUNKATÁRSAI (2000) vizuo-taktilis illeszkedési feladat közben végeztek PET mérést. Az unimodális (vizuo-vizuális) feltételben a kísérleti alanyok négy vizuális kör közül egyet választottak ki, ami illeszkedett egy egyidejûleg a monitor alsó negyedében látható vizuális ívhez. Az eredményül kapott agyi aktivációs térképek kivonása a vizuo-taktilis aktivációs térképbôl az agyi területek egész hálózatát tárta fel, beleértve az inferior parietális lebenyeket, a bilaterális superior temporális sulcust (STS), az anterior cingulatumot (AC), a bal dorzolaterális prefrontális kérget (DLPFC) és a bal insula-claustrumot. A szerzôk azt állítják, hogy az eltérés oka HADJIKHANI ÉS ROLAND (1998) eredményeitôl azzal magyarázható, hogy Hadjikhani és Roland taktilis-taktilis feladatot is végeztettek. A vizuo-taktilis és vizuo-vizuális feltételekkel szemben a taktilis-taktilis illesztési feladat szekvenciális és nem szimultán összehasonlítást követel meg. Mivel a kísérleti alanyok vizuális képzetet alkothattak az elsôként bemutatott taktilis ingerrôl - hogy segítsék az összehasonlítást az ezután bemutatott taktilis tárggyal - a modalitásközi illesztésben szerepet játszó területek is aktiválódhattak ebben a feladatban és így a taktilis-taktilis aktivitás kivonása a nyilvánvaló modalitásközi (vizuo-taktilis) aktivitásból azoknak a területeknek az alulértékeléséhez vezetett, amelyek feltételezésük szerint szerepet játszanak a modalitásközi illeszkedésben. Azonban a közös eredmény, az insula-claustrum aktiváció valószínûvé teszi, hogy ez a terület szerepet játszik az érzékek közötti ingerjellemzôk összehasonlításával járó feladatokban. Valószínû, hogy az insula-claustrum egy nagyobb neuronális hálózat részét képezi, amiben heteromodális területek is szerepet játszanak, hogy koordinálják a vizuális és taktilis modalitások közötti illeszkedést. Az is lehet, hogy a modalitásközi illeszkedés két párhuzamos útvonalon halad: az egyikben a heteromodális területek konvergenciája, a másikban pedig a modalitásspecifikus kérgek közötti kommunikáció jászik szerepet, amit a claustrum koordinál. Ez magyarázhatja azt, hogy a heteromodális kérgek léziói más fajokban nem rontják le a modalitásközi illesztés és transzfer feladatokban nyújtott teljesítményt, ha a claustrum ép.
62
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.5.4.2 MODALITÁSKÖZI AZONOSÍTÁS A modalitásközi azonosítás az olyan modalitásközi kulcsingerek integrációjával jár, amelyek a tárgy azonosságára (pl. méret, hangmagasság, idôtartam) és nem térbeli helyzetére vonatkoznak. A tanulmányokat hasznos szétválasztani olyanokra, amelyek lingvisztikus ingereket használtak (CALVER ÉS MUNKATÁRSAI , 1999, 2000; RAIJ ÉS MUNKATÁRSAI, 2001; CALLAN ÉS MUNKATÁRSAI, 2001) vagy nem (GIARD ÉS PERONNET, 1999; F OXE ÉS MUNKATÁRSAI , 2000; BUSHARA ÁS MUNKATÁRSAI , 2001; CALVER ÉS MUNKATÁRSAI, 2001). További különbség tehetô az olyan tanulmányok között, amelyek a szenzorosan invariáns információk - mint amilyen a temporális ingerkezdet, idôtartam és/vagy korreláló audio-vizuális frekvencia-amplitúdó információ az audio-vizuális beszéd esetében - integrációjára koncentráltak és azok között, amelyek a tetszôleges modalitásközi kombinációk modalitásközi szintézisét vizsgálták, mint a betûk hallható és grafikus reprezentációjának azonosítása, amiben az írott szimbólum tetszôleges kapcsolatban van az akusztikus formával (RAIJ ÉS MUNKATÁRSAI , 2001). 1.5.4.1.1 NYELVI INFORMÁCIÓT FELHASZNÁLÓ TANULMÁNYOK Az MEG-et (SAMS ÉS MUNKATÁRSAI , 1991) és fMRI-t (CALVER ÉS MUNKATÁRSAI , 1997) felhasználó kísérletek demonstrálták, hogy a vizuális beszéd (azaz az ajakról olvasás) az auditoros kéreg olyan területeinek aktiválására képes, amelyekrôl azelôtt azt tételezték fel, hogy kizárólag hang-alapú szignálok feldolgozására szentelôdött. CALVER ÉS MUNKATÁRSAI (1999) - fMRI - kimutatták, hogy amikor a beszélô látható amellett, hogy hallható is, a szenzor-specifikus (ebben az esetben az auditoros és vizuális) kérgek aktivitása megnövekszik a bármely egyedüli modalitásra mutatott aktivációhoz képest . Úgy érveltek, hogy a megnövekedett aktivitás ezeken a modalitás-specifikus területeken a ‚hallás’ szubjektív javulásának amikor a beszélô ajkai és szájmozgásai is láthatóak (REISBERG, 1987) - és a hangforrás kiváló „vizuális lokalizációnak” ( annak megkülönböztetése, hogy ki mit mond egy beszélô emberekkel teli teremben, ha az auditoros és vizuális beszéd mintázatok illeszkednek egymáshoz; lásd DRIVER, 1996; MCDONALD ÉS MUNKATÁRSAI , 2000) fiziológiai korrelátuma. Azonban egyik tanulmány sem vizsgálta explicit módon a konvergencia helyét a két szenzoros modalitás között. A kérdés megválaszolására CALVER ÉS MUNKATÁRSAI (2000) egy fMRI tanulmányt végeztek azoknak az agyi területeknek a feltárására, amelyek szerepet játszanak az auditoros és a vizuális beszéd-szignálok integrálásában, a multiszenzoros integráció elektrofiziológiai adataira támaszkodva. Habár a multiszenzoros intergációs neuronok reakcióit csak térben egybeesô modalitásközi ingerekkel vizsgálták, a viselkedéses adatok azt sugallják, hogy hasonló szabályok érvényesülnek a tartalom-információ modalitásközi integrációjában is. A beszédértés javul olyankor, amikor a beszélô látható és nem csak hallható (SUMBY ÉS POLLACK , 1954; R EISBERG, 1987), azonban leromlik, ha az ajkak és szájmozgások nem összefüggôek (DODD, 1977). CALVER ÉS MUNKATÁRSAI (2000) feltételezték, hogy a multiszenzoros integráció hasonló BOLD (blood oxygen level dependent - vér-oxigén szint függô) reakcióváltozásokat is okoz. Kísérleti alanyaik - a mérés közben - egymásnak megfelelô vagy disszonáns audio-vizuális beszédet, hallott beszédet, látott beszédet vagy nyugalmat észleltek. A kongruens audio-vizuális feltételben a beszélô szája ugyanazt a történetet mesélte, mint amit a fejhallgatókban lehetett hallani, az inkongruens feltételben a beszélô szája egy másik történetet mesélt. Az egyetlen terület, amit az egyes modalitások önállóan is aktiváltak és pozitív interakciós hatást (AV > A + V) mutatott a kongruens és negatív interakciós hatást (AV < A + V) az inkongruens audio-vizuális feltételben a bal superior temporális sulcus (STS) posterior ventrális szélén volt. Más területek vagy pozitív vagy negatív interakciós aktivitást mutattak a kongruens és inkongruens bimodális ingerekre, de mindkettôt egyik sem. Szuper-addíciós hatást találtak az auditoros és vizuális kérgekben a kongruens audio-vizuális feltételben. Mivel a szuper-addíciós hatások sokkal gyengébbek voltak, mint az STS-ben megfigyelt aktivitás, a szerzôk arra következtettek, hogy multiszenzoros növekedés történik a modalitás-specifikus kérgekben és nem integráció, ahogy azt egy korábbi tanulmány is mutatta (CALVER ÉS MUNKATÁRSAI, 1999). Mivel különösen a kéregben nem minden pozitív integrációt mutató multiszenzoros integrációs neuron mutat szükségképpen reakció elnyomást is (WALLACE ÉS MUNKATÁRSAI , 1992), az hogy az STS-ben mind63
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
kettôt megtalálták azt sugallja, hogy jelentôs szerepe van legalábbis az audio-vizuális beszéd esetében. CALLAN ÉS MUNKATÁRSAI (2001) - EEG - kísérletében a kísérleti alanyok angol szavakat hallottak zaj (több beszélô cseveg) jelenlétében vagy anélkül egy videóval egyetemben, amin a beszélô ugyanazokat (kongruens feltétel) a szavakat mondta, vagy nem lingvisztikus arcmozgásokat végzett. Az inverz hatékonyság elvének (STEIN ÉS MEREDITH, 1993) megfelelôen a multiszenzoros-integráció reakciók akkor maximálisak, amikor az unimodális ingerek a legkevésbé hatékonyak, így a megegyezô vizuális beszéd nagyobb reakció növekedést hoz létre a multiszenzoros integrációs neuronokban, ha az auditoros szignált gyengíti a zaj. Ha azonban a CALVER ÉS MUNKATÁRSAI (2000) által megfigyelt modalitásközi interakció egyszerûen a beszédértés és/vagy figyelem növekedését vagy csökkenését tükrözi a kongruens és inkongruens ajak és szájmozgásoknál, a maximális növekedést a zaj nélkül bemutatott audio-vizuális beszéd közben figyelhetô meg. A teljesítmény ugyan jobb volt amikor az audio-vizuális beszédet zaj nélkül mutatták be, azonban a legnagyobb interakciós hatást az audio-vizuális beszéd plusz zaj feltételben találták. A független-komponenselemzés feltárta, hogy az interakció két független komponensnek tulajdonítható több energiával a magasabb frekvenciatartományokban (45-70 Hz). A 45-70 Hz-es tartományon belüli aktivitást elôzôleg a perceptuális kötéssel (binding) kapcsolták össze (SINGER ÉS GRAY, 1995). Az elsô komponens - a bal STSben - körülbelül 150-300 ms-al az ingerkezdet után jelentkezett, ezt inger-kiváltotta hatásnak tulajdonították. A másik komponens a szignál teljes idôtartama alatt aktív volt és egy egész hálózaton oszlott meg, amiben szerepet játszott a parietális, az occipitális, a temporális, a prefrontális és a szenzorimotoros terület is. Ezt a komponenst feladat-indukálta hatásnak tulajdonították. Adataik megegyeznek a CALVER ÉS MUNKATÁRSAI (2000) által leírtakkal, akik multiszenzoros-integráció reakciót azonosítottak a superior temporális területen, ami úgy látszik a kötési (binding) feladattal és más reakciókkal kapcsolatos feladatokat lát el az agyi területek elosztott hálózatában (feladattal-kapcsolatos aktivitás). RAIJ ÉS MUNKATÁRSAI (2001) kísérleti alanyaikat aközben mérték MEG-eljárással, hogy azok a római ábécé auditoros, vizuális és egyidejûleg bemutatott audio-vizuális betûit észlelték és elôzôleg arra kérték ôket, hogy azonosítsanak bizonyos betûket az inger-modalitástól függetlenül. Az audio-vizuális ingerek között voltak illeszkedô és nem illeszkedô (azaz véletlenszerûen párosított) betûk. Jelentés nélküli auditoros (nem beszédhangok), vizuális (ál-szimbólumok) és audio-vizuális kontrol ingereket is bemutattak. A CALVER ÉS MUNKATÁRSAI (2000) által használt kritériumok alapján csoport-átlag audio-vizuális interakciót találtak minden inger-kategóriában az agyi területek egy hálózatában, amiben benne volt a bal fronto-parietális terület, a jobb frontális kéreg, a jobb temporo-occipito-parietális csatlakozás (RTOP), valamint a jobb és a bal STS. A területek közül csupán a RTOP és az STS mutatott erôsebb interakciót betûk, mint kontrol-ingerek esetében. A nem illeszkedô betûknél erôsebb interakciót az illeszkedô betûkre csupán a két féltekei STS-ben (nagyobbat a balban) figyeltek meg, azt sugallva, hogy ezek a területek felelôsek az audio-vizuális integrációért. Az adatok megegyeznek a CALVER ÉS MUNKATÁRSAI (2000) által leírtakkal abban, hogy kiemelik az STS kulcsszerepét az audio-vizuális lingvisztikus szignálok integrációjában. Az ebben a tanulmányban talált interakciók azonban gátlóak voltak annak ellenére, hogy a bimodális ingerekre gyorsabbak voltak a reakciók, valószinûsítve, hogy a szimultán auditoros és vizuális szignálok gátolják egymást vagy versenyeznek ugyanazért a neuron-populációért. A szerzôk szerint a talált interakciós hatások irányának eltérése a más tanulmányokban beszámoltaktól (CALVER ÉS MUNKATÁRSAI , 2000; CALLAN ÉS MUNKATÁRSAI , 2001) az asszociáció véletlenszerûségével függ össze az auditoros és vizuális betûk között, miközben az audio-vizuális beszédben intermodálisan invariáns frekvencia-amplitúdó információ játszik 64
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
szerepet. 1.5.4.1.2 NEM -NYELVI INFORMÁCIÓT FELHASZNÁLÓ TANULMÁNYOK GIARD ÉS PERONNET (1999) ERP-t használt a multiszenzoros interakció helyének és idôbeli lefolyásának tanulmányozására a tárgyfelismeréshez szükséges információk modalitásközi integrációjában. Az ERPt aközben mérték, hogy az alanyok két tárgy közül azonosították azt, amelyiket elôzôleg auditoros (A hang vagy B hang), vizuális (egy kör ellipszis felé torzulása a vízszintes vagy a függôleges síkon), vagy kombinált jellemzôik (A tárgy = A hang + a kör vízszintes deformációja és B tárgy = B hang + a kör függôleges deformálódássa) alapján megismertek. A kísérleti alanyokat arra kérték, hogy azonosítsák A tárgyat vagy B tárgyat egy billentyû lenyomásával. A viselkedéses vizsgálat a mérés alatt és elôtt gyorsabb reakció idôt jelzett a kombinált audio-vizuális ingerekre, viselkedéses bizonyítékként a multiszenzoros integrációra. Az ERP és a skalp-áram-sûrûség spatio-temporális elemzése több audio-vizuális interakció komponenst tárt fel - amelyek idôben, térben és funkcionálisan is különböztek - egészen 200 ms-al az ingerkezdet utánig. A komponenseket modalitás-specifikus és heteromodális agyi területeken találták. A vizuális és az auditoros kérgek interakciós hatásai fôként az unimodális ingerekre adott modalitásspecifikus vizuális és auditoros reakciók latenciájára, polaritására és topográfiájára hasonlítottak (a vizuális P100-ra és az auditoros N100-ra), azt sugallva, hogy multiszenzoros növekedés - de nem szükségképpen multiszenzoros integráció - történik ezeken a területeken (de lásd FOXE ÉS MUNKATÁRSAI, 2000). A hallás esetében az interakciós hatások attól függtek, hogy az alanyok auditoros vagy vizuális dominanciával rendelkeztek: az interakciós hatások nagyobbak voltak a nem domináns modalitás-specifikus kéregben, jelezve hogy az inverz hatékonyság elve nem csak a szenzoros kéreg aktivitásának globális szintjén mûködik, hanem az unimodális kulcsingerek szubjektív hatékonyságától is függ. A szenzoros kérgeken kívül erôs interakciós hatást figyeltek meg a jobb fronto-temporális területen, 145-160 ms-al az ingerkezdet után. Mivel ezt a területet egyik unimodális inger sem aktiválta, a szerzôk ezt a területet emelték ki a nemrég tanult audio-vizuális asszociációk multiszenzoros integrációjának helyszíneként. A szenzoros dominancia hatásának hiánya a fronto-temporális kéregben azt sugallja, hogy a különbözô kérgi területek nem ugyanolyan integratív feladatokat látnak el. GIARD ÉS PERONNET (1999) szerint a modalitás-specifikus kérgek interakcióit azok a finom és flexibilis mechanizmusok hozzák létre, amelyek segítik a legkevésbé hatékony kulcsingerek feldolgozását, míg a fronto-temporális területek általános integratív funkciókat látnak el. FOXE ÉS MUNKATÁRSAI (2000) kísérletében a kísérleti alanyok 1 kHz-es hangokat hallottak, vagy medián ideg elektromos pulzusokat kaptak, vagy a két, egyidejûleg bemutatott inger kombinációjával ingerelték ôket. A mért ERP és a skalp-sûrûség topográfiák spatio-temporális elemzése pozitív interakciós hatást tárt fel 50 ms-al az ingerkezdet után a szomatoszenzoros kéregben, a postcentrális gyrus területén. A késôbbi - 70-80 ms - interakciós hatásokat a superior temporális terület közelében figyelték meg. Eredményeik beleillenek az auditoros és szomatoszenzoros modalitások korai integrációs modelljébe (az integráció a kérgi feldolgozási hierarchia elején, a heteromodális területek integrációját megelôzôen vagy azzal egyidôben történik a modalitás-specifikus kérgekben), legalábbis olyan szignálok feldolgozásakor, amelyeknek nincs más kapcsolatuk egymással, mint a közös kezdet. A frissebb adatok - haemodinamikus méréssel - azt sugallják, hogy az ilyen interakciók olyan struktúrákban zajlanak le, amelyek a kérgi köpeny mélyén rejlenek és ezért nehezen azonosíthatóak ERP-vel. Egy PET tanulmányban az audio-vizuális aszinkrónia detekcióról, amiben az alanyokat explicit módon arra kérték, hogy koncentráljanak az ingerek idôbeli megfelelésére, BUSHARA ÉS MUNKATÁRSAI (2001) az agyi területek FOXE ÉS MUNKATÁRSAI tól (2000) meglehetôsen eltérô mintázatát azonosították. A résztvevôknek az auditoros hang és a vizuálisan bemutatott színes kör szinkronját kellett detektálniuk. Az ingerkezdet aszinkróniát parametrikusan változtatták, ami három nehézségi szintet eredményezett. Egy kontrol feltételben az alanyokat arra kérték, hogy döntsék el, a vizuális inger zöld volt-e vagy sárga és csak akkor reagáljanak, ha auditoros inger is szól. A kontrol próbákban az auditoros és vizuális ingerkezdetek szinkronban voltak. A kombinált aszinkron feltételek kivonása a kontrol feltételbôl olyan heteromodális agyi területeket tárt fel, amik szerepet játszanak a vizuo-auditoros temporális szinkrónia detekciójában: a jobb 65
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
insulát, a posterior parietális és a prefrontális területet. A regionális agyi véráramlás (rCBF) elemzés egy csoportosulást (cluster) tárt fel a jobb insulán belül azt sugallva, hogy ez a terület játsza a legfontosabb szerepet ebben a feladatban. Az interregionális kovariancia-elemzés is azonosított feladattal-kapcsolatos interakciót az insula, a posterior talamusz és a colliculus superior között. Az anatómiai és elektrofiziológiai adatokkal egyetemben (amik állat-tanulmányokból származnak), ezek az adatok azt jelzik, hogy a multi-szenzoros temporális feldolgozás a szub-kortikális tectothalamo-insula pályán történik. Hasonló eredményekrôl számoltak be egy fMRI tanulmányban az audio-vizuális idôbeli egybeeséssel kapcsolatban (CALVER ÉS MUNKATÁRSAI , 2001). A kísérleti elrendezés azonos volt azzal, amit az audiovizuális beszéd integrációjában szerepet játszó agyi területek vizsgálatára használtak (CALVER ÉS MUNKATÁRSAI , 2000), de ebben a tanulmányban a vizuális inger egy 8 Hz-el megforduló fekete-fehér sakktábla volt, amit 30 s-onként üres képernyô váltott fel. Az auditoros ingerek 1000 ms-os fehérzaj-ingerek voltak, amiket úgy idôzítettek, hogy vagy pontosan egybeessenek a vizuális sakktábla megfordulásával (illesztett kísérlet), vagy véletlenszerûen kicsússzanak a szinkronból, miközben az auditoros események száma ugyanaz marad. Az auditoros inger egy csendes periódussal váltakozott 39 s-onként. Az a struktúra, ami a legnagyobb pozitív és negatív modalitásközi intergációt mutatta a szinkron és aszinkron bimodális szignálokra, a colliculus superior (SC) volt. Gyengébb modalitásközi interakciót figyeltek meg a bilaterális insula/claustrumban, a bal superior temporális sulcusban (STS), a jobb intraparietális sulcusban (IPS), valamint a superior és a ventromediális frontális gyrusban. Ezek az adatok megegyeznek a BUSHARA ÉS MUNKATÁRSAI (2001) által beszámoltakkal abban, hogy az SC-t és az insulát jelzik a modalitásközi kulcsingerek temporális egybeesése alapján történô szintézisében. A két tanulmány azt is sugallja, hogy a heteromodális kérgek játszanak valami szerepet ebben a folyamatban, bár szerepük még tisztázandó. Az a tény, hogy egyik tanulmány sem figyelt meg aktivitásváltozást a modalitás-specifikus kérgekben amirôl FOXE ÉS MUNKATÁRSAI (2000) számoltak be - valószínûleg a technikák különbségének tulajdonítható (elektromos események összehasonlítva a haemodinamikai változásokkal). Egyre több bizonyíték van arra, hogy az STS kulcsszerepet játszik az audio-vizuális beszéd, általában a lingvisztikai szignálok integrációjában. Ez megfelel a leképezô eljárások adatainak, amik az emberi STS szerepét jelzik a szociálisan kommunikatív szignálok feldolgozásában (lásd ALLISON ÉS MUNKATÁRSAI , 2000). Az SC-bôl és az insulából álló hálózat különösen érzékeny a modalitásközi kulcsingerek temporális egybeesésére. Ezeknek az interakcióknak a következménye a szignál-intenzitás erôsödése a szenzor-specifikus kérgekben. Ahol a modalitásközi asszociációk régen rögzültek (azaz a beszéd esetében), az erôsödések a korai szenzoros feldolgozási területeken koordinálhatóak a magasabb feldolgozási területekrôl - STS - érkezô projekciókon keresztül. Az újabban tanult asszociációk esetében, amilyenek a GIARD ÉS MUNKATÁRSAI (1999) által leírt modalitásközi objektumok, a modalitásspecifikus kérgek multiszenzoros növekedését kezdetben a frontális kéreg területei közvetítik, amelyek a modalitásközi asszociáció felidézésében játszanak szerepet.
66
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.5.4.2 MODALITÁSKÖZI LOKALIZÁCIÓ Ahogy képesek vagyunk integrálni az inger-azonossággal kapcsolatos modalitásközi szignálokat, tudjuk az érzékek között kombinálni a térbeli koordináta információt is. Ezt „modalitásközi lokalizációnak” nevezik (CALVER ÉS MUNKATÁRSAI, 1998). Azt, hogy különbözô kérgi hálózatok játszanak szerepet az ingerazonossággal összefüggô bemenetek modalitásközi integrációjában és lokalizációjában, az a tény sugallja, hogy a McGurk-hatás (MCGURK ÉS MACDONALD , 1976) és a hasbeszélô-illúzió (amely a ‚mi’ és ‚hol’ információ modalitásközi integrációjából ered) meglehetôsen különbözô kognitív korlátozásnak vannak alávetve (BERTELSON , 1994): miközben az auditoros és a vizuális információ deszinkronizációja erôsen lerontja a hasbeszélô illúziót, a McGurk hatás kiváltható 180 ms auditoros és vizuális ingerkezdetek közötti késéssel is (BERTELSON , 1994). A modalitásközi lokalizációt két meglehetôsen különbözô perspektívából tanulmányozták. A modalitásközi integráció kísérleteiben olyan kísérleti elrendezéseket használtak, amelyekben a modalitásközi térbeli ingereket idôben egymáshoz eléggé közel mutatták be ahhoz, hogy (feltehetôen) neurális szintû multiszenzoros integrációt hozzanak létre. A modalitásközi térbeli figyelem kísérleteiben azt próbálták demonstrálni, hogy az egyik modalitás kulcsingere meggyorsítja a késôbb más modalitásban, de azonos térbeli helyzetben bemutatott célinger detekcióját. Mivel a modalitásközi figyelemmel kapcsolatos hatások kiválthatóak akkor is, amikor a kulcsinger és a célinger idôben elég távol lett egymástól bemutatva ahhoz, hogy a neurális szintû multiszenzoros integráció idôablakán kívül essenek (MEREDITH ÉS MUNKATÁRSAI , 1987), feltehetôen két külön rendszer játszik szerepet a modalitásközi lokalizációban és a modalitásközi térbeli figyelemben (MACALUSO ÉS DRIVER, 2001; MCDONALD ÉS MUNKATÁRSAI , 2001). MACALUSO ÉS MUNKATÁRSAI (2000a) kísérletében a kísérleti alanyok vizuális ingereket észleltek a bal vagy a jobb térfélen, amit a próbák felében egyidejû taktilis ingerléssel párosítottak a jobb kézben, ami térben egybeesô vizuo-taktilis ingereket eredményezett akkor, amikor a vizuális ingert a jobb oldalon mutatták be és térben elkülönülô vizuo-taktilis ingereket akkor, amikor a bal oldalon mutatták be azt. Az fMRI mérés szignifikáns tér-specifikus interakciót azonosított a bal linguális gyrusban. Effektív konnektivitás-elemzéssel (az egyik terület aktivitásának korrelációja egy más területen mérttel, lásd FRISTON ÉS MUNKATÁRSAI , 1997). M ACALUSO ÉS MUNKATÁRSAI (2000a) szerint a vizuális kéregben megfigyelt modallitásközi erôsödést közvetítô területek csupán térben egybeesô bimodális ingerléskor növelik effektív konnektivitásukat a bal linguális gyrussal. A legerôsebb hatást a jobb inferior parietális lebenyben figyelték meg, a supramarginális gyrus anterior területén. Habár vslódi multiszenzoros interakciót nem figyeltek meg ezen a területen, szerintük az inferior parietális lebeny heteromodális területei alapozzák meg a gyrus lingualisban megfigyelt modalitásközi interakciókat. lehetôvé téve, hogy a taktilis koordináta információ átkerüljön az occipitális területekre a heteromodális kéregbôl kinduló projekción keresztül, amit elôzôleg a vizuális-térbeli feldolgozásban implikáltak. L EWIS ÉS MUNKATÁRSAI (2000) olyan agyi területeket vizsgáltak, amik szerepet játszanak a dinamikus térbeli információ modalitásközi szintézisében, fMRI-t használva. Az elsô kísérletben az alanyok vizuális és auditoros mozgás-diszkriminációs feladatokat végeztek, amelyekben mozgó pontok és hangok sebességét határozták meg. Az unimodális mozgási feladatok különbözô aktivációs mintázatokat eredményeztek, amelyek az adott elsôdleges szenzoros területtôl a parietális kéregig terjedtek. A két unimodális aktivációs térkép egymásra helyezése (superimposition) ko-aktivációs területeket tárt fel a laterális parietális kéregben (beleértve az intraparietális sulcust, IPS), a laterális frontális kéregben, a superior frontális gyrusban (SFG) és a szomszédos anteriror cingulatum (AC) kéregben, valamint az anterior insulában. Hogy megkülönböztessék a közös feladat területeit a multiszenzoros integrációt mutató területektôl, a kísérleti alanyokat ezután egy olyan feladatvégzés során mérték, amiben explicit modalitásközi sebességösszehasonlítást végeztek. A vizuális és az auditoros ingereket egyidejûleg mutatták be és az alanyokat arra kérték, hogy döntsék el, a vizuális inger gyorsabban, vagy lassabban mozog, mint az auditoros célinger. Két kontrol-feltételben az alanyokat arra kérték, hogy ignorálják a vizuális ingert és hasonlítsanak össze sebességeket az auditoros modalitásban, vagy fordítva. A modalitásközi feltétel összehasonlítása a kombinált unimodális feladatokkal audio-vizuális interakciót tárt fel fôként az IPS-ben (bal > jobb), az anterior insulában és az anterior középvonalon belül (SGF 67
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
és AC). Szuper-additív reakciót figyeltek meg az STS-ben néhány egyénnél, de ezek a reakciók általában gyengék és elosztottak voltak. Adataik szerint azok az agyi területek, amelyek explicit módon szerepet játszanak a mozgó auditoros és vizuális ingerek integrációjában, együtt aktiválódtak. Az intraparietális lebenyen belüli aktiváció sokkal inkább posterior és anterior volt, mint amilyeneket MACALUSO ÉS MUNKATÁRSAI (2000a) azonosítottak statikus térbeli kulcsingerekkel. Azt, hogy a heteromodális területek szerepet játszanak-e valamiben, azon az alapon határozták meg, hogy a területek szuper-additív multiszenzoros integrációs reakciókat mutattak vagy sem. Nem találtak olyan agyi területeket, amelyeket csupán a modalitásközi feladat aktivált volna és ez azt sugallja, hogy a modalitásközi integrációban szerepet játszó területek az unimodális feldolgozásban is szerepet játszanak. Ez magyarázhatja azt, hogy az elektrofiziológiai és a leképezéses tanulmányok, amik „kizárólag modalitásközi” agyi területek azonosítására koncentráltak (ETTLINGER ÉS WILSON, 1990; HADJIKHANI ÉS ROLAND , 1998), általában kudarcot vallottak és nem találtak ilyen zónákat. Az inferior parietális lebenyen belüli heteromodális kéreg aktivációját többen is jelzik a moda-litásközi lokalizációval járó feladatokban. A feltételezett integrációs hely azonban különbözô attól függôen, hogy a kulcsingerek statikusak (MACALUSO ÉS MUNKATÁRSAI , 2000a) vagy dinamikusak (Lewis ÉS MUNKATÁRSAI, 2000). Mivel az IPS szerepét jelzik az olyan feladatokban is, amelyek modalitásközi térbeli figyelemmel járnak (BUSHARA ÉS MUNKATÁRSAI , 1999; EIMER, 1999; MACALUSO ÉS MUNKATÁRSAI , 2000b), lehetséges, hogy a térbeli koordináta-információ modalitásközi integrációja és a modalitásközi térbeli figyelem egyszerûen két kifejezés, ami ugyanazt a folyamatot írja le.
68
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.5.4.3 MODALITÁSKÖZI TANULÁS A leképezô eljárások, amik azokat a neurális mechanizmusokat vizsgálják, amelyek közvetítenek a modalitásközi asszociációk fejlôdésében, egyenlôre az audio-vizuális modalitásokra korlátozódtak. PET-et használva MCINTOSH ÉS MUNKATÁRSAI (1998) demonstrálták, hogy egy tanulási idôszak után, amiben a vizuális ingert következetesen egy hallható hanggal társították, a hang elszigetelt bemutatása aktivációt vált ki a vizuális kéregben. A fordított asszociációt egy késôbbi tanulmány vizsgálta, fMRI-vel (J. ROSENFELD, kiadatlan, idézi CALVER, 2001). Két hallható hang egyikét ismételten párosítva egy egyidôben bemutatott vizuális ingerrel, a vizuális inger késôbbi egyedüli bemutatása aktivációt váltott ki az elsôdleges auditoros kéregben. Az ilyen tanulmányok a modalitás-specifikus kérgek szerepét jelzik az új modalitásközi asszociációk elsajátításában és megmagyarázhatják azt, hogy az emberek miért számolnak be arról, hogy ‚hallucinálják’ a hangot vagy az inger külsejét az elôzôleg társított más modalitású inger jelenlétében (HOWELLS, 1994). GONZALO ÉS MUNKATÁRSAI (2000) megkísérelték azonosítani az idôtôl függô neurális változásokat, amik a szenzoros modalitások közötti asszociatív tanulással kapcsolatosak. Az alanyokat három elkülönült képzési szakaszban mérték, amikben konzisztensen és inkonzisztensen párosított audiovizuális szignálokat társítottak, valamint önálló vizuális vagy auditoros ingereket mutattak be. A résztvevôket arra kérték, hogy tanulják meg, mely audiovizuális párok konzisztensek. Idôtôl függô hatásokat azonosítottak modalitásközi asszociációk elsajátítása közben a posterior hippocampusban és a superior frontális gyrusban. A konzisztens párosítások tanulására specifikus aktivációt találtak a mediális parietális kéregben és a jobb dorzolaterális prefrontális kéregben (DLPFC) is. Mivel azonban nem volt intramodális (auditorosauditoros és vizuális-vizuális) asszociációs tanulási feltételük, nem tudhatjuk, hogy a szerzôk által azonosított területek a modalitásközi asz-szociatív folyamatokra specifikusak vagy általános inger-inger asszociatív tanulási mûveleteket tükröznek.
69
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.5.5 MULTIMODÁLIS INTEGRÁCIÓ A KÉREGBEN A fenti áttekintés a modalitásközi feldolgozással kapcsolatos képalkotási irodalomról világossá teszi, hogy az agyi területek hálózata és nem egyes helyek játszanak szerepet a modalitásközi bemenetek illesztésében és integrációjában. A hálózatok komponensei azonban a modalitásközi információ különbözô típusainak szintetizálására specializálódtak. Jelenleg négy ilyen terület szerepe látszik egyre világosabban. A superior temporális sulcus (STS) az összetett tulajdonságok integrációjában játszik fontos szerepet, különösen az audio-vizuális beszéd percepciójában. Az intraparietális sulcus (IPS) a modalitásközi térbeli koordináta kulcsingerek integrációjára és a figyelem modalitásközi mediálására specializálódott. Amikor a különbözô modalitások információi integrálódnak a heteromodális területeken, az interakciók a szignál intenzitását modulálják - projekcióikon keresztül - a modalitás-specifikus kérgekben. A temporális egybeesés detekcióját a modalitásközi ingerekben - legalábbis részben - egy fôként szubkortikális pálya közvetíti, amiben a posterior insula és a colliculus superior (SC) játszik fontos szerepet. Azt, hogy a temporális szignálok valóban ‚konvergálnak’ ezeken a területeken vagy az információk összekapcsolása a releváns modalitás-specifikus területek temporális szinkronizációjával történik, nem tudjuk. Van némi bizonyíték arra, hogy a frontális kérgen belüli területek szerepet játszanak az újonnan elsajátított modalitásközi asszociációk integrálásában. Az, hogy az ezen területekre érkezô információ szükszégszerûen ugyanúgy integrálódik-e, mint ahogy az STSben és az IPS-ben, még nem világos. Fontos különbséget jelent a modalitásközi asszociációk tetszôlegessége. Míg az IPS és az STS az intermodálisan invariáns információ percepciójában játszik szerepet, a frontális területekre akkor van szükség, amikor a modalitásközi kulcsingerek közötti asszociációk tetszôlegesek. A claustrumnak a modalitásközi illeszkedésben van fontos szerepe.
70
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.6 I DÔÉSZLELÉS 1.6.1 HANG -TARTAM ÉSZLELÉS A hang-tartam az akusztikus információ fontos összetevôje. Az állatok ugyanazokat a hangokat különbözôen észlelik a tartamtól függôen (REPP ÉS MUNKATÁRSAI , 1978). Hang-tartamra hangolt neuronokat találtak a béka centrális talamuszában és középagyában, ahol rövid-átengedô, hosszú-átengedô, sáv-átengedô és sáv-elnyomó reakciókat találtak (POTTER, 1965; FENG ÉS MUNKATÁRSAI , 1990, 1991; GOOLER ÉS FENG , 1992). A neuronoknak 8,5-150 ms-ig terjedô (többnyire 20 ms-nál nagyobb) latenciával reagáltak, az elsô tüske variabilitása azonban kicsi volt (POTTER, 1965), hasonlóan a HE ÉS MUNKATÁRSAI (1997) által beszámoltakhoz. Késôbb a denevér colliculus inferiorában (IC) mutattak ki hang-tartamra hangolt neuronokat (PINHEIRO ÉS MUNKATÁRSAI , 1991; CASSEDAY ÉS MUNKATÁRSAI, 1994). Az eredmények szerint a hang-tartam hely-alapján kódolódik (CASSEDAY ÉS MUNKATÁRSAI , 1994). CASSEDAY ÉS MUNKATÁRSAI (1994) rövidátengedô és sáv-átengedô tartamra-hangolt neuronokat találtak a denevér IC-ben, ám a cochleáris nucleusban nem, ami azt valószinûsíti, hogy a tartamra-hangoltság az IC-ben alakul ki. CASSEDAY ÉS MUNKATÁRSAI (1994) kimutatták, hogy a denevér IC tartamra-hangolt neuronjainak OFF-reakciói vannak. A preferált tartamok 0-75 ms-ig terjedtek. Calford és munkatársai szerint a macska mediális geniculatum (MGB) dorzális nucleusa (MGd) olyan latenciákkal reagál a tiszta hangokra, amelyek a ventrális MGB (MGv) aktivitásának tartamánál több tíz msal tovább tartanak (CALFORD ÉS WEBSTER , 1981; CALFORD, 1983; LENNARTZ ÉS WEINBERGER, 1992). Az MGd a dorzális zónába (DZ), az elsôdleges auditoros kéregbe (AI), az anterior auditoros mezôbe (AAF), valamint az auditoros kéreg más területeire küld projekciókat (W INER ÉS MUNKATÁRSAI, 1977; ANDERSEN ÉS MUNKATÁRSAI , 1980). Néhányan a DZ-t az AI és az AAF részének tekintetik (W OOLSEY, 1964; ANDERSON ÉS MUNKATÁRSAI , 1980), míg mások szerint a DZ funkcionálisan és anatómiailag különbözô bemenetet kap az MGd-bôl (MIDDLEBROOKS ÉS ZOOK, 1983; H E ÉS MUNKATÁRSAI, 1994). Fiziológiailag a DZ neuronjai frekvencia-specificitásukban különböznek az AI-tôl, mivel széles és/vagy több maximumú hangolással és binaurális reakciókkal rendelkeznek (MIDDLEBROOKS ÉS ZOOK , 1983; SUTTER ÉS SCHREINER, 1991). HE ÉS MUNKATÁRSAI (1997) kimutatták, hogy a macska-DZ-ben sok neuron reagál hosszú latenciával és hang-tartamra szelektív. A macska-DZ neuronjaiban a tartamra-hangoltság nagyobb tartományú, mint a denevér IC-neuronokban (a macskában 0-200 ms-ig, míg a denevérben 0-75 ms-ig terjed). A macska DZ neuronok közül az OFF-reakciót mutató neuronok nagyrésze tartam-szelektív (HE ÉS MUNKATÁRSAI , 1997). OFF-reakcióról beszámoltak a középagyban, a talamuszban és számos emlôsfaj kérgében is (AITKIN ÉS PRAIN, 1974; CALFORD ÉS W EBSTER, 1981; R HODE ÉS SMITH, 1986; B ORDI ÉS LEDOUX , 1994; GROTHE, 1994). CALFORD ÉS W EBSTER (1981) szerint az OFF-reakciót a gátló bemenet kezdete utáni visszacsapás (rebound) hozza létre és a tartamra-hangolt OFF-reakcióval rendelkezô neuronok egy koincidencia-mechanizmust hoznak létre, ami lehetôvé teszi a tartamra-hangolást (CASSEDAY ÉS MUNKATÁRSAI , 1994). A koincidencia-mechanizmus megfelelô az OFF-reakcióval rendelkezô neuronok esetében, azonban nem magyarázza meg a hosszú latenciájú tartam-szelektív neuronok reakcióit. HE ÉS MUNKATÁRSAI (1997) szerint azok a hosszú latenciájú neuronok, amelyek növekvô reakciót mutatnak a hosszabb tartamú ingerekre, temporális összegzést végeznek az inger-tartam ideje alatt, míg azok a neuronok, amelyek csökkenô reakciót mutatnak a hosszabb tartamú ingerekre, temporális elnyomást végeznek az ingerkezdet utáni periódusban.
71
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.6.1.1 A FELBONTÁS-INTEGRÁCIÓ PARADOXON Az auditoros észlelésnek sok olyan jellegzetessége van - például az észlelt hangerô növekedése az idôtartammal vagy a maszkolás - ami arra utal, hogy az auditoros rendszer a bejövô akusztikus szignálok temporális integrációját végzi. Azonban az auditoros rendszer képes a finom temporális felbontásra is, gondoljunk csak a kiváló rés-detekcióra, dupla-klikk diszkriminációra (lásd késôbb) és persze a kérgi reakciók rövid latenciájára (VIEMEISTER ÉS PLACK, 1993). Ezt nevezik a felbontás-integráció paradoxonnak, mivel valószínûtlen, hogy ugyanaz a rendszer hosszú idôtartamokon át integrálja az információt és mégis megôrizze a finom temporális felbontást. A kéreg-alatti feldolgozás idôviszonyai jelentôsen különböznek a kérgiektôl. Az auditoros periféria feldolgozási sebességével és pontosságával összevetve az elsôdleges auditoros kéreg (A1) neuronjainak temporális reakciói meglepôen lomhának tûnnek. A bejövô szignálok talamo-kortikális átalakításában a temporális finom-struktúra nagy része elveszik (CREUTZFELDT ÉS MUNKATÁRSAI, 1980), az AI-ben mért legjobb modulációs frekvenciák általában 15 Hz alatt vannak (SCHREINER ÉS URBAS, 1988) és a maszkoló hatást a teszthangra 400 ms-al a maszk eltûnése után is mérhetjük (BROSCH ÉS SCHREINER, 1997). 1.6.2 É SZLELÉS ÉS PRODUKCIÓ IVRY ÉS HAZELTINE (1995) kísérleti alanyai idôtartamokat kopogtak, valamint tartamokra vonatkozó temporális ítéleteket hoztak (325-550 ms). A variancia mindkét feladatban hasonlóan növekedett a tartamok meghosszabbodásával. KEELE ÉS MUNKATÁRSAI (1985) is szignifikáns korrelációt figyeltek meg ismételtkopogási feladatuk és tartam-diszkriminációs feladatuk adatai között. TREISMAN ÉS MUNKATÁRSAI szerint az egyidôben hallható egyenletes klikkelések befolyásolják az észlelési (1990) és a produkciós (1992) feladatok pontosságát is. A klikkelések hatása frekvenciájuktól függ: egyes frekvenciák következetesen növelik vagy csökkentik az észlelt és a produkált intervallumokat. Azok a frekvenciák, amelyek lerövidítik az észlelt idô becslését, meghosszabbítják a produkciós idôket és fordítva.
72
DANCZI CSABA LÁSZLÓ : A ZENEI 1.6.3 AGYI
TÉR
STRUKTÚRÁK AZ IDÔÉSZLELÉSBEN
1.6.3.1 A KISAGY JEUPTNER ÉS MUNKATÁRSAI (1995) kisagyi véráramlás (rCBF) növekedést figyeltek meg - PET leképezéssel - amikor kísérleti alanyaik hangok idôtartamát ítélték meg. A kisagy-sérült páciensek gyengén teljesítenek az olyan mozgás- és sebességészlelési feladatokban, amikben pontos temporális információkat kell felhasználniuk (IVRY ÉS DIENER, 1991; NAWROT ÉS RIZZO , 1995), valamint megnövekedett variabilitást mutatnak az ismételt-kopogási feladatokban (IVRY ÉS KEELE, 1989). Ivry és munkatársai adataikat a Wing és Kristofferson módszer (W ING ÉS KRISTOFFERSON, 1973b) alapján elemezték és diszszociációt figyeltek meg a patológia helye alapján: a mediális kisagy léziós páciensek erôs periferiális (motoros) variabilitást, míg a laterális kisagy léziós páciensek erôs centrális (óra) variabilitást mutattak (I VRY ÉS MUNKATÁRSAI , 1988). IVRY ÉS K EELE (1989) kísérletében a kisagy-léziós pácienseknek nemcsak az ismételtkopogás óra-variabilitása volt nagyobb a kontrol alanyokénál, a tartam-diszkriminációs feladatban mutatott teljesítményük is rosszabb volt. JEUPTNER ÉS MUNKATÁRSAI (1995) idôészlelési feladatuk során - PET leképezéssel - a bazális ganglionokban, valamint a temporális, a prefrontális és a cingulatum kéregben is megfigyeltek rCBF növekedést. HALSBAND ÉS MUNKATÁRSAI (1993) szerint a premotoros vagy kiegészítô motoros kérgi léziók a ritmus-produkció deficitével járnak. Lateralitásról is beszámolnak a temporális reprodukciós tesztekben: VON STEINBUCHET ÉS MUNKATÁRSAI (1996) kísérletében (1-5 s-ig terjedô intervallumok) a bal precentrális léziót szenvedett páciensek általában a kontrol alanyoknál rövidebb, a jobb precentrális léziót szenvedett páciensek általában hosszabb idôtartamokat produkáltak. Braitenberg (BRAITENBERG ÉS ATWOOD, 1958; BRAITENBERG, 1983) szerint a kisagy felépítése ideális a különbözô bemeneti, valamint a bemeneti és kimeneti mintázatok közötti pontos idôbeli viszonyok komputációjához. RAYMOND ÉS MUNKATÁRSAI (1996) arra hívták fel a figyelmet, hogy komputációs átfedés van két olyan viselkedés között, amelyben a kisagynak kimutatottan lényegi szerepe van: a pislogás kondicionálásában (áttekintése KIM ÉS T HOMPSON, 1997; IVRY, 1993; PERRET ÉS MUNKATÁRSAI, 1993) és a vestibuláris oculáris reflexben (VOR) - mindkét feladatban motoros kimeneteket (azaz pislogást vagy szemmozgásokat) kell pontosan idôzíteni. Az idô-produkció és -észlelés közötti különbség sokszor nem egyértelmû. Amikor az ember egy mozgó tárgyat akar elkapni (amit általában a kisagy feladatának tartanak), a motoros parancsokat dinamikus szenzoros-információkkal kell integrálni a feladat megfelelô elvégzéséhez. Idôzítésre van szükség a céltárgy 73
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
helyének bejóslásához és az egyes izomcsoportok aktivációjának összehangolásához is. Az ilyen összetett problémák megoldására kifejlôdött rendszer ahelyett, hogy a szenzoros és a motoros folyamatokhoz szükséges temporális információt függetlenül komputálná, a két eseményhalmaz közötti megfelelést is elemezheti valamint akkor is mûködhet, amikor csak egy bemeneti forrás van: amikor egyetlen rövid hang tartamát kell megítélni, a kisagy a hangot valamilyen belsô standarddal veti össze és nem a következô ingerrel vagy a motoros szignállal. A kisagyi Purkinje-sejteken nagyon sok bemenet konvergál: egyetlen Purkinje sejt akár 200 000 párhuzamos rosttól is kaphat bemenetet. Ez a felépítés ideális a mintázat-felismerésre (ALBUS, 1971; MARR, 1969). Ezek a neuronok felismerhetik az aktivitások temporális mintázatait a párhuzamos rostok között, hogy elôrejelezzék a várt események idôpontját. A Purkinje-sejtek a tartamot többféleképpen is kódolhatják. A granulátum-, stellátum- és kosár-sejtek interakcióba léphetnek, hogy olyan neurális hálózatokhoz hasonlóan mûködjenek, amelyek a temporális információt térbeli információvá alakítják át (BUONOMANO ÉS MAUK, 1994; BUONOMANO ÉS MERZENICH, 1995). Viszonylag lassú pre- és poszt-szinaptikus mechanizmusok teszik lehetôvé azt, hogy a neuronok lokális reprezentációt alkossanak a temporális információról. BUONOMANO ÉS MERZENICH (1995) a temporális becsléseket egy olyan neurális hálózattal modellezte, amiben a pulzus-facilitációhoz társuló lassú gátló poszt-szinaptikus potenciálok idôbeli lefutása véletlenszerûen változik és így a hálózat folyamatosan változó állapotban van a kezdeti ingerre adott tüzelési reakció után, azaz a következô ingerlésre adott reakció a közbeiktatott intervallum hosszától függ. Egy másik hipotézis szerint a kisagyban különbözô tartamokra hangolt idôzítések vannak, amelyek mindegyike különbözô ingertartamot kódol (IVRY, 1996). Ahogy a vizuális kéregben specifikus neuronok kódolják a teljes vizuális mezôben az irányultságot, a kisagyi kéreg egységei a specifikus idôtartamokat kódolják. Az egységek specifikus izomcsoportokkal kapcsolódnak össze és amikor egynél több effektort használnak, (például amikor az egyén a bal és a jobb mutatóujjával is kopog), az egységek kimenete átlagolódik, ami a variabilitás csökkenését eredményezi (HELMUTH ÉS IVRY, 1996). A motoros-kontrol elmélet szerint a kisagy a különbözô bemenetek komplex mintázat-felismerésével koordinálja és hangolja a kérgi kimeneteket (HOUK ÉS BARTO, 1992; THATCH, 1996), ami felhasználható az idôben változó szenzo-motoros mintázatok tartam megítéléséhez is (BUONOMANO ÉS MAUK, 1994; BUONOMANO ÉS MERZENICH , 1995), azaz a kisagy a többi agyi területet is hozzásegítheti a reprezentációs állapotok anticipációjához és felismeréséhez, ami némiképpen hasonló ALLEN ÉS MUNKATÁRSAI (1997) elképzeléséhez, hogy a kisagy koordinálja az anticipált szenzoros információval végzett belsô mûveleteket.
74
DANCZI CSABA LÁSZLÓ : A ZENEI 1.6.3.2 A
TÉR
STRIATÁLIS RENDSZER
Az elkülönült motoros akciók azonban általában 1 s-nál rövidebbek és a motoroskontrol hipotézisben szereplô helyi neurális aktivitás fenntartására szolgáló mechanizmusokat is hasonlóan rövid tartamúnak tartják (BUONOMANO ÉS MERZENICH, 1995), így az ilyen mechanizmusok nem valószínû, hogy adekvátak lennének 1 s-nál sokkal nagyobb intervallumokra. A hosszabb tartamokat a striatális rendszer idôzítheti, vagy a kisagy más neurális struktúrákkal összehangolva, amelyeknek a kisagy idôzített szignálokat küld. A patkányokon végzett farmakológiai és léziós kísérletek segítették elkülöníteni a temporális feldolgozásban szerepet játszó kérgi és kéreg alatti területek funkcióit. A kísérletekben általában az állat feladatok során mutatott reakcióinak (karlenyomás) gyakoriságát mérik. A képzési próbák során jutalmat adnak az elsô olyan reakcióért, amely azután történik, hogy egy adott idô (30 s) lejárt. Ebben a kísérleti elrendezésben a patkányok megtanulják, hogy visszatartsák reakciójukat egy olyan idôtartam végéig, amelyet implicit módon semmi sem jelez. A reakciók gyakoriságát olyan próbákban mérik, ahol nem kapnak jutalmat. A mai nyelvhasználatban a ‚bazális ganglionok’ a Az olyan drogok, amelyek a nucleus caudatust, a putament és a globus pallidust jelendopaminerg és a kolinerg rendszerekre tik. Funkcionális jelentôségük van legalábbis az akaratla hatnak, a reakcióidô eltolódását okoz- gos mozgások kontroljában és a testtartások (posture) zák. A dopaminnal kapcsolatos hatások létrehozásában. A nucleus caudatust és a putament a közöttük találkezdetben erôsek, azonban lecsökkenható internal capsula anterior nyúlványával együtt corpus nek egy idô után, mintha a drog a belsô striatumnak nevezik (stria: barázda; barázdás test) külseóra sebességét változtatná meg és az je miatt. állat idôvel megtanulná kompenzálni A striatum a bazális ganglionok bemeneti központ azt. Ezzel szemben az acetilkolinnal ja. Az elsôdleges bemenet az agykéregbôl jön, egy másodkapcsolatos hatások lassan fejlôdnek ki, lagos pedig a talamusból. A kéreg specifikus területei a ám tovább tartanak azt sugallva, hogy az striatum specifikus részeire képezôdnek le. Ezek a kapcsolatok fennmaradnak a bazális ganglionok egészén belül. állat tárolt reprezentációját befolyásolják a cél intervallumról (a kísérletek áttekintésére lásd MECK, 1996). MECK (1996) egy több-összetevôs modellt javasolt ezeknek az eredményeknek a magyarázatára, amiben a dopaminerg bazális ganglionok-dorzális striatum rendszer alkotja az órajel-akkumuláló mechanizmust, míg a kolinerg frontális kéreg rendszer feladata a temporális memória és figyelem. A modellben a dorzális striatum akkumulátor, ami tárolja a más forrásokból származó adatokat. A substantia nigra (SN) szabályos jeleket küld a striatumon keresztül a pallidumba, ahol a dorzális striatum akkumulálja a jeleket. Az SN léziója lerontja a patkányok temporális-diszkrimináció tanulását amikor az idôtartam 20-60 s-ig terjed, míg a dorzális striatum károsodása fôként a 60 s-os idôtartam teljesítményét rontja le. Az akkumulált jel a talamuszon keresztül a frontális kéregbe kerül, ahol összehasonlítódik a feladattal kapcsolatban tárolt tartam reprezentációjával. A modell összhangban van azzal a megfigyeléssel, hogy a Parkinson-kóros betegek (dopaminerg) általában alulbecsülik az intervallumokat (PASTOR ÉS MUNKATÁRSAI , 1992), de nem veszi figyelembe a kisagy szerepét az idôészlelésben.
75
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.6.3.3 KÉRGI TERÜLETEK A frontális kéreg szerepet játszik a munkamemóriában (PARDO ÉS MUNKATÁRSAI , 1991; PAULESU ÉS 1993), ami az idôzítéshez szükséges (GIBBON ÉS MUNKATÁRSAI , 1997), ugyanis a standard intervallumot meg kell ôrizni a célinger utáni intervallummal való összehasonlításhoz. A mediális és a superior frontális gyrusok sérülései a tartam-észlelés deficitjével járnak (GOLDMAN-RAKIC, 1987; RAJKOWSKA ÉS GOLDMAN-RAKIC, 1995B). Ezeknek a területeknek és a frontális szemmezônek (FEF) közvetlen kapcsolata van a bazális ganglionokkal (substantia nigra) - a nucleus caudatussal való kölcsönös kapcsolatrendszer révén (ALEXANDER ÉS MUNKATÁRSAI, 1986) - azaz a belsô órával, amennyiben a bazális ganglionok vezérlik az idôzítést (GIBBON ÉS MUNKATÁRSAI, 1997; HARRINGTON ÉS MUNKATÁRSAI, 1998b). HARRINGTON ÉS MUNKATÁRSAI (1998b) szerint a bazális ganglionokkal kölcsönös összeköttetésben álló kérgi területek - a kiegészítô motoros terület (SMA), a frontális szemmezô (FEF, Br. 6), és a dorzolaterális prefrontális kéreg (DLPF) - is szerepet játszanak az idôészlelésben. A normális tartamészleléssel rendelkezô pácienseknek általában a jobb inferior parietális lebenye és prefrontális kérge (FEF és DLPF) ép, ráadásul ugyanezeknek a területeknek a bal oldali léziói után a páciensek idôzítési képessége normális marad, azaz az idôzítés a jobb féltekére lateralizált (HARRINGTON ÉS MUNKATÁRSAI , 1998b). A kisagyi nucleus dentatus - ami szintén szerepet játszik az idôzítésben - a DLPF-be és az SMA-ba küld projekciót (MIDDLETON ÉS STRICK, 1994). A DLPF a munkamemóriához és a figyelemhez fontos (POSNER ÉS DEHAENE, 1994). Az inferior parietális kéregnek erôs bilaterális projekciói vannak a putamenhez, a bazális ganglionokhoz és a nucleus caudatusba (CAVADA ÉS GOLDMAN -RAKIC, 1991 majomkísérletek), ráadásul ROLAND ÉS MUNKATÁRSAI (1981) a jobb félteke prefrontális és inferior parietális kérgének aktivációját találták ritmus-diszkriminációs feladat végzése közben, így az inferior parietális kéreg is szerepet játszhat az idôészlelésben. MUNKATÁRSAI ,
76
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.6.4 T EMPORÁLIS FIGYELEM Figyelemre lehet szükség az óra mûködtetéséhez, vagyis lehetséges, hogy az óra nem aktiválódik figyelem hiányában (MACAR ÉS MUNKATÁRSAI , 1994). A jobb félteke lézióira jellemzô figyelmi deficitek nem járnak a frekvencia-észlelés leromlásával, ami azt jelzi, hogy a deficitek az idô-diszkriminációra specifikusak, vagyis a jobb féltekének nem csak a térbeli figyelem változásában és fenntartásában van szerepe (KNIGHT ÉS MUNKATÁRSAI , 1981; POSNER ÉS MUNKATÁRSAI , 1984; HEILMAN ÉS MUNKATÁRSAI, 1985; PARDO ÉS MUNKATÁRSAI , 1991; CORBETTA ÉS MUNKATÁRSAI , 1993; SMITH ÉS MUNKATÁRSAI, 1996), hanem a temporális figyelemben is (COULL ÉS NOBRE, 1998). A figyelem térbeliségre összpontosítását behatóan tanulmányozták. Az agy képes a figyelmet dinamikusan irányítani az alapján, hogy az események várhatóan hol fordulnak majd elô, a várt helyen felbukkanó ingereket pedig gyorsabban és pontosabban detektáljuk, mint a nem ott elôfordulóakat (POSNER ÉS MUNKATÁRSAI , 1980). Neuropszichológiai (áttekintésükre lásd MESULAM, 1990) és az agyi leképezéses (CORBETTA ÉS MUNKATÁRSAI , 1993; NOBRE ÉS MUNKATÁRSAI, 1997) tanulmányok szerint a térbeli figyelem neurális hálózatának lényeges eleme a posterior parietális kéreg az intraparietális sulcus körül, a frontális szemmezô a laterális és a mediális premotoros kéregben, valamint az anterior cingulatum. A leképezéses eljárások (COULL ÉS MUNKATÁRSAI, 1996; W OJCCIULIK ÉS KANWISHER , 1998) valamint a neuropszichológiai tanulmányok (HARRINGTON ÉS MUNKATÁRSAI, 1998b) szerint a jobb posterior parietális kéreg a térbeli és a temporális figyelemben is szerepet játszik. COULL ÉS NOBRE (1998) szerint azonban a bal fronto-parietális hálózat fontos az adott idôpillanatra irányuló figyelemhez. PLATEL ÉS MUNKATÁRSAI (1997) aktivációt találtak a bal inferior frontális gyrusban a hang-sorozatok ritmusára - szekvenciális ingerek temporális jellemzôire - irányuló figyelem esetében. FIEZ ÉS MUNKATÁRSAI (1995) a bal frontális operculumban találtak aktivációt akkor, amikor a kísérleti alanyok arra figyeltek, hogy az ingerek nyelviek vagy sem. COULL ÉS NOBRE (1998) szerint a fronto-parietális területek nem csupán a térbeli figyelem irányításában, hanem más inger-dimenzióban is szerepet játszanak. Egyes területek (az intraparietális sulcus és a frontális szemmezô) aktivitását okulo-motoros feladatokban figyelték meg, alátámasztva az erôs kapcsolatot az okulo-motoros elôkészület és a figyelem irányítása között (RIZZOLATTI ÉS MUNKATÁRSAI , 1987; CORBETTA, 1998; N OBRE ÉS MUNKATÁRSAI., 1998). COULL ÉS NOBRE (1998) szerint a bal intraparietális sulcus (IPS) és a bal inferior kiegészítô motoros kéreg (SMA) játszik szerepet az idôtartamokra irányuló figyelemben, míg a funkcionális leképezések (CORBETTA ÉS MUNKATÁRSAI, 1993; NOBRE ÉS MUNKATÁRSAI , 1997) és a neuropszichológiai tanulmányok (POSNER ÉS MUNKATÁRSAI, 1984) a jobb IPS aktivációját jelzik térbeli orientáció során. A térbeli orientációs feladatban (POSNER, 1990) a kísérleti alanyok olyan vizuális ingerekre reagálnak amilyen gyorsan csak tudnak, amelyek periférikus helyeken jelennek meg. Közvetlenül a célinger elôtt van egy vizuális kulcsinger, amely vagy helyesen („érvényes kulcsinger”) vagy helytelenül („érvénytelen kulcsinger”) bejósolja a következô célinger helyét. A temporális orientációs feladatban (COULL ÉS NOBRE, 1998) azt mérik, hogy az olyan ingerek, amelyek kulcsingerrel bejósolt idôben fordulnak elô, hatékonyabban detektálhatóak-e, mint a nem a bejósolt pillanatban elôfordulók. A szimultán térbeli és temporális figyelem fôként a parietális területet aktiválja. A parietális kéreg, különösen a jobb oldalon, erôsebben aktiválódik akkor, amikor a kísérleti alanyok a térre és az idôre együttesen figyelnek, mint amikor a kettôre külön-kölön (COULL ÉS NOBRE, 1998). Ez a terület szerepet játszik a térbeli figyelemben (CORBETTA ÉS MUNKATÁRSAI, 1993; NOBRE ÉS MUNKATÁRSAI , 1997) és a fenntartott figyelemben (PARDO ÉS MUNKATÁRSAI , 1991) is. Az IPS - beleértve a temporo-parietális csatlakozást - játssza a legkövetkezetesebb szerepet a klinikai neglectben (RAFAL ÉS ROBERTSON , 1995). HUSAIN ÉS MUNKATÁRSA i (1997) jobb félteke léziós neglectes és nem neglectes pácenseknek gyors betûsorozatot mutattak be, amiben azonosítaniuk kellett egy (kontrol feladat) vagy két (dupla feladat) betût, amelyek változó idôbeli közelségben voltak egymáshoz. A nem-térbeli figyelemnek a két célinger között meg kell változnia a dupla feladat elvégzéséhez. Egészséges személyeknél a második célinger azonosítása leromlik - a kontrol feladathoz képest -, ha azt az elsô célingertôl mért 400 ms-on belül mutatják be. Ezt a jelenséget nevezik „figyelmi pislogásnak” (attentional blink). RAYMOND ÉS MUNKATÁRSAI (1992) szerint figyelmi pislogáskor a szoros idôbeli közelségben bemutatott célingerek versen77
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
genek a korlátozott feldolgozási kapacitásért. HUSAIN ÉS MUNKATÁRSAI (1997) szerint a figyelmi pislogás azoknál a jobb inferior parietális léziót szenvedett pácienseknél volt hosszabb (1440 ms), amelyek egyoldali neglectesek voltak (a nem neglectes jobbfélteke-léziós páciensek normális figyelmi pislogással rendelkeztek). A meghosszabbodás nem tulajdonítható a fenntartott figyelem leromlásának, mivel ugyanezek a páciensek normális teljesítményt mutattak a kontrol feladatban (HUSAIN ÉS MUNKATÁRSAI , 1997). COULL ÉS NOBRE (1998) szerint azonban Husain és munkatársai a figyelmi folyamat idôbeli lefolyását és nem a temporális figyelmet mint olyant mérték. 1.6.5 TÖBBSZÖRÖS
TEMPORÁLIS FELDOLGOZÁS
A patkány kisagyának léziói a tartam-diszkriminációs feladat szelektív deficitjével járnak, ha az ingersáv 500 ms körül van, de nem befolyásolják a teljesítményt, ha a sáv 30 s-körüli (CLARKE ÉS MUNKATÁRSAI , 1996). Az emberekkel végzett kísérletek eredménye alapján minôségileg különbözô a 1,5-2 s-nál hosszabb intervallumok temporális feldolgozása az ennél rövidebbekétôl (FRAISSE, 1963). Ha szinkronban akarunk kopogni egy hang-sorozattal, a kopogások sietnek amikor a hangok közötti szünet 1800 ms-nál rövidebb; hosszabb szünetek esetén a kopogások általában késnek (MATES ÉS MUNKATÁRSAI , 1994). IVRY ÉS MANGLES (1997) kisagy és frontális kéreg sérült pácienseket teszteltek olyan tartam-diszkriminációs és hangmagasság-diszkriminációs feladatokkal, amelyekben a standard és az összehasonlítandó inger között hosszú vagy rövid szünet volt (400 ms és 4 s). A kisagy-sérült páciensek mindkét szünethossz esetén rosszul teljesítettek az idôtartam-diszkriminációs feladatban, ám a frontális kéreg sérült páciensek csak a 4 s-os szünethossznál teljesítettek a kontrol alanyoknál rosszabban, ám akkor a hangmagasság diszkriminációs feladatban is, azaz feltehetôen a figyelmi képességük - is - sérült. RAO ÉS MUNKATÁRSAI (1997) a jobb inferior frontális gyrus aktivációját találták olyan motoros idôzítési feladat végzése közben, amelyben a megôrzött tartamot (300 vagy 600 ms) egy 18 s-os próbában kellett reprodukálni. Ez a terület a superior temporális gyrussal együtt a nem-nyelvi auditoros képzetek elôhívásához és aktiválásához fontos neurális hálózat része (ZATORRE ÉS MUNKATÁRSAI , 1996). HARRINGTON ÉS MUNKATÁRSAI (1998b) szerint azonban az inferior frontális gyrus sérülése nem társul idôészlelési deficittel, ha a standard intervallumot csak 1 s-ig kell megôrizni. Számos szerzô sugallta, hogy különbözô mechanizmusok használatosak különbözô idôzítés-típusok esetén (például implicit és explicit idôzítési mechanizmusok). A megítélt tartam hossza - ami idôzített, vagy mozgásos - valamint a temporális ítélethez kapcsolódó tudatosság foka határozza meg a használt rendszert. Több szerzô is sugallta, hogy az idôzítésben szerepet játszó tudatosság foka a mért tartam hosszától függ és a motoros rendszer mûködését is ugyanez a tényezô határozza meg (pl. IVRY, 1996, 1997; R AMMSAYER, 1999). LEWIS ÉS MIALL (2003) szerint a három tényezô (idôzített-mozgásos, tudatos-nemtudatos, motoros-nemmotoros) mellett még az idôzítés folytonossága is fontos meghatározó. 1.6.5.1 INTERVALLUM-TARTOMÁNY Számos különbözô megfigyelés sugallja azt, hogy milliszekundumos tartományba esô intervallumokhoz különbözô idôzítést használunk, mint a több szekundumos tartományba esô intervallumokhoz: a két tartam-sávba esô temporális megítélések különbözô pszicho-fizikai jellemzôi (GIBBON ÉS MUNKATÁRSAI, 1997), a farmakológiai szerek különbözô hatása (MITRIANI ÉS MUNKATÁRSAI , 1977; RAMMSAYER, 1993, 1999; RAMMSAYER ÉS VOGEL, 1992), különbözô teljesítmény-leromlás kettôs-feladatok végzésében (RAMMSAYER ÉS LIMA , 1991) és különbözô teljesítmény-leromlás specifikus agyi léziók esetén (CLARKE ÉS MUNKATÁRSAI, 1996). LEWIS ÉS MIALL (2003) kimutatta, hogy különbözô agyi területek aktívak a 0,6 és a 3 s-os intervallumok esetén ugyanazon feladat közben.
78
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.6.5.2 FIGYELEM ÉS TARTAM Számos tanulmány szerint az 1 s-nál hosszabb intervallumok megítélése kognitívan kontrolált és figyelt feldolgozást igényel, míg a ms-os tartományba elsô intervallumok feldolgozása nem követel meg semmilyen közvetlen figyelmet: például azok a kísérletek, amelyek kimutatták, hogy a munka-memória aktív feldolgozása csak hosszabb intervallumok idôzítéséhez szükséges (FORTIN ÉS BRETON, 1995; FORTIN ÉS MUNKATÁRSAI , 1993; RAMMSAYER ÉS LIMA , 1991). A ms-os tartományba esô temporális feldolgozást nem befolyásolja az arousal szintje (RAMMSAYER, 1989; R AMMSAYER ÉS VOGEL, 1992), de függ a szenzoros folyamatoktól (RAMMSAYER ÉS LIMA, 1991). Farmakológiai szerekrôl, mint például az LSD-rôl és a meszkalinról tudjuk, hogy megzavarják a kognitív feldolgozást: lerontják a több szekundumos idôzítést, de épen hagyják a milliszekundumos idôzítést (MITRIANI ÉS MUNKATÁRSAI, 1977). A ms-os tartományba esô intervallumokat többé-kevésbé automatikusan észleljük, míg a több szekundumos tartomány aktív feldolgozást követel meg közvetlen kognitív kontrollal (MITRIANI ÉS MUNKATÁRSAI , 1977; RAMMSAYER, 1999). 1.6.5.3 MOTOROS RENDSZER ÉS TARTAM Mivel a mozgásban használatos tartamok - például az izom-koordináció létrehozásához - a szekundumnál kisebb tartományba esnek feltehetô, hogy az ilyen intervallumok idôzítésére használt órák a motoros rendszerben találhatóak. Az egyik jelölt erre a kisagy. A kisagy gyakran aktív szekundumnál kisebb tartományba esô intervallumok idôzítési feladataiban (COULL ÉS MUNKATÁRSAI , 2000; COULL ÉS NOBRE, 1998; JANCKE ÉS MUNKATÁRSAI, 2000 B; JEUPTNER ÉS MUNKATÁRSAI , 1995, 1996; KAWASHIMA ÉS MUNKATÁRSAI , 2000; LUTZ ÉS MUNKATÁRSAI , 2000; MAQUET ÉS MUNKATÁRSAI , 1996; PARSONS , 2001; PENHUNE ÉS D OYON, 2002; PENHUNE ÉS MUNKATÁRSAI, 1998; R AO ÉS MUNKATÁRSAI , 1997; ROLAND ÉS MUNKATÁRSAI, 1981; SCHUBERT ÉS MUNKATÁRSAI , 1998; S CHUBOTZ ÉS MUNKATÁRSAI , 2000; SCHUBOTZ ÉS VON CRAMON, 2001). A kisagy léziói a hasonló tartamú mozgás-idôzítés deficitjével járnak (IVRY ÉS MUNKATÁRSAI, 1988). Mindez arra az elképzelésre vezetett, hogy a kisagy szekundumnál kisebb tartományra specifikus órákat tartalmaz (lásd HAZELTINE ÉS MUNKATÁRSAI , 1997; IVRY, 1996). A kisagy neurális hálózati modelljei kimutatták, hogy a kisagy számos különbözô módon is jól mérheti a szekundumnál kisebb intervallumokat (DE ZEEUW ÉS MUNKATÁRSAI, 1998; GUIGON ÉS MUNKATÁRSAI , 1994; MEDINA ÉS MUNKATÁRSAI , 2000; PERRETT ÉS MUNKATÁRSAI, 1993). A kisagy szerepet játszik a perceptuális (azaz nem-motoros) idôzítésben is (CASINI ÉS IVRY, 1999; IVRY ÉS KEELE, 1989; NICHELLI ÉS MUNKATÁRSAI , 1996) és hosszabb, akár 21 s-os tartamok idôzítésében is (M ALAPANI ÉS MUNKATÁRSAI , 1998; NICHELLI ÉS MUNKATÁRSAI , 1996). A motoros rendszer más területei - például a premotoros kéreg - is szerepet játszhatnak az idôzítésben. Egy lehetséges mechanizmus az ilyen szerepre a „buildup” sejtek bejósolható aktivitása, amirôl MATSUZAKA ÉS MUNKATÁRSAI (1992) kimutatták, hogy növekszik vagy csökken a mozgásra készülôdéskor. A központi mintázat-generátorok (CPG) egy másik lehetôséget kínálnak. Tudjuk, hogy ritmikus aktivitást produkálnak 60 ms alatti periódusoktól több szekundumos periódusokig (ARSHAVSKY ÉS MUNKATÁRSAI, 1997) mindenféle ritmikus motoros aktivitáshoz, különösen a lokomóciós, légzési és rágási akciókhoz. Az agytörzsi és gerincvelôi CPG-ket felülrôl-lefelé ható kontrol modulálja (ARMSTRONG, 1988) és projekciókat küldenek az agykérgi területekre (ARSHAVSKY ÉS MUNKATÁRSAI, 1978). L EWIS ÉS MIALL (2003) feltételezi, hogy ha egy intervallumot újra meg újra változtatás vagy megszakítás nélkül észlelünk (például a saját tempójú kopogásban vagy az izokron ritmus észlelésekor) a temporális mérést automatikus neurális hálózatok is végezhetik, amelyek nem követelnek meg nyílt figyelmet. Az elképzelés megfelel a motoros-program elképzelés (SCHMIDT, 1982) laza értelmezésének, ami szerint a túltanult mozdulathoz szükséges összes információ tárolható úgy, hogy kiválasztásakor és indításakor a mozdulat lényegében automatikusan zajlik le. Ezért lehet, hogy szükséges figyelni a temporális produkció vagy percepció elsô egy-két ciklusára hogy kiválasszuk a megfelelô idôzítési mechanizmust és beindítsuk, de ezután csak akkor van szükség figyelemre, ha eltérés van az intervallum és az elvárás között. Az ilyen „automatikus” mozgási feladatok végrehajtásához nincs szükség explicit figyelemre (PASSINGHAM , 1996). Ha nincs szükség figyelemre a mozgáshoz, akkor feltehetôen az ezzel kapcsolatos temporális idôzítéshez sem szükséges figyelem. LEWIS ÉS MIALL (2003) feltételezi, hogy létezik egy idôzítési 79
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
rendszer az olyan rövid intervallumok mérésére, amelyek folytonosan és mozgásosan produkálódnak (mint a kopogás vagy más túltanult motoros programok). A rendszer valószínûleg olyan neurális hálózatokat használ az idôzítésre, amelyek a motoros rendszerben vannak és figyelmi moduláció nélkül lefuthatnak; ezért LEWIS ÉS MIALL (2003) ezt automatikus idôzítési rendszernek nevezi. A CPG-k ideális mechanizmust szolgáltatnak az automatikus rendszerhez, mivel folytonos ritmikus kimenet jellemzi ôket. A kisagy idôzítési mechanizmusai az automatikus mozgás intervallumainak mérésére alkalmasak, mivel úgy tûnik, hogy a kisagynak fontos szerepe van az automatizálódott cselekvésekben (NIXON ÉS PASSINGHAM , 2000). 1.6.5.4 KOGNITÍV KONTROL Automatikus idôzítés csak akkor lehetséges, ha a kérdéses intervallum ismétlôdik megállás nélkül, mivel a szekvencia bejósolhatatlan szünetei figyelmet követelhetnek meg, hogy újraindítsák vagy átállítsák az órát az új sorozatra. Továbbá korlátai lehetnek a maximális tartamnak, amelyet a rendszer idôzítôi kényelmesen mérhetnek (DE ZEEUW ÉS MUNKATÁRSAI , 1998; GUIGON ÉS MUNKATÁRSAI , 1994; MEDINA ÉS MUNKATÁRSAI , 2000; PERRETT ÉS MUNKATÁRSAI , 1993). Ráadásul ha az automatikus rendszer órái a motoros kéregben vagy a kisagyban vannak, akkor feltehetô, hogy fôként a mozgás intervallumainak a mérésére használatosak. LEWIS ÉS MIALL (2003) szerint az 1 s-nál hosszabb intervallumokat diszkrét eseményekként észleljük és nem egy bejósolható szekvencia részeként, ráadásul nem mozgás határozza meg ôket és így közvetlen figyelmet követelnek meg. LEWIS ÉS MIALL (2003) szerint az ilyen intervallumokat a kognitívan kontrolált idôzítési rendszer dolgozza fel. 1.6.5.5 AUTOMATIKUS IDÔZÍTÉSI RENDSZER Az automatikus idôzítési rendszerrel kapcsolatos feladatok leggyakrabban a bilaterális kiegészítô motoros területen (SMA) és a szenzorimotoros kéregben.váltanak ki aktivitást. A jobb féltekei kisagyi ganglionok szintén gyakran aktiválódnak ezekben a feladatokban, bár nem látszanak olyan általánosnak, ha a mért intervallumok hosszabbak 1 s-nél. Ezekkel a feladatokkal társuló aktivitás gyakran figyelhetô meg az occipitális kéregben és a bal talamuszban bizonyos feltételek közepette, bár ezek nem olyan konzisztensek, mint a többi terület. Több tanulmány is leírt aktivitást a temporális kéregben olyan idô-megítélési feladatokban, amelyekben nem szerepeltek auditoros kulcsingerek (COULL ÉS MUNKATÁRSAI, 2000; L ARASSON ÉS MUNKATÁRSAI, 1996; RAO ÉS MUNKATÁRSAI, 2001). Mások kimutattak auditoros aktivitást az auditoros kulcsingerek megszûnése utáni feladat-fázisokban, mint a kopogás folytatása az auditoros szinkronizáció után (RAO ÉS MUNKATÁRSAI , 1997) vagy mint memória-kódolás a bemutatás után (S AKAI ÉS MUNKATÁRSAI, 1999). RAO ÉS MUNKATÁRSAI (1997) szerint ez az aktivitás az auditoros képzelettel kapcsolatos, amire szükség van a feladatban. Így az a megfigyelés, hogy a jobb féltekei superior temporális kéreg az egyik leggyakrabban aktiválódó terület az automatikus idôzítési rendszert igénybe vevô feladatokban azt is jelentheti, hogy ezeknek az intervallumoknak a mérése gyakran auditoros képzelettel jár. Ezzel szemben nincs olyan tanulmány, amelyben az occipitális kéreg aktiválódna olyan feladatokban, amelyekben nem játszik szerepet vizuális inger, ami valószínûtlenné teszi, hogy az itt megfigyelt aktivitás a temporális feldolgozással függ össze. 1.6.5.6 KOGNITÍVAN
KONTROLÁLT IDÔZÍTÉS
LEWIS ÉS MIALL (2003) a specifikusan aktiválódott területek áttekintése alapján arra következtetett, hogy több prefrontális terület - amelyekrôl azt tartják, hogy flexibilis kognitív modulokat tartalmaz (DUCAN, 2001) - aktiválódik a kognitívan kontrolált feladatokban, de nem aktiválódik az automatikus feladatokban. Ilyen terület a dorzolaterális prefrontális kéreg (DLPFC), a ventro-laterális prefrontális kéreg (VLPFC), az intraparietális sulcus (IPS) és az inferior parietális kéreg. A motoros rendszer sok területe (az SMA, a szenzorimotoros kéreg, a frontális operculum, a bazális ganglionok, a jöbb kisagy és a talamusz) aktiválódik automatikus feladatokban. Következtetésük szerint az automatikus idôzítési rendszer olyan mechanizmusokon alapul, amelyek magában a motoros rendszerben vannak. Az, hogy ezek közül némelyik terület (az 80
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
SMA és a jobb kisagy) szintén gyakran aktiválódik kognitívan kontrolált feladatokban, szerintük azt sugallja, hogy a kognitívan kontrolált rendszer nem zárja ki az automatikus rendszer moduljainak szerepét. Érdekes, hogy a DLPFC és a parietális kéreg ritkán aktiválódik az automatikus idôzítéssel kapcsolatos feladatokban. A kognitívan kontrolált idôzítési rendszerrel kapcsolatos feladatokban azonban a jobb féltekei DLPFC (amit a munka-memóriával kapcsolnak össze) gyakrabban aktiválódik, mint más területek. A bal féltekei kisagy is nagyon gyakran aktív a kognitívan kontrolált feladatokban, míg a bilaterális IPS (amit a figyelemmel kapcsolnak össze), az SMA és a jobb féltekei kisagy gyakran aktiválódik, amikor a mért intervallum hosszabb, mint 1 s. A jobb féltekei VLPFC és az IPS (amit a figyelemmel kapcsolnak össze) gyakran aktiválódik, amikor az idôzítés diszkrét idôtartamokban történik. L EWIS ÉS MIALL (2003) szerint azok a területek, amelyekrôl tudjuk, hogy szerepet játszanak a mozgásszelekcióban, aktivitást mutatnak a különbözô ritmusok kezdetén, de inaktívak az ezután következô ritmusbemutatások során. 1.6.6 I DÔVEL KAPCSOLATOS FELDOLGOZÁS AZ AUDITOROS RENDSZERBEN A cochlea egy olyan szûrô-sorhoz hasonló, ami lefedi a hallható frekvenciák tartományát (kb. 20 Hz - 20 kHz ember esetében). Lényegében egy Fourier-transzformációnak tartják a szerepét: a cochlea lassan változó spektruma átlag kisülési-sebesség értékekbe kódolódik az auditoros idegrostokban, amik továbbítják ezt az auditoros idegrendszerhez további feldolgozásra. Logikus, hogy az ilyen feldolgozás frekvencia alapján történik. Ez az elképzelés HELMHOLTZ-tól (1877) ered. Azonban bizonyíték van arra, hogy az auditoros feldolgozás idô alapján is történik. A legtöbb idômodell két alapelembôl megalkotható: késleltetés-vonalakból és kapu-neuronokból. A kapu-neuronok bemeneteik neurális tüzelés-mintázataira szenzitívek, különösen a tüzelések relatív idôzítésére. Az interakció izgalmi vagy gátló: az egyik pályán érkezô tüske lehetôvé teszi - vagy éppen ellenkezôleg, megakadályozza - egy tüske továbbhaladását a másik pályán.
81
DANCZI CSABA LÁSZLÓ : A ZENEI 1.6.6.1 JEFFRESS LOKALIZÁCIÓS
TÉR
MODELLJE
Az auditoros lokalizáció „kereszt-korrelációs”modelljét JEFFRESS (1948) alkotta meg. A neurális áramkör két bemenettel rendelkezik, amelyek különbözô késleltetés után konvergálnak a neuronon. A neuron egybeesés-számláló: akkor reagál, amikor az idegi impulzusok („tüskék”) az egybeesés idô-ablakán belül érkeznek a két szinapszisra. Az idô-ablak viszonylag rövid a fontos ingerösszetevôk periódusához képest. Feltételezve a statisztikai függetlenséget a tüskét generáló folyamatok között, a valószínû kimeneti sûrûség arányos a bemeneti sûrûségekkel. A modell ilyen neurális áramkörökbôl áll olyan késleltetésekkel, amelyek felölelik a lehetséges interaurális késések tartományát (kb. plusz/minusz 0,8 ms ember esetén). Ez az elrendezés a bemeneti tüske-sûrûségek kereszt-korrelációs idô-függvényét hozza létre. A frekvencia-csatornák két dimenzióban szervezôdnek: az egyik dimenzió a frekvencia (amit a cochleáris szûrésbôl kap), a másik pedig az interaurális késés. Az auditoros tér egyik oldalára lokalizált széles-sávú forrásra adott reakcióként egy aktivitás-taréj keletkezik ott, ahol a belsô (neurális) késleltetés kompenzálja a külsô (akusztikus) interaurális késést. Jeffress modellje spekulatív maradt sok éven át, amíg fiziológiai és anatómiai bizonyítékokat nem találtak rá az emlôsök mediális oliva superiorában (MSO) és colliculus inferiorában (IC, ahová az MSO küld projekciót), valamint madarak ezeknek megfelelô struktúráiban (CARNEY ÉS MUNKATÁRSAI , 1989; CHAN ÉS MUNKATÁRSAI , 1989; KONISHI ÉS MUNKATÁRSAI, 1988; Y IN ÉS MUNKATÁRSAI, 1984, 1987 1990). Jeffress modellje akkor is mûködik, ha az izgalmi-izgalmi (EE) interakciót izgalmi-gátló (EI) interakcióval, azaz a maximum keresést minimum kereséssel helyettesítjük.
82
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.6.6.2 L ICKLIDER HANGMAGASSÁG -MODELLJE L ICKLIDER (1951, 1959) egy hasonló modellt alkotott a hangmagasság magyarázatára. A modellben ahogy Jeffress modelljében is - a késleltetés-vonalak és egybeesés-számláló neuronok két dimenziós elrendezését találjuk. A bemenetek azonban nem különbözô fülekbôl érkeznek, hanem ugyanabból, ezáltal a neurális áramkör az autokorrelációs függvény megfelelôjét végzi minden egyes csatornában. Nem a fülek közötti korrelációra érzékeny, hanem az ingeren belüli korrelációkra, amik akkor keletkeznek, ha az inger periodikus. A periodikus hangra adott reakcióként egy taréj bukkan fel a két-dimenziós (szûrô-csatorna frekvencia X autokorrelációs késleltetés) mintázatban olyan késleltetésnél, amely az inger periódusával egyenlô. Ez az inger hangmagasságának kulcsingere Licklider modelljében. CARIANI ÉS MUNKATÁRSAI (1996a,b) fiziológiai megalapozást találtak a modellre azzsl a megfigyelésükkel, hogy az auditoros idegrost-tüzelések autokorrelációs hisztogramjai korrelálnak a hangmagasság-észleléssel. Jeffress modelljével ellentétben azonban még nem lokalizálták azokat a neurális központokat, ahol ilyen feldolgozás történik. 1.6.6.3 MEDDIS ÉS HEWITT MAGÁNHANGZÓ-HANGSZÍN MODELLJE Az idô-alapú feldolgozás rendszerint a lokalizációhoz, gyakran a hangmagassághoz, ritkán pedig a hangszínhez is szükséges. Az állandó-állapotú (steady-state) hangok hangszínét rendszerint a spektrális jellemzôk adják, amiket a cochlea kódol. MEDDIS ÉS HEWITT (1992) magánhangzó-azonosítási modelljében a két-dimenziós autokorrelációs-mintázat frekvenciák összegzôdnek és autokorrelációs szumma-függvényt alkotnak. Az azonosítás az autokorrelációs szumma-függvény rövid-késleltetésû részének mintázata, összevetve a tárolt sémával. Hasonló modellt sikerrel használt fel de CHEVEIGNÉ (1997). 1.6.6.4 B INAURÁLIS ÉS PERIODIKUS SZEGREGÁCIÓS-MODELLEK Jeffress modellje egyetlen forrás vízszintes síkbeli helyzetének megadására szolgál, de továbbfejleszthetô úgy, hogy több forrás pozícióját adja meg. Amíg a források a spektrum elkülönült részeit foglalják el, elkülönült „taréjokat” hoznak létre a két-dimenziós kereszt-korrelációs mintázat azon csatornáiban, amelyekben dominálnak. Az a tény, hogy a taréjok különbözô helyen vannak a különbözô csatornákban, felhasználható arra, hogy cimkézzük az egyes forrásokhoz tartozó csatornákat. LYON (1983-1988) binaurális hang-szegregációs rendszere ezen az elven alapul. Lyon modellje volt az elsô spektro-temporális modell, ami temporális információt használ a spektrális reprezentáció összetevôinek cimkézésére. W EINTRAUB-ot (1985) közvetlenül Lyon elképzelése inspirálta, de az ô modellje periodikus és nem binaurális információt használ fel. A csatorna olyan cimkét kap, hogy egy hanghoz tartozik, ha a hang periodicitása uralja. MEDDIS ÉS HEWITT (1992) ugyanerre az elképzelésre építve alkották modelljüket az egyidejû-magánhangzók észlelésére. Meddis és Hewitt modelljének az újdonsága az, hogy csupán az egyik (az erôsebb) hang periodicitását követeli meg, míg a Weintraub-modellben és más modellekben is mindkét hang periodicitására (F0) szükség van.
83
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.6.6.5 MEGOSZTOTT CSATORNÁK A spektro-temporális modellekben a csatornák atomszerûek: az információ megoszlik a csatornák között, de nem osztóthat tovább. Azonban a cochleáris frekvencia-felbontás nem tökéletes és így néhány csatornáról elképzelhetô, hogy valójában több forrásra is reagál egyidôben. A modellek különbözô stratégiát követnek: (a) a csatornát az egyik vagy a másik forráshoz rendelik, (b) mindkettôhöz, (c) egyikhez sem, (d) megpróbálják megosztani. A (d) stratégia csatornán belüli idô-alapján-történô feldolgozást jelent. 1.6.6.5.1 DURLACH MODELLJE Jól ismert a maszkolás alóli binaurális feloldás jelensége. Egy cél-szignál detekciós-küszöbe zajban alacsonyabb (azaz a maszkolás kevésbé hatékony), ha a célingernek és a maszkoló ingernek különbözô az interaurális fázis-viszonya. Ennek a jelenségnek a magyarázatára találta ki DURLACH (1963) modelljét, amelyben a két fül szignáljai hasonulnak egymáshoz úgy, hogy egymásnak megfelelô intenzitásra erôsödnekgyengülnek és egyidôbe késnek-sietnek, majd kivonódnak egymásból, hogy megszüntessék a maszkolás hatását. Durlach keskeny-sávú szingálokkal dolgozott, azaz nem volt különbség aközött, hogy nyers szignál vagy egyetlen auditoros szûrô-csatornán belüli jel alapján történik a feldolgozás. A modell kiterjeszthetô széles-sávú célingerekre is feltéve, hogy az összes csatornában ugyanazokkal a paraméterekkel (erôsítés és késleltetés) történik a feldolgozás. Amikor a jel-zaj viszony alacsony, a paramétereket érdemes úgy meghatározni, hogy az értékek olyan paraméter-terét keressük, amely a kitörlés után minimális maradékot ad. Ez végrehajtható egy hasonló neurális áramkörrel, mint amit Jeffress modellje használt, azonban gátló és nem izgalmi interakciókkal. Az egyik oldalra lokalizált forrásra adott reakcióként egy völgy bukkan fel a két-dimenziós elrendezésben. A völgy szolgál kulcsingerként a forrás helyzetéhez, ahogy azt a taréj tette Jeffress modelljében. Fiziológiai megalapozást találtak a modellre a laterális oliva superiorban (LSO, JORIS ÉS YIN 1998). A maradék-aktivitás a völgyben (ha egyáltalán van még) felhasználható egy második, gyengébb forrás meghatározására. A maradék-aktivitásról azt tartják, hogy lassan változó aktivációs mintázat a frekvenciacsatornák között, amit frekvencia-alapján kell feldolgozni. Azonban idô alapján is fel lehet dolgozni, amiben az idô-alapján történô feldolgozás egymást követô szintjeinek mindegyike az elôzô szint maradék-kimenete alapján mûködik.
84
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.6.6.5.2 C ULLING ÉS SUMMERFIELD MODIFIKÁLT MODELLJE CULLING ÉS SUMMERFIELD (1995) szerint Durlach modellje nem írja le a kísérleti alanyok viselkedését olyan helyzetben, amikor két egyidejû magánhangzót kell szegregálni a binaurális diszparitás alapján. Pontosabban nem találtak semmilyen bizonyítékot arra, hogy ugyanazok a hasonult paraméterek használódnak fel a különbözô frekvencia csatornákban. Egy „modifikált modellt” ajánlottak ehelyett, amiben a paramétereket egy minimális-maradék-keresési folyamat találja meg ahogy Durlach modelljében is, de az egyes csatornákban egymástól függetlenül. Ez a modell közelebb van a valósághoz, mint Durlach modellje, ám súlyos problémához vezet. Ha a feldolgozás független az egyes csatornákban, akkor milyen alapon csoportosítódnak és tulajdonítódnak forrásokhoz a csatornák? Egy lehetséges válasz az, hogy az auditoros rendszer ezzel a meglehetôsen különös „két-értékû” mintázattal kezd valamit. A csatornákban két érték van: a „nyers” érték a kitörlés elôtt, valamint a maradék a kivonódás után. Az elsô a csatornán belüli erôsebb forrást tükrözi, míg a második a gyengébb forrást. 1.6.6.5.3 A MAGÁNHANGZÓ-SZEGREGÁCIÓ KITÖRLÉSES MODELLJE Az összekevert magánhangzók könnyebben azonosíthatóak, amikor különbözik az alapfrekvenciájuk (F0). A harmonicitás különbözô alapfrekvenciák esetén kihasználható hatékonyságát megfigyelhetjük nagyszámú úgynevezett „dupla-magánhangzó” kísérletben. Számos modellt javasoltak ennek a magyarázatára, közöttük MEDDIS ÉS HEWITT (1992) elôbb említett csatorna-választás modelljét is. Meddis és Hewitt modellje a perifériás csatornákat olyan csatornákba rendezi, amiket egy-egy magánhangzó dominál. Meglehetôsen sikeres a modell egyenlô amplitúdójú magánhangzók esetében, ám kudarcot vall, ha az egyik magánhangzó erôsebb mint a másik, ugyanis ilyenkor ez az egy dominál minden csatornában. Szegregáció azonban megfigyelhetô ilyen esetben is ( DE CHEVIGNÉ ÉS MUNKATÁRSAI , 1997) és ezt Meddis és Hewitt modellje nem képes megmagyarázni. Az ilyen hatások magyarázata az lehet, hogy alapfrekvencia-alapú szegregáció elôfordulhat csatornákon belül is és nem csak csatornák között. A csatornán-belüli szegregáció történhez az idô-alapján is egy a Durlach-modellhez hasonló kitörlôszûrôvel, ami azonban nem a különbözô, hanem ugyanabból a fülbôl érkezô tüske-sorozatok alapján mûködik. A szûrô eltávolít minden olyan tüskét, ami az elôzô tüske után, a késleltetési paraméterének megfelelô idôpillanatban érkezik. A zavaró hang periódusára hangolódva a szûrô elnyomja azt a gyengébb célinger érdekében. A modellt tesztelték az auditoros idegbôl nyert adatokkal (DE CHEVEIGNÉ , 1993) és a pszichoakusztikai adatokat is meglehetôsen jól magyarázza (DE CHEVEIGNÉ , 1997). 1.6.6.5.4 T ÖBBSZÖRÖS PERIÓDUS-BECSLÉS A hangmagasság-észlelés kitörlési modelljének az a csábítása, hogy generalizálható a többszörös periódusok felbecslésére is. Ez egy kereséssel történik a kitörlési szûrôk „kaszkádjának” paraméter-tere után (DE CHEVEIGNÉ ÉS KAWAHARA, 1997, 1998). A keresés lehet szekvenciális: azután, hogy egy hang periódusa felbecsülôdött, kitörlôdik és a másiké becslôdik fel a kitörlés maradékából. Kimerítô is lehet: a kaszkádolt szûrôk több dimenziós paraméter-tere kereshetô egészen addig, amíg egy minimális kimenetet nem ér el. Ez a modell magyarázhatja azt, hogy például egy zenekarvezetô kihallja az egyes hangszerek hangjait a zenekarban egyidôben játszó sok hangszer közül.
85
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1.6.6.5.5 A KÉSLELTETÉSI-VONALAK KÉRDÉSE A legtöbb modell két alkotóelemmel fiziológiailag kivitelezhetô: késleltetési-vonalakkal és (izgalmi vagy gátló) kapu-neuronokkal. A kapu-neuronok léte nem kérdéses már. Rövid késleltetési vonalakat (a természetesen elôforduló interaurális késlekedések nagyságrendjében) szintén találtak. Azonban kevés bizonyíték létezik olyan késleltetési vonalak létére, amelyek: (a) a hangmagasság periódusok (10 vagy 20 ms) nagyságrendjébe tartozó késleltetéssel rendelkeznének, (b) temporálisan pontosak és (c) „széles-sávúak” (tüske sorozatokat szállítanak az auditoros idegrostokhoz hasonlóan). A (b) követelmény a temporális pontosságról specializált neurális struktúrákat jelez, amelyeket azokban a pályákban találtak, amelyek a laterális oliva superioron (LSO) konvergálnak (JORIS ÉS YIN, 1998), ám viszonylag rövid késleltetésekkel. A (c) követelmény az, hogy a késleltetési vonal hordozza (és így memorizálja) a részletes temporális struktúrát egy viszonylag hosszú tartamon át. Ez egy meglehetôsen komoly korlátozás. Egy olyan késleltetési vonal, amely egyetlen impulzust tartalmaz periódusonként, könnyebben kivitelezhetô, mivel kevesebb információt kell késleltetnie. Ez egy érv lehet PATTERSON ÉS MUNKATÁRSAI (1992) „stroboszkóp auditoros integráció” (SAI, strobed auditory integration) modellje mellett, ami valamiféle kereszt-korreláció az idegrost tüzelési-valószínûség mintázata és egy periodikus „stroboszkopikus” villanás között. Egyetlen stroboszkópvillanást könnyebb pontosan késleltetni, mint egy részletes mintázatot. A feldolgozás történhet egy egybeesés-számláló elrendezés révén is (mint Licklider modelljében), amin konvergálnak a nem-késleltetett elsôdleges vagy elsôdleges-szerû rostok és a késleltetett rostok, amelyek egyetlen impulzust (vagy kis számú impulzust) szállítanak periódusonként. Ez némiképpen különbözô Patterson és munkatársai. statikus buffétôl, amibe betöltôdik a temporális tüzelés-mintázat minden egyes stroboszkóp-villanáskor. 1.6.6.6 A PERIFÉRIÁS SZÛRÉS SZEREPE A legtöbb idô-modell egyáltalán nem veszi hasznát a perifériás szûrésnek. Jeffress lokalizációs modellje akkor is mûködne, ha a két fül hullámformái a szûrés elôtt korrelálódnának és nem utána. Ugyanezt mondhatjuk el Licklider hangmagasság-modelljérôl és Durlach binaurális modelljérôl, de Cheveigné kitörlési-szûrô modelljérôl is. Elsô pillantásra a szûrés a dolgokat csak súlyosbítja, mivel ugyanazt a folyamatot kell ismételni minden szûrt csatornában. A kiváló mechanikus szelektivitás azonban sok faj cochelájára jellemzô és ennek haszna kell hogy legyen. A perifériás szûrés lehet, hogy nem szükséges az idô-alapú modellekhez alapelvként, de alapvetô sikeres megvalósításukhoz. A mechanikus-neurális átalakítás nem lineáris és ezért - valamint más okokból is a neurális szignál-feldolgozásnak korlátozott dinamikája van. A sávra-korlátozott csatornák párhuzamos feldolgozása, amelyek mindegyike saját frekvencia- és fázis-jellemzôit szállítja, kompenzálhatja ezeket a tényezôket. A cochleáris szûrés az „utolsó lineáris szint” (MOLLER, 1983) azelôtt, hogy az idô-alapú feldolgozás átvenné a terepet az auditoros idegrendszerben. 1.6.6.7 A KITÖRLÉS Több modell azon az alapelven alapul, hogy az auditoros rendszer próbálja kitörölni egy forrás korrelátumait. A kitörlés a forrás-jellemzôk felbecsülésének egy módja. Ráadásul „kitörli” a belsô reprezentációt, hogy az új források felbukkanását könnyebben észrevegyük. A jelenet-elemzés tehát egy sor felbecsléskitörlés-felbecslés lépésben történhet, ahogy az auditoros jelenet elemei egymás után „lehámozódnak” (NAKATANI ÉS MUNKATÁRSAI, 1995). A kitörlés jól megfelel az újabb fiziológiai bizonyítékoknak az interaurális idô- és szintkülönbségek gátló feldolgozásáról a laterális oliva superiorban (LSO, BATRA ÉS MUNKATÁRSAI , 1997; JORIS ÉS MUNKATÁRSAI , 1998; T SUCHITANI, 1997). Szintén jól összefér a konkurrens források vakelválasztásáról szóló jelenlegi elképzelésekkel. Egy forrás kitörlése maradékot hoz létre, ami nem korrelál a forrással. N forrás esetén az N-1 forrás összes kombinációjának kitörlése N korrelálatlan kimenetet ad.
86
DANCZI CSABA LÁSZLÓ : A ZENEI 2. A ZENE
TÉR
ÉSZLELÉSE
MEYER A TEXTÚRÁRÓL A textúra azért alakul ki, mert az elme az egyidejû zenei ingereket szimultán figurákra, figurára és kíséretre (háttérre) és így tovább csoportosítja. Más zenei folyamatokhoz hasonlóan a texturális szervezôdés vagy annak hiánya is elvárások kialakulásához vezet. Koffka szerint „ha a feltételek kisebb és nagyobb egységek kialakulásához vezetnek, a kisebb egységek ceteris paribus figurává válnak, a nagyobbak pedig háttérré” (Koffka, 1935, 191. oldal). Azt jelen ti ez, hogy egy polifonikus darabban a kisebb fragmentumokat szükségszerûen figuráknak és a nagyobb részeket háttérnek észleljük? Például egy augmentációban bemutatott téma háttérré válik, amelyen a rövidebb motívumok felbukkannak? Nem feltétlenül. A textúra eloszlását észlelhetjük több, független figura együtteseként is. Mivel az aurális tapasztalatban nem szükségszerû a háttér, a hallgató a szenzoros adatokat többféleképpen is szervezheti. A zenei mezôt észelelhetük úgy, mint ami: (1) egyetlen figurát tartalmaz min denféle háttér nélkül (például egy szóló fuvola darabban); (2) több figurát tartalmaz háttér nélkül (például egy polifonikus kompozícióban, amiben a részek világosan elkülönülnek; (3) egy vagy néha több figura egy háttér kíséretében (például a tizennyolcadik és tizenkilencedik század tipikus homofon mûvei); (4) egyedül a háttér (mondjuk egy zenemû - pédául egy dal - bevezetô részében, ahol a dallam vagy figura nyilvánvalóan még csak most következik); (5) kis motívumok egymásra helyezése, amelyek hasonlóak, de nem pontosan azonosak és amelyeknek alig van egymástól független mozgásuk (például az úgynevezett heterofonikus tex túrákban). A texturális szervezôdés a lehetô legegyszerûbb és -elkülönültebb. Az elme kiemeli a teljes formát, akár a különálló formák gyengítésével is. Amikor a „mezô” legkönnyebben figura-háttér elkülönülésben észlelhetô amiben egy rész jól formált, míg a másik az egyformasághoz közelít, akkor a mezô egységesített része olyan egységesnek és homogénnek fog látszani, amennyire csak az adott feltételek azt lehetôvé teszik. Ha azonban az ingermezôt egyszerûbb egyetlen formaként vagy néhány többé-kevésbé egyenlô formaként felfogni, akkor az elme a különálló formákat és a közöttük lévô kapcsolatokat emeli ki, már amennyire ez lehetséges. A gyakorlott hallgató megtanulta, hogyan irányítsa a figyelmét a stilisztikai körülményektôl függôen; ezért nem csak arra hajlamos, hogy általában véve erôsítse az artikulációt, hanem arra is, hogy bizonyos szervezôdési típusokat preferáljon mások rovására. Így olyan zene észlelése közben, amelyet polifonikusnak tart, a gyakorlott hallgató kihangsúlyozza a figurák egyformaságát; míg olyan zene hallgatásakor, amelyet homofonnak tart, a textúra egyik összetevôjét a másik fölébe helyezi, ráadásul a textúra utóbbi összetevôit egységesebben észleli, mint egyébként. Nem biztos, hogy a texturális szervezôdést kielégítônek érezzük. Az, hogy kielégítônek észleljük vagy sem, a perceptuális mezôn belüli részek specifikus elrendezôdésétôl, az adott mûalkotásban megvalósuló normáktól, valamint a hallgató stilisztikus észlelési szokásaitól függ (MEYER , 1956, 185-188. oldal).
87
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.1 AUDITOROS FELISMERÉS Képzeljük el, hogy hallgatóinknak egy akusztikus demonstrációt játszunk, amiben kerámia tányérok lecsúsznak egy konyhaszekrényrôl, egymásnak ütköznek a levegôben, majd egy kivételével az összes eltörik a padlón. Halljuk, ahogy az egyetlen megmaradó tányér megperdül a padlón, majd végül megáll. Ezután a hallgatóknak a következô kérdéseket tesszük fel: Miféle tárgyakat hallottak? Hány volt belôlük? Mi történt velük? Mind egy darabban maradt az események során? Vizuális kulcsingerek hiányában és a helyzet kontextusát nem ismerve is bármely hallgató, aki egy olyan kultúrából érkezett, amelyben ilyen tárgyakat használnak hasonló környezetben, könnyedén leírja amit hallott, felismerve az egész eseményt, a benne szerepet játszó egyes tárgyakat, sôt legtöbbjük állapotát is a széttörésig. Az emberek könnyedén és gyorsan felismerik környezetük részleteit a hangokat létrehozó tárgyak vagy hangforrások viselkedése alapján még olyankor is, amikor ezek a források a látótéren kívül esnek: felismerünk tárgyakat, amelyek összeütköznek, lépéseket amelyek hátulról közelednek és tárgyakat, amelyek váratlanul leesnek. Bár együtt használjuk érzékszerveinket, a fenti példák azt sugallják, hogy a hallás jelentôs tényezô a környezet észlelésében, ami részben a perceptuális szervezésnek köszönhetô (BREGMAN, 1990). Felismerésrôl akkor beszélünk, amikor a hallottak megfelelnek valamilyen módon egy olyan hangnak, amit már hallottunk a múltban: mondjuk felismerünk egy hangot a telefonban, valakinek a lépéseit az elôszobában vagy egy zenedarabot a rádióban. A felismerés az ismerôsség érzésével jár és gyakran arra is rájövünk közben, hogy a hallott forrás mit jelentett számunkra abban a helyzetben Az információfeldogozási megközelítés szerint (pl. ANDERSON , 1985; LINDSAY ÉS NORMAN , 1977) a hangforrás perceptuális jellemzôi, memóriabeli absztrakt reprezentációja, identitása, jelentése és asszociációi más tárgyakkal egy többszintû folyamat eredménye. Ez a folyamat fokozatosan elemzi és átalakítja a szenzoros információt, amelyet elôször az auditoros ideg kódol. A felismerést megelôzi a feldolgozott szenzoros információ összevetése valamilyen reprezentációval, amely a hangformák lexikonában tárolódik a hosszútávú memóriában és az illeszkedés mértéke határozza meg, hogy a hang felismerôdik-e vagy sem és ha igen, akkor milyen ismerôsségi fokot ér el. A forma (formák), amelyet a hangesemény felvesz, valamint a különbözô szemantikus információk, amelyek asszociálódtak vele a tapasztalatban, szintén összehasonlításra kerülnek memóriabeli megfelelôikkel (FRAUENFELDER, 1991). Az asszociációk aktivációja a lexikon adott „szószedetének” aktivációjából indul. A lokális kontextustól függ, hogy mely asszociációk aktiválódnak: az autóduda jelentôsége az ember számára különbözô az utcán figyelmetlenül sétálva, a moziban ülve, vagy a közlekedési lámpánál várakozva. A hangesemény felismert identitása és jelentôsége az elemzési, összehasonlítási és asszociációs folyamatok eredménye. Egy másik megközelítés az ökológiai pszichológia (GIBSON, 1966, 1979/1986, VALAMINT MICHAELS ÉS CARELLO , 1981 bevezetôje). Az ökológiai megközelítés szerint a hangzó tárgy fizikai természete, az eszköz, amellyel rezgésbe hozták és a funkció, amelyet szolgál a hallgató számára (és feltehetôen a neve is) közvetlenül észlelt, bármilyen közvetítô feldolgozás nélkül. Azaz az észlelés nem a hangeseményt alkotó elemek elemzésén és mentális képzetbe alakításán keresztül halad, amit azután összehasonlít a memóriabeli reprezentációval, hanem a perceptuális rendszer ráhangolódik a környezet olyan eseményeire, amelyek biológiai jelentôségûek a hallgató számára, vagy amelyeknek tapasztalatban elsajátított viselkedéses jelentôsége van. A megközelítés követôi a fizikai világ struktúráját invariáns tulajdonságok alapján próbálták leírni, azaz olyan jellemzôk alapján, amelyeket változatlannak észlelünk más jellemzôk változásakor (például az ember akkor is felismeri a nagyanyja hangját, amikor az meg van fázva és egy zajos telefonvonalon, avagy gyorsan és magasabb hangregiszteren beszél, mert izgatott valami miatt). A ‚felismerés’ és ‚azonosítás’ kifejezéseket operacionálisan különítik el a kísérleti pszichológiában. A felismerést általában azzal mérik, hogy a kísérleti alany hányszor ítéli meg helyesen azt, hogy az ingert már hallotta, általában a kísérlet idôkeretein belül. Az egyszerû ‚régi/új’ típusú ítéletet kísérheti az ítélet bizonyosságának és az inger ismerôsségének a megítélése is. Az azonosítási kísérletekben a hallgatóknak, meg kell nevezniük (cimkézniük) az ingert, mint ‚ez egy oboa’ vagy ‚5-ös intenzitású’. Az azonosítást egy szorosabbra koncentrált felismerésnek is tekinthetjük, ami eléri a név-lexikont. Képzeljük el, hogy ismerôs bebop trombitást hallgatunk a rádióban és tudjuk, hogy gyakran hallottuk 89
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
már ezt a trombitást iskolás korunkban, de nem jut eszünkbe a neve. A felismerés bizonyára megtörtént. A felismerés bizonyos foka, mivel felismertük a hangforrást mint trombitát, a zenét mint jazzt, feltehetôen a bebop stílus egy bizonyos idôszakában, valamint azt is, hogy a zenészt az iskolában hallottuk. Az osztályozási hierarchia utolsó szintje azonban nem aktiválta a lexikonban a zenész nevét. 2.2 AZ AKUSZTIKUS SZIGNÁL ÁTALAKÍTÁSA A fülbe érkezô hang idegi impulzusok sorozatát indítja el a cochleában, ami átkapcsoló állomásokon keresztül kb. 10 ms alatt az elsôdleges hallókéregbe érkezik. Ez a felfelé haladó (a perifériától az idegrendszer centrális részei felé tartó) afferens aktivációs mintázat állandóan változik, részint azért, mert a szignál egyre újabb struktúrákon halad át az idegrendszerben, részben pedig azért, mert ezek a struktúrák átalakítják a beérkezett nyers információt, miközben meghatározzák különbözô hangjellemzôit. Az ingerületi hullám a kéregbôl visszakanyarodik egyes kéreg alatti területekre (például talamo-kortikális hurkok, lásd DAVIDSON ÉS MUNKATÁRSAI , 2000). Az ingerület egyes struktúrákon gyorsan áthalad (például az agytörzsön, melynek idegsejtjei már néhány milliszekundum után visszanyerik az ingerület áthaladása elôtti állapotukat, lásd PICTON ÉS MUNKATÁRSAI , 1981), másutt hosszabban tartó változást hoz létre. Az elsô szint az akusztikus szignál ‚nyers’ reprezentációja a perifériás auditoros idegrendszerben (szenzoros átalakítás). Ide tartozik a cochlea rezgési információjának átalakítása: a szignál mozgásba hozza az alaphártya különbözô részeit a frekvenciaspektrumtól függôen. A magasabb frekvenciák a hártya egyik, az alacsonyabbak egy másik részét ingerlik. Az alaphártyarészek mozgása átalakul neurális impulzusokká, amiket az auditoros ideget alkotó rostok a központi auditoros feldolgozó-központokhoz szállítanak, ahol az impulzusok egy csomó átalakításon esnek át. Az egyes rostok csak korlátozott frekvenciatartományban kódolnak információt: az akusztikus frekvenciatartomány lényegében az alaphártyára képezôdik le, ott pedig az auditoros idegrostok aktivitása kódolja. A tonotopikus leképezés megôrzôdik az auditoros feldolgozásban egészen a kéregig. Alacsony intenzitás-szinteken az adott rost által kódolt frekvenciatartomány keskeny, a növekvô intenzitással kiterjed, erôs intenzitásoknál az egyes rostok frekvenciaszelektivitása már meglehetôsen alacsony. Annak ellenére, hogy a frekvencia-szelektivitás változik az intenzitással, a hang spektrális (vagy frekvencia) jellemzôit kódolja az idegrostok aktivitásának mértéke. A rostok azonban kódolják a bejövô hullámforma temporális jellemzôit is saját frekvenciasávjukban a neurális impulzusok pontos idôzítésével, azaz a neuronok tüzelésének az inger hullámformájához zárásával (idô-zár). A kódolás két formájának (az ideg tüzelési mintázatának átlagos aktivitása és temporális finomstruktúrája) köszönhetô az, hogy az auditoros rendszer ennyi akusztikus tulajdonságot képes reprezentálni. Ha figyelembe vesszük azt, hogy a frekvencia-specifikus rostok spektrum-dimenziót, átlagos aktivitásszintjük az idegrostok különbözô populációjában pedig intenzitás-dimenziót képvisel, akkor a kódolás egyik formája egy idôben kifejlôdô neurális-átlagaktivitás-spektrogramként képzelhetô el. Az auditoros reprezentáció másik kódolási formája a szinkronitás fokának idôbeli változásaként képzelhetô el a szomszédos rostok neurális impulzus-mintázatában annak a frekvenciának a függvényében, amelyre az adott neuronok a leginkább szenzitívek. Ez egy neurális-szinkron-spektrogram. Az auditoros átalakítási folyamat spektrális és temporális felbontási határai korlátozzák az akusztikus hullámforma auditoros idegben kódolt részletességét.
90
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.3 AUDITOROS CSOPORTOSÍTÁSI FOLYAMATOK A való életben ritkán hallgatunk egyetlen hanforrást teljes elszigeteltségben. Gyakran figyelünk egy beszélô hangjára több beszélô ember között vagy egy hangszer hangjára a zenekar hangjai között. A fül az összetett hangokat keskeny frekvenciatartományokban elemzi és a szignál temporális viselkedését ezekben a tartományokban kódolja. Az elemzés eredménye frekvencia-specifikus csatornákon keresztül jut az agyba. Egy hangobjektumnak a környezet más hangobjektumaitól való megkülönböztetéséhez a fülnek azokat az összetevôket, amelyek egy forráshoz tartoznak, csoportosítania kell, a más forrásból származó összetevôket pedig el kell választania (szegregáció) ezektôl. A szimultán-csoportosítás kulcsingerei: a hangösszetevôk közös térbeli eredete, harmonicitása vagy periodicitása, összefüggô amplitúdó- és frekvenciamodulációja, pontosabban a rezonáns struktúrák koherens viselkedése (lásd McAdams, 1984a áttekintésükre). Az alulról-felfelé irányuló folyamatokat a beérkezô szenzoros információk vezérlik. Séma-vezérelt (vagy felülrôl-lefelé irányuló) folyamatok révén azonban az ismerôs vagy jól ismert hangesemények (például az ember neve) könnyebben kiválaszthatóak a környezeti zajból, mint a kevésbé jól ismert események. 2.3.1 C SOPORTOSÍTÁSI ALAPELVEK A zene komplex, gyorsan változó akusztikus spektrum, ami gyakran sok különbözô hangforrásból származik. Amikor auditoros rendszerünk egy komplex szekvenciával találkozik, az ingereket az összetevôk frekvenciájára, amplitúdójára, forrásának térbeli helyzetére, vagy hangszínére alapozott szabályok szerint csoportosítja. Mindegyik jellemzô szolgálhat a hallási szervezôdés és csoportosítás alapjaként. Az elvek, amelyek eldöntik, hogy milyen tulajdonság határozza meg a szekvencia szervezését, komplexek és merevek: egy típusú szekvenciával egyöntetû frekvencia-alapú szervezôdés jön létre, azonban ha kissé megváltoztatjuk a szekvenciát, a térbeli helyzeten alapuló szervezôdés uralkodik. Az ilyen szervezôdési különbségek stratégiák, amelyek a lehetô legvalószínûbben vezetnek helyes következtetésre környezetünk értelmezésében. A Gestalt-pszichológusok szerint az ingereket néhány egyszerû elv alapján csoportosítjuk. Az egyik ilyen elv a közelség elve, ami szerint a közeli elemek inkább kerülnek egy csoportba, mint a távolabb esôk. Egy másik a hasonlóság elve (a hasonló elemek kerülnek egy csoportba). A harmadik a jó folytatás elve: az egy irányban következô elemeket összetartozónak észleljük. A negyedik elv, a közös sors alapján azokat az elemeket, amelyek ugyanabban az irányban mozognak, összetartozónak észleljük (WERTHEIMER, 1923). 2.3.2 AZ AUDITOROS VONÁS-ELEMZÉS Amikor a szenzoros információ hangforrások csoportjaiba került (csoportosítás), egy folyamatsor elemzi azokat a perceptuális vonásokat, amelyek relevánsak a halláshoz az adott pillanatban. Ez az elemzési folyamat a lokális - milliszekundumoktól centiszekundumokig - és a globális - centiszekundumoktól néhány szekundumig - idôtartamokból is nyer információt a mikro- és makrotemporális jellemzôk megállapításához.
91
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.3.2.1 MIKROTEMPORÁLIS JELLEMZÔK ELEMZÉSE A mikrotemporális jellemzôk egyszerû hangesemények jellemzôi (például a lecsúszó tányér összeütközik egy másik tányérral, vagy a hangszer egy hangja). Ezeket a jellemzôket a rezgési állapotba jutott rezonancia-struktúra határozza meg (ami a hangforrás geometriájától és anyagától függ) és az a mód, ahogy a rezonancia-struktúra rezgésbe került (csúszás, ütôdés, vonókezelés avagy fúvás stb.). A rezonanciajellemzôk (például a rezgô kristánypohár vagy a hegedú húrja és teste) információt szolgáltatnak a hangforrás fizikai struktúrájáról és így lehetôvé teszik késôbbi azonosítását. Az ökológiai pszichológusok véleménye szerint mikrotemporális jellemzôk alapján detektáljuk a hangforrás strukturális-invariánsait, amik az akusztikus struktúra olyan részletei, amelyek ‚közösek olyan tárgyaknál, amelyeket a leírás valamilyen szintjén azonosnak tekintünk’ (MICHAELS ÉS CARELLO , 1981, 25. oldal), azaz a tányérok vagy egy hangszer hangját. A hegedû általában arról ismerhetô fel - attól függetlenül, hogy alacsony vagy magas regiszteren játszik -, hogy vonóval szólaltatják meg, a gitár hangját pedig a pengetett húr (a húr megszólaltatása) alapján ismerjük fel. Az ökológiai pszichológusok szerint a hallgatók az invariáns jellemzôk alapján detektálják a transzformációs-invariánsokat: azokat az akusztikus jellemzôket, amelyek meghatározzák, hogy mi történt a hangzó tárggyal, mert invariánsok maradnak annak ellenére, hogy más jellemzôk változnak. A strukturális-invariánsok a tárgy - vagy tárgyak csoportja amelyek részt vesznek az eseményben jellemzôi, míg a transzformációs-invariánsok azok a változásmintázatok az ingerben, amelyek meghatározzák a változás természetét vagyis azt, hogy mi történt a tárggyal. A különbözô hangtulajdonságok elemzése eltérô ideig tart. Hangok magasságával korreláló idegi válaszok már 15 ms-mal az inger kezdetét követôen regisztrálhatóak az agytörzsbôl (GREENBERG ÉS MUNKATÁRSAI , 1987). Ezzel szemben a stabil hangerôsség észlelésének kialakulása kb. 130-180 ms-ot vesz igénybe (COWAN, 1984). Egyes hangtulajdonságok megállapítása még hosszabb idôt, 150-200 ms-ot igényel és ezalatt megzavarja a hang feldolgozását az újabb hang (visszaható maszkolás, Cowan 1984, MASSARO 1975), amint ezt az eltérési negativitás (EN) vizsgálatok is mutatják (WINKLER ÉS MUNKATÁRSAI 1993). A hallórendszer az elsô hangot és az utána körülbelül 200 ms-on belül érkezô hangokat általában egyetlen közös hangeseménybe integrálja. A kiváltott-potenciál módszerrel (ERP) mért hallókérgi N1összetevôt (a szokványos jelölés szerint ez azt jelenti, hogy negatív összetevô körülbelül 100 ms-al az inger után) a hallási ingerlés energiájában bekövetkezô hirtelen változás (tipikusan egy új inger belépése, hosszú hangok esetében a hang megszûnése, illetve valamilyen paraméterének változása) váltja ki (lásd NÄÄTÄNEN ÉS PICTON, 1987). Az összetett akusztikus N1-aktivitás csúcsát az inger kezdete után 80-120 ms-al lehet mérni. Az akusztikus N1-válasz amplitúdója érzékeny az észlelt tér akusztikus paramétereire: a fülek közötti hangintenzitás és -idôzítés eltérésére (például MC EVOY ÉS MUNKATÁRSAI , 1993). Minél hasonlóbb egymáshoz két egymást követô hang, annál kisebb a második hang által kiváltott N1-reakció és a két hang közötti idôkülönbség akár 11-15 s is lehet (COWAN ÉS MUNKATÁRSAI , 1993), 92
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
azaz az N1 mögött álló folyamat nagyjából ennyi ideig tárolja a hang jellemzôit. Az egyenletes ritmusban bemutatott ingerek által kiváltott akusztikus N1-hullám amplitúdója az ingerbemutatás sebességének 0,1 Hz feletti növelésével csökken. A hallókérgi N1-reakiót generáló hallókérgi források egy része tonotopikus, illetve ampliotopikus (hangintenzitást hely szerint kódoló) elrendezésû (PANTEV ÉS MUNKATÁRSAI, 1989a, b). A hallókérgi N1válasz nem érzékeny a hangjellemzôk kombinációira (jellemzô-egybeesésekre), sem az összetett hangingerek idôi-szekvenciális szerkezetére (dinamikus hangjellemzôk). A hallókérgi N1-reakciót generáló idegsejt-populációk fôként a hangok spektrális jellemzôit tárolják. Az akusztikus N1 amplitúdó- és latenciaváltozásai nem feltétlenül járnak az észlelés megváltozásával (NÄÄTÄNEN ÉS PICTON, 1987; W INKLER ÉS MUNKATÁRSAI , 1997). 2.3.2.2 MAKROTEMPORÁLIS
JELLEMZÔK ELEMZÉSE
A makrotemporális jellemzôk elemzése a teljes környezeti esemény ritmikus és texturális részleteit elemzi és ez teszi lehetôvé, hogy azonosítsuk például azt, hogy a tányérok csúsznak, ütköznek és összetörnek a padlón. A törés eseményének azonosítása különösen érdekes abból a szempontból, hogy a kérdéses tárgy rezonancia-jellemzôi megváltoznak, azaz mérete és geometriája más lesz, ráadásul a hangforrások száma is változik közben. Ilyenkor egy sor súrlódási és egymásra hatási esemény történik, aminek azonosítható makro-szervezôdése van. Az ilyen eseményeket a transzformációs-invariánsok alapján azonosítjuk. A kiváltott-potenciál módszerrel (ERP) mért EN-komponenst (eltérési negativitás) szabályos hangingerek sorában bekövetkezô változások váltják ki (NÄÄTÄNEN ÉS MUNKATÁRSAI, 1978; összefoglalót lásd PICTON ÉS MUNKATÁRSAI , 2000) és a változás kezdete után 100-250 ms-al mérhetô. Az ismétlôdô hang bármely egyszerû hangtulajdonságának (hangmagasság, hangszín, intenzitás, hosszúság, a hangforrás térbeli helyzete stb.) megváltozása EN-t vált ki (NÄÄTÄNEN ÉS ALHO , 1997). Az EN-t összetett, sôt absztrakt relációkra épülô szabályosságok megsértése is kiváltja (lásd NÄÄTÄNEN ÉS W INKLER, 1999). A ritkán bemutatott, ám szabálynak megfelelô (például ismétlôdô) ingerek nem váltanak ki EN-t, sem az olyan ingerváltozás, ami elôtt nem alakult ki valamilyen akusztikus szabály. Az EN olyan folyamat jelzése, ami a beérkezô hangokat az elôzô hangok alapján felállított szabályokkal egyezteti és jelzi, ha az új hang nem felel meg azoknak. EN-reakció akkor is létrejön, ha a kísérleti személynek nincs hangokkal kapcsolatos feladata. Ha egy ismétlôdô hangsorba két, egymást 200 ms-on (integrációs idô) belül követô változást iktatunk be, akkor a két változás csak egy EN-komponenst vált ki; ezzel szemben ha a két változás közötti idô 200 ms-nál hosszabb, akkor mindkét eltérés külön EN-választ eredményez (W INKLER ÉS MUNKATÁRSAI 1998). A hangesemények integrációja azonban nem történik meg, ha a két - az EN kisérletekben „deviáns” - esemény eltérô információt hordoz az adott hangsor szempontjából (például két különbözô szabályt sértenek meg, lásd W INKLER ÉS CZIGLER 1998). Az EN által vizsgálható nyomok tárolják az egyszerû hangjellemzôk egybeeséreit (például GOMES ÉS MUNKATÁRSAI , 1997) és az összetett hangingerek idôi/sorrendi szerkezetét is (W INKLER ÉS SCHRÖGER, 1995). Az EN kiváltásához szükséges minimális eltérés egyezést mutat az aktív diszkrimináció köszöbével (például W INKLER ÉS MUNKATÁRSAI, 1997), beleértve ebbe a képességekben rejlô különbségeket, az éberségi szint változásaiból fakadó ingadozásokat és a tanulással elérhetô javulást (összefoglalót lásd NÄÄTÄNEN ÉS ALHO , 1997). Az EN amplitúdója az észlelt és nem a fizikai eltérés mértékével párhuzamosan növekszik (T IITINEN ÉS MUNKATÁRSAI , 1994). Aktív akusztikus-kakukktojás helyzetben (a kísérleti személy számára a deviáns ingerek a célingerek) az EN-válasz ideje jól korrelál mind a reakcióidôvel, mind pedig az EN-t kísérô felaldat-függô kiváltottpotenciál összetevôk (N2b, P3) idejével (NOVAK ÉS MUNKATÁRSAI , 1992; TIITINEN ÉS MUNKATÁRSAI , 1994), azaz a kiváltott potenciálban megfigyelt deviánshoz kapcsolódó szelektív-figyelmi aktivitások az EN-el egy idôben mérhetôek (például SCHRÖGER, 1995). Az EN kiváltott-potenciál összetevô kiváltásának az elôfeltétele valamilyen akusztikus ingernyom megléte, hiszen a reakciót egy hangsor valamilyen szabályosságát megsértô („deviáns”) hangok váltják ki. A szabály nyomának tehát a változás pillanatában az EN-folyamat rendelkezésére kell állnia. Az EN hátterében álló nyomok valószínûleg hosszabb idôtartamú emlékezeti formákba is átíródnak, ahonnak késôbb visszaállíthatók egy emlékeztetô hanginger segítségével (például COWAN ÉS MUNKATÁRSAI, 1993), azaz az EN segít93
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
ségével vizsgálható nyomokban tárolt információk többféle központilag irányított folyamat számára is hozzáférhetôek. WINKLER (2003) szerint az EN-t létrehozó folyamatban szerepet játszó akusztikus nyomok hangreprezentációk, amelyek jellemzôik alapján (a tárolás ideje, kapacitása, maszkolási hatások stb.; lásd NÄÄTÄNEN ÉS WINKLER, 1999) a viselkedéses vizsgálatok alapján leírt akusztikus szenzoros emlékezet hosszabb idejû (szintetizált) formájának (MASSARO, 1975; COWAN, 1984) felelnek meg. Az EN fô forrásai az akusztikus N1-hez hasonlóan a hallókéregben találhatóak, kb. 1 cm-re frontálisan az N1-aktivitás súlypontjától.
94
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.3.3 A „ KOKTÉLPARTI-HELYZET” BREGMAN (1990) szerint ahhoz, hogy a beszédet megértésük több hangforrás hátterében, az auditoros rendszernek elôször az akusztikus jelenetet kell elemeznie, majd ez alapján egy integrált perceptuális reprezentációt kell kialakítania a hangok idôbeli viselkedésérôl. A hangok keveredése a CHERRY (1953) által „cocktail party problémának“ nevezett helyzet. Cherry szerint a forrás követését segítô kulcsingerek között van a térbeli helyzet, ami binaurális információ. Egy másik kulcsinger a természetes beszéd kiválasztására az alapfrekvencia. BROKX ÉS NOOTEBOOM (1982) szerint az alapfrekvencia elôsegíti az egyidejû beszéd-láncok elválasztását és azt, hogy a hallgatók jobban reprodukálják azt az üzenetet, amit az egyik vagy a másik lánc hordozott. Az alapfrekvencia-különbség különösen akkor hatásos, amikor kezdet-aszinkróniával (DARWIN ÉS CULLING 1990) vagy binaurális kulcsingerekkel (SUMMERFIELD ÉS ASSMANN 1991; ZWICKER 1984) társul. Lea és munkatársai (L EA, 1992; LEA ÉS SUMMERFIELD 1992) kísérletében a kísérleti alanyok magánhangzó-párokat hallottak, amelyek vagy beszéltek vagy suttogottak voltak és azonosítaniuk kellett valamelyik magánhangzót. Lea és munkatársai szerint a célingert könnyebb azonosítani akkor, amikor a háttér beszélt, mint amikor suttogott. Nem találtak viszont szignifikáns különbséget a beszélt és a suttogott célinger azonosítása között. Némileg különbözô módszerekkel azonban LEA ÉS T SUZAKI (1993a,b) kísérleti alanyai szignifikánsan jobban ismerték fel a beszélt célingereket. 2.3.3.1 A HANGÖSSZETEVÔK
MODULÁCIÓJA
HUGGINS (1952, 1953) szerint az auditoros rendszer a fizikai forrás strukturális jellemzôit kódolja. A rezonáns források fizikai struktúrája erôsen meghatározza spektrális burkológörbéjüket. Frekvenciamoduláció esetében a rezonáns struktúra csak keveset változik: a magánhangzó formáns hasonló marad amikor a hangmagasság változik éneklés vagy beszéd közben, a spektrális burkológörbe formája sem sokat változik az alapfrekvencia vibratojával. Ha a hang összetevôit szub-audio frekvenciával modulálják a közöttük fennálló frekvenciaarányok megôrzésével, a hallgató könnyebben választja ki a hangot a háttérbôl (CHOWNING, 1980; MCADAMS, 1984a,b, 1989; CHALIKIA ÉS BREGMAN, 1989). MCADAMS (1989), valamint MARIN ÉS MCADAMS (1991) demonstrálta, hogy a frekvencia-moduláció növeli az egyidejûleg két másik, nagy alapfrekvencia-különbséggel (5 félhang vagy 33% F0 különbség) bemutatott magánhangzók közüli perceptuális kiemelkedést. Azonban ez a növekedés független attól, hogy a magánhangzókat összefüggôen vagy nem összefüggôen modulálták. MCADAMS (1989) három magánhangzót mutatott be egyidejûleg a hallgatóknak, különbözô hangmagasság-permutációkban. A magánhangzókat harmonikus összetevôkbôl szintetizálta valódi magánhangzók spektrális burkológörbéje alapján úgy, hogy rezonancia-struktúrájuk ugyanaz legyen. Egyes magánhangzókat vibratóval modulált (frekvencia moduláció). Összefüggô moduláció esetén az egyes magánhangzók vibratói szinkronban voltak, nem összefüggô moduláció esetében nem voltak szinkronban. Több modulációs feltétele volt: 1) a magánhangzók nincsenek modulálva; 2) egy magánhangzó modulált, a másik kettô nem; 3) egy (aszinkron) modulált magánhangzó két egymással szinkronban modulált magánhangzó hátterében; és 4) mindhárom magánhangzó szinkronban modulált. A kísérleti alanyokat arra kérték, hogy ítéljék meg a keverék minden magánhangzójának észlelt kiemelkedését. A kísérleti alanyok a modulált magánhangzót kiemelkedôbbnek ítélték, mint a nem modulált magánhangzót. Amikor mindhárom magánhangzó modulálva volt, a kiemelkedés megnövekedése (a modulálással) független volt attól, hogy a magánhangzó függetlenül lett modulálva vagy a többi magánhangzóval szinkronban. MCADAMS (1989) szerint frekvencia-moduláció esetében a modulált összetevôk követik a magánhangzó spektrális burkológörbéjét és így további információt szolgáltatnak a több forrásos komplexumba ágyazott rezonancia-struktúráról. Az együttes amplitúdó- és frekvencia-moduláció is segíti a spektrális burkológörbe meghatározását a burkológörbe követésével (McAdams, 1984a). A vibrato által létrehozott spektrális burkológörbe-követés MCADAMS (1989) szerint segíti a rezonancia-struktúrák diszkriminációját és azonosítását (MCADAMS ÉS RODET, 1988). A rögzített rezonancia-struktúra (amit a spektrális burkológörbe-követés jelez) is lehet a csoportosítás 95
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
kulcsingere: a hallgató képes arra, hogy a komplex spektrumból kinyerje a spektrális burkológörbét és mint ilyent azonosítsa azt. Az alábbi tényezôk nehezítik a spektrális burkológörbe meghatározását: 1) a magánhangzót alkotó frekvenciaösszetevôk spektrális burkológörbéje (pontosabban a formáns) hiányzik magasabb alapfrekvenciák esetén; 2) a meghatározó összetevôk más összetevôkhöz csoportosítódhatnak és így más spektrális burkológörbét alkotnak; vagy 3) a magánhangzó felismeréséhez és azonosításához szükséges jellemzôk maszkolódhatnak (például az alsó két-három formáns maszkolásakor; CARLSON, FANT ÉS GRANSTRÖM, 1975; KARNICKAYA, MUSHNIKOV, SLEPOKUROVA ÉS ZHUKOV, 1975). MARIN ÉS MCADAMS (1991) három magánhangzót mutatott be kísérleti alanyainak: a francia /a/, /i/ és /o/ magánhangzót, három alapfrekvencia (F0) egyikén (C3 - 130,8 Hz, F3 - 174,6 Hz és B3 - 233,1 Hz). Két további feltétel volt az 1989-es MCADAMS kísérlethez képest: az egyikben a spektrális komponensek amplitúdója változott a magánhangzó spektrális burkológörbéjének megfelelôen a moduláció során, a másikban pedig azon az amplitúdón maradt, amin moduláció nélkül volt. A magánhangzók 2 s tartamúak voltak, amibôl 150 ms növekvô illetve csökkenô amplitúdójú koszinusz-hullám volt az indító szakasz (attack) és a lecsengési idô. Vibrato esetében a vibrato szélesség 0 maradt 300 ms-ig, majd lineárisan növekedett maximum értékére a következô 400 ms-ban. A vibrato szinuszhullám formájú volt. Két maximális csúcs-csúcs vibrato szélességet használtak: 3% és 6%, amelyeket a kísérleti alanyok külön csoportjának mutattak be. A modulált magánhangzó harmonikus összetevôinek spektrális-burkológörbe-követés elemzésére két ingertípust használtak: Az egyikbenn olyan magánhangzók voltak, amelyekben a harmonikus összetevôk amplitúdója állandó maradt a frekvenciamoduláció során, azaz nem követte a magánhangzó spektrális burkológörbéjét (formánsait). A második ingertípusban olyan magánhangzók voltak, amelyeknek a harmonikusai követték a magánhangzó spektrális burkológörbéjét a moduláció során. Eredményeik hasonlóak a MCADAMS (1989) kísérletében nyertekhez: a frekvencia-moduláció fontos a magánhangzó észlelt kiemelkedéséhez más, egyidôben bemutatott magánhangzók közül, a modulációk összefüggése azonban nincs hatással a kiemelkedésre. A magánhangzó kiemelkedése függ a magánhangzók hangmagasság-különbségétôl. A magánhangzót kiemelkedôbbnek ítélték a kísérleti alanyok akkor, amikor modulálva volt, mint amikor nem; a kiemelkedés mértéke lecsökkent, amikor a többi magánhangzót is modulálták, ám még így is magasabb volt, mint modulálatlan célinger-magánhangzó esetében. A modulált magánhangzó kiemelkedése csökkent más modulált magánhangzók jelenlétében akkor is, ha a moduláció szinkronban volt és akkor is, ha nem volt szinkronban a megítélt magánhangzó modulációjával. A kiemelkedés a frekvencia-moduláció szélességétôl függött: azokat a magánhangzókat, amelyeket 6%-os szélességû vibratóval moduláltak, kiemelkedôbbnek ítélték, mint azokat, amelyeket 3%-os szélességgel moduláltak. A különbség a modulációs feltételek között szignifikáns maradt mindhárom célingermagánhangzónál 6% modulációs szélességnél, ám nagyon kicsi vagy nem létezô volt 3% modulációs szélességnél. MARIN ÉS MCADAMS (1991) szerint a frekvenciamoduláció szélessége a lényeges tényezô az együtt elôforduló hangok elkülönítésében. A rezonáns struktúrák összefüggô viselkedése MCADAMS ÉS RODET (1988) szerint hozzájárul a magánhangzó megkülönböztetéshez és azonosításhoz, MARIN ÉS MCADAMS (1991) szerint azonban csak 6 %-os vibratónál. A többi magánhangzó modulációjának nem volt hatása a modulálatlan célinger-magánhangzók kiemelkedés-megítélésére sem 3%-os, sem 6%-os modulációnál. Amikor mindhárom magánhangzó modulálva volt, a kiemelkedés megítélésére nem volt hatással, hogy azok szinkronban vagy függetlenül voltak modulálva. HUGGINS (1952, 1953) szerint a rezonancia-struktúra egyetlen, analitikus részletének elszigetelése mint a spektrális burkológörbe-követés - nem ragadja meg teljességében azt a viselkedést, amire az auditoros rendszer szenzitív. Ez a rendszer az olyan fizikai rezonátorok viselkedésére hangolódott, amelyek mindenütt jelen vannak a hangkörnyezetben. Lehet, hogy amikor a burkológörbe-követést nem kíséri megfelelô fázismoduláció a formáns középfrekvenciáján, az auditoros rendszer a rezonancia-struktúra-elemzés alapján az ilyen viselkedést nem minôsíti „értelmesnek”.
96
DANCZI CSABA LÁSZLÓ : A ZENEI 2.3.3.2 A HANGÖSSZETEVÔK
TÉR
HARMONICITÁSA
Amikor egyidôben két beszédhangot hallunk, az alapfrekvenciák (F0) különbsége segíti azt, hogy az egyikre vagy a másikra figyeljünk és megértsük mit mond. Ezt természetes és szintetikus beszéd (BROKX ÉS NOOTEBOOM 1982), valamint szintetikus magánhangzó-párok esetén is kimutatták (SCHEFFERS 1983; CULLING ÉS DARWIN 1993a). Az alapfrekvencia hatását részletesen tanulmányozta több szerzô is (ASSMANN ÉS SUMMERFIELD, 1989, 1990; SCHEFFERS , 1983; SUMMERFIELD ÉS ASSMANN , 1991; ZWICKER 1984; CHALIKIA ÉS BREGMAN, 1989; DARWIN ÉS CULLING , 1990; CULLING ÉS DARWIN, 1993a). Az ilyen kísérletekben két szintetikus magánhangzót mutatnak be különbözô alapfrekvencián és a kísérleti alanyoktól azt kérik, hogy azonosítsák mindkét magánhangzót az elôre meghatározott 5-8 magánhangzó alapján. Általában az azonosítási teljesítmény megnövekszik az alapfrekvencia 1/2 és 2 félhang elválasztásáig (3-12%-os alapfrekvencia eltérés), amit egy telítôdési szakasz követ. Ezt általában azzal magyarázzák, hogy az a mechanizmus, ami a magánhangzó spektrumának harmonikus struktúráját használja ki hatékony, amikor az alapfrekvenciák különböznek, de kudarcot vall, amikor azonosak vagy a két magánhangzó harmonikus sorozata egybeesik. CHALIKIA ÉS BREGMAN (1989) kísérleti alanyai változó alapfrekvenciájú magánhangzó-párokat hallottak azonos irányban változó alapfrekvenciával vagy úgy, hogy a kontúrok az ingertartam felénél keresztezték egymást (vagyis ellenkezô irányban változtak). A magánhangzók közötti alapfrenvencia eltérés 0 és 12 félhang között változott. Bár kísérleti alanyaik általában a párhuzamos csúszásoknak alacsonyabb magánhangzó-azonosítási pontszámokat adtak mint a keresztezô csúszásoknak, a különbségek nem voltak szignifikánsak 1/2, 3 és 6 félhangnyi alapfrekvencia-különbségnél, ám szignifikáns volt a különbség egy oktávos alapfrekvencia-különbségnél, azaz amikor tökéletes harmonikus viszony van a két mássalhangzó összetevôi között. Az összefüggô moduláció növeli a harmonikus viszonyban álló összetevôk összeolvadásának valószínûségét, ám a nem-harmonikus viszonyban álló összetevôk összeolvadásának a valószínûségét nem növeli meg. A harmonicitásnak kevés vagy semmilyen hatása nincs az összefüggô amplitúdó-modulációnak köszönhetô perceptuális fúzióra (BREGMAN ÉS MUNKATÁRSAI, 1990). A harmonicitás a moduláció alapján történô csoportosítás korlátozó tényezôje. A harmonikus hangforrás szub-audio frekvencia-modulációja segíti a hang elkülönítését más egyidejû hangforrásoktól ha a modulációs szélesség elég nagy, de a harmonikus források szinkron modulációja sem okozza az összetevôk összeolvadását, ha a kombinált spektrum nem harmonikus. A különbözô alapfrekvenciájú harmonikus források független modulációja nem mindig segíti az alapfrekvencia alapján történô elválasztást, azaz úgy tûnik, hogy a harmonicitás erôsebb csoportosítási kulcsinger, mint a frekvencia-moduláció. A frekvencia-moduláció azonban erôsítheti a harmonicitás szegregációs hatását több összetett harmonikus forrás esetén. Különbözô modelleket és módszereket dolgoztak ki a harmonicitás hatásának magyarázatára vagy reprodukálására. Némelyik a hang harmonikus-struktúráját használja fel az összetevôk azonosításához az összetett spektrumban: a hangot úgy szigetelik el, hogy felerôsítik harmonikus összetevôit a háttérhez képest. Más modellek a zavaró hang harmonikus-struktúráját használják ki, amelyet eltávolítanak a zavaró hang harmonikus összetevôinek kitörlésével. Bármelyik - vagy mindkét - stratégia használható amikor a két hang harmonikus és különbözik az alapfrekvenciája. Mindkét stratégia kudarcot vall azonban, ha a magánhangzóknak azonos az alapfrekvenciája (lásd DE CHEVEIGNÉ 1993a a modellek áttekintésére). Mindkét stratégiának vannak elônyei és hátrányai. A harmonikus-erôsítés lehetôvé teszi, hogy a harmonikus hangok - például a beszéd hangja - kiemelkedjen bármiféle zavarból (interferencia), kivéve az ugyanolyan alapfrekvenciájú harmonikus interferenciát. A harmonikus-törlés (harmonic cancellation) viszont azt teszi lehetôvé, hogy bármilyen célinger kiemelkedjék a harmonikus interferenciából. 97
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Az erôsítés akkor mûködik a legjobban, amikor a jel-zaj viszony magas, mert ilyenkor a célinger alapfrekvenciáját viszonylag könnyû megbecsülni. Igen ám, de elválasztásra fôleg akkor van szükség, amikor a jel-zaj viszony alacsony és ilyenkor a törlés jobb. A törlés eltávolítja az interferencia harmonikus összetevôit és ezzel eltorzíthatja a célinger spektrumát is. Az erôsítés viszont nem torzítja a célinger spektrumát, ha az tökéletesen harmonikus. A tökéletesen harmonikus interferencia törölhetô egy rövid reakcióidejû szûrôvel, míg az erôsítéshez olyan szûrôre van szükség, amelynek hosszú a reakcióideje (DE CHEVEIGNÉ 1993a).
98
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.4 Z ENEI FOLYAMATOK Az auditoros csoportosítási folyamatok (1) szervezik az akusztikus felszínt zenei eseményekké (szimultán csoportosítás), (2) kapcsolják az eseményeket zenei folyamattá (szekvenciális csoportosítás) és (3) „tömbösítik” a folyamatokat (szegmentációs csoportosítás) zenei egységekbe. A szimultán, szekvenciális és szegmentációs csoportosítás a folytonos „akusztikus felszínt” elkülönült entitásokba és entitások csoportjába szervezi, azaz elô-szervezi a zenei formát. Ez a szervezôdés valójában mentális leírásokat hoz létre arról, hogy mi történik a világban: az akusztikus forrásokat és eseményeket auditoros leírásokkal kapcsolja össze, hogy elvárásokat alakítson ki az „auditoros jelenet-elemzéshez” (BREGMAN, 1977, 1981). A csoportosítási folyamatok megelôzik az események perceptuális minôségének (hangmagasság, hangszín) és az események közötti kapcsolatok (sûrûség, ritmus, intervallum, konszonancia stb.) komputációját (MCADAMS, 1987; WRIGHT ÉS BREGMAN, 1987). A zenei forma a perceptuális minôségek közötti kapcsolatokra épül. Amennyiben a csoportosítási folyamatok befolyásolni tudják az emergens minôségeket, befolyásolják a forma észlelését is. Némely perceptuális dimenzió erôsen korrelál a szenzoros dimenziókkal (amiken a csoportosítási döntések alapulnak): például a hangmagasság és a hangszín erôsen korrelál a spektrális változásokkal, amiken a szekvenciális és szegmentációs csoportosítás alapul (BREGMAN, 1978; MCADAMS ÉS BREGMAN, 1979; MCADAMS, 1984; DELIÉGE , 1987). Az ilyen dimenziók a zenei forma fontos összetevôi: a zenei formát hordozó (akusztikus) dimenziók fontos kritériuma az, hogy dimenzión belüli kontrasztot hozzanak létre a zenei felszínen. A zenei események perceptuális minôségei a kapcsolatok tanult rendszerébe (skála, metrum, harmonikus mezô stb.) horgonyzódnak le, amit a zenei események közötti kapcsolatok hívnak elô. A viszonyoknak ez a rendszere absztrakt tudásnak tekinthetô az adott kultúra zenei struktúrájáról, amit a hallgató huzamos tapasztalat során sajátított el. Ez a tudás absztrakt abban az értelemben, hogy olyan kapcsolatokról szól, amelyek nagy zenei repertoárban érvényesülnek, ráadásul a dimenzió értékei közötti kapcsolatok viszonylagos stabilitása vagy kiemelkedése is az absztrakt tudástól függ. Ez talán a legfontosabb a zenei formák létrehozásához, mivel ha a szokványos dimenzióértékek közötti kapcsolatok rendszere nem tanulható, a dimenzió nem strukturálható zeneileg. A zenei események miután átestek az elemi csoportosítási folyamatokon, elnyerik magasabb-szintû struktúrájukat. Ez inger-vezérelt folyamat az absztrakt tudással szemben. A zenei formának azonban vannak olyan összetevôi, amelyek nem tisztán hierarchikusak (például az asszociatív kapcsolatok a darab különbözô részeinek hasonló mintázatai között). Az esemény-struktúrák alapozzák meg a zenei események és mintázatok kódolását a kiváltott kapcsolatrendszerek kontextusában; a zenei mintázatok invarianciájának és átalakulásának észlelését; valamint az idôben lezajló asszociatív és hierarchikus viszonyokat a zenei forma mentális reprezentációjának kiépítésével.
99
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.4.1 É RTÉKEK ÉS KAPCSOLATOK KÓDOLÁSA
A kódolt kapcsolatok és mintázatok közé tartoznak a hangmagasság-intervallumok, a hangmagasságkontúrok, az akkord-minôségek, a ritmus-intervallumok az események kezdete között, a hosszú és rövid események szekvenciájának ritmikus kontúrjai, valamint a vektorok a hangszín-tér pontjai között (lásd késôbb). Az észlelt kapcsolatokat korlátozzák a csoportosítási folyamatok és az elvárások azokról az eseményekrôl, amelyek valószínûleg elôfordulnak. Az elvárások az absztrakt tudásból erednek - amit tapasztalat során szereztünk - és az észlelt események aktiválják. A sémák elôsegítik bizonyos hangok észlelését mások ellenében tonális hangmagasság-viszonyok (BHARUCHA ÉS STOECKIG, 1986) és ritmus-szekvenciák (BHARUCHA ÉS PRYOR, 1986) esetében. A tonalitás és metrum mentális reprezentációjának az aktiválódása az észlelést a kontextus által meghatározott alternatíva felé irányítja (BARTLETT ÉS DOWLING, 1988). A strukturális sémák aktiválása relatív stabilitást, dominanciát és kiemelkedést ad az észlelt eseményeknek. Az események értelmezési kerethez horgonyzása zenei jelentôséget ad az eseményeknek és létrehozza a dinamikus zenei áramlást a kevésbé stabil vagy kiemelkedô elemek stabilabb és kiemelkedôbb elemekhez kapcsolásával. A hangok temporális rendje erôsen befolyásolhatja azt, hogy mit észlelünk stabilabbnak. A tonalitás szempontjából többértelmû H3-C4-D#4-E4-F#4-G4 szekvenciához BHARUCHA (1984a) szerint a hallgatók jobban kedvelik a C dúrt kísérô akkordként mint a H dúrt, bár mindkét akkord hangjai megtalálhatóak a szekvenciában. Ha azonban a szekvenciát fordított sorrendben játsszák le, a hallgatók jobban kedvelik a H dúrt. Bharucha melodikus-lehorgonyzás (melodic anchoring) elmélete szerint a stabil hang általában követi az instabilt és az összekapcsolt hangok általában diatonikusan vagy kromatikusan szomszédosak. A C-D# és az E-F# közötti ugrások miatt a H3-C4-D#4-E4-F#4-G4 szekvenciát úgy értelmezzük, mint ami három kéttagú sorozatból áll és a megvalósulandó stabilitás-relációkat a ezeken belül várjuk. Ilyenkor a csoportosítási mechanizmusok és a tudás-struktúrák interakcióba lépnek (DEUTSCH, 1978; KRUMHANSL , 1979; BHARUCHA, 1984a,b). Kérdés, hogy a hallgatók mit választanának, ha több lehetséges kíséretet mutatnának be nekik, vagy ha bôséges tapasztalatuk lenne az arab zenében, ahol ez a skála-mintázat meglehetôsen gyakori. BUTLER ÉS BROWN (1984) szerint a tritonusz melodikus sorozaton belüli helye fontos meghatározója a tonális centrum aktivációjának, azaz a megkülönböztetô intervallumok (olyan hangmagasság intervallumok, amelyekbôl kevés van egy skálában) önmagukban még nem elegendôek ahhoz, hogy aktiválják a teljes reláció-rendszer reprezentációját. A temporális (szekvenciális) lehorgonyzás vagy asszimiláció hozzájárul a zenei formához.
100
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.4.2 MEMÓRIABELI REPREZENTÁCIÓ A nyers auditoros reprezentáció átkódolódik absztrakt jellemzôkre a hangforrás vagy esemény invariánsai alapján (például a zenei hang kezdetének spektro-temporális struktúrája vagy a pattogó labda gyorsuló, majd lelassuló ritmusa). Az absztrakt jellemzôk (a felismerési folyamat bemenetei) ezután összehasonlítódnak a megfelelô hangforrások és események memóriában tárolt osztályaival (auditoros lexikon), végül pedig az ingert egy olyan ingerosztály tagjaként ismerjük fel, ami a legpontosabban hasonlít az auditoros bemenethez. Az információfeldolgozási megközelítés szerint az összehasonlítás olyan folyamat, amiben az auditoros jellemzôk összekapcsolódnak a memóriabeli reprezentációval és a legjobban illeszkedô reprezentáció kiválasztódik. Az összevetési folyamatot valamilyen végrehajtó ágens (homunkulusz) irányítja vagy egy mentális algoritmus, ami végrehajtja az összehasonlítást, majd kiadja az eredményt. Az ökológiai megközelítés szerint a memória-struktúrákhoz való hozzáférés a források és az események memóriabeli reprezentációjának közvetlen aktivációja, ami a perceptuális jellemzôk elrendezésére érzékeny. A hangeseményt a legerôsebben aktiválódó memóriabeli reprezentáció alapján ismerjük fel és akkor, amikor a memóriabeli reprezentáció valamilyen aktivációs határértéket ér el. A memóriabeli reprezentációk viszonylag absztrakt természetûek. (azaz sosem hallottuk ezeket az eltörô tányér hangokat, mégis felismerjük ôket mint olyanokat). Mind a közvetített (információfeldolgozási), mind pedig a közvetlen (ökológiai) megközelítés szerint ha egyetlen kategória sem illeszkedik vagy túl sok kategória illeszkedik nagyjából azonos szinten, nem történik meg a felismerés. 2.4.3 I NVARIANCIA ÉS ÁTALAKÍTÁS A mintázatok hasonlóságának az észlelése, ami invarianciák absztrakciójával jár a zenei mintázatok feldolgozásában, a zenei fejlôdés fontos tényezôje. A zenei mintázatok absztrakciója az egyik legáltalánosabb jellemzôje a világ zenei rendszereinek. A zenei formát létrehozó dimenziónak sokféle mintázat-átalakítást kell lehetôvé tennie, amelyeket az átalakítás után az eredeti mintázattal mégis valamiféleképpen összefüggônek észleljük (SLAWSON, 1985). Mi marad ugyanaz és mi változik, amikor a zenei mintázatot átalakítjuk? A hangmagasság-dimenzióban például a transzpozíció megôrzi a pontos intervallum-mintázatot és kontúrt de megváltoztathatja a hangnemet. A harmonikus moduláció fenntartja a kontúrt és az intervallum-osztály mintázatot (lehetôvé téve az intervallumok ekvivalenciáját a hangnemekben). A rákfordítás megôrzi az intervallumok méretét, de megfordítja az irányt (és így a kontúrt). Bartók a Zene vonósokra, ütôhangszerekre és cselesztára címû darabjában (1936) kinyújtással és összenyomással nagyította vagy redukálta azokat az intervallumokat (a kívánatos hangmagasság-készlet korlátain belül) amelyek létrehozzák a hangmagasság-kontúrt. A téma és a variáció gyakran hierarchikus kidolgozás: az eredeti dallam hangjai díszítést kapnak vagy melodikus figurákba fejlôdnek, ami hierarchikus abban az értelemben, hogy a kidolgozott dallam „redukciója” az eredetit eredményezné. A perceptuális invariancia azt jelenti, hogy bizonyos kategóriák közötti kapcsolatok az ingerdimenzióban állandóak maradnak a transzformáció során. A tiszta kvint (vagy egy teljes dallam) viszonylag konstans minôség marad a regisztertôl függetlenül, amiben bemutatják (a zenei hangmagasságok tartományán belül). A transzpozíció tehát olyan mûvelet, ami megengedhetô a hangmagasság-dimenzióban. Ha egy dimenzióban összetett mintázatok változnak és mégis hasonlónak észleljük azokat, akkor a dimenzió nem valószínû, hogy zenei formát hozzon létre (WHITE , 1960). Az inverzió és az expanzív transzformációk kevésbé hasonlóak a témához mint az olyan transzpozíció, ahol mind a kontúr, mind pedig az intervallum megmarad. A rákfordítás megfordítja az abszolút hangmagasság szekvenciát, az intervallumszekvenciát és a kontúrt. Bár a hangmagasság készlet azonos, a rendje teljesen megváltozik. Az emberek a rákfordítást mégis általában hasonlónak érzik az eredeti szekvenciához (FRANCES, 1972/1988, 6. kísérlet). KRUMHANSL, SANDELL ÉS SERGEANT (1987) kimutatta, hogy a hallgatók a tükrözött formákat képesek az eredetivel kapcsolatosként osztályozni, amikor csak két tényezôjük változott meg. Úgy tûnik, hogy két alapvetô transzformációs osztály létezik: (1) lineáris mûveletek egy adott dimenzióban vagy dimenzióhalmazban (pl. transzpozíció, expanzió, rotáció stb.) és a mintázat strukturális modifikációi (pl. egyetlen elem 101
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
megváltoztatása, egy belsô ütem kettéhasítása, egy melodikus folyamat hierarchikus kidolgozása zenei figurák kifejlesztésével a fô hangok köré, vagy a mintázat más metrumhoz adaptálása). Lineáris mûveletek esetében az eredeti és a transzformált verzió közötti összehasonlítás ugyanazon a strukturális szinten marad. Olyan mûveletek esetében, mint a hierarchikus kidolgozás, a hasonlóság ítéletek szükségszerûen a kidolgozás fokától függô szinteken történnek (DEUTSCH ÉS FEROE, 1981; ROSNER ÉS MEYER, 1986). 2.4.4 MINTÁZAT-LEXIKON Minden kultúrában léteznek a hangmagasság-, a tartam- és talán még a hangszín-relációknak is olyan mintázatai, amik gyakrabban fordulnak elô bizonyos feltételek között. Meyer szerint ezek a hangmagasságmintázatok archetipikus szub-struktúrák és ezeken alapul a dallamok kidolgozása (lásd MEYER „melodikus folyamata”, 1973). A sztereotipukus mintázatok és formák absztrakt esemény-sémái bizonyos mértékben megfelelnek a „forgatókönyv” (script) fogalmának, ahogy azt SCHANK ÉS ABELSON (1977) használta. Szerintük absztrakt forgatókönyveink vannak különbözô makro-eseményekre, mint például a koncert-látogatásra vagy a fürdésre. A forgatókönyv tartalmazza a szükséges akciók fôbb fajtáit (például elmegyünk otthonról, a koncertterembe megyünk, jegyet vásárolunk, leülünk, figyelmesen hallgatunk, majd hazamegyünk), amelyek nagyon absztraktak és sokféle variációjuk elképzelhetô. Ugyanez áll Meyer melodikus folyamatára. A „változó hangfolyamat” a fô hangmagasságról indul (például a tonikáról), egy lépéssel ez alá ereszkedik a skálán, felugrik a felette lévô hangmagasságra, majd visszatér a fô hangmagasságra. Ezt a hangfolyamatot a zenében több ütemen keresztül is lehetséges kidolgozni. Meyer szerint ezek a folyamatok a melodikus struktúra alapkategóriái és kevés van belôlük. Az elképzelést némileg alátámasztja ROSNER ÉS MEYER (1982, 1986) elemzése és kísérleti tanulmánya. NARMOUR (1990, 1992) szerint a hangmagasság-mintázatok viszonylag korlátozott lexikona „genetikus kód”, ebbôl épülnek fel a dallamok. MEYER (1956) szerint a zenében „betöltendô rések” (fill in gap) keletkeznek, azaz bizonyos zenei lépések megkövetelik, hogy a folytatásuk kitöltse az átívelt intervallumot egy ellenkezô irányú, kis lépésekben megtett mozgással. NARMOUR (1990) erre az elképzelésre alapozta implikációs-realizációs elméletét. Szerinte a dallamok folytatásukra vonatkozó elvárást (implikáció) keltenek a hallgatóban, ami genetikus és tanult tényezôk összjátéka. Az implikáció-realizáció elmélet szerint az olyan intervallum, amelyet nem érzünk teljesnek (vagyis lezártnak), implikatív intervallum: az ilyen intervallum azt implikálja, hogy bizonyos hangok valószinûbben következnek utána, mint mások. Az implikatív intervallum második hangja és az azt követô hang a realizált intervallum. NARMOUR (1990, 1992) szerint az implikációk öt perceptuális hajlamból erednek. Ezek a „regiszterirány”, az „intervallum-különbség”, a „regiszter-visszatérés”, a „közelség” és a „zárás”. Az elsô két hajlam (a regiszter-irány és az intervallum-különbség) alkotja az implikáció-realizáció elmélet lényegét; ezekbôl származnak az „alapvetô dallamstruktúrák”. Mindkettô arra érzékeny, hogy az implikatív intervallum kicsi (öt félhang vagy annál kisebb) vagy nagy (hét félhang vagy annál nagyobb), mivel a kis intervallumok mást implikálnak, mint a nagy intervallumok. A tritonusz (hat félhang) határ-intervallum, amely sem kicsi, sem nagy. A regiszter-irány hajlama alapján a kis intervallumok a hangmagasság irányának a folytatását implikálják (azaz a kis, felfelé haladó implikatív intervallum felfelé haladó realizált intervallumot implikál), míg a nagy intervallum irányváltást implikál (például egy nagy, felfelé haladó intervallum lefelé haladó realizált intervallumot vagy hangismétlést implikál). Az intervallum-különbség hajlama alapján a kis implikatív intervallumok hasonlóan kis realizált intervallumokat implikálnak (pontosabban azonos méretû plusz-mínusz két félhang, ha a realizált intervallum regiszter-irányt vált; ugyanaz a méret plusz-mínusz három félhang egyébként), míg a nagy implikatív intervallum kisebb realizált intervallumot implikál. A regiszter-visszatérés egy dallam-arhetípus, amiben a realizált intervallum második hangja közel (két félhang vagy annál kisebb távolságra) kerül az implikatív intervallum elsô hangjához és így szimmetrikus (ABA) vagy megközelítôleg szimmetrikus (ABA’) mintázatot hoz létre. A tükör-szimmetriától való eltérés mértékében a dallamok kevésbé archetipikussá, azaz kevésbé implikálttá válnak. 102
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
A közelség hajlama alapján a kis realizált intervallumok (öt félhang vagy annál kisebb) implikáltabbak, mint a nagy intervallumok és a kisebb realizált intervallumok erôsebbek: például az öt félhangnyi intervallum implikáltabb, mint a hat félhangnyi és így tovább. Végül a zárás hajlama alapján a hallgatók a dallamiránytól és az intervallum-mérettôl függôen szegmentálják perceptuálisan a dallamokat. Zárást akkor érzünk, amikor a dallam irányt vált (azaz az implikatív és a realizált intervallum iránya eltérô) vagy amikor viszonylag kis realizált intervallum követ egy nagyobb implikatív intervallumot. Mind az öt hajlam érvényesül emelkedô és ereszkedô dallamok esetében is. 2.4.5 AKUSZTIKUS ELVÁRÁS Természetes helyzetekben a hangforrások rendszerint nem egy hangot, hanem hosszabb hang-sorozatokat bocsátanak ki: a zenében dallamokat (hangmintázatokat) és nem hangokat hallunk. A hangingerek csoportosítását (esemény-integráció) a hangingerek paraméterei és az ingersorban érvényesülô szabályok határozzák meg attól függetlenül, hogy figyelemmel kísérjük a hangokat vagy sem. Két (például hangmagasságban) eltérô hang szabályos váltakozásával létrehozott hangsorozatban a hangismétlés - ami megsérti a váltakozás szabályát - EN-t vált ki (például HORVÁTH ÉS MUNKATÁRSAI 2001), azaz nemcsak az egyes hangok, hanem a hangsorozat mintázatának a változása is EN-t generál, mivel a hangismétlés „csak” a váltakozás szabályát sérti meg, új ingert nem hoz a hangsorozatba. Három vagy több egymástól eltérô, azonos sorrendben ismétlôdô hangokból álló sorozatban a sorrendet ritkán megsértô hang EN-választ vált ki attól függetlenül, hogy az egyes hangok között rövid (néhány milliszekundumos) szünetek vannak vagy sem (lásd például W INKLER ÉS SCHRÖGER 1995). SCHERG ÉS MUNKATÁRSAI (1989) szerint a négy azonos hang után következô ötödik, eltérô hangból álló sorozatban az ötödik, eltérô inger EN-t vált ki (annak ellenére, hogy ez a hang is része az ismétlôdô mintázatnak). SUSSMAN ÉS MUNKATÁRSAI (1998a) az ingeradás sebességét a Scherg és munkatársai által alkalmazott 1,3 s-ról 0,1 s ingerkezdetek közötti idôre gyorsították és ilyenkor eltûnt az EN az ötödik hangra. Lassú ingerbemutatás esetén a hangsor nagyobb léptékû szabályossága nem detektálható automatikusan (magasabb szintrôl irányított folyamatok nélkül), mert ilyenkor a ciklus ideje 5x1,3 s = 6,5 s, azaz a szabályos ismétlôdés „észrevételéhez” szükséges kb. 3 ciklusnyi hang (lásd például HORVÁTH ÉS MUNKATÁRSAI 2001) nem lehet egyidôben a körülbelül 10-15 s tárolási idejû akusztikus szenzoros emlékezetben (lásd COWAN 1984). Az ingerbemutatás gyorsítása lehetôvé teszi a szabályos mintázat automatikus detektálását, azaz a mintázatészlelés folyamatainak egy része inger-vezérelt (figyelemtôl független). Az inger-vezérelt mintázat kialakulására az ingerek abszolút idôzítése mellett a relatív idôi viszonyok (a csoporton belüli és a csoportok közötti idôk aránya) is hatnak (lásd WINKLER ÉS MUNKATÁRSAI 2001). SUSSMAN ÉS MUNKATÁRSAI (2002) 1 s-os ingerkezdet közötti idôvel mutattak be egy szabályosan ismétlôdô, négy azonos hangot követô ötödik, különbözô hangból álló hangsort, aminek egy-egy hangját nagyon ritkán egy harmadik, mindkét hangtól különbözô ingerre cserélték. Három feltételük volt: 1) passzív akusztikus helyzet (könyv-olvasás), 2) gombnyomásos válasz a ritka ingerre (ingerdetekció) és 3) gombnyomásos válasz a szabály megsértésére (szabálysértés-detekció). A kísérleti személyeknek adott instrukció nem említette a sorozat szerkezetét, bár a harmadik feltétel instrukciója felhívta a kísérleti személy figyelmét a sorozat szabályosságára. A kísérleti személyek az ingerdetekciós feltételben nem vették észre a sorozat szabályosságát. A ritka hangok minden feltételben EN-t váltottak ki és amikor a ritka hang célinger volt, akkor a cél detektálásával együttjáró kiváltott-potenciál összetevôk is megjelentek (N2b, P3). A periódusban ismétlôdô eltérô hanginger által kiváltott válaszok a kísérleti személyek szubjektív benyomásának feleltek meg: a passzív és az ingerdetekció feltételben ezek az ingerek EN-t váltottak ki, míg a szabálysértés-detekció feltételben az ilyen ingerek nem váltottak ki EN-t. Vagyis a lassú bemutatás ellenére - ami megakadályozza az automatikus csoportosítást - a központilag irányított folyamatok befolyásolják a hangok csoportosítását.
103
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.4.5.1 ABSZTRAKT ÉS APERIODIKUS AKUSZTIKUS ELVÁRÁS GOMES ÉS MUNKATÁRSAI (1995) egy hangsorozatban a hangok néhány jellemzôjét véletlenszerûen változtatták, míg más hangjellemzôk változatlanul maradtak. Az állandó jellemzôktôl eltérô ritka hangingerek ilyenkor is EN-t váltanak ki. Az EN olyan szabályosságok megsértésekor is megjelenik, amelyekben a szabály nem egy konkrét hangjellemzô-értékre vonatkozik, hanem két hangjellemzô (például minél magasabb egy hang, annál halkabb; PAAVILAINEN ÉS MUNKATÁRSAI 2001) vagy két egymást követô hang relációjára (például magasabb hangot nálánál mélyebb követ és viszont, vagy egy hangot mindig attól eltérô hang követ; HORVÁTH ÉS MUNKATÁRSAI 2001). Az egyenletes ingerbemutatási sebesség sem elôfeltétele a szabálysértés detekciójának (például HORVÁTH ÉS MUNKATÁRSAI 2001). A nem periodikus szabályok megsértése is EN-t vált ki, például az állandóan emelkedô magasságú hangok sorába iktatott hangismétlés vagy alacsonyabb hang (T ERVANIEMI ÉS MUNKATÁRSAI 1994). 2.4.5.2 TÖBBSZÖRÖS
SZABÁLY
A több szabályt is megsértô hangingerek több, esetleg egymást átfedô EN-t váltanak ki (lásd például WINKLER ÉS CZIGLER, 1998), bár az egyszerre detektálható, egymással összefüggô szabályok megsértésével kiváltott EN-válaszok nem (vagy nem teljesen) additívek (például TAKEGATA ÉS MUNKATÁRSAI, 2001). A legtöbb szabály több ekvivalens és/vagy eltérô általánossági fokon is megfogalmazható. HORVÁTH ÉS MUNKATÁRSAI (2001) szerint a szabályvariánsok megsértése EN-t vált ki, azaz egy-egy szabályosság egyszerre több lehetséges módon is leképezôdik: a hangsorok reprezentációja többszörös, redundánsan leképzett szabályokat tartalmaz. Két azonos hang még nem (HORVÁTH ÉS MUNKATÁRSAI 2001), de három azonos hang már kialakít egy ismétlési szabályt (lásd például SCHRÖGER 1997; COWAN ÉS MUNKATÁRSAI 1993) attól függetlenül, hogy az ismételt hangok indítják a hangsort vagy eltérnek egy korábbi szabálytól (HORVÁTH ÉS MUNKATÁRSAI 2001; WINKLER ÉS MUNKATÁRSAI 1996a). Ezzel szemben a szabály csak jó néhány (legalább 4) egymást követô „deviáns” hang, vagy az ingereket követô hosszabb szünet után veszti érvényét (COWAN ÉS MUNKATÁRSAI 1993; W INKLER ÉS MUNKATÁRSAI 1996a, b és 2001) és még ilyenkor is reaktiválható emlékeztetô ingerrel (COWAN ÉS MUNKATÁRSAI 1993; W INKLER ÉS MUNKATÁRSAI 1996b).
104
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.4.6 L ÁNCRA-BONTÁS (DALLAMVONALAKRA SZAKADÁS) Ha két jelentôsen eltérô hangmagasságú hangból sorozatot alkotunk és a szekvenciát elég gyorsan mutatjuk be, a hangsort két független dallamvonalnak észleljük: egyik a magas, a másik a mély hangokból áll. Ilyenkor a hangok valódi sorrendjét csak nehezen vagy egyáltalán nem tudjuk megkülönböztetni: ez a jelenség az akusztikus láncra bontás (lásd BREGMAN 1990). BREGMAN (1978) kísérleti alanyai olyan szekvenciákat hallottak, amelyek két „magas” (748 és 831 Hz) és egy „alacsony” (330 Hz) hangból álltak. Amikor ez a szekvencia két dallamvonalra szakadt, a felsô dallamvonalat úgy észlelték, mint két magas hang váltakozását, az alsó dallamvonalat pedig mint egyetlen hang ismétlôdését. VAN NOORDEN (1975) összehasonlította a láncra bontás határát két és három hangból álló valamint hosszú, ismétlôdô szekvenciák esetében. A három hangból álló szekvenciák frekvencia-változása egyirányú, vagy kétirányú volt. Kísérleti személyei egyirányban változó három hangból álló szekvenciák esetén a két hangból álló sorozat sebességével egyenlô vagy még nagyobb sebességeknél is észlelték a temporális összefüggést, azaz a hangok nem szakadtak láncokra. Ám a kétirányban változó három hangból álló szekvenciák esetén a bemutatás sebességét sokkal alacsonyabbra kellett állítani, mint a két hangos szekvenciák esetében, hogy észlelni lehessen a temporális összefüggést (azaz ne szakadjanak láncokra a hangok). Hosszú ismétlôdô szekvenciák esetén a bemutatás sebességét még alacsonyabbra kellett állítani. SUSSMAN ÉS MUNKATÁRSAI (1999) kísérleti alanyai gyorsan vagy lassan váltakozó magas és mély hangokat hallottak. A magas hangok - és a mély hangok is - három, frekvenciában kissé eltérô hangsorozatot alkottak, amelyek azonos sorrendben ismétlôdtek. A három hang sorrendjét idônként megfordították. Lassú bemutatás esetén egyetlen, hangmagasságában váltakozó ingersor hallható, amelyben a magas és a mély hangok külön szabályosságai nem észlelhetôek (lásd BREGMAN 1990). Gyors ingerbemutatáskor egyidejû magas és mély hangsorozatokat hallunk, amelyekben a szabályosan ismétlôdô (magas és mély) hangorozatok világosan felismerhetôek. A passzív (nem figyelt) helyzetben gyors ingerbemutatás esetén a deviáns hangsorozatok EN-t váltanak ki, lassú bemutatás esetén azonban nem, pontosan az észlelésnek megfelelôen. RITTER ÉS MUNKATÁRSAI (2000) szerint az akusztikus láncra bontás során elváló hangsorok automatikusan detektált szabályosságai egymástól függetlenek. YABE ÉS MUNKATÁRSAI (2001) szerint pedig az akusztikus láncra bontás a temporális integráció egyes folyamatait is megelôzi. SUSSMAN ÉS MUNKATÁRSAI nak (1998b) egy másik kísérletében a kísérleti.személyek azt a feladatot kapták, hogy - lassú ingerbemutatás mellett - koncentráljanak a magas hangokra és ignorálják a mélyeket (SUSSMAN ÉS MUNKATÁRSAI 1998b). Ilyenkor mindkét hangsor deviáns ingerei EN-t váltottak ki, noha olyankor, amikor a kísérleti személyek nem figyeltek a hangingerekre, ugyanez a hangsor nem váltott ki ENt. Vagyis egyértelmû hangjellemzôk esetén az akusztikus láncra bontás inger-vezérelt folyamat, míg a mindkét szervezôdést lehetôvé tévô helyzetekben magasabb szintrôl irányított folyamatok döntik el, hogy melyik struktúrában észleljük a hangokat. Az információ nem egyöntetûen lentrôl-felfelé - szenzoros átalakítástól felismerésig - halad. A hangesemény ismerete segít elválasztani azt a háttérzajtól, például az ember zajos környezetben is meghallja a saját nevét, ami kiemelkedik a zajból. Több nyelven beszélô embereknél az a zajszint, amin a beszéd még érthetô, magasabb az anyanyelven mint a második nyelven. BREGMAN (1990) az ilyen jelenségeket auditoros séma-alapú feldolgozásnak nevezte, mivel ezekben a feldolgozás késôbbi szintjei befolyásolják az auditoros csoportosítást és az auditoros jellemzôk elemzését. A felülrôl-lefelé haladó folyamat egyik legnyilvánvalóbb példája a helyreállítási illúzió (restoration illusion; WARREN, 1970) a fonéma felismerésben. Ha kivágunk a szóból egy fonémát és csenddel helyettesítjük azt, a hallgatók szaggatott beszédet hallanak. Ha azonban a fonémát zajjal helyettesítjük, a hallgatóknak az a benyomása támad, hogy a hiányzó fonémát hallják a zaj „mögül”. Több hasonló jelenség is létezik a beszédfelismerésben (FRAUENFELDER ÉS TYLER , 1987; S EGUI, 1989). Számos észlelési jelenség bizonyítja, hogy a kontextus befolyásolja a hangok és hang-mintázatok észlelését (lásd például CZIGLER 2001). A hangkörnyezet a nem-figyelt hangok szervezését is befolyásolja. W INKLER (2003) két, kissé eltérô frekvenciatartományból vett hangok alkottak egy hangsort (teszthangok). A hangok többsége azonos hosszúságú volt, de néhány rövidebb hangot is a hangsorba kevert (próbadevián105
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
sok). A hangsorhoz két további frekvenciatartományból vett hangokat adott, amelyek ugyanolyan rövidek voltak, mint a teszt-hangsorban ritka rövid hangok. Az egyik passzív akusztikus feltételben a hangsorhoz adott (kontextuális) hangok két, a teszthangok frekvenciatartományától távol esô frekvenciatartományból származtak, hogy automatikusan elváljanak a teszthangoktól és erôsítsék azok közös láncba szervezését. A második feltételben az egyik kontextuális hangcsoport tagjai valamivel mélyebbek voltak, mint a mélyebb teszthangcsoport, míg a másik kontextuális hangcsoport nem sokkal a magasabb teszthangcsoport felett volt azért, hogy a kontextuális hangok elválasszák egymástól a teszthangok két csoportját és az egyes teszt- és kontextuális hangok külön akusztikus láncot alkossanak. A teszthangoktól távol esô frekvenciatartományból vett kontextuális hangok esetében a rövid teszthangok kiváltottak EN-választ, míg közeli kontextuális hangok esetében nem. Vagyis az akusztikus kontextus hatással van a hangsorok szervezésére, szabályosságaik detektálására akkor is, amikor a hangok nem állnak a figyelem központjában. A hangokat sohasem izoláltan dolgozzuk fel, hanem kezdettôl fogva a teljes környezetükkel összefüggésben. 2.4.6.1 FREKVENCIA-KÖZELSÉG ÉS A TEMPORÁLIS RELÁCIÓK ÉSZLELÉSE Gyorsan bemutatott szekvenciák elkülönült dallamvonalakra szakadása esetén a temporális kapcsolatok a dallamvonalak elemei között feldolgozhatatlanná válnak. Ezt többféleképpen is demonstrálták. BREGMAN ÉS CAMPBELL (1971) egy hat hangból álló szekvenciát ismételt: három hang a magas frekvenciatartományból és három az alacsony tartományból. Amikor másodperenként 10 hangot hallottak, nehézzé vált a hallgatóknak a szekvenciába ágyazott magas és mély hangok sorrendjét észlelni. DANNENBRING ÉS BREGMAN (1976) szerint amikor két hang váltakozik nagy sebességgel, - hogy elkülönült perceptuális dallamvonalakat alkossanak -, a két dallamvonal hangjait egyidôben halljuk. Egy hasonló tanulmányt végzett FITZGIBBON , POLLATSEK ÉS THOMAS (1974), akik a gyors egymásutánban bemutatott hangok közötti temporális szünetek észlelését vizsgálták. Amikor 20 ms-os szüneteket illesztettek az ugyanolyan frekvenciatartományú hangok közé, a szünet detekciója könnyû volt. Amikor azonban a szünet két különbözô frekvenciatartományból származó hang közé esett, a detekciós teljesítmény szignifikánsan csökkent. VAN NOORDEN (1975) az olyan hang temporális eltérésének detekcióját vizsgálta, ami egy másik, különbözô frekvenciájú hanggal váltakozott folyamatosan és úgy találta, hogy amikor a szekvencia tempója növekedett, az éppen észlelhetô eltérés is megnôtt. A növekedés jelentôs volt akkor, amikor a hangok frekvenciában erôsen különböztek, de csak csekély, amikor a frekvenciák szomszédosak voltak. A temporális feldolgozás leromlása a frekvenciakülönbség eredményeképpen két hangos szekvenciáknál is elôfordul. DIVENYI ÉS HIRSCH (1972) szerint a hangok közötti temporális szünet tartamának megkülönböztetése romlik növekvô hangok közötti frekvencia-különbség esetén. W ILLIAMS ÉS PERROTT (1972) is mérte a minimális detektálható szünetet a hangpárok között: 100 és 30 ms-os tartamú hangok esetén a határérték növekedett a növekvô frekvenciakülönbséggel. 2.4.6.2 CSOPORTOSÍTÁS A JÓ FOLYTATÁS ALAPJÁN BREGMAN ÉS DANNENBRING (1973) szerint amikor egy magas hanggal váltakozó mély hang ciklusának ismétlôdése kezd két dallamvonalra szakadni, a szakadási tendencia lecsökkenthetô a magas és mély hangok glissando kötésével. NABELEK, NABELEK ÉS HIRSCH (1973) szerint komplex hangoknál az összetevôk kezdeti és záró hangjai közötti frekvencia-glissandó több hangmagasság-összeolvadást eredményezett, mint az átmenet nélküli kapcsolódás. DIVENYI ÉS HIRSCH (1974) a sorrend-azonosítást vizsgálta három hangból álló szekvenciák esetén és úgy találta, hogy az egyirányban változó frekvencia-sorozatokat könnyebb sorrendbe rendezni, mint a kétirányban változó frekvencia-sorozatokat. Hasonló eredményeket kapott NICKERSON ÉS FREEMAN (1974), WARREN ÉS BYRNES (1975) valamint MCNALLY ÉS HANDEL (1977) négy hangból álló sorozatok esetén. Ráadásul VAN NOORDEN (1975) úgy találta, hogy a három hangból álló sorozatot valószínûbben ítélik koherensnek, ha a hangok egyirányú, mint ha kétirányú frekvencia változást mutatnak.
106
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.4.6.3 HANGSZÍN -KÜLÖNBSÉG ÉS TEMPORÁLIS KAPCSOLATOK A komplex hangok hangtípus vagy hangszín alapján történô csoportosítása a hasonlóság alapján történô csoportosítás példája. A hangszín alapján történô csoportosítás világosan jelen van a természetes zenei helyzetekben (ERICKSON , 1975). A szomszédos frázisokat gyakran különbözô hangszerek játszák, hogy növeljék a perceptuális elkülönülést. Továbbá a hangmagasság-átfedések sokkal gyakoribbak több hangszertípusnál, tükrözve a hangszínkülönbség szétválasztó hatását. WARREN, OBUSEK , FARMER ÉS WARREN (1969) olyan hangsorozatokat alkotott, amelyek négy nem összefüggô hangból álltak: egy magas hangból (1 kHz), egy susogásból (2 lHz oktáv sávnyi zaj), egy alacsony hangból (796 Hz) és egy zizegésbôl (400 Hz négyszögletes hullám). Minden hang 200 ms tartamú volt és a hangok szünet nélkül követték egymást. A hallgatók képtelenek voltak a hangok sorrendjének megnevezésére az ilyen szekvenciákban. Ahhoz, hogy a sorrendet meg tudják nevezni, minden hang tartamát meg kellett növelni több mint fél szekundumra. 2.4.7 A HANGKÖRNYEZETI
MODELL
Ahhoz, hogy természetes (több párhuzamosan mûködô, mintázott jeleket elôállító hangforrást tartalmazó) környezetben akár csak egyetlen hang reprezentációja is elkészülhessen, a teljes környezet dinamikus (az idôbeli mintázatokat figyelembe vevô) és interaktív (az egyes források és a hangsorokon belüli szabályok egymásra hatásával számoló) modelljét kell kialakítani. A korábban magasabb szintûnek feltételezett mûveleteket már a hangok feldolgozásának elsô szakaszában és minden hangra, tehát nem csak a figyelem aktuális központjában álló hangokra kell elvégezni. Ehhez nem elég az egyes ingerreprezentációk átmeneti tárolása (a hagyományos értelemben vett hallási szenzoros emlékezet), ehhez az éppen mûködô hangforrások és azok aktuális idôbeli mintázatának ismerete is szükséges. WINKLER ÉS MUNKATÁRSAI (1996a) azt a struktúrát, amely ezeket az információkat rendszerezve rögzíti, az akusztikus környezet idegrendszeri modelljének nevezi és szerintük ez a modell attól függetlenül létezik, hogy az aktuális viselkedés szempont-jából mely hangoknak van jelentôsége. A hangkörnyezeti modell felépítése idôbe telik. BREGMAN (1990) vizsgálatai szerint a láncra bontás még egyszerû esetekben is néhány (3-5) másodpercet vesz igénybe, ezt tekintik a modellkiépítési idô alsó becslésének. Az EN-komponens mögött álló folyamatok a modell állandó megújítását végzik (WINKLER ÉS CZIGLER 1998; W INKLER ÉS MUNKATÁRSAI 1996a). A hangkörnyezeti modell alapot ad a modalitások közötti integrációra és az észlelésben tapasztalható audio-vizuális interakciók alapján feltételezi, hogy a hallási környezet modelljét más modalitásbeli információkkal is befolyásolni lehet. Az automatikus folyamatok akkor is lezajlanak, ha a hangok általában (vagy a vizsgált hangingerek specifikusan) nem állnak a figyelem középpontjában. A hangok feldolgozása egy alapértelmezett mûködés, aminek a paraméterei szükség esetén megváltoztathatóak. A hangok szervezését jórészt ilyen alapértelmezett folyamatok végzik, amelyek akkor is lezajlanak, ha a hangok nem állnak a figyelem központjában, ám bizonyos esetekben - magasabb szintrôl irányított hatásokkal - megváltoztatható az eredményük. Az EN-vizsgálatok azt mutatják, hogy a modell kialakulását befolyásolják az adott típusú hangokról szerzett korábbi tapasztalatok. A komplex hangok diszkriminációja gyakorlással finomítható és ennek a tréningnek a hatása az EN kiváltására késôbb is kimutatható (NÄÄTÄNEN ÉS MUNKATÁRSAI 1993). A tanulás hatása különösen fontos a magasabb szintû funkciók, mint például a beszédészlelés fejlôdésében. CHEOUR ÉS MUNKATÁRSAI (1998) kimutatták, hogy az anyanyelvre jellemzô magánhangzók csecsemôkori elkülönülésével párhuzamosan a különbözô magánhangzók közötti automatikus („default”) megkülönböztetés drámaian kifinomul. Ehhez hasonló folyamat zajlik le akkor is, amikor valaki megtanul beszélni egy idegen nyelven. W INKLER ÉS MUNKATÁRSAI (1999a), valamint KRAUS ÉS MUNKATÁRSAI nak (1996) kísérletei kimutatták a tanulás rövid- és közép-távú hatását beszédhangok „default” megkülönböztetésére. A tanulási példák arra utalnak, hogy a beszéd-tanulás folyamán kialakul az egyes beszédhangok reprezentációja, ami a hosszú-távú emlékezetben tárolódik. Ez a reprezentáció már a hangok elemzésének korai, figyelmet nem igénylô szakaszában aktiválódik, és befolyásolja a beérkezô hangok feldolgozását, észlelését (összefoglalót lásd NÄÄTÄNEN ÉS MUNKATÁRSAI 2001). A fonémák kategorikus percepciója (LIBERMAN ÉS MUNKATÁRSAI , 1957) és a „perceptuális mágnes” jelensége (K UHL, 1991) kimutatható akkor is, ha a kísérleti személynek nincs a beszédhangokkal kapcsolatos feladata (W INKLER ÉS MUNKATÁRSAI, 1999b, illetve 107
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
AALTONEN ÉS MUNKATÁRSAI , 1997). Akár figyelünk a hangokra, akár nem, a részletes akusztikus információk kb. 10-15 s alatt elvesznek az emlékezetbôl (ez a hallási szenzoros emlékezet idô kapacitása; lásd COWAN, 1984). Azonban egy barátunk hangját évekkel az utolsó találkozás után is felismerjük anélkül, hogy ehhez más - például vizuális - modalitásbeli segítséget kapnánk. Nyilvánvaló, hogy barátunk hangjának jellemzô akusztikus vonásait a hosszú távú emlékezet tárolja, mégpedig kellôen finom felbontásban, hiszen nem csupán kategóriákat (például férfi vagy nôi hang), hanem azon belül egyedeket is azonosítani tudunk. Az EN alapját képezô szabályok (beleértve azok konkrét, finom felbontásban tárolt akusztikus paramétereit is) az utolsó hangtól számított legalább 30 s-ig, tehát jóval az akusztikus szenzoros emlékezet törlôdése után is, visszaállíthatóak (WINKLER ÉS MUNKATÁRSAI, 2002), akkor is, ha a teszthangsor és a szabály visszaállítása közötti idôben más hangokat hall a kísérleti személy (WINKLER ÉS MUNKATÁRSAI, 1996b). Valószínûleg a hangsorokból kivont szabály-reprezentációknak létezik egy olyan tárolási formája, amely átmenet a szenzoros puffer (amelyben a hangreprezentációk csak rövid ideig elérhetôek és az újabb hangok kiszorítják ôket) és a hosszú távú emlékezet szenzoros információkat tartalmazó formái között. Ebbôl a köztes tárból a szabályok egy emlékeztetô hang segítségével hívhatóak elô, azaz nem a felidézéshez, hanem a felismeréshez nyújtanak segítséget. Az ilyen módon ideiglenesen tárolt szabályreprezentációk valószínûleg alvás közben rögzülnek a hosszú idejû emlékezetben (ATIENZA ÉS CANTERO , 2001), hogy késôbb megalapozzák képességeinket a hangokkal végzett összetett mûveletekben. Az EN-t vizsgáló kutatások kimutatták a zenei hangközök automatikus kódolását. Ha olyan, változó abszolút hangmagasságú hang-párokból alkotunk hangsort, amelyben a hang-párokon belüli hangköz azonos, akkor ritkán bemutatott, a szabályostól eltérô (annál kisebb vagy nagyobb) hangközû hangpárok EN-t váltanak ki, függetlenül a figyelem irányától (PAAVILAINEN ÉS MUNKATÁRSAI, 1999). Automatikusan detektáljuk azt is, ha egy egyszerû ritmusba hiba csúszik (IMADA ÉS MUNKATÁRSAI, 1993). Ezek az alapvetô képességek mindannyiunkban megtalálhatóak, ám a professzionális zenészek hatékonyabban kódolnak összetett hangmintázatokat (TERVANIEMI ÉS MUNKATÁRSAI, 2001). KOELSCH ÉS MUNKATÁRSAI (1999) szerint a zenészek kisebb hangmagasság-eltéréseket különböztetnek meg automatikusan, mint a zeneileg kevésbé képzett személyek, ez a különbség azonban fôként a zenészek saját hangszerének jellegzetes hangeltéréseinél jelentkezik. A hallási percepció - valós feltételek között - összetett, modell-vezérelt folyamatok eredménye, amik a figyelem irányultságától függetlenül leképezik a teljes hangkörnyezetet, megteremtve ezzel azt a lehetôséget, hogy látszólag erôfeszítés nélkül élvezhessünk egy zenemûvet, vagy beszélgetést folytathassunk zajos környezetben.
108
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.4.8 I NTERAKCIÓK AZ AKUSZTIKUS PARAMÉTEREK KÖZÖTT Amikor egy hangot hallunk, hangmagasságot, hangosságot és hangszínt tulajdonítunk neki, valamint egy adott helyrôl halljuk azt. Minden egyes hang-észleletet tehát le lehet írni a tulajdonságértékek egy csoportjával. Ha észlelésünk helyes, e tulajdonságcsoport tükrözi az akusztikus hang jellemzôit. Olyan helyzetekben azonban, amikor több mint egy hang szólal meg egyidôben, a tulajdonságértékeknek ezek a csoportjai fragmentálódhatnak és újrakombinálódhatnak, aminek köszönhetôen illúziók jönnek létre. A perceptuális csoportosítás nem csak abból áll, hogy összekapcsoljuk a különbözô ingerösszetevôket egymással, közben az ingerek ingerjellemzôkre fragmentálódnak, majd a fragmentálódott jellemzôk integrálódnak, miközben a különbözô jellemzô-értékek újrakombinálódnak. A két-csatornás hallgatási technika különösen hasznos a zene szervezôdésének tanulmányozására, mivel lehetôvé teszi, hogy a különbözô tulajdonságokat egymással ellentétbe hozzuk a csoportosításban. Például a térbeli elhelyezkedésen alapuló csoportosítás ellentétbe hozható a frekvencia vagy amplitúdó alapján történô csoportosítással. Ehhez hasonlóan a különbözô elvek - amelyek irányítják a csoportosítást az adott dimenzióban - ellentétbe hozhatóak egymással, mondjuk a közelség elve szembe kerülhet a jó folytatás elvével. 2.4.8.1 A SKÁLA-ILLÚZIÓ Az az ingerelrendezés, ami létrehozza a skála-illúziót egy dúr skála, amelyet egyszerre mutatnak be emelkedô és ereszkedô változatában. Amikor az emelkedô skálából származó hang az egyik fülbe jut, az ereszkedô skálából származó hang a másik fülbe érkezik, ráadásul a skálák egymást követô hangjai egyik fülrôl a másikra vándorolnak (DEUTSCH, 1975b). Ez a szekvencia különbözô illuzórikus percepciókhoz vezet. A hallgatók többsége két dallamvonalat észlel: egy magasabbat és egy alacsonyabbat, amelyek ellentétes irányba mozognak. A magasabb hangok az egyik fejhallgatóból hallatszanak, míg a mélyek a másikból és amikor a fejhallgató elhelyezkedését megfordítják, a magas és mély hangok észlelt helyzete nem változik. Néhány hallgató négy hang egyszerû sorát hallotta, amely a szekvencia magasabb hangjainak felelt meg, míg a szekvencia többi részét alig - vagy egyáltalán nem - észlelték. Térbeli helyzet alapján sosem, mindig a frekvencia alapján történt a szervezôdés. B UTLER (1979) demonstrálta, hogy a hangmagasság alapján történô csoportosítás meglehetôsen általános jelenség: DEUTSCH (1975b) tiszta hangokat (szinuszhullám és négyszögjel) mutatott be fejhallgatón keresztül hallgatóinak, BUTLER (1979a) kísérleti alanyai azonban valódi hangszerhangokat (pl. zongorahangokat) hallottak térben elválasztott hangszórókból. A hallgatók - még akkor is, amikor az egyik hangszóró hangjai más hangszínen szóltak - a hangmagasság alapján csoportosították a hangokat. BUTLER (1979b) hívta fel a figyelmet Csajkovszkij hatodik (Pathetique) szimfóniájának záró motívumára. A téma és a kíséret két hegedû-csoport között van elosztva, ám a témát 109
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
a hangszerek egyik csoportjából halljuk, míg a kíséretet a másikból. Egy kevésbé ismert példa található erre a jelenségre Rachmaninov Második szvít két zongorára címû mûvében (Op. 17). A hangmagasság alapján történô csoportosítás néha a hangok téves helyen való észlelését okozza. Vannak olyan esetek, amikor a hangmagasság alapján történô csoportosítás (vagy hangmagasság-láncolás, ahogy gyakran nevezik) azt is lehetôvé teszi, hogy egyetlen hangforrást két független forrásként halljunk. Egy szóló hangszer a polifónia illúzióját keltheti két ellenpontozott szólam hangjainak összeszövésével. Ezt az eszközt gyakran használták a zeneszerzôk, különösen a barokk korszakban (például J.S. Bach: Prelude Gben , Das Wohl-temperierte Klavier, jobb kéz szólam). 2.4.8.2 MASZKOLÁS ALÓLI FELSZABADÍTÁS ZAJJAL DEUTSCH kísérletében (1978a, 1979) a hallgatók olyan dallam mintázatokat azonosítottak, amelyeknek az összetevô hangjai fülrôl-fülre vándoroltak. Volt olyan feltétel, amelyben az inger csak az egyik fülbe érkezett és olyan, amelyben az ingerek egyidôben érkeztek a két fülbe (amikor az egyik fülbe a dallamösszetevô érkezett, a másik fülbe zúgó hangot mutattak be). Egy további feltételben az egyidejû zúgás és dallamösszetevô ugyanabban a fülben szólt. A negyedik feltételben a dallamot binaurálisan mutatták be. Amikor a dallamot binaurálisan mutatták be, a teljesítmény kiváló volt. Amikor azonban a dallam alkotó hangjai egyik fülrôl a másikra váltottak - kísérô zúgás nélkül -, a teljesítmény komolyan leromlott. Ha azonban zúgást lehetett hallani a másik fülben a dallamösszetevô mellett, a teljesítményszint megint nagyon magas volt, még akkor is, ha a dallam az egyik fülrôl a másikra vándorolt. Amikor a zúgást ugyabba a fülbe adták, mint amelybe a dallamösszetevôt, a teljesítmény a véletlenszint alatt maradt. 2.4.8.3 AZ OKTÁV-ILLÚZIÓ DEUTSCH (1974a, b, 1975a) azonos szekvenciát - két hang oktáv távolságban egymással váltakozik - mutatott be egyidôben a két fülbe úgy, hogy amikor a jobb fül a magas hangot kapja, a bal fül az alacsonyabbat és fordítva, azaz egy kéthangos akkordot mutatott be, aminek az összetevôi fülrôl fülre vándorolnak. Ez a szekvencia különbözô illúziókat hozott létre, amelyek közül a leggyakoribb az volt, hogy egyetlen hang vándorol egyik fülrôl a másikra, aminek a hangmagassága az egyik oktávról a másikra változik a lokalizációs változással szinkronban. Amikor a fejhallgatókat fordítva helyezték fel, a legtöbb hallgató ugyanazon az oldalon észlelte a magas és mély hangokat, mint elôtte. DEUTSCH (1982) változtatta az egymást követô hangok közötti intervallumot a hangok tartamának változtatásával vagy közéjük iktatott szünetekkel. A hatás erôssége csökkent a ciklus növekvô idejével attól függetlenül, hogy a növekedést a hangok tartamának meghosszabbodása hozta-e létre, vagy a közéjük iktatott szünet A csoportosítás mindig a térbeli helyzet alapján történt. Ez szöges ellentétben áll a skála-illúzió eredményeivel, amiben a csoportosítás mindig a frekvencia-közelség alapján történt, bár az ingerek amelyek ezeket az illúziókat létrehozták, megdöbbentôen hasonlóak. A hallgatók mindkét esetben szinuszhullámhangokat hallottak egyenlô ampitúdóval és tartammal. Az ingerek mindkét esetben folytonosak voltak és az egyik fülbe bemutatott frekvenciák mindig különböztek a másik fülbe szimultán bemutatott frekvenciáktól. Térbeli helyzet alapján történô csoportosítás akkor történik, amikor a szekvenciákban ugyanazok a frekvenciák érkeznek egymás után különbözô auditoros térrészrôl, a csoportosítás más alapon történik, ha nem így van. A viszonylagos amplitúdó egyetlen kísérletben sem volt döntô tényezô. Amikor a csoportosítás frekvenciaközelség vagy kontúr alapján történt, akkor is így történt, ha jelentôs amplitúdó-különbség volt a két fülbe érkezô szignálok között. Amikor a csoportosítás a térbeli helyzet alapján történt, az egyik oldalról 110
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
a másikra ugrás nem akkor történt, amikor amplitúdó-egyensúly volt, hanem egy más idôpillanatban, vagyis az amplitúdó csak elôkészítette a terepet és nem a csoportosítás elsôdleges kulcsingere volt. 2.4.8.4 A KEZESSÉG
HATÁSA
Erôs kezességi hatást találtak az oktáv- és a skála-illúzióban is. Oktáv-illúzió esetén a jobbkezesek döntô többsége a magas hangot a jobb és a mély hangot a bal oldalon hallotta, míg a balkezesek fordítva (Deutsch, 1974a, b). Skála-illúzió esetén a jobbkezesek általában a magas hangokat a jobb, míg a mélyeket a bal oldalon észlelték, ami megint fordítva volt a balkezeseknél. Valószínû, hogy a frekvencia-mintázatokat az auditoros tér domináns oldalán észleljük (DEUTSCH, 1975a, 1981; D EUTSCH ÉS ROLL, 1976). 2.4.8.5 SHEPARD-HANGOK A Roger Shepard által alkotott hangok speciálisan tervezett összetett hangok, amelyekben az egymástól oktáv távolságban levô szinuszhullám-összetevôk harang formájú spektrális burkológörbét alkotnak (hangzó példák: Shepard1.wav; Shepard2.wav; Shepard3.wav). Illúzió származik a Shepard-hangokból, ha a spektrális burkológörbék állandóak maradnak, de a frekvencia-összetevôk hangmagasságát növelik vagy csökkentik. A hangmagasság növelése vagy csökkentése történhet folytonosan, de ugrásokban is. Az egyes lépések intervallum-távolsága bármilyen érték lehet az oktávon belül (ami azonos relatív hangot ad). A legtöbb tanulmány 12 egyenlô logaritmikus lépést használt, az oktávot a nyugati zenében hagyományos félhang-lépésekre osztva fel. A harang-formájú spektrális burkológörbe logaritmikus frekvencia szerinti felfelé- vagy lefelé mozdításával (miközben a frekvencia-összetevôk azonosak maradnak) változást idézhetünk elô a kromakörön (az azonos zenei névvel rendelkezô hangokon) belül, míg az összes frekvencia-összetevô frekvenciájának a logaritmikus frekvencia szerinti föl vagy lefelé mozgatásával változást idézhetünk elô a hangmagasságban. A Shepard-hangok hangmagassága többértelmû, mivel több oktáv-összetevô szólal meg bennük egyidôben. Az észlelt hangmagasság nem változik a spektrális burkológörbe eltolásakor, mivel az alapfrekvencia, ami meghatározza az összetett harmonikus hangok észlelt hangmagasságát (alapfrenvencia) ugyanaz marad, azonban az egyes frekvencia-összetevôk energia-eloszlása eltolódik, ami a hangok hangszínkülönbségét okozza. Ésszerûtlen azt állítani, hogy csak az összetevôk frekvenciaváltozása a hangmagasság változása, mivel a cirkuláris kroma-változások is hozzájárulnak a hangmagasság észleléséhez. A hangmagasság és a kroma független változtatását legteljesebben RISSET (1971, 1978) demonstrálta, aki ezt a két komponenst ellenkezô irányban változtatta egyidôben - létrehozva egy olyan hangot, amit folytonosan emelkedô hangmagasságúnak észlelünk, ám paradox módon sokkal alacsonyabb hangmagasságnak halljuk végül, mint az elején (hangzó példa: Risset).
111
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.4.8.6 HANGMAGASSÁG Az akusztikus rezgés tisztán fizikai meghatározása céljából nem sok okunk van megkülönböztetni a rezgés hangmagasságát - fizikai korrelátumától - a frekvenciától, ha a rezgés egyszerû szinuszhullám. Azonban ha a hallgató reakcióit is figyelembe vesszük, a pszichológiai hangmagasság és a fizikai frekvencia közötti megkülönböztetés lényegessé válik. A hangmagasság azonosítása a fizikai frekvenciával nehézségekbe ütközik amikor összetett, vagy kombinációs hangokat hallunk. Az összetett hangnak jól meghatározott hangmagassága lehet, ráadásul a hallgatók képesek az észlelt hangmagasságnak megfelelô szinuszhullám beállítására, azonban a szinuszhullám frekvenciája idônként (például a szubjektív hangmagasságnak, residue hangmagasságnak vagy hiányzó alaphangnak nevezett jelenség esetében) nem felel meg az eredetileg bemutatott hang egyetlen fizikailag mérhetô frekvenciájának sem (SCHOUTEN, 1938; PLOMP, 1976, 112-114. oldal; WARD, 1954). Amikor zenei hangot hallunk, szinte mindíg nem egy, hanem több hangot hallunk, amelyeket egységesnek észlelünk, egyetlen hangmagasságnak. Amikor a gitár egy húrját megpengetik, egyetlen hangot hallunk. Ha ezután az eredeti hang ötödik haromonikusát szólaltatjuk meg (amit úgy hozhatunk létre, hogy a húrhossz 2/5-énél tompítva pengetjük meg a húrt), akkor is egyetlen hangot hallunk. Amikor azonban újra játszuk az elsô hangot, a hallgató valószinûleg nem egyetlen, hanem - legalább két - különbözô hangmagasságot hall, habár az, amit hallott, pontosan ugyanaz, mint az eredeti üres húr. A különbség annak köszönhetô, hogy amikor a második hangot játszuk ami az elsô harmonikusa, a hallgató figyelme valami olyanra terelôdik, ami már azelôtt is ott volt, vagyis arra, hogy a második hang az elsô harmonikusa, azaz ugyanazon komplex hang része. A jelenség egyszerû magyarázata az, hogy amikor megpengetünk egy hangot, a húr egyidôben több különbözô módon rezeg. Az összes rezgési mód különbözô hangot ad ki - különbözô frekvenciákon -, amelyek hozzájárulnak az észlelt egységes hanghoz. A különbözô rezgési frekvenciák egymással szabályosan viszonyban vannak, többnyire a hang legményebb összetevôje és a magasabb részhangok harmonikus viszonyban vannak egymással. A frekvenciák és a rezgési összetevôk egész szám arányban vannak egymással és így a második összetevô kétszeress sebességgel rezeg, mint az alapfrekvencia és a harmadik háromszor olyan gyorsan stb. Amikor az összes harmonikus együtt szól, gazdag hangszínt hallunk, aminek ugyanaz a hangmagassága, mint az egyedül megszólaló alapfrenvenciának, vagyis a komplex hang hangmagassága meglehetôsen hasonló az alapfrekvencia hangmagasságához: a komplex hangot egységesen észleljük. Ha harmonikus relációban levô összetevôket hallunk, ám az alapfrekvencia hiányzik (hiányzó alaphang), akkor is olyan egységes hangmagasságot („virtuális hangmagasság“) hallunk, ami az alaphang frekvenciájának felel meg bár az alaphang fizikailag nincs jelen a hangban. A klasszikus pszicho-fizikai módszer - amit eredetileg FECHNER (1860/1966) fejlesztett ki, majd STEVENS (1975) fejlesztett tovább - a monoton pszicho-fizikai függvény matematikai képletét próbálta meghatározni, ami átalakítja az inger fizikai értékeit (frekvenciáját mondjuk szinuszhullám hang esetén) egy megfelelô pszichológiai értékké (hangmagasság). Egy ilyen hangmagasság-skála a mel-skála, amit Stevens és munkatársai fejlesztettek ki (STEVENS ÉS VOLKMAN, 1940; S TEVENS, VOLKMAN ÉS NEWMAN, 1937; BECK ÉS SHAW, 1961, 1963). Zenei képesség alapján nem válogatott hallgatóknak ha tiszta szinuszhullám-hangokat játszunk zenei kontextus nélkül, a hangmagasság-skála az alacsonyabb frekvenciák felé kinyúlik a logaritmikus frekvenciához képest - azt a tény tükrözve, hogy a fül kevésbé érzékeny a különbségekre olyan hangok között, amelyek a hallható frekvenciák alján vannak. Az egymást követô oktávok, amelyek a logaritmikus frekvenciaskálán (és a zongora klaviatúráján) egyenlô távolságra vannak, egyre nagyobbak ahogy a hangmagasság melskáláján lefelé mozgunk. A mel-skála azonban nem veszi figyelembe azt a tényt, hogy zenei kontextusban van valami egyedi az olyan zenei hangközökben, mint az oktáv attól függetlenül, hogy a két hang, amelyet ez a hangköz választ el, hova esik - legalábbis azon a sávon belül, ahol a zenei hangközök jól észlelhetôek, mondjuk 100 és 4000 Hz között (ATTNEAVE ÉS OLSON , 1971; GUTTMAN ÉS PRUZANSKY, 1962; WATT, 1917, 63. oldal). Zenei kontextus esetén a hangmagasság nem folytonosan változik a hang fizikai paramétereinek megfelelôen egy rögzített, bár több-dimenziós pszicho-fizikai függvény alapján. Megfelelôbb leírásnak lát112
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
szik a „kategorikus percepció”, amiben minden egyes hang a legközelebbi csomópontot aktiválja egy elkülönült kognitív struktúrában - például a tonális keretben vagy a diatonikus skálában (BALZANO, 1980; DOWLING, 1978; F RANCES, 1958; WARD, 1970) - és egy zenei kontextussal alapozható meg (KRUMHANSL ÉS SHEPARD, 1979) vagy akár a teszhangok közötti zenei relációk is létrehozhatják (BURNS ÉS WARD, 1978; L OCKE ÉS KELLAR, 1973; SIEGEL ÉS SIEGEL, 1977A , B; ZATORRE ÉS HALPERN, 1979). A zeneelméleti (pl. RISSET, 1978, p. 526) elvárásokkal öszhangban KRUMHANSL (1979) szerint olyan hang-relációk észlelése, amelyeket adott fizikai hangköz választ el a hang-párok relációjától függ a kontextuálisan meghatározott tonális centrumhoz (vagy „tonikához”) képest. A különbözô hangmagasság-skálák (például ATTNEAVE ÉS OLSON, 1971; BECK ÉS SHAW, 1961; STEVENS ÉS VOLKMAN , 1940; STEVENS , VOLKMAN ÉS NEWMAN, 1937) közötti különbségek egyszerûen abból fakadnak, hogy a kutatók másként határozzák meg azt, hogy mely hangmagasságok „állnak ugyanolyan pszichológiai viszonyban”. Így ha a meghatározás a szinuszhullám-hangok diszkriminációján alapult (ahogy a keskeny sávú fehérzaj diszikriminációjára alapozottak is) bármilyen zenei kontextus nélkül, az egymástól oktáv-távolságra levô hangmagasságokat kisebb távolság választja el a skála alsó végén. Ha azonban a meghatározás zenei kontextuson belüli hangköz-ekvivalencia ítéleteken alapul, az oktáv távolságra levô hangmagasságok a zenei hangok tartományában egyenlô távolságra vannak egymástól (lásd DOWLING, 1978; NULL, 1974; WARD, 1954; BURNS ÉS WARD, 1982). 2.4.8.7 A TRITONUSZ-PARADOXON A tritonusz-paradoxon létrehozására használt hangokat elôször Diana Deutsch szintetizálta. Ezek a hangok hasonlóak a Shepard-hangokhoz: hat (oktáv) összetevôjük van, amelyek harang-formájú spektrális burkológörbét alkotnak. A tritonusz intervallumokat emelkedônek vagy ereszkedônek halljuk a hangmagasság közelsége alapján (hangzó példák: Triton.mp3). Vagyis amikor a második hang az oktáv felénél (a tritonusznak nevezett hang) kisebb távolságra van az elsôtôl (például C-E), a második hangot magasabbnak halljuk, mint az elsôt. Ha a második hang a tritonusznál többel van az elsô felett (például C-G), a második hangot az elsônél alacsonyabbnak észleljük. A fél oktávnyi intervallumok (például C-F#) alkotják a tritonusz hangközt. Mivel tizenkét különbözô Shepard-hang van a kroma-körben, 12 tritonusz-pár létezik. Diana Deutsch és munkatársai sok kísérletet végeztek arról, hogy az emberek hogyan észlelik a 12 tritonusz-párt. Mivel ez az intervallum maximálisan többértelmû, az ember azt várná, hogy az képesek vagyunk mindkét irányban észlelni. Azonban Deutsch úgy találta, hogy néhány tritonusz pár egyértelmû: a kísérleti alanyok egyik csoportja mindig emelkedônek, a másik pedig ereszkedônek észlelti azokat. A többi tritonusz-párt könnyen lehetett mindkét módon észlelni. Azok a párok, amelyek egyértelmûbbek, a kroma-kör ellentétes oldalán vannak. A kroma-kör tetején vagy alján lévô hangmagasságosztályok egyértelmûbbek. Az, hogy melyik hangmagasságot hallja valaki a legmagasabbnak, kísérleti személyenként különbözô, ám érdekes módon. A dél-angliai kísérleti alanyok a F#-A hangmagasságokat ereszkedônek észlelik, míg a kaliforniai kísérleti alanyok emelkedônek, azaz hangmagasság-osztály köreik éppen ellenkezô orientációjúak. Deutsch-ék pozitív korrelációt találtak a csúcs-hangmagasság kategória és a beszéd fô oktávjának felsô határa között. Ráadásul van némi bizonyíték arra, hogy kapcsolat van aközött, ahogy a gyermekek és anyjuk észleli a tritonusz párokat. 113
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
DAWE ÉS MUNKATÁRSAI (1998) a kanadai McMaster egyetem hallgatóit tesztelték, akik South Western Ontario lakosai voltak. A kísérleti alanyok között sok emigráns volt és legtöbbjük (kb. 80 %) több nyelven beszélt. A kísérleti alanyok jelezték, hogy sok idôt töltenek amerikai TV-csatornák nézésével. Kanada azonban az angolokhoz áll közel, általában angol kiejtést és helyesírást használnak. Az összes kísérleti alany az angolokhoz hasonló csúcs-hangmagasság kategóriákat mutatott. Ez azt jelzi, hogy a hangmagasság kromakör orientációja változtatható és a geográfiai terület uralkodó módjához illeszthetô.
2.4.8.7.1 MOZGÁSI-UTÓHATÁS A TRITONUSZ-PARADOXONBAN DAWE ÉS MUNKATÁRSAI (1998) spektrális mozgási-utóhatást találtak a Shepard-skála hosszabb bemutatása után. A mozgási utóhatást alaposan vizsgálták a látás területén: egy adott irányban történô mozgás hosszasabb szemlélése után az álló tárgyak az ellenkezô irányba látszanak mozdulni. Miért történik mindez? Az idegrendszerben vannak olyan sejtek, amelyek bizonyos irányban történô mozgásokat kódolnak. Ezek a sejtek spontán tüzeléssel rendelkeznek akkor is, amikor nincs objektív mozgás a környezetben. Azért nem észlelünk ilyenkor mozgást, mert egyetlen sejtpopuláció sem dominál. A balróljobbra történô mozgásra érzékenye sejtjek spontán aktivitása gátolja a jobbról-balra történô mozgásra érzékeny sejtjének spontán aktivitását. Az adott irányba tartó mozgás hosszas szemlélése kimeríti a kódoló sejteket, amelyek már nem reagálnak (adaptálódnak). Amikor az ember ilyenkor egy statikus jelenetet néz, az ellenkezô irányba történô mozgást kódoló sejtek spontán aktivitása hozza létre a mozgás illúzióját, amit nem gátol a másik irányba történô mozgást kódoló sejtek spontán aktivitása. Miután hosszabb ideig Shepard-skálát hallgattunk, a tritonusz-párok mozgásának észlelése megváltozik attól függôen, hogy a skála emelkedô vagy ereszkedô volt-e. Ha emelkedô skálát hallgattunk, inkább ereszkedni fognak a tritonusz-párok és a kroma-kör orientációja az óramutató járásával ellenkezô irányba mozdul. Ha azonban ereszkedô skálát hallgattunk, lecsökkennek az ereszkedô reakciók és a kroma-kör orientációja az óramutató járásával megegyezô irányba fordul. Ezek a hatások a látás spirális mozgási utóhatásának auditoros megfelelôi és azt jelzik, hogy spektrális-mozgás-specifikus sejtek vannak az auditoros idegrendszerben.
114
DANCZI CSABA LÁSZLÓ : A ZENEI 2.4.8.8 MINTÁZAT-FELISMERÉS
TÉR
PERCEPTUÁLIS LÁNCOKON BELÜL ÉS AZOK KÖZÖTT
A perceptuális szervezôdés általában segíti a mintázat-felismerést azzal, hogy azokat az akusztikus összetevôket, amik valószínûleg ugyanahhoz a mintázathoz tartoznak, összecsoportosítja. A laboratóriumban azonban elrendezhetjük az egészet úgy, hogy az auditoros anyag perceptuális szervezôdése ne feleljen meg azoknak az egységeknek, amelyeket a kísérleti alany próbál hallani. Egy hat hangból álló ciklus a tesztinger. Amikor ez két perceptuális láncra szakad, nagyon nehéz a magas és a mély láncolat tagjaira egyszerre figyelni, ezért a magas és mély hangokból álló tesztingert nem tudjuk detektálni. Ha a hat közül csak három hangot kell detektálni, ezt sokkal könnyebb akkor, amikor a három hang ugyanabban a láncolatban (hasonló hangmagasságúak), mint amikor különbözôben (különbözô hangmagasságúak) van (lásd BREGMAN, 1990, 50., 138-140., 147. és 153. oldal). 2.4.8.9 GALOPP -MINTÁZATOK RITMUSA Amikor egy ismétlôdô ciklus két láncolatra szakad, a globális szekvencia ritmusa elveszik, helyettesíti azt az alkotó láncolatok ritmusa. A változás tisztán hallható, ha a teljes szekvencia ritmusa különbözik az alkotó láncolatokétól. Magas-mély-magas szünet magasmély-magas hangsorozatok amikor magas és mély láncolatra szakadnak, sem a magasnak, sem a mélynek nincs galopp ritmusa, így mindkét láncolatban idôben egyenletesen eloszló (izokron) hangokat észlelünk. Az egyik láncolat csak a magas hangokat tartalmazza. A magas hangok között észlelt látszólagos szünetek két forrásból származnak: egyrészt a tényleges szünetbôl, ami a második magas hangot követi a magas-mély-magas szekvenciában. De van egy másik, látszólagos szünet is, mert a perceptuális szervezôdés eltávolította a mély hangokat a magas-hang láncolatból, ami ûrt hagyott maga után és ezt észleljük szünetként. Ehhez hasonlóan a mély láncolatot úgy halljuk, mint ami csak a mély hang ismétléseit tartalmazza három egységnyi szünetekkel a hangok között. Az egyik szünet itt a magas-mély-magas szünet magas-mélymagas szekvenciák közötti szünetébôl származik, ám a másik kettôt az észlelésünk hozza létre, hogy helyettesítse a két hiányzó magas hangot, amelyek saját láncolatukba kerültek. Ezért a szegregáció eltünteti az eredeti triola-ritmust és helyettesíti azt két izokron ritmussal: egy gyorsabb, magas frekvenciájúval és egy lassabb, alacsony frekvenciájúval. A változás érinti az észlelt melódiát is. Amikor a szekvenciát egyetlen láncolatként halljuk, melodikus mintázata magas-mély-magas. Ez eltûnik a szegregáció után. Mind a ritmusok, mind pedig a melódiák elsôsorban a láncolatokon belül fordulnak elô és amikor a láncolatok szervezôdése változik, az észlelt melódiák és ritmusok is változnak. A szegregációt elôsegíti a szekvencia sebessége és a nagyobb elválasztás a magas és mély hangok frekvenciája között. Amikor a szekvencia fokozatosan felgyorsul, lassú sebességnél nincs szegregáció, ám nagyobb sebességnél a frekvencia-elválasztástól függ: amikor a magas és mély hangok frekvenciában távol vannak (kb. 18 félhang), alacsony sebességnél az emberek egy láncolatot hallanak, de ahogy a szekvencia gyorsul, elér egy pontot (ami személyrôl személyre változhat), ahol a frekvencia különbségre alapozott láncokra válás elkerülhetetlenül bekövetkezik. Amikor a magas és mély hangok csupán egy félhanggal térnek el, a szekvencia nem szakad két elkülönült láncra még nagyobb sebességnél sem. A sebesség csökkenti az ugyanabban a frekvencia-tartományban levô hangok temporális különbségét. A hangok csoportosítása frekvencia-változásuk alapján történik. Amikor a sebesség alacsony és a frekvenciák közel vannak egymáshoz, a hangok legközelebbi szomszédja a másik frekvenciájú hang; ezért egy láncolatot észlelünk. Amikor a gyors sebesség nagy frekvencia-különbségel párosul, a tényezôk összjátéka az 115
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
ugyanolyan frekvenciájú hangokat közelebb helyezi egymáshoz, mint a más frekvenciájú hangokhoz, ami elôsegíti a frekvencia szerinti csoportosítást, és két láncra szakítja az észlelést. A galopp-mintázatot elôször VAN NOORDEN (1975) használta. Ezt a mintázatot, valamint a frekvenciaelválasztás és a sebesség hatását a csoportosításra BREGMAN (1990) a 17-21. és a 48-73. oldalon tárgyalja. A csoportosítás hatása az észlelésre 131-172. oldal. 2.4.8.10 A KÉT HANGBÓL ÁLLÓ CÉLINGER FELSZABADÍTÁSA A MASZKOLÓ HANGOK ELRAGADÁSÁVAL BREGMAN ÉS RUDNICKY (1975) egyik kísérletében azt vizsgálták, hogy a láncolatokat a figyelem, vagy figyelem elôtti mechanizmusok hozzák-e létre. Stratégiájuk az volt, hogy a csoportosítási mechanizmus ragadjon el anyagot a figyelem elôl, amibôl arra következtethetnek, hogy a csoportosítási mechanizmus nem a figyelem része. Amikor emelkedô vagy ereszkedô magasságú hangokat mutatunk be, a hang-párok sorrendjét könnyû megítélni. Ha a hangpárt azonban két tôlük eltérô, de egymással azonos frekvenciájú hang veszi közre, az ilyen négy hangból álló szekvenciában ugyanannak a hangpárnak a megítélését az újabb hangok megnehezítik, valószínûleg azért, mert a négy hang egy magasabb-rendû egységet alkot, amelyben a magas és a mély hangok elvesztik kiemelkedésüket az újabb hangokból, amik most a perceptuálisan kiemelkedô kezdeti és vég helyzetekre esnek (hangzó példa: Capture.wav). Ha a négy hangból álló szekvenciát egy sor olyan (elragadó) hanggal szegélyezzük, amelyek ugyanolyan frekvenciájúak, mint a hangpárt szegélyezô hangok és ráadásul két szünet van közöttük (ugyanannyi idô, mint a két szegélyezô hang között), akkor a hangpárt szegélyezô hangokat elragadja az izokron egyetlen frekvenciából álló láncolat az ôket szegélyezô hangokkal, ami felszabadítja a hangpárt a szegélyezô hangok interferenciája alól és ezért azok sorrendjét fel lehet ismerni. Versengés van a hangok csoportosítása között, a további hangok a szekvenciához adása megváltoztatja a perceptuális szervezôdést. BREGMAN ÉS RUDNICKY (1975) kísérletét Bregman (1990) a 14., 132-133., 140., 165., 169., 192., 444445., 450. és 475. oldalon írja le. A perceptuális csoportosítások közötti versengés általánosabb hatásainak leírása a 165-171., 434., 218., 296., 303-311., 335. és 651. oldalon található. 2.4.8.11 A HARMONIKUSOK ALCSOPORTJÁNAK PÁRHUZAMOS MOZGÁSÁRA ALAPOZOTT FÚZIÓ Az összetett hang frekvencia-összetevôinek csoportosítása a párhuzamos frekvencia-változások alapján történik, ha az összetevôket két tetszôleges csoportba osztjuk, amelyek közül az egyik csoport összes összetevôjét moduláljuk (növeljük vagy csökkentjük a frekvenciáját), ám a másik csoport egyetlen összetevôjét sem, akkor a két harmonikus-csoportot elkülönült hangként halljuk (hangzó példa: Harmonic.wav). Az állandó hang hangszíne változik, amikor elveszíti néhány harmonikusát, amelyek az emelkedô vagy süllyedô hangok összetevôivé válnak. Ehhez meg kell ôrizni a modulált összetevôk közötti harmonikus relácókat: amikor kezdôdik a frekvenciaváltozás, az állandó és a változó részhangok harmonikus kapcsolata megszakad. Ez az egyik oka annak, hogy szegregálódnak. Az is valószínû, hogy a két csoport független (nem párhuzamos) frekvenciaváltozása is hozzájárul szegregációjukhoz, azaz „közös sors alapján történô csoportosítás” történik. A közös sors alapján történô csoportosítás tárgyalása BREGMAN (1990) 248-289., 657-658. oldal. 116
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.4.8.12 R ITMIKUS MASZKOLÁS ALÓLI FELSZABADÍTÁS A ritmikus maszkolás alóli felszabadulás jelensége az „együtt-modulált maszkolás alóli felszabaduláshoz” hasonló. Az utóbbiban tiszta-hang célingereket kell detektálni maszkoló hang jelenlétében, ami keskeny-sávú zaj a célinger frekvenciája körül, aminek az intenzitása fluktuál. A célingert könnyebb detektálni, ha a célingerrel és a zajsávval egyidôben egy harmadik hangot - egy szegélyezô sávot - mutatunk be, ami olyan keskeny-sávú zajból áll, amelynek a középfrekvenciája elég távol van a célinger frekvenciájától, hogy a „kritikus sávon” (azon a frekvencia sávon, amin belül a hangok egymással interferenciába lépnek) kívül essen. Ha a szegélyezô és a maszkoló sávok „együtt-moduláltak” (azaz a két sáv amplitúdó-fluktuációjának a fázisa szinkronizált) a hangdetekció felszabadul a maszkolás alól. Valószínû, hogy a maszkoló és a szegélyezô sávok amplitúdó-változásának korrelációja alapján az auditoros rendszer a két sávot egyetlen hanghoz tartozóként kezeli, ezzel lehetôvé téve hogy a célinger aminek az amplitúdója nem fluktuál - elkülönüljön. A „ritmikus maszkolás alóli felszabadulás” ennek a kísérletnek egy variánsa, amiben a hang ritmusa maszkolódik. Egy szabályos, tíz tiszta hangból álló szekvenciát (célinger-hangokat) egy másik szekvenciával (ugyanolyan frekvenciájú, de szabálytalanul elhelyezkedô hangok a célinger hangjai közé szôve) maszkolhatunk. A szabálytalan maszkoló hangok elfedik a célinger-hangok szabályosságát. Azonban szegélyezô hangok hozzáadásával, amik a maszkoló hangokkal egyidejûek, ám kívül esnek kritikus sávjukon, könynyebben észlelhetô a célinger-hangok szabályos (izokron) ritmusa. A maszkolás alóli felszabaduláskor a maszkoló és a szegélyezô hangok a szinkron miatt fuzionálnak és egy olyan hangot alkotnak, amelynek a hangszíne a maszkoló és a keretezô hangokból áll össze és ezért gazdagabb, mint az egyedülálló célinger-hangoké. Ezért lágy, tiszta hangokat hallunk szabályos ritmusban, szabálytalanul ismétlôdô gazdag hangok kíséretében, amelyeket a hallórendszer szegregált a célingertôl. Az együtt-modulálált maszkolás alóli felszabadulást BREGMAN (1990) 320-323. oldal tárgyalja. A ritmikus maszkolás alóli felszabadulást Cooke-ék (BARKER ÉS COOKE, 1999; COOKE, 1993) demonstrálták. 2.4.8.13 E GY GLISSANDO-ÖSSZETEVÔ ELRAGADÁSA A GLISSANDO-KEVERÉKBÔL Ha egy tiszta hang glissandót követ két egyidejû tiszta-hang glissando, az elôzô tiszta hang elragadhatja az ôt követô egyik tiszta-hang glissandót (hangzó példa: glissand.wav). Ha az elsô glissando magasabb frekvenciájú, mint a második közül az egyik és mélyebb, mint a másik, amikor az elsô glissando elragadja a második magasabb öszetevôjét, két magasabb tiszta hang glissando láncolatot hallunk, amit egy alacsonyabb tiszta hang glissando kísér, ami ritkábban ismétlôdik. Ha nem sikerül elragadnia, egy tisztán hangzó glissandót hallunk, ami egy gazdagabban hangzó glissando-val váltakozik, mindkettô azonos tempóban. Amennyiben szünet van az elsô glissando és a másik kettô kezött, az elsônek akkor sikerül elragadnia a második egyikét, ha annak pontos mása (azaz ugyanarról a frekvenciáról indulnak és ugyanoda érkeznek). Csak akkor érezzük az elsô glissando folytatásának a második magasabb glissandóját, ha egyáltalán nincs szünet közöttük. A glissando hangok csoportosítását BREGMAN (1990) 96., 101., 108-113., 257-260. és 581. oldalon tárgyalja.
117
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.4.8.14 DALLAMÉSZLELÉS ELTOLT FÁZISÚ HANGOKKAL KUBOVY, CUTTING ÉS MCGUIRE (1974) szimultán és folytonos szinusz-hullám hangsorozatokat mutatott be mindkét fülbe. A hang fázisát az egyik fülben eltolták a másik fülbeli hanghoz képest. Amikor az eltolt fázisú hangok egy dallamot alkottak, az világosan hallható volt. Azonban a dallam detektálhatatlan volt amikor az ingert csak az egyik fülbe mutatták be. A dichotikusan bemutatott dallamot a fejen belül hallották, ám az egyik oldalra eltolódva, míg a háttérzajt a másik oldalon. Olyan volt, mintha az egyik forrás egy térbeli helyen produkálná a dallamot, míg a másik forrás egy másik térbeli helyen a zajt.
118
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.4.9 Z ENEI SZERVEZÔDÉS A zenei információ feldolgozása több különbözô „szinten” történik (MCADAMS, 1987; B IGAND, 1993a; BOTTE ÉS MUNKATÁRSAI , 1994). Az auditoros rendszer több mechanizmust is használ (primitív auditoros csoportosítás) a két fülhöz érkezô akusztikus keverék mentális „leírásokká” alakítására. A leírások hangforrásokkal és temporális viselkedésükkel kapcsolatos eseményeket reprezentálnak. Ezek a leírások korlátozott számú akusztikus kulcsingeren alapulnak, amelyek egymást megerôsíthetik, de ellent is mondhatnak egymásnak. A csoportosítási döntések az információkat úgy rendezik, hogy azok alapján a környezet eseményei és hangforrásai minél egyértelmûbb reprezentációt alkossanak. BREGMAN (1990) auditoros jelenet-elemzés elmélete szerint az események és eseménysorozatok perceptuális jellemzôinek a komputációjától függ, hogy az akusztikus információ hogyan szervezôdik. A zenei események közé a hangmagasság, a hangosság és a hangszín, míg a zenei eseménysorozatok közé a dallamvonal, a hangmagasság-különbségek és a ritmus-mintázatok tartoznak. A zeneszerzô az auditoros szervezôdés irányítása révén - a hangok megfontolt elrendezésével - befolyásolhatja az észlelés eredményét. A hagyományosan zenei észlelésnek tekintett folyamat akkor kezdôdik, amikor az információ perceptuális tulajdonságokkal rendelkezô eseményekbe és eseménysorozatokba rendezôdött. Az auditoros jellemzôk olyan absztrakt tudásstruktúrákat aktiválnak, amelyek a hosszú-távú memóriában reprezentálják az események közötti - adott kulturális környezetben ismételten elôforduló - kapcsolatokat. Többféle szabályosságot is kódolnak a tapasztalt világról. BREGMAN (1993) szerint a fizikai világ szabályosságait írják le, feldolgozásuk - a primitív auditoros szervezôdés szintjén - nagyrészt születéstôl adott. A hangmagasság-relációk (pl. skálák és harmóniák), a temporális relációk (pl. ritmus és metrum) és a hangszín relációk (mint a gyakran tapasztalt hangszerfélék és kombinációik) rendszere többnyire hierarchikus. A nyugati kultúrákban található hangstruktúrák azonban mások, mint a Koreában, Közép-Afrikában vagy Indonéziában találhatóak. A nyers perceptuális tulajdonságok, amelyek a zenei eseményekhez és eseménycsoportokhoz kapcsolódnak, azokat a struktúrákat aktiválják, amelyeket a kultúrába való beépülés (akulturáció) során szereztünk és az események ezáltal kapnak funkcionális jelentôséget az adott értelmezési keretben (Fisz dúr és waltzer metrum például). A feldolgozás magasabb szintjén (eseménystruktúra feldolgozás) az események a zenei forma strukturált mentális reprezentációjába rendezôdnek - olyan szinten, amilyenen a hallgató megérti a zenét (McAdams, 1989). Különösen a nyugati tonális/metrikus zenében jelentôs szerepet játszik a hierarchikus szervezôdés a zenei forma mentális reprezentációjában. Az eseményhierarchia egy szintjén a ritmikus-metrikus és a hangmagasság-struktúrák gyakran egybeesnek: bizonyos eseményeket erôsebbnek, strukturálisan fontosabbnak és stabilabbnak észlelünk. A funkcionális értékek, amire az események és eseménycsoportok szert tesznek az eseményhierarchiában a zenei feszültség és feloldás - vagyis zenei mozgás - érzetét keltik. Elvárásokat alakítunk ki arról, hogy a zene merre tart a közeljövôben a hallottak és a kultúra szokásos zenei formáiról szóló absztrakt tudás ismeretében, még olyan darabok esetében is, amelyeket azelôtt sohasem hallottunk. A hallottak és a a zenei stílusról szóló „tudásunk” alapján bizonyos eseménytípusokat várunk bizonyos hangmagasságokon és idôpillanatokban (DOWLING ÉS MUNKATÁRSAI , 1987). Az elvárások befolyásolják azoknak a tudásstruktúráknak az aktivációját, amelyek alapján értelmezzük a szenzoros információt. Bizonyos hangmagasságokat hallunk, kapcsolatrendszerük alapján egy bizonyos hangnemre következtetünk és elvárjuk, hogy a következô hangok beleilljenek ebbe a hangnembe. Aktivitás-hurok jön létre, ami lassan kiépít egy olyan mentális reprezentációt, aminek a részletességét a hallott zenérôl szóló tudásunk korlátozza. Valószínû, hogy egy nyugati zenész nagyobb léptékû és részletesebb mentális struktúrát tud kialakítani egy Mahler szimfónia hallgatása közben (aminek az alôadása másfél óráig tart), mint az az ember, aki éppen most mászott ki a bozótból Közép-Afrikában. A fordítottja igaz azonban a komplex pigmeus polifonikus formák észlelésekor. Mégis képesek vagyunk hallani és élvezni az újat is, azt sugallva, hogy a zeneértésnek velünk született összetevôi vannak. Ám az, amit hallunk és értünk egy új zenei kultúrával való elsô találkozásunkkor, nem valószínû, hogy ugyanaz, mint amit a kultúra bennszülöttje tapasztal. Az akkumulálódó reprezentáció által generált elvárások befolyásolják a csoportosítást az auditoros 119
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
információfeldolgozás alapszintjén. Ez nagyon fontos, mert a zenei kompozíciókban a zeneszerzô azzal, hogy játszik néhány ilyen folyamattal - perceptuális kontextusokat hoz létre, amik befolyásolják azt, ahogyan a hallgató szervezi az új szenzoros információkat. Az ilyen mechanizmusokat BREGMAN (1990) sémavezérelt auditoros szervezôdési mechanizmusoknak nevezte. Van némi bizonyíték arra, hogy a figyelmi folyamatok befolyásolják azt, ahogy az információ feldolgozódik az auditoros periférián, az efferens projekciók révén, amelyek a cochlea külsô szôrsejtjeit innerválják (PUEL ÉS MUNKATÁRSAI, 1988). Míg ezeknek a szinteknek a természete és szervezôdése valószínûleg hasonló perceptuális és kognitív mechanizmusokon alapul a különbözô kulturákban, a „magasabb szintû” folyamatok - a perceptuális tulajdonságok komputációján túl - nagyon is a tapasztalattól és felgyülemlett tudástól függenek, ami szükségszerûen kultúra-specifikus. 2.4.9.1 ABSZTRAKT TUDÁSSTRUKTÚRÁK ÉS MINTÁZATOK Az auditoros észlelés sok jellemzôje olyan általánosításokon alapszik, amiket specifikus tapasztalatokból vontunk le az adott akusztikus és szocio-kulturális környezetben felnövekedés (akulturáció) során. Ez a tudás absztrakt abban az értelemben, hogy nem csupán arra a zenei mintázatra vonatkozik, amelyet hallunk. Például a C-dúr hangnem egy absztrakció. Végtelen sok dallamot lehet létrehozni egy zenei skálának nevezett hangmagasság-reláió-rendszeren belül. Az absztrakt tudásstruktúrák olyan reláció-rendszerek a zenei kategóriák között, amik alapján egy kultúra zenei szintaxisa kifejlôdik (például hangmagasság-kategóriák, skála-struktúrák valamint tonális és harmonikus hierarchiák). A tanult általánosítások az idôben kibontakozó zenei formákról absztrakt mintázatlexikont alakítanak ki az adott kultúrában gyakori jellemzôkrôl (például prototipikus dallamforma, harmonikus progresszió, vagy a zenei struktúra formális sémái mint a nyugati szonátaforma vagy az indiai raga). 120
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
A mintázat-lexikon a hallott események „felszíne” alatti struktúrák kódolt absztrakciója. A legfontosabb különbség a zenei kategóriák közötti absztrakt tudásstruktúrák (pl. skálák és tonális hierarchiák) és az absztrakt-mintázatok (mint formális zenei sémák) lexikona között az, hogy az elôbbi egyféle hierarchikus ábécé az „idôn kívül”, amelybôl elemek használhatóak a zenei matéria felépítésére, míg az utóbbi szekvenciális séma, amelyet az alkotóelemekkel lehet kidolgozni. 2.4.9.2 SKÁLÁK Az összes kultúra hangmagasság-rendszere a hangmagasság-kategóriák korlátozott készletébôl áll, amelyeket alcsoportokra osztanak, ezeket nevezzük skáláknak. A nyugati egyenletes-temperálású hangmagasság-rendszerben a hét hang diatonikus skálái az oktávon belüli 12 kromatikus hangból származnak. A szomszédos hangokat a kromatikus skálán egy félhang választja el, amely körülbelül 6%-os frekvenciakülönbségnek felel meg. Az oktáv speciális hangköz (2:1 frekvenciaarány), aminek a távolságában két hangmagasságot amiket elválaszt a hangmagasság - valamiben közösnek, egyenlônek érzünk. Az összes kultúrában, amely megnevezi a hangmagasságokat a skálán, az egy oktávval elválasztott hangmagasságoknak azonos a neve (pl. do, re, mi, fá, szó, lá, ti, dó vagy C, D, E, F, G, A, H, C a nyugati rendszerben és sa, re, ga, ma, pa, dha, ni, sa az indiai rendszerben). Kimutatták, hogy fiatal gyerekek (DEMANY ÉS ARMAND, 1984) és fehér patkányok (BLACKWELL ÉS SCHLOSSBERG , 1943) hibákat követnek el a hangmagasság-diszkriminációban oktávval elválasztott hangok esetén, ami azt sugallja, hogy az oktáv-ekvivalencia az emlôs auditoros idegrendszer általános jellemzôje. Egy adott skálát a hangmagasság-kategóriák közötti hangközök mintázata határoz meg. A dúr-skálának 2—2—1—2—2—2—1 a mintázata, félhangokban mérve a skálalépéseket. A moll-skála egy fajtája (amit természetes mollnak neveznek) a 2—1—2—2—1—2—2 mintázattal rendelkezik. A skálán belül gyakran van funkcionális hierarchia a hangmagasságok és az akkordok között, amelyeket a hangmagasságok alkotnak. A nyugati tonális hangmagasság-rendszerben némely hangmagasság és akkordja - például a skála elsô és ötödik foka (a C és a G a C-dúr hangnem tonikája és dominánsa) - strukturálisan fontosabb másoknál. Ez a hierarchizáció vezet a hangnem érzetéhez. A hangnemen belül legstabilabbnak tekintett - bizonyos értelemben a hangnemet reprezentáló - akkord a skála elsô, harmadik és ötödik fokán álló hangokból áll. A tonális zenében az ember megalapozhatja a hangnem érzetét egy adott dúr vagy moll skálában, majd fokozatosan elmozdulhat egy új hangnem irányába (a folyamatot modulációnak nevezik) úgy, hogy az új hangnembôl származó hangokat vezet be és nem játsza tovább az eredeti hangnem olyan hangjait, amelyek nem szerepelnek az új hangnemben. Az ilyen jelenségek azt sugallják, hogy funkcionális hierarchia létezik a hangnemek között is, amely befolyásolja a hallgató tonális mozgás érzetét a zenedarabon belül, valamint bizonyos hangmagasságok és akkordok funkciójának lokális értelmezését.
121
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.4.9.2.1 MEREV HANGMAGASSÁG-SKÁLA A hangközök mintázata (vagy a skálán belüli hangok-frekvencia arányainak készlete) viszonylag stabil egy adott kultúrán belül. Ez arra a hipotézisre vezette JORDAN-t és SHEPARD-ot (1987), hogy ahogyan a tárgyak merev struktúrákat reprezentálnak az agyban, aminek köszönhetôen képesek vagyunk a tárgy mentális forgatására (SHEPARD ÉS METZLER , 1971), úgy a skála is a hangközök merev mintázataként reprezentálódik. Ennek következtében a hangmagasságok észlelése és memóriája egy adott kultúra normális hallgatóiban asszimilálódik a megfelelô mintázat struktúrájához. A hipotézis tesztelésére JORDAN ÉS SHEPARD (1987) megváltoztatott dúr skálát mutatott be hallgatóiknak, amiben a hangközök arányosan megnyúltak úgy, hogy az oktáv egy félhanggal magasabbra (Cisz) essen. Ezután a kísérleti alanyok próba-hangokat hallottak, amelyek a normális dúr skálákból (C-dúr skála, Cisz dúr skála) vagy a kinyújtott skálából származtak és meg kellett ítélniük hogy a hang milyen mértékben illik az elôzôleg hallott skálába. A nem-zenész hallgatók úgy viselkedtek, mintha folyamatosan hangolnák a merev skálát, hogy az akkomodálja a fokozatosan elmozduló skálát, amíg a skála végén az ilyen mintázat Cisz-re nem tolódik: a Cisz dúr skálából származó hangokat magasabbra értékelték, mint a C-dúrból vagy a kinyújtott skálából származó hangokat. Nyilvánvaló, hogy mivel a skálák kultúráról-kultúrára változnak, az ilyen mintázatok az ember saját kultúráján belüli skálastruktúrák alapján alakulnak ki és így kultúránként változnak.
122
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.4.9.3 Z ENEI HIERARCHIÁK A KRUMHANS (1979) által kifejlesztett próba-hang technika meglehetôsen hasznosnak bizonyult a hangmagasságok közötti viszonyok hierarchiájának pszichológiai alátámasztására a hangok, az akkordok és a hangnemek szintjén. Ebben a paradigmában valamilyen zenei kontextust alapoznak meg egy skálával, egy akkorddal, egy dallam vagy akkord progresszióval, majd egy próba-hangot mutatnak be. A hallgatókat arra kérik, hogy számszerûen ítéljék meg vagy azt, hogy egy próba-hang vagy -akkord milyen mértékben illeszkedik az elôzô kontextusba, vagy hogy két hang vagy akkord milyen mértékben tûnik kapcsolatosnak az elôzô kontextuson belül. Így a hallgatónak nem kell megmagyaráznia a hangok, akkordok és hangnemek funkcióját a nyugati tonális zene kontextusában, mégis feltárható implicit tudása ezekrôl. 2.4.9.3.1 T ONÁLIS HIERARCHIA Ha bemutatunk egy kontextust például a C-dúr vagy a C-moll skálát -, amelyet egy próba-hang követ, amit kromatikus skálán változtatunk próbáról-próbára, az egyes hangmagasságok kontextusba illeszkedésébôl egy profil rajzolódik ki (Krumhansl és Kessler, 1982). Ez a kvantitatív profil, amikor zenész hallgatóktól származik, nagyon szorosan illeszkedik abba, amit a zeneelmélet intuitíven és kvalitatívan leírt. Figyelemre méltó a tonika fontossága, amely nevét adja a skálának, amit a domináns vagy ötödik fok, majd a mediáns vagy harmadik fok követ. Ez a három hang alkotja az alap hármashangzatot, vagy akkordot a diatonikus skálában. A többi skálahang kevésbé fontos, végül a kromatikus - nem skála hangok következnek a fontossági sorrendben. A zenészek és nem zenészek profiljai különbözôek: a nem zenészek hierarchikus struktúrája kevésbé gazdag, akár az egyszerû közelségre is szorítkozhat a próba-hang és a kontextus utolsó hangja között. Kumhansl (1990, 3. fejezet) kimutatta, hogy a profilok által feltárt tonális fontossági hierarchia erôsen egybeesik a hangok adott tonalitásban való elôfordulási gyakoriságával (a tonika gyakrabban hallható, mint a domináns és a mediáns és így tovább). Egybeesik még a hangok zenedarabon belüli átlagos tartamával is (a tonika általában a leghosszabb). Ezek az egybeesések azt sugallják, hogy a tonális hierarchia stabil mentális reprezentációjának kialakítása és használata kezdetben a zenei felszín egyszerû statisztikai és pszichoakusztikai jellemzôin alapul.
123
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.4.9.3.2 HARMONIKUS HIERARCHIA Egy hangnemben a skála összes hangjából alkothatunk akkordokat úgy, hogy egymás fölé helyezünk nagy- és kisterceket (például a C-E-G adja a C-dúr hármashangzatot, vagy az A-C-E hangok az A moll hármashangzatot adják). A tonális hierarchiához hasonló harmonikus hierarchiát demonstráltak akkordok és kadenciák esetében Krumhansl és tanítványai (KRUMHANSL, 1990). A harmonikus hierarchia az akkordok adott hangnemen belüli funkcióját a strukturális fontosság hierarchiájába rendezi. Ez hozza létre a nyugati tonális zene egyik különösen gazdag aspektusát, a harmonikus progressziót. A harmonikus hierarchiában a tonika (a skála elsô fokára épített akkord) a legfontosabb, amit a domináns (az ötödik fokra épített) és a szubdomináns (a negyedik fokra épített) követ. Ezután következnek a többi skála-fokra épített akkordok. A kevésbé stabil akkordok - azaz azok, amelyeknek kisebb strukturális fontosságuk van - általában olyan hangokra oldódnak, amelyek stabilabbak. A kevésbé stabil akkordra irányuló mozgás feszültséget kelt, míg a feloldás egy stabilabb akkordban megnyugtatja a feszültséget. A tonális kontextus nagy hatással van az akkordok közötti kapcsolatok észlelésére. Ha a hallgatókat arra kérik, hogy ítéljék meg két akkord kapcsolatosságát - vagy kontextustól függetlenül, vagy két különbözô hangnem kontextusában -, a kapcsolatosság változik a harmonikus kontextustól függôen (BHARUCHA ÉS KRUMHANSL, 1983). Ezek a kapcsolatok határozzák meg a hallgatók harmonikus elvárásait és ezek tükrözôdnek az akkord-progressziók elôfordulási gyakoriságában a tonális zenén belül. RISSET (1978, 526. oldal) zeneelméleti példája szerint ugyanazt a fizikai intervallumot - akár F-H akár E#-H-nak nevezzük - különbözôképpen észleljük különbözô kontextusokban. C-dúrban a hangköz felsô hangja a vezetô hang és ezért ezt az intervallumot úgy észleljük, mint ami az E-C intervallumra oldódik. F# dúrban azonban az alacsonyabb hangot értelmezzük vezetô hangként és ezért ebben az esetben úgy észleljük, hogy a F#-A# intervallumra oldódik. Ennek megfelelôen a zenészek az ilyen intervallumokat különbözôen adják elô a két esetben (lásd SHACKFORD , 1961, 1962; SMALL, 1936). BHARUCHA ÉS STOECKIG (1986) kifejlesztett egy elôhangolási (priming) feladatot, amiben az elôhangoló akkordot egy célinger-akkord követi, amelynek harmonikus hierarchiabeli kapcsolata az elôhangolóhoz közeli vagy távoli. A célinger-akkord egyik hangja el van hangolva és a hallgatónak csak azt kell eldöntenie, hogy a célinger akkord jól hangolt-e vagy hamis. Normális hallgatóknál erôs interakciót találtak az akkord-reláció és az intonációs ítéletek között. A jól hangolt akkordokat a kapcsolatos próbákban, a hamis akkordokat a nem kapcsolatos próbákban detektálták könnyebben. A különbségek zenész és nem zenész populációkban is megjelentek azt jelezve, hogy a harmonikus kontextus elôhangolja azoknak az akkordoknak a feldolgozását, amelyek a kontextusba illenek azokhoz az akkordokhoz képest, amelyek távoli kapcsolatban vannak a kontextuson belül. A kapcsolatos célingerekre megnövekszik a szenzitivitás, ráadásul a kapcsolatos célingereket stabilabbnak és konszonánsabbnak ítéljük. A teszt egy varinánsát két jobb kezes callosotómiás (hasított agyú) páciensre fejlesztették ki, hogy a harmonikus percepciót mindkét féltekében függetlenül tesztelhessék (TRAMO ÉS MUNKATÁRSAI , 1990). Csupán a jobb félteke mutatta a normális interakciót az intonációs detekció pontossága valamint az elôhangoló és a célinger-akkordok harmonikus kapcsolatossága között. Ez az eredmény azt sugallja, hogy az asszociatív auditoros funkciók, amelyek harmonikus progressziókra irányuló elvárásokat generálnak a zenében, a jobb féltekére lateralizáltak. Z ATORRE (1989) egy kísérlete elôzôleg már elegánsan demonstrálta, hogy a zenei hangmagasság feldolgozása a jobb féltekére lateralizálódik.
124
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.4.9.4 KATEGÓRIÁK A világ zenéjének többségében a struktúra olyan dimenziókon alapul, amelyeket hangmagasság-, tartam-, dinamika- vagy hangszín-azonosság kategóriákba osztanak. Sok (bár nem minden) kultúrában a kategorizálást az a tény bizonyítja, hogy ezek a kategóriák lejegyzési rendszerbe vagy nyelvbe (szolfézs a hangmagasság számára a nyugati és az indiai zenében valamint egyfajta hangszín-szolfézs a tabla-ütések számára az indiai zenében) kódolódnak. A kategória-rendszerek arra szolgálnak, hogy „maximális információt szolgáltassanak a legkevesebb kognitív leterheléssel” (ROSCH, 1978, 28. oldal). Ez akkor valósul meg, amikor az ember a dimenzió értékeit ugyanazon kategória értékeinek ekvivalenseként észleli, azonban különbözônek más kategóriák értékeitôl. A kistercet így észleljük a nyugati 12 hangú hangmagasság rendszerben a pontos hangolástól függetlenül, megkülönböztetve a nagyszekundtól. Vizsgáljunk meg néhány olyan tulajdonságot, amelyek hozzájárulnak a hangmagasság rendszerek szervezôdéséhez (pl. skála-struktúrák - CROSS, H OWELL ÉS WEST, 1985; és tonális hierarchiák - KRUMHANSL , 1983) és amelyekrôl azt állíthatjuk, hogy többé-kevésbé könnyen feldolgozza ôket a hallgató. Az ilyen tulajdonságok felismerése a zenei események között segíti a hallgatót, hogy felismerje a rendszer vonatkoztatási kereteit. 2.4.9.4.1 C IKLIKUS HANGMAGASSÁG-DIMENZIÓ Néhány kutató szerint a kategória-értékek és -intervallumok a szenzoros konszonancia alapján alakulnak ki (HELMHOLTZ, 1877/1985; KRUMHANSL, 1987; L ERDAHL, 1988; bár ez ellen szól BROWN, 1988). A szenzoros jellemzôknek megfelelô kapcsolatok szervezôdése szilárd pszicho-akusztikus alapot ad zenei mintázatokban játszott szerepükhöz. MATHEWS, PIERCE ÉS ROBERT (1987) az új zenei dimenziók kifejlesztésének ilyen korlátozását akusztikus nucleus hipotézisnek nevezi: „Új anyagok esetében szükséges, hogy egy akusztikus nucleussal rendelkezzünk, amire erôs zenei konnotációkat építhetünk hosszú távú-tanulással. Az akusztikus nucleus olyan hangminôségekbôl áll, amelyek az alacsonyabb, perifériás szinten észlelhetôek, mint például a ... viszonylagos disszonancia...” (83. oldal). Ez a korlátozás azonban valamivel lazább az egyenlôen-temperált hangmagasság-rendszerben, amiért cserébe más szervezôdési lehetôségeket kapunk (például azt, hogy transzponáljuk a hangmagasság-mintázatot valamilyen más hangmagasságra anélkül, hogy eltorzítanánk az intervallum-relációkat). Az oktáv erôs perceptuális ekvivalenciájának köszönhetôen a hangmagasság-dimenzió ciklikusan szervezhetô az értékek olyan mintázata alapján, ami minden oktávban szabályosan ismétlôdik. Ez a ciklikusság megtalálható a világ legtöbb zenei skálájában, bár van néhány figyelemre méltó kivétel is (BURNS ÉS WARD, 1982). BURNS ÉS WARD (1982) szerint az oktáv-generalizáció a hangmagasságok szenzoros konszonancia alapján tanult azonosítása. A ciklikus dimenziónak köszönhetôen sok és nagyon különbözô érték használható a memória túlterhelése nélkül, mivel olyan skálamintázat ismétlôdik, amiben kevés számú elem van. Ez az alaposan megtanult mintázat a strukturális értelmezés alapja (KRUMHANSL, 1983; S HEPARD ÉS JORDAN, 1984). MATHEWS ÉS PIERCE (1980) elôállítottak egy „kinyújtott” diatonikus skálát, aminek az „oktáv”-aránya 2,41:1 volt 2:1 helyett. A hangoknak arányosan nagyobb frekvencia-arányú összetevôi voltak, ami inharmonikussá tette ôket. A kísérleti alanyoknak azt kellett megítélniük, hogy a rövid harmonikus progressziók ugyanabban a hangnemben vannak-e, mint a hosszabb passzusok. Kíséleti alanyaik képesek voltak összevetni az akkord-szekvenciák „hangnemét” a kinyújtott rendszerben, bár a kadenciákat általában nem érezték zártnak. A kortárs nyugati zenében az 1950-es évek óta szinte mániákusan kerülik a hangmagasság-mintázatok ismétlését más oktávokban. Ennek egyik oka az, hogy kerülik a klasszikus tonális zene sémáit. A másik ok is esztétikai elv: az anyag folytonos megújulása a lehetô legkevesebb ismétléssel (SCHOENBERG, 1941/1975, 1948/1975). Az így keletkezô szabálytalanságok (amelyek gyakran a ritmusban is megjelennek) arra késztetik a hallgatókat, hogy a hallgatás és emlékezet teljesen különbözô módszereit fejlesszék ki. Nincs bizonyíték valódi cirkularitásra más dimenziókban. Egy kísérletet tett azonban SLAWSON (1985) a cirkularitás felhasználására a hangszínben. A magánhangzó-tér két dimenziós reprezentációját (a dimenziók két formáns/szûrô közép-frekvenciájának felelnek meg) használja „hang-szín” (sound color) 125
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
elméletének kiindulópontjaként. Kifejlesztett egy sor szeriális eljárásra alapozott tér-szervezési és mûveleti szabályt a tér elemeire. Ha egy mûvelet (például a transzpozíció) az embert arra készteti, hogy a körülhatárolt teret jobbra elhagyja, az ember a jobb oldali határt úgy kezeli, mint ami ekvivalens a balkéz felôli határral és egyszerûen onnan folytatja a mûveletet. Ilyenkor azonban megváltozik a mintázat intervallum- és kontúrrendszere: nem lehet olyan perceptuális ekvivalenciát „feltalálni”, aminek nincs pszicho-akusztikus alapja. BALZANO (1980), DOWLING ÉS HARWOOD (1986) valamint KRUMHANSL (1987) a hangmagasságdimenzió számos más tulajdonságát is leírták, amelyek segíthetnek egy tonális hangmagasság-hierarchia kialakításában. Ezeket a kritériumokat részletesen tárgyalja több létezô és feltételezett skála-rendszerrel együtt KRUMHANSL (1987). A központi elemek azok, amelyek gyakran fordulnak elô, hosszú tartamúak és általában erôs pozíciót foglalnak el a zenei frázisokban. Az elôfordulási gyakoriság és a tartam különösen hasznosak a rendszer kereteinek a megalapozásában, ha a hallgató egy ismeretlen zenei stílussal találkozik. A nyugati hallgatók képesek ezt megtenni az indiai raga-k esetében, bár az indiai rendszer bizonyos finomságai rejtve maradnak elôttük (CASTELLANO, B HARUCHA ÉS KRUMHANSL, 1984; lásd még KESSLER, HANSSEN ÉS SHEPARD, 1984 nyugati és balinéz hallgatóit). Kívánatos, hogy a hallgatók képesek legyenek gyorsan megkülönböztetni a „pozíciókat” a hangmagasság-relációk rendszerén belül (BROWNE, 1981). A pozíció megtalálását a skála kategóriái közötti intervallumok aszimmetrikus struktúrája segíti (azaz a dúr diatonikus skálában két és három nagyszekundnyi sorozatokat választ el kisszekund) valamint a hangkészleten belüli ritka vagy megkülönböztetô intervallumok (dúr diatonikus skálában csak egyetlen bôvített kvart, két kisszenkund, ám több más intervallum létezik; vesd össze BUTLER ÉS BROWN , 1984). Az aszimmetria maximalizálja az intervallum-méretek számát az adott skálában. Ez különbözteti meg a nyugati diatonikus skálákat és sok indiai skálát az egyenlôen temperált pentaton skáláktól, amelyeket az indonéz gamelánban vagy az ugandai hárfa-zenében (harp) hallunk, vagy bizonyos egyenlôen temperált heptaton skáláktól amilyeneket az ugandai és thaiföldi xylophon-zenében találunk (vesd össze BURNS ÉS WARD, 1982, 257-258. oldal). A rendezés utolsó kritériuma bizonyos szekvenciális kapcsolatok gyakorisága (prediszpozíciója) a dimenziós értékek között (BUTLER ÉS BROWN, 1984; BROWN , 1988). Olyan funkciós viszonyokat jelent ez, amelyek nem csupán az egyes értékek elôfordulási gyakoriságával kapcsolatosak, hanem a szekvenciális sorrend elôfordulási gyakoriságával is, azaz a zene statisztikus aszimmetriái. A nyugati zenében az instabil vezetôhang általában a következô tonikára oldódik: ez a hangsorozat sokkal gyakrabban fordul elô, mint a fordítottja. Az ilyen hangsorok hosszú idôn át tartó gyakorisági-tanulása felelôs a mozgásirány érzetéért: egy érték implikálja folytatását és így feszültség és megnyugvás, azaz implikációs és realizációs mintázatok keletkeznek (NARMOUR , 1990, 1992). BUTLER ÉS BROWN (1984) szerint a hangmagasság funkcionális és szekvenciális rendjének a kulcsingerei váltják ki a tonális központ és a hangnem érzetét. A gyakran elôforduló stabilitás- és instabilitás-relációk egy zenei dimenzió - mint a hangmagasság - struktúrájáról szóló absztrakt tudás részévé válnak. Ez az absztrakt tudásstruktúrák és a valós idejû eseménystruktúra feldolgozás területe, amint DEUTSCH (1984) és BHARUCHA (1984b) a tonális és esemény-hierarchiák szintjén tárgyal. Az információt könnyebben kódoljuk, szervezzük, észleljük és jobban emlékszünk rá, ha az hierarchikusan szervezett (RESTLE, 1970; DEUTSCH ÉS FEROE, 1981). Kétféle hierarchia létezik hangok esetén: (1) a dominancia- vagy stabilitás-relációk hierarchiája (amit SIMON - 1962/1982 - „formális hierarchiának” nevez): némely elem dominál más elemek felett és így nagyobb strukturális jelentôségre tesz szert azoknál (a skála hangmagasság-rendszere); (2) az alacsonyabb szintû elemek kombinációi emergens tulajdonságokat hoznak létre a magasabb szinteken (hangmagasságok, akkordok és hangnemek közötti relációk). A harmonikus funkció emergens zenei hierarchia (vesd össze KRUMHANSL, 1987; LERDAHL , 1988): csak a hierarchikus rendszer magasabb szintjein jelenik meg. Az „emergens értékek” (akkord-típusok) közötti kapcsolatok megdöbbentôen hasonló módon szervezôdnek, mint az egyszerûbb értékek (hangmagasságok) az alacsonyabb szinten. A legtöbb hallgató érzékenyebb a kontúrra, mint a pontos intervallum struktúrára az atonális és szeriális zenében (FRANCES , 1972/1988, 3. és 4. fejezet; DOWLING ÉS HARWOOD, 1986, 5. fejezet). KRUMHANSL, SANDELL ÉS SERGEANT (1987) szerint tapasztalatlan hallgatók és a kortárs zenei idiómákban magasan képzett hallgatók is amikor 12-hangú szeriális zenei fragmentumokat hallanak (Schoenberg: Fúvós kvintett, op. 26, 1924, és Vonós kvartett, no. 4, op. 37, 1936), általában a fragmentumokon belüli tonális implikációk alapján 126
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
értelmezik a hangmagasságokat. A képzett hallgatók ítéletei általában nem felelnek meg az implikációknak: a szerzôk szerint felismerik a tonális implikációt és ezért alacsony értékelést adnak az implikált hangoknak, mivel ebben a zenében ritkán forulnak elô ilyen hangok. 2.5 ÚJ ZENEI DIMENZIÓK
ÉS FORMÁK LÉTREHOZÁSA
Észlelésünk, döntéseink és felismeréseink nagy része generalizációkon alapul, amiket specifikus tapasztalatok során szereztünk. A zenei kognícióban ezek az absztrakciók két olyan típusba sorolhatóak, amelyek általánosak legalábbis egy egész zenei repertoáron vagy zenei kultúrán belül (bár néhány kultúrák között is mûködik): (1) reláció-rendszerek (absztrakt tudás-struktúrák) a zenei kategóriák között (például hangmagasság-kategóriák, skála-struktúra, valamint tonális és metrikus hierarchiák) és (2) absztrakt mintázatok lexikona, amelyekkel gyakran találkozunk (például galopp-ritmus, ûr-kitöltô /gap-fill/ dallam, szonáta-forma vagy raga). Az elôbbiek általában atemporális tudás-struktúrák, míg az utóbbiak szekvenciálisak. Egy dimenzió akkor hordozhat formát, ha a dimenzió értékeinek az elrendezôdése kódolható, szervezhetô, összehasonlítható más elrendezôdésekkel és felismerhetô. Ha egy olyan hangmagasság-sorozatot hozunk létre, ami könnyen felismerhetô, könnyen észrevesszük az ilyen sorozat variációit. Azonban az olyan dimenzió, amiben több észlelhetô konfiguráció hozható létre, értékesebb a zeneszerzô számára mint az olyan, amiben csak kevesebb konfiguráció lehetséges. A korlátot az értékek megkülönböztetési képessége adja. Sok hangmagasság észlelhetô és megkülönböztethetô, ezért rengeteg hangmagasság-kombináció lehetséges. Azonban vibrato-sebességbôl csak keveset lehet könnyen megkülönböztetni, így csak kevés konfiguráció lehetséges vibrato-sebességekbôl. A dimenzió kódolása is korlátozza a lehetséges konfigurációk számát. A relatív tartamok kódolása meglehetôsen pontos és erôsen strukturált, ami a ritmikus mintázatok gazdag variációját és kidolgozását teszi lehetôvé. Azonban a térbeli helyzet auditoros kódolása viszonylag gyenge és ezért a hangok térbeli pozícióinak sorozata nehezen észlelhetô. Fontos tényezô a mintázatok kódolásának függetlensége más dimenziók változása közben. A tartam a legstabilabb dimenzió ebbôl a szempontból: sok zeneszerzô használ ritmikus motívumokat meglehetôsen nagy hangmagasság- és hangszín-variációkkal és a hallgatók mégis könnyedén felismerik a hasonlóságot. Ezek alapján a hangmagasság és a tartam erôs dimenziók, a hangszín-dimenziók többnyire közepesen erôsek, míg a vibrato-sebesség és a térbeli helyzet nagyon gyenge. Lényeges, hogy a kategóriákat könnyen meg lehessen különböztetni egymástól. Ha a hallgató nem tudja megkülönböztetni ôket, akkor az egyik kategória használata a szomszédja helyett nem hozza létre a struktúra észlelhetô megváltozását. A félhang a nyugati 12-hangú hangmagasság-rendszerben pédául legalább hatszor akkora, mint a legkisebb intervallum, amit az átlagos hallgató képes megkülönböztetni (GREEN, 1976). Még a negyedhangok is ésszerû intervallumok a megkülönböztethetôség szempontjából, legalábbis a középsô és felsô regiszterben. JORDAN (1987) kimutatta, hogy a hallgatók megkülönböztetik a tonális funkciót a negyedhang szintjén, ám a nyolcadhang szintjén már nem. A PARTCH (1974) által használt Chromelodeon, amely oktávonként 43 hangot használ, szorosan megközelíti a megkülönböztethetôség határát, ami nehézséget okozhat a rendszer hangmagasság-struktúráinak észlelésekor. Az is lényeges, hogy viszonylag kis számú kategória legyen. A szám elsôdlegesen a rövid-távú memória korlátaitól függ (attól a képességünktôl, hogy egy viszonylag rövid idôtartamon belül kódoljunk és összehasonlítsunk értékeket). Könnyebb a túltanult kapcsolatrendszerbe ágyazott értékeket kódolni. Amikor az ember egy új skálával vagy ritmus-rendszerrel - avagy olyan új hang-kategóriákkal, amilyenek az elektro-akusztikus zenében találhatóak - találkozik az ilyen túltanult kapcsolatrendszer hiányzik. A világ legtöbb hangmagasság-rendszere 5-12 hangra korlátozódik oktávonként, ami olyan korlát, amelyet jócskán túllépett Partch Chromeloden-ja. Ha az olyan minôségeket, mint a hangszín - aminek több perceptuális „dimenziója” van (például fényesség, hangszín, durvaság, attack-jelleg stb.) - zenei forma építésére akarjuk használni, szükségesnek látszik, hogy csupán néhány érték legyen a dimenzióban. Ráadásul az értékek élesen különüljenek el, hogy a kontrasztok közöttük könnyen észlelhetôek és tanulhatóak legyenek. Ilyenek a beszédhangok megkülönböztetô jellemzôi, mivel csak két vagy három érték létezik minden adott beszéd-dimenzióban (FANT, 1973). Az is kívánatos lehet a memória-korlátok miatt, hogy jól meghatározott - gyakran rögzített kategóriák és relációk (intervallumok) létezzenek egy dimenzióban. A hangszerek hangmagassága és 127
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
hangszíne a hangszerkészítéskor eldôl, általában a kulturális konvenciónak megfelelôen (bár lényeges kivételek vannak). A tartam és a dinamika kevésbé rögzített és ezért nagyobb a perceptuális jelentôsége, hogy megôrizzük és kontrasztáljuk értékeiket az elôadás során (GABRIELSSON , 1979). A memória-korlátokat is tekintetbe kell vennünk a zenei anyag kódolásánál. Hogy könnyen kódolható legyen és aztán hozzájáruljon az összefüggés észleléséhez az idôben elválasztott zenei események csoportjai között, a zenei mintázatnak számos kritériumot ki kell elégítenie. (1) Eléggé rövidnek kell lennie ahhoz, hogy beleilleszkedjen a perceptuális jelenbe (körülbelül 2-5 s; FRAISSE, 1978). (2) Eléggé egységesnek kell lennie ahhoz, hogy a rövid-távú memória egyetlen tömbbe csoportosítsa. (A rövid-távú tárolás korlátját 5-9 tömbben állapítja meg MILLER , 1956, bár ez a mintázat természetétôl függ.) (3) A mintázatok érthetôen szervezôdjenek: a hierarchikus mintázatokra könnyebben emlékszünk és több elemüket tároljuk a rövid-távú memóriában (RESTLE, 1970; D EUTSCH ÉS FEROE, 1981; D EUTSCH, 1982). Jobban emlékszünk olyan mintázatokra, amiknek inherens stabilitása vagy jól formáltsága van és olyan mintázatokra, amik könnyebben asszimilálódnak a tudás-struktúrába (lásd FRANCES, 1972/1988; DOWLING ÉS HARWOOD, 1986). Könnyebben emlékszünk az elkülönült entitásokra mint a folytonosakra vagy nem világosan elhatároltakra, legalábbis struktúrákra való emlékezéskor. Ez nem jelenti azt, hogy a folytonos variáció nem fontos a zenei forma észlelésekor: létfontosságú a zenei gesztus kifejezô variációiban. CLARKE (1987) szerint az elkülönült elemek struktúrát hoznak létre, míg a folytonos variációk a kifejezést biztosítják. Ha egy zenedarab folytonos változásokból áll számos dimenzióban, a hallgató nem észlel formát. A kifejezô, értelmezô gesztus ugyan folytonos természetû, de egy stabil viszonyítási pont körül (vagy viszonyítási pontpár között), ami a kategória prototípusa (ROSCH, 1978). Nem csak az kívánatos, hogy a hallgatók képesek legyenek felismerni a transzformált anyagot mint hasonlót vagy kapcsolatosat, hanem az is, hogy felismerjék a transzformáció természetét. Ez hozzájárul az irány-érzethez a zenei fejlôdésben. A transzformáció után többé-kevésbé hasonló mintázat összehasonlítása és felismerése az eredeti mintázat mentális reprezentációjával kiemel bizonyos strukturális tulajdonságokat a transzformáció során, például a kontúrt. A reprezentáció korlátokat is jelenthet a transzformált zenei anyagok strukturálásában. A dimenziók kategóriáinak elkülönülése dimenziónként más (vesd össze ROSCH, 1973, 1978 vizuális és szemantikai kategóriák esetében). A hangszerek hangszínei általában az hang-elôállítási mód (az attackminôség vagy spektrális kifejlôdés erôsen összefügg a hangszercsaláddal: rézfúvósok, vonósok, nádfúvósok stb.) alapján különülnek el, valamint néhány olyan absztrakt minôség alapján, mint a fényesség (GREY, 1977). Ugyanez a helyzet a beszédfonémáknál is, feltehetôen velünk született perceptuális mechanizmust tükrözve, ami a hangot létrehozó tárgyak fizikai viselkedésére hangolódik (NEISSER, 1976, 8. fejezet). Más dimenziók kategorizációja (mint a hangmagasság, tartam, dinamika és a szintetizált hangszín) a perceptuális minôségek pszicho-fizikai kontinuumának tanult, mesterséges felosztásából származik (DOWLING ÉS HARWOOD, 1986, 4. fejezet). Természetes kategóriák esetén nehéz a dimenziók folytonos észlelése, nagyon erôs a hajlam a kategorizációra és forrás-azonosításra. Mesterséges kategóriák esetében a dimenzió folytonossága már eleve adott, ilyenkor elkülönítési rendszer szükséges. A hangszerek hangszíneit meghaladja az olyan hangszerelés, amiben az összetevô minôségek keveredése nagyobb rugalmasságot ad a folytonos variációra az „összetett” hangszínek között (vesd össze BOULEZ , 1987). A formát létrehozó dimenzióknak perceptuális kategóriákba szervezhetônek, a kategóriák közötti reláációknak pedig könnyen kódolhatóaknak kell lenniük. A relációk a zenei anyag meglehetôsen fontos összetevôi. Sok pszichológiai kísérlet kimutatta a zenei felismerésben a relációk fontosságát (például hangmagasság-intervallumok, hangszín-vektorok és tartam-arányok). A kiemelkedési vagy stabilitás-rendszernek tanulhatónak kell lennie egyszerû bemutatás útján és a tanulásnak befolyásolnia kell a mintázatok észlelését ebben a dimenzióban. Bizonyos visszatérô szekvenciális érték-mintázatoknak könnyen tanulhatóaknak kell lenniük, vagyis a dimenziók közötti relációknak absztrakt tudásként megszerezhetôeknek kell lenniük. A formát létrehozó dimenziónak pontosan meg kell felelnie azoknak a szenzoros dimenzióknak, amelyek befolyásolják a szimultán, a szekvenciális és a szegmentációs perceptuális csoportosítást . A kutatások szerint a hangszín-fényesség, a hangmagasság, a tartam, a dinamika és a térbeli helyzet ilyen. Fontos, hogy az inger kategóriák osztályozása és relációik rendezése lehetséges legyen pszichológiailag, vagyis megfelelés legyen az inger-struktúra és mentális reprezentációja között, különben a struktúrákat nem tudja dekódolni a hallgató. A perceptuális kategóriák rendezési módja többé-kevésbé szigorú korlátokat szab a felismerhetô zenei formáknak. 128
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.5.1 HANGSZÍN -STRUKTÚRÁK A hangszín olyan auditoros tulajdonság, amely megkülönbözteti a hasonló feltételek között bemutatott hangokat, amelyeknek ugyanaz a hangmagasságuk, hangerejük és tartamuk. Beszéd esetében a mássalhangzók és magánhangzók tekinthetôk a hangszín-variáció terének. A költészetben a hangszín esztétikai szerepet játszik, a hangmagasság zenében játszott szerepéhez hasonlóan. A rím és az alliteráció, valamint a másalhangzó- és magánhangzó-minôségek terében végrehajtott modulációk gazdag palettát kínálnak a hangszobrászathoz a szó által hordozott jelentés körül. . Egészen a XIX. sz. közepéig a hangszín zenében játszott szerepe azonban vagy az volt, hogy a dallamvonalat hordozza és megkülönböztethetôvé tegye azt a többi szólamtól, vagy az, hogy a részek közötti határt jelezze az instrumentáció változásával. Fôként olyan tulajdonságként szolgált tehát, ami alapján a hangesemények csoportosíthatóak vagy szétválaszthatóak hasonlóságuk alapján. A szimfonikus zenekar megjelenésével a hangszín is a zenei fejlôdés tárgya lett és a zeneszerzôk kezdtek összetett hangszíneket építeni kifinomult hangszerelési eljárásokkal (BOULEZ, 1987). Késôbb, a XX. sz. másik felében elôször az elektronikus, majd a digitális hangszintézis-technikák olyan kontrolt adtak a zenészek kezébe a hangszín felett, amirôl azelôtt nem is álmodtak (Francis Bacon kivételével). A zeneszerzôknek már nem kell ragaszkodniuk a zenekar „talált tárgyaihoz”, hanem maguk komponálhatják a hangokat. Ez megnyitotta az utat a hangszín strukturális használata elôtt, ami - elvben - akár a hangmagasság riválisa is lehet. A több-dimenziós skálázási technikák tették lehetôvé, hogy megismerjük a hangszín sokoldalú természetét. GREY (1977) úttörô munkássága alapján KRUMHANSL (1989) kísérleti eredményei azt mutatják, hogy a hangszínek közötti különbség-megítélésekben a zenész hallgatók általában három fôbb perceptuális dimenzióra - és számos olyan megkülönböztetô jegyre, ami egyes hangszínekre vonatkozik - alapozzák ítéleteiket. Késôbb megtalálták azokat az akusztikus paramétereket is, amelyek erôsen korrelálnak a hangszínek elhelyezkedésével ezekben a dimenziókban (KRIMPHOFF ÉS MUNKATÁRSAI , 1994), ami lehetôvé teszi a hangok erôs perceptuális kontrolálását biztosító hangszintézis-eszközök építését. A folytonos dimenziók közé tartozik 1) a felfutási idô (attack) minôség, ami megkülönbözteti a pengetett és az ütôs hangszereket a vonós és a fúvós hangszerektôl: korrelál az felfutási idô logaritmusával, 2) a fényesség ami megkülönbözteti a több magas-frekvenciájú összetevôvel rendelkezô hangokat azoktól, amelyeknek a spektruma az alacsonyabb frekvenciákra korlátozódik: korrelál a spektrális gravitációs-centrummal (amplitúdó-súlyozott átlagfrekvencia) végül pedig 3) a variációs mérték a globális spektrális burkológörbében a szomszédos frekvencia-összetevôk között. Ezek azok a jellemzôk, amelyek a legvilágosabban megkülönböztetik a hangforrásokat egymástól és amelyek szerepet játszanak abban, hogy felismerjük ôket (MCADAMS, 1993). Ezek a dimenziók lehetnek a zenei struktúra fejlôdésének jelöltjei, habár feltûnôségük mértéke hallgatóról hallgatóra változik (DONNADIEU ÉS MUNKATÁRSAI, 1994). A hangszín-relációknak megfelelô akusztikus tulajdonságok hasonló mentális reprezentációkat aktiválnak (GREY, 1977; RISSET ÉS WESSEL , 1982): a hallgatók képesek analóg hangszín-vektorokban (több dimenziót átívelô intervallumok, amelyek távolság- és irány-összetevôkkel rendelkeznek) megkülönböztetéseket tenni. A transzponált vektorokat ekvivalensnek észleljük, amikor a távolság- és irány-relációk állandóak maradnak (WESSEL, 1978). LERDAHL (1987) a szenzoros disszonancia általánosításaként hozott létre hierarchikusan szervezett hangszín-szekvenciákat. Az értékek kombinációjának egy emergens tulajdonsággal kell rendelkeznie, ami a csoport-konfigurációból származik és nem a dimenzió új értéke. Hangmagasságok esetén az akkordnak dúr vagy moll jellege van és mégis hallani az összetevô hangmagasságokat: a hangmagasságok nem olvadnak egy új hangmagasságba, ami helyettesítené ôket (annak ellenére, hogy a maszkolás gyakran korlátozza a belsô hangösszetevôk észlelését). Több hangszín azonban gyakran egyetlen összetett hangszínbe olvad (amit sok XX. századi zene tanúsít), amiben az egyes sajátságokat helyettesíti az újonnan felbukkanó hangszín. Ez korlátozza a lehetséges hangszín-kombinációk rendszerét.
129
DANCZI CSABA LÁSZLÓ : A ZENEI 2.5.2 TEMPORÁLIS
TÉR
STRUKTÚRÁK
A másik fontos formát alkotó dimenzió a tartam, amire kifinomult metrikus és ritmikus rendszerek fejleszthetôek ki. A jól meghatározott relatív tartamok viszonylag kis száma használatos. Az erôs és gyenge mérôütések többnyire hierarchikusan szervezôdnek és mint mentális absztrakt-struktúrák reprezentálódnak, amelyek alapján észleljük a tartam mintázatokat (vesd össze GABRIELSSON, 1979; LERDAHL ÉS JACKENDOFF, 1983, 4. FEJEZET; L ONGUET-HIGGINS ÉS L EE, 1984; POVEL ÉS ESSENS, 1985; DOWLING ÉS HARWOOD, 1986, 7. fejezet). A temporális dimenzió alapvetô fontosságú az olyan kapcsolatok kialakulásához, amelyek absztrakt tudást hoznak létre más dimenziókban.
130
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.6 A RITMUS A ritmus a görög rhythmosz (ritmus) és rheo (áramlani) szóból származik. Azonban ahogy BENVENISTE (1951) kimutatta, a szemantikus kapcsolat a ritmus és az áramlás között nem a hullámok szabályos mozgásából származik, ahogy azt gyakran hitték. A görögök nem a rheo vagy rhythmosz szavakat használták, amikor a tengerrôl beszéltek. A rhythmosz szó az ion filozófiai írásokban általában „formát” jelölt: improvizált, pillanatnyi és módosítható formát. A rhythmos valójában „az áramlás egy adott módját” jelenti. Platón lényegében a testi mozgásokra használta ezt a kifejezést, amiket - ahogy a zenei hangokat is - számok segítségével lehet leírni. A Lakomában (az orvos, Erüximakhosz) ezt mondja: „... a ritmus ... eredetileg ellenkezô elemekbôl: a gyorsból és lassúból, késôbbi megbékélésükbôl született“ (PLATÓN , 1999, 46. oldal). A Philébos-ban pedig Szókratész szerint: „a régiek... felismerték azokat az elváltozásokat is, melyek a test mozgásában rejlenek és valósulnak meg, melyeket, mint mondták, számokkal mérve ritmusoknak és mértékeknek kell hívnunk“ (lásd RITOÓK, 1982, 123. oldal) . Fogadjuk el egyenlôre ezt a definíciót, ami még általánosságában is a ritmus sokoldalú leírása. Azonban lényeges megkülönböztetéseket kell tennünk. A ritmus rendezett szekvencia, amiben a rendezettség lehet konstruált vagy észlelt. Beszélünk a nappalok és éjszakák, az évszakok ritmusáról, valamint nagyon gyors vagy lassú fizikai jelenségekrôl (például a fény vagy a bolygók frekvenciájáról). A ritmus ilyenkor csak mentális konstrukció. Észleljük a ritmust bizonyos helyzetekben: például a táncban, a dalban, a zenében és a költészetben. MACH (1865) a motoros aktivitást tartotta a ritmus-észlelés központjának és néhány évvel késôbb VIERORDT (1868) ritmikus mozgásokat kezdett lejegyezni. FRAISSE (1982) szerint minden észlelt ritmus olyan ritmus, ami eredetileg az emberi aktivitásból származik. Általában akkor beszélünk ritmusról, amikor az észleltek alapján bejósolhatjuk, hogy mi következik. MARTIN (1972) szerint: „A ritmus fogalmában benne rejlik az, hogy egy szekvencia korai eseményeinek észlelése elvárásokat generál késôbbi eseményekre, mégpedig valós idôben” (503. oldal). Az ember többé vagy kevésbé képes elképzelni azt, hogy mi következik. Az egyik véglet ugyanannak az ingernek az izokron ismétlése: a pulzus, a menetelés és az óra tik-takolása. Az ismétlôdés lehet analóg struktúrájú ingerek mintázata is, mint a waltzerben és az alexandrinusban. A másik végleten különbözô mintázatok szekvenciáját találjuk, mint a szabad versben vagy bizonyos modern zenékben. Az anticipáció temporális, azaz a tartamon belüli szervezôdéshez kötött. Mi is szervezôdik így? A ritmus vajon olyan ingersorozatból származik, amire a temporalitás jellemzô, ahogyan a költemények hosszú és rövid szótagjai sugallják vagy a kottaolvasás, mivel a kottában minden egyes hangnak pontos hossza van? Vagy a ritmus az elemek közötti temporális intervallumok rendezése, amit az intenzitás-, hangmagasságvagy hangszínkülönbségek jeleznek? Egyesek szerint a ritmus az idôbeli mozgás teljes érzete, beleértve a pulzust, a frázisokat, a harmóniát és a metrumot is (APEL , 1972; LERDAHL ÉS JACKENDOFF, 1983). Gyakran azonban ritmus alatt az auditoros szekvencia esemény-tartamainak temporális mintázatát értik. A mérôütések észlelt impulzusok, amelyek egyenlô távolságban lévô (szubjektíven izokron) idôpontokat jelölnek, vagy hangzó események, vagy elképzelt (nem hangzó) idôpontok formájában. A mérôütés-észlelést a zenei események alapozzák meg, ha azonban az ütemérzet kialakult, az folytatódik a hallgató elméjében akkor is, amikor ez idôlegesen ellentmond a pulzus-sorozatoknak vagy az eseménysor már meg is szûnt (COOPER ÉS MEYER , 1960). PARNCUTT (1994) szerint a zenei ritmus „egy olyan akusztikus szekvencia, amely mérôütés-észlelést vált ki” (453. oldal). A ritmus-szervezôdés egyik perceptuális jellemzôje a tempo. A ritmus-észlelés a tempótól függ, mivel a szekvencia észlelhetô mintázatokba szervezését fôként a közelség törvénye határozza meg: amikor a tempo túlságosan lelassul, a ritmus és a dallam is eltûnik (FRAISSE, 1982).
131
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.6.1 REKURZIÓ A Schenker-i elemzés (SCHENKER , 1979) jellemzôi a hierarchia, a progresszió és a visszatérés (rekurzió). A zenei struktúra három szintû: elôtér, középtér és háttér. Az elemzés elszigetelés, azonosítás, kapcsolás és ezáltal a zenei percepció három szintjének integrálása, ami a zenei felszín struktúráit egymásba szôtt hálózatok sorozatává alakítja. LERDAHL ÉS JACKENDOFF (1983) elméletében - akik erôsen kötôdnek a Schenker-i nézethez - a metrikus csoportosítási struktúra a zenében rekurzív. Feltételezik, hogy a metrikus csoportosítás szintrôlszintre egységes: a csoportosítási struktúra a végtelenségig kidolgozható azonos szabályok alapján. Azt állítják, hogy „a metrikus struktúra elemei lényegében ugyanazok a legkisebb hangértékek és a hipermetrum szintjén (ami nagyobb, mind a jelzett metrum)” (LERDAHL ÉS JACKENDOFF, 1983, 20. oldal). Nem azt tételezik fel, hogy létezik ilyen egység a zenében, hanem azt, hogy amikor zenét hallgatunk, ilyen szabályosságokat várunk. LERDAHL ÉS JACKENDOFF (1983) elmélete eltételezi, hogy az átlagos, tonális zenében járatos hallgató valamilyen klasszikus, nagy-léptékû rendet vagy egységet vár el, amiben a hangok összefüggô melódiát alkotnak, a frázisok más frázisokra válaszolnak és a részek egymást kiegyensúlyozzák. A koherenciát vagy mûvészi egységet a koherencia valamilyen elmélete vetíti ki, a koherencia nem a mûalkotások intrinzik tulajdonsága (STREET, 1989). NARMOUR (1990) szerint több-irányú kapcsolat-hálózatok vannak és kommunikáció történik a hierarchia egyes szintjei között. Fizikai szempontból az impulzus/mérôütés, metrum, szub-frázis stb. mind egyetlen egységesen hierarchikus temporális rendszerben léteznek. Azonban kevés bizonyíték van arra, hogy ez a hierarchia ugyanilyen egységes perceptuális szempontból. A gregorián ének példa rá, hogy lehetségesek zenei frázisok megalapozó mérôütések vagy metrum nélkül és az ilyen énekekkel nem tud mit kezdeni a rekurzív-hierarchikus ritmus-elmélet. 2.6.2 A RITMUS-MEMÓRIA Három akusztikus memória-típust különítenek el: az echoikus tárolást; a rövid-távú vagy munkamemóriát és a hosszú-távú memóriát. BROWER (1993) szerint az echoikus memória a ritmikus aktivitás közvetlen idô-skáláját adja („elôtér ritmikus struktúra”), a rövid-távú memória a metrum és frázisok idôskálájának felel meg („közép-tér”), míg a hosszú-távú memória a zenei részek és tételekek („háttér”) idôskálája. A háromféle memória háromféle feldolgozással jár. Begyakorlunk (entrain) egy mérôütést az elôzô mérôütés echoikus tára és valamilyen belsô oszcillátor periódusa alapján, figyelünk az erôs és gyenge mérôütések közötti kapcsolatra (hangsúlyozás), számolunk frázisok és ütemek között (metrikus csoportosítás) és valamelyik rész jellemzôit asszociáljuk egy elôzô rész emlékéhez, ami már nincs jelen.
132
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.6.3 MÉRÔÜTÉS -KÖVETÉS A ritmus-észlelés lényeges vonása a periodikus bemeneti szignál begyakorlása (entrainment): ez teszi lehetôvé, hogy a lábunkkal kövessük a zene mérôütemét. Ha periodikus szignált hallunk, alig toleráljuk a szignál hibáit; egy alacsony határérték felett könnyen észreveszünk minden hirtelen eltérést a periodicitástól. Az auditoros rendszer az alábbi módokon detektálhatja a hibát: (1) összehasonlítja az inger-kezdet intervallumokat az elôzôekkel, (2) a periodikus szignált egy belsôleg generált periodikus oszcillátorhoz illeszti, vagy (3) minden egyes inger-kezdet intervallumot egy belsô ideális periódushoz illeszt. SCHULZE (1978) szerint ha szabályos ritmikus impulzusokat hallunk, az intervallumokat nem egyesével illesztjük vagy hasonlítjuk a belsô ideális intervallumhoz, hanem a periodikus pulzusokat együtt alkotjuk. Az ilyen belsô, szinkronizált impulzus-generálást nevezik begyakorlásnak. A szinkronizáció olyan intervallumoknál a legszabályosabb, amelyek 400 és 800 ms közé esnek. Az a tartomány, amin belül a szinkronizáció lehetséges, 200-1800 ms a hangok között (FRAISSE, 1982). 2.6.4 T EMPORÁLIS CSOPORTOSÍTÁS Bármilyen különbség egy izokron, azonos elemekbôl álló sorozatban szolgálhat a csoportosítás alapjaként. Általában sokkal hosszabb hang vagy két hang közötti intervallum határozza meg a csoport végét; a hosszabb tartam teszi lehetôvé, hogy megkülönböztessük az egymást követô mintázatokat. A szubjektív ritmizálásban (ahol a hangok valójában teljesen egyformák és izokronak) is megjelenik ez a különbség (FRAISSE, 1982). Amikor kísérleti alanyokat arra kérünk, hogy szabályos hármas vagy négyes csoportokat kopogjanak, azok spontán módon 600-700 ms szünettel választják el a csoportokat. A mintázatok strukturája egy vagy több elem hangsúlyából jön létre. Ez a kihangsúlyozás a szubjektív ritmizálásban is felbukkan. A kiemelt elem határozza meg a csoport hosszát. Az objektív hangsúly általában a mintázat elejére esik és ez megjelenik a szubjektív ritmizálásban is (FRAISSE, 1982). 2.6.5 METRUM A zeneelméletek a metrikus struktúrát az erôs és gyenge ütemegységek idôbeli váltakozásának tekintik. LERDAHL ÉS JACKENDOFF (1983) a metrikus struktúrát mérôszakasz-rácsként képzeli el különbözô idôskálákon, ami hasonló a beszéd fonológiai elméleteiben felvetett metrikus-rácshoz (L IBERMAN ÉS PRINCE, 1977). A szokásos jelölési mód szerint a vízszintes pontsorok (ahol a pontok zenei események) metrum-szinteket alkotnak, amiben a szomszédos szintek pontjai közötti relatív elhelyezkedés és elrendezés adja meg a kapcsolatot a metrum-szintek hipotetikus periódusai és fázisai között. A metrikus hangsúlyt a rácsban több szint egyidejû pontjai jelzik. Azokat az idôpontokat, ahol sok esemény egybeesik, erôs mérôütésnek nevezik; azokat az idôpontokat pedig, ahol kevés taktus esik egybe, gyenge mérôütésnek. A zenei jelölés nyugati konvenciói kategorikus megközelítést adnak a zenei elôadás idôzítésére. A zenei jelölés az esemény-tartamokat kategorikusan határozza meg; az egyes események tartama a legkiemelkedôbb metrikus szint egész-számú többszöröse vagy aprózása. Az események ütemekbe csoportosítódnak, amik meghatározott temporális hangsúly-mintázatokat tartalmaznak (azaz metrumot). Habár a jelölt tartamok az esemény kezdete és vége közötti intervallumot jelölik, a hallgatók általában az ingerkezdetek közötti intervallumot észlelik, mivel az ingerkezdetek kiemelkedôbbek a -végzôdéseknél. A hallgatók a zenét általában meglehetôsen szabályosnak észlelik; az emberek bármilyen zenei képzés nélkül is pattintanak az ujjukkal vagy tapsolnak a temporális struktúrára, amit a zenében észlelnek, látható erôfeszítés nélkül. A hallgatók a zenei eseményeket tartam-kategóriákban hallják, amelyek a nyolcad, negyed-, félhangoknak stb. felelnek meg a kottában. Az erôfeszítés nélküli képesség a zenei szekvenciák temporális szabályosságának észlelésére figyelemre méltó, mivel a valóságos esemény-tartamok a zenei elôadásban jelentôsen eltérnek a tartamkategóriák szabályosságától (CLARKE, 1989; GABRIELSSON, 1987; PALMER , 1989; REPP, 1990). Ráadásul a hallgatók a tartam-kategóriáktól való eltéréseket (vagy temporális fluktuációt) az elôadók zenei szándékával összefüggésben észelik (CLARKE, 1985; PALMER , 1996; SLOBODA, 1983; T ODD, 1985). A hallgatók általában 133
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
tartam-hosszabbodást észlelnek a strukturális határok között, ami a frázis-végzôdést jelzi (miközben szabályosságot hallanak). Azaz a hallgatók kategorikusan észlelik a tartamokat a temporális fluktuáció ellenére, ám közben észlelik a fluktuációt is, amit az elôadó zenei szándékának tulajdonítanak (SLOBODA , 1985; PALMER, 1996). A perceptuális konstancia, amit a hallgatók tapasztalnak a fizikai változás ellenére, nem csak a zenére jellemzô. A hallgatók általában megértik a beszédet a hatalmas beszélôk közötti variabilitás ellenére is. A beszéd-absztrakció (speaker normalization) korai modelljei az extra-lingvisztikai (nem strukturális) varianciát zajként kezelték, amit ki kell szûrni a beszédértéshez. Mostanában azonban a beszélô-specifikus beszédjellemzôket - például a nemet, a dialektust és a beszédsebességet - hasznosnak tekintik a lingvisztikai kategóriák azonosításához (vesd össze NYGAARD , SOMMERS ÉS PISONI, 1994; PISONI, 1997). L ARGE ÉS PALMER (2002) szerint a zenei elôadások inger-variabilitása segíti a hallgatókat a ritmus-kategóriák azonosításában. A zenei elôadás temporális variabilitás-mintázatai szisztematikusak és intencionálisak (BENGTSSON ÉS GABRIELSSON, 1983; PALMER, 1989). A legtöbb nyugati kotta-zenében azért jelölik a metrumot, mert a zeneszerzô formálni akarja az elôadó zeneértését és ezáltal a zene elôadását. A nyugati tonális zenében az ütemjelzés mérôüteme bizonyos sémát sugall a fenomenológiai hangsúly-mintázatokhoz, míg az osztás a kifejezô idôzítési variációkra. Az ütemjelzés alapvetô vezérfonalként szolgál a hangosság, hangszín és idôzítés változtatására a zeneszerzô szándékával összhangban. A diakritikus jelek nagy készlete használatos az ütemjelzés kibôvítésére. Ezért a darab metrumáról általában feltételezik, hogy objektív. PARNCUTT (1994) zenei elôadások észlelését vizsgáló kísérletek és a felhasznált zenei ingerek elemzése alapján azt állítja, hogy a metrum bizonytalan - ha nem éppen teljesen képzetes - jellemzôje az auditoros szignálnak. Egy adott ritmus - akár szándékoltan zene, akár nem - számos egymással ellentmondó mérôütem- és metrum-észleléshez vezethet különbözô hallgatók vagy ugyanazon hallgató különbözô próbái esetén. Ebbôl a szempontból a nyugat-afrikai és sok afro-amerikai zene sem kivétel. Számos szignál-feldolgozási technikát fejlesztettek ki, hogy a mérôütemet és a metrumot visszanyerjék a zenei felvételekbôl, de az ilyen kísérletek általában nagyon különbözô eredményeket adnak az olyan „szinkopált” zenék esetében, mint amilyen a jazz. A metrum általában a hangsúlyok észlelt periodikus mintázatára (beleértve paradox módon ebbe az olyan hangsúlyokat is, amelyeket maga a képzelt metrum hoz létre) alapozott perceptuális és kognitív konstrukció.
134
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.6.5.1 T ERMÉSZETES TEMPÓ L ERDAHL ÉS JACKENDOFF (1983) szerint a metrikus struktúra a visszatérés (rekurzió) mélységének tetszôleges fokán álló mérôütések hierarchikus egymásba ágyazódása. Amikor azonban néhány egyszerû zenei példára próbálják alkalmazni ezt az elméletet (LERDAHL ÉS JACKENDOFF, 1983, 250-253. oldal) váratlan nehézségekbe ütköznek és úgy találják, hogy az ütem-szintnél hosszabb távú periodicitások esetén a hallgatók gyakran hibáznak. Úgy látszik, hogy a metrum leghatékonyabban a fô ütemrész viszonylag kis periodikus csoportosításában mûködik, magasabb szinteken meglehetôsen variábilis. Megdöbbentô, hogy a szív és a járás ritmusa, a spontán és a preferált tempo ugyanazon nagyságrendû (500-700 ms intervallumok). A szív ritmusa mégsem korrelál a spontán tempóval (T ISSERAND ÉS GUILHOT, 1949-1950): a szívverés gyorsulása nem okozza a spontán tempo gyorsulását. Figyelemre méltó korreláció van azonban a járás ritmusa és a spontán tempo között (HARRISON, 1941; M ISHIMA, 1965). PARNCUTT (1994) egy sor ciklikusan ismétlôdô egyszerû ritmust alkotott ütôs hangszerek hangjából. A hallgatók ezeket a ritmusokat különbözô tempóban hallották és arra kérték ôket, hogy kopogják a mérôütést egy számítógép billentyûzetén. A hallgatók kopogásai egy mérsékelt tempó körül maradtak. Kísérletének második felében ugyanezekbe a mintázatokba egy „célhangot” is beiktatott különbözô hangszínnel. A hallgatóknak négy-fokozatú skálán kell megítélniük, hogy a célhang mérôütemre esett, vagy szinkopált (off beat) volt. Az a tempó, aminél a percepció a legkönnyebbnek tûnt, 600-700 ms volt. A spontán motoros tempo és a preferált tempo nemcsak hasonlóak, hanem a megfigyelések és kísérletek szerint gyakran kapcsolódnak is. Az emberek meglehetôsen könnyen kísérik motoros tevékenységgel a hangok szabályos sorozatát. Ez a jelenség spontán felbukkan bizonyos gyermekekben egyéves korban, néha korábban is. Három, négy éves kortól a gyermek kérésünkre képes kísérni a metronóm ütéseit (FRAISSE ÉS MUNKATÁRSAI , 1949). Amikor egy óra tik-takolását halljuk, kettes csoportokba rendezzük a tik-takolásokat. Lassítsuk le a tik-takolást! Eljön egy olyan pillanat, amikor a tikelések és a takolások már perceptuálisan nem kapcsolódnak egymáshoz, független eseményeknek tûnnek. Ugyanez a határ az, ahol a dallamok eltûnnek és független hangok váltják fel ôket. MAC DOUGALL (1903) a felsô határt 1500 és 2000 ms közé helyezi, FRAISSE (1982) szerint inkább 1800 ms. A motoros szinten is egy optimumot találunk 600 ms körül a perceptuális szervezôdésben, ráadásul ezt a tartamot észleljük a legnagyobb pontossággal (FRAISSE, 1963, 119. oldal, MICHON , 1964). Amikor a kísérleti alanyokat arra kérjük, hogy hármas vagy négyes csoportosításban kopogjanak, a hármas csoport kopogásai között átlagosan 420 ms intervallum van, míg 370 ms a négyes csoportokban (FRAISSE, 1956). A hallgatók preferált tempo-tartománya a periodikusan ismétlôdô ingerek felismerésére és szervezésére 70-120 percenkénti mérôütés közé esik, amirôl azt tartják, hogy viszonylag könnyû emlékezni rá és asszimilálni (CLYNES ÉS WALKER, 1982; DOWLING ÉS HARWOOD, 1986; FRAISSE, 1982; H ALPERN, 1988). A neurális hálózatok kutatása azt sugallja, hogy a természetes tempó az olyan neurális hálózatok sajátossága (DESAIN ÉS HONING, 1991. POVEL, 1981), amelyek a természetes tempót a temporális kogníció meglehetôsen alacsony szintjére helyezik.
135
DANCZI CSABA LÁSZLÓ : A ZENEI 2.6.5.2 A METRUM-ÉSZLELÉS
TÉR
MINT FIGYELMI MECHANIZMUS
POVEL (1984) szerint a metrum belsô periodikus séma, ami az észlelést és a cselekvést temporálisan alapozza meg. Modelljében a zene temporális feldolgozásának elsô lépése a szekvencia egyenlô intervallumokra (azaz mérôszakaszokra) szegmentálása, amit események jeleznek. A második lépésben a mérôszakasz intervallumánál kisebb intervallumok azon mérôszakasz aprózásaivá válnak, amiben elôfordultak. A mérôszakaszok és aprózások a percepció és az akció irányítására szolgálnak a zenei környezetben, azaz a metrum figyelmi mechanizmus. Figyelmi kapacitásunkat erôsen korlátozza a metrum és a mérôütés által implikált idô-skála. Mások is felvetették (GJERDINGEN , 1989; JONES , 1986; JONES ÉS BOLTZ, 1989; JONES ÉS YEE, 1993). hogy a metrum egy figyelmi mechanizmus - egy temporális séma, ami alapján az idô-információt feldolgozzuk. POVEL (1984) modelljének apró hibája - amit LERDAHL ÉS JACKENDOFF (1983, 1997) is megemlít - az, hogy nem tud mit kezdeni a páratlan számú vagy szabálytalan mérôütésekkel. A ritmus sokszor (például a kelet-európai, görög és közel-keleti folk zenékben, valamint a dél-indiai klasszikus zenében) hosszú és rövid mérôütések sorozatán alapul. A különbözô mérôszakaszok szinte mindig 3:2 vagy 2:1 tartam-arányban fordulnak elô, ami kisebb temporális egységre utal (aprózás) az alacsonyabb metrikus szinten. A hagyományos zeneelmélet szerint a zenei metrum az autonóm zenei objektumok egy különös elrendezése, azaz a mérôütések, ütemhangsúlyos részek, aprózások és más metrikus struktúrák „a zene részei” (habár ez a nézet megkapta jogos kritikáját az elméleti irodalomban; lásd például BROWER , 1993; KRAMER, 1988; LERDAHL ÉS JACKENDOFF, 1983; LESTER , 1986; LONDON, 1990). BHARUCHA ÉS PRYOR (1986) szerint: „A hangok szekvenciája perceptuálisan szervezôdik izokron mérôütésekhez vagy mérôütés-rácshoz viszonyítva, ami annyi inger-kezdet részletességû, amennyi csak lehetséges”. L EE (1991) kiváló áttekintést ad és kritizálja a zenei metrum ilyen kódolási modelljeit. Az ökológiai pszichológia szerint a metrum a zenei környezet invariánsa, amit a visszatérô temporális mintázatokból komputálunk. Az ilyen invariánsoknak köszönhetôen tudjuk megkülönböztetni a zenei variációt (a zene ritmusát és kifejezô idôzítését). A kísérleti alanyoknak nehézséget okoz az olyan ritmusok reprodukálása, amelyeknek nincs nyilvánvaló közös idôegysége (JONES , 1986). A kódolási modellek egy alternatívája JONES modellje (1976, 1990a, b, 1992; JONES, K IDD ÉS WETZEL, 1981) amit DESAIN (1992), GJERDINGEN (1989, 1993), JONES ÉS BOLTZ (1989) és L ARGE ÉS MUNKATÁRSAI (1993) fejlesztettek tovább. A begyakorlási (entrainment) modellek nem az események zenei-akusztikus felszínén történô események kódolására koncentrálnak, hanem a hallgató figyelmi viselkedésére. A begyakorlási modellben a hallgató ráhangolja észleleteit valamilyen ciklikus temporális mintázatra, ami a jelenlegi és a következô zenei események temporális helyzetére vonatkozó elvárásait fókuszálja. A temporális figyelem begyakorlási modelljei nagyon vonzóak a zenei metrum értelmezésére, mivel megkönnyítik az aprózások, tartam ítéletek, szinkópa, „hangsúlyos” szünetek, az elvárás megsértései és a temporális anomáliák (azaz késô hang belépések vagy temporális eltolódások) magyarázatát. A metrikus oszcillációk neurális hálózatokkal való modellezése meglehetôsen egyszerû: a szignál egy neurális alapú metrikus számlálóból felhasználható arra, hogy modulálja a sokkal nagyobb neurális hálózat teljesítményét egy adott metrum alapján, azaz a metrikusan modulált figyelem egy formáját hozza létre (GJERDINGEN, 1989, 78. oldal). JONES (1990a) szerint a „temporális figyelem... két egymással átfedésben lévô és interaktív folyamaton alapul: az absztrakción és az általánosításon. Az absztrakció az invariáns zenei információ kinyerését; az általánosítás pedig ennek az információnak a ‚felhasználását’ jelenti valós idejû elvárások kialakítására” (193. oldal). A metrum felismeréséhez szükséges a zenei felszín valamilyen kódolása (az alap tartamok és relatív tartamok felismerése az ütem és metrum kialakulásához, stb.). A zenei szignál kinyert invariáns információi összevetôdnek a hallgató metrikus hierarchiákról és azok strukturális nyelvtanáról szóló elôzetes tudásával. Ez az elôzetes tudás teszi lehetôvé, hogy a hallgató kiválassza a megfelelô metrikus keretet (vagy legalábbis valamilyen kezdeti metrikus hipotézist alkosson) olyan helyzetben, amikor a zenei felszín invariáns vonásai önmagukban bizonytalanok. A felismerési fázis után a hallgatók átkapcsolnak a folytatási fázisba, amelyben - ahogy Jones megjegyezte - a metrum, amelyet a felismerési fázisban kinyertünk, a begyakorlás mintázatává válik. DOWLING, LUNG ÉS HERRBOLD (1987) az „elvárás ablaka” kifejezést használta arra a tartamra, amin belül a zenei 136
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
események általában elôfordulnak. Néhány esetben (például amikor a hosszú tartam több mérôszakaszon átnyúlik, vagy amikor a szünet ütemhangsúlyos részre esik) a folytatási fázis figyelmi mintázata metrikus artikulációt hoz létre a hallgató „lelki fülében” („hangos szünet” lásd L ONDON, 1993). A zene idôskáláinak áttekintése alapján JONES (1993), valamint JONES ÉS BOLTZ (1989) különbözô zenehallgatási stratégiákat tételez fel a figyelem különbözô fajtáiként: a jövô-oriendált (hosszú-távú, memória-alapú) és az analitikus (rövid-távú, percepció-alapú) figyelmet. Valójában ez a különbségtétel viszonylagos és nem abszolút, mivel a két véglet között több lehetôség is van. „A jövôre-orientált figyelem a referencia-szintnél nagyobb idô periódusokra irányuló figyelem, míg az analitikus figyelem a figyelmi energiákat a temporális hierarchia viszonylag alacsony szintjeire irányítja... Ezek a fokális figyelmi aktusok ugyanazon esemény különbözô temporális perspektíváján alapulnak” (JONES , 1993, 471. oldal). JONES ÉS BOLTZ (1989) tárgyalja a begyakorlási hierarchiák „referencia szintjét”, ami „lehorgonyzásként vagy referencia-idô szintként szolgál az észlelô számára” (470. oldal). A metrikus hierarchiákban a mérôütés-szint szolgál általában ilyen referenciaként. Mind a nagyobb/lassúbb, mind pedig a kisebb/gyorsabb események ezen szinthez való viszonyuk alapján reprezentálódnak: a magasabb szintek a mérôütések és mérôütés-csoportok összekapcsolódásából jönnek létre, míg az alacsonyabb szintek a mérôszakasz temporális tartamának aprózásai. A metrum a ritmikus jelenségek keskeny tartományát jelöli, nagyjából a pszichológiai jelent. A metrum meghatározó elveként néhány kisszámú (gyakran szabályos) - nagyjából kettôtôl nyolcig - mérôütés szolgál. A mérôütések metrikus csoportosítása nagyjából a 800 ms és 5 s közötti tartamot íveli át, ami tovább tart, mint az echoikus tár tartama (1 s-nél kisebb), ám rövidebb, mint a munkamemória tartama (kb. 30 s). Van néhány kivétel a tonális zeneirodalom adagio-iban - ahol az írott metrum több mint 10 s-ig nyúlhat - vagy némely allegro-ban és presto-ban, ahol az írott metrum fél másodpercig vagy még addig sem tart. Ilyenkor azonban az írott metrum és az észlelt metrikus csoportosítás általában nem azonos és egyénrôlegyénre változik a figyelmi kapacitásnak megfelelôen. A zenei ütemegység perceptuális kettes, hármas, négyes stb. (talán egészen nyolcasig) csoportosítása speciális státuszban van a ritmus-percepció jelenségei között. A pulzusok tudattalan periodikus csoportosítása valamiféle gestaltként telítôdik „a mágikus hét plusz mínusz kettô”-nél (MILLER , 1956). Az ezen túl terjedô tartamoknál vagy tudatos számolási elvre van szükség, hogy megtartsuk az ütemet vagy egy csoportosítási eljárásra a mérôütések nagyobb egységekbe „tömbösítéséhez”. A metrum esetében az ismerôsség is számít: az adott metrum hangját és érzetét tapasztalni kell, máskülönben nem mûködik tudattalanul. Az öt-negyedes metrum általában idegennek tûnik a nyugatiak számára, ám meglehetôsen gyakori az indiai populáris zenében.
137
DANCZI CSABA LÁSZLÓ : A ZENEI
138
TÉR
DANCZI CSABA LÁSZLÓ : A ZENEI 2.6.5.3 METRIKUS
TÉR
SZINTEK
Az átlagos hallgató ha azonosította a metrikus keretet, arra is képes, hogy ettôl függetlenül generálja a metrikus mintázatot olyankor is, amikor a zene véget ért vagy amikor a ritmikus felszín ellentmond az elfogadott metrikus keretnek. Tehát miközben a metrum a zenei felszínen jelen lévô tartamoktól függ, attól független perceptuális aspektus marad. Amikor egy merengue-re táncolunk, miféle metrikus mintázatot reprodukálunk? Úgy tûnik, hogy a számolt kopogás és/vagy tánc, ami ilyen ritmikus kontextusban jellemzô, komplex metrikus keretet követel meg, amit nem izokron struktúrák alkotnak a különbözô szinteken. 2.6.5.3.1 B EETHOVEN: ÖRÖMÓDA
Amikor a Beethoven dallamot közepes, percenként 78 negyedhang tempóban adják elô (minden egyes negyedhang 770 ms tartamú) a mérôütés a legalacsonyabb (azaz a legrövidebb) szint. A mérôütés szintje felett további két metrikus szervezôdés jön létre: a két mérôszakasznyi egységek szintje és a négy mérôszakasznyi egységek legmagasabb szintje, amelyek mindegyikének megkülönböztetô melodikus mintázata van. Minden mérôütés-pár egy kettôs (duple) metrumot hoz létre és mivel a négy mérôszakasznyi egységek a kettôs metrumok összefonódásából jönnek létre, hipermetrumnak tartják ôket a metrum magasabb szintje miatt. A legtöbb esetben a metrum magasabb szintû analógjaként definiálják a zeneelméletben, azaz a metrum-szint ütemhangsúlyos részeirôl azt mondják, hogy „hipermetrumként” funkcionálnak egy magasabb szinten és így tovább (lásd LERDAHL ÉS JACKENDOFF, 1983; LESTER , 1986; BENJAMIN , 1984; SCHACHTER, 1987; K RAMER, 1988; ROTHSTEIN, 1989; LONDON , 1990 és BROWER 1993). Azonban ha ezt a passzust percenként 138 negyedhangos sebességgel adták volna elô (minden egyes negyedhang 435 ms tartamú), metrikus-hierarchia érzetünk valószínûleg megváltozott volna. Formálisan a kapcsolatok szintrôl-szintre azonosak lennének mint azelôtt, de most a mérôütés-szint inkább középre és nem a hierarchia aljára kerülne és így csak egy strukturális szint lenne a mérôütés-szint felett (azaz nem lenne semmilyen hipermetrum szervezôdés), a negyedhangként jelzett hangokat pedig az aprózás-szinten hallanánk.
139
DANCZI CSABA LÁSZLÓ : A ZENEI 2.6.5.3.2 CSAJKOVSZKIJ
TÉR
HATODIK SZIMFÓNIA MÁSODIK TÉTEL
A Csajkovszkij tételben - mint sok más passzusban is - közbeesô aprózás szint van: az aprózás szint meglehetôsen szabadon mozoghat a metrikus hierarchián belül. Mivel a metrum mérôütés-szintje a referencia-szint, a retrospektív analitikus figyelem (JONES ÉS BOLTZ, 1989), az aprózásra irányítja a figyelmet. Ahelyett, hogy fenntartanánk az aprózás-szintet ott, ahol az nincs mindig jelen vagy nem emelkedik ki a zenei felszínbôl, feltételezhetô, hogy a hallgatók a metrikus hierarchia magasabb szintjein alakítanak ki begyakorlási mintázatokat és az aprózás alkalmi megnyilvánulásait váratlan eseményekként kezelik a kialakult mérôszakaszon belül. Az aprózás-szint szabadon változhat a szervezôdésen belül: a fôként triolák közé beszúrt alkalmi duolák (és fordítva) általában nem zavarják meg a metrumot. Azonban a metrikus hierarchia magasabb szintjei rosszul tûrik az ilyen szabadon változó és/vagy közbeesô struktúrákat. A Csajkovszkij zenében a 2 + 3 ütemszervezôdés világos érzete van jelen, amelyet a 2/4 és 3/4 ütemek folytonos váltakozásának tekinthetünk egy nagyobb, öt mérôütésnyi aggregátum érzetével. Így amint a lassabb Beethoven példában is, van egy metrum és egy hipermetrum szint. Azonban az 5/4-es zene különbözik az „Örömódától” két lényeges szempontból: bár a mérôütés- és hipermetrum-szintek Csajkovszkij zenéjében idôben egybeesnek, a közbeesô metrikus-szint nem. A hipermetrum-szint - bár megnyilvánul benne az alulról-felfelé kibontakozó tartam és hangmagasság-kontúr mintázat - további funkcióként szolgál fentrôl-lefelé garantálva a szabályosságot és ezzel a begyakorolhatóságot: idôbeli egybeesése tartalmazza az egyébként idôben nem egybeesô metrikus-szintet. Az is lehetséges, hogy a Csajkovszkij dallamot hármas és nem négyes metrikus mintázatnak kezeljük, kiiktatva az idôben nem egybeesô metrikus-szintet a metrikus hierarchiából. Ilyenkor egy sor öt mérôszakasznyi metrumot kapunk (azaz a hipermetrum-szint most metrum-szintként szolgál) közbeesô triola aprózással. Azonban ez az elemzés nem venné figyelembe a zene fontos invariáns struktúráját, ami ESSENS (1986) szerint az, hogy alacsony szintû prímszámokat (azaz ketteseket és hármasokat) használunk a metrikus hierarchia konstruálására.
140
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.6.5.3.3 B ERSTEIN, AMERIKA
A gyors artikulációk, amelyek a dallamot kezdik, azonnal kizárják a mérôütés-szintet - túl gyorsak ahhoz, hogy a preferált tempón belül essenek. A következô triola-mintázat azonnal mérôütés-szintnek tûnik. Kezdetben (azaz az elsô hat hang után) azt gondoljuk, hogy ez a passzus szabályos metrumban van hármas aprózással. De ahogy a lejegyzett ütem második fele kibontakozik negyedhangokban (és ugyanúgy a második ütemben) azt gyanítjuk, hogy kezdeti metrikus feltételezésünk hibás volt. A kezdeti triolák az aprózás és mérôütés világos érzetét váltják ki; a következô negyedhangok azonban nem illenek ebbe bele - túl hosszúak, hogy aprózások legyenek, ám nem elég hosszúak ahhoz, hogy mérôütések legyenek. A mérôszakaszoknak nem kell egyformának lenniük: a zenészek ezt a passzust „3+3+2+2+2” vagy a 6/8 és 3/4 váltakozásaként értelmezik. A dallam 6/8 és 3/4 váltakozásaként értelmezése egy módszer arra, hogy a nyugati lejegyzési rendszert használjuk a nem egyforma mérôszakasz-sorozatok értelmezésére. A passzus 6/8 és 3/4 váltakozásaként értelmezése nem megfelelô azonban, mivel nem veszi figyelembe azt, hogy a két metrikus egység egy nagyobb egészbe integrálódik. A passzust pontosabban és teljesebben jellemzi egy nagyobb, öt mérôütésbôl álló struktúra: két hosszú mérôszakaszt három rövidebb mérôszakasz követ (hosszú-hosszú-rövid-rövid-rövid). Ez - ahogy a 3/4-es mintázat is - olyan metrikus struktúra, amiben egy szint nem izokron. Ami a Berstein melódiát Csajkovszkijétôl megkülönbözteti, az a nem-izokron mérôütés-szint. A nem egyforma mérôszakaszok sorozata speciális problémát jelent, mivel a mérôütés-szint referencia-szintként mûködik a metrikus hierarchia konstruálásában. Márpedig egy nem-izokron szint hogyan mûködhet temporális „lehorgonyzásként” a metrikus hierarchia többi szintje számára? A válasz az, hogy az izokron aprózás-szint segítségével teszi ezt, mivel az aprózás-szint fennmarad a továbbiakban, nem úgy, mint Csajkovszkijnál. Az „Amerika” hallgatásakor a hallgató az aprózás-szintet tartja fenn a mérôütés-szint követésére. YEE, HOLLERAN ÉS JONES (1994) szerint zeneértô hallgatók képesek az aprózás fenntartására és használják is az interpolált aprózásokat a problematikus metrikus kontextusokban. Szerintük az aprózás interpolálódik, ha az egymást követô mérôszakaszok tartama túl hosszúra nyúlik. Bernstein melódiájánál az interpolált aprózások más célra szolgálnak: izokron alapvonalat szolgáltatnak, amire a metrikus hierarchia nemizokron szintjeit lehet konstruálni. A komplex metrumok tempói megfelelô gyorsaságúak ahhoz, hogy az aprózás szintet túl gyorssá tegyék ahhoz, hogy mérôütésnek kezeljük az aprózás-szintet és ezért a felette található nem-izokron szint funkcionál mérôütésként.
141
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.6.5.3.4 A METRIKUS SZINTEK KAPCSOLÓDÁSA London (1995) szerint a a zenei metrumhoz szükséges és elégséges feltételek egyszerû és komplex kontextusokban: 1. A kialakuló metrumhoz legalább egy további szervezôdési szint szükséges, azaz a metrum legalább két szintbôl áll: mérôütés és ütem (ahol az ütem a mérôütések valamilyen moduláris elrendezése). 2. A metrum viszonylag „vastag” vagy „vékony” a szintek száma alapján, ami szükséges alap periódusának meghatározásához (és így generálásához). A vastag metrumok extra szinteket követelnek meg (aprózás és/vagy hipermetrum szinteket), hogy metrikus struktúrájuk teljes meghatározását adják. London (1995) szerint a metrikus mintázat legmagasabb szintje mindig izokron. Habár lehetséges további metrikus-szintek létrehozása a minimális leíráson felül - ahogy a „lassú Beethoven” példában -, a további szintek redundánsak. 3. Olyan kontextusokban, amikben a mérôütés-szint izokron, az aprózás-szintnek nem kell folytonosnak lennie; elôbukkanhat és eltûnhet vagy hiányozhat teljesen. Ennek megfelelôen ilyen kontextusokban az aprózás szabadon változhat. 4. Ha a mérôütés-szint nem izokron, akkor az aprózás-szintnek kell izokronnak lennie. A hallgató fenn fogja tartani ezt a szintet akkor is, ha az nincs jelen a zenei szignálban, hogy stabilizálja és kövesse a mérôütésszint (és talán a magasabb szintek) nem-izokron mintázatát. 5. A komplex metrumok invariáns vonásaik „explicit meghatározását” igénylik a zenei felszín tartam és szervezôdés mintázataiban és ha kialakultak, csak különösen szûk határok között változhatnak. A szabályos metrumok nem követelnek meg ilyen explicit meghatározást és ezért nagyobb ritmikus és/vagy melodikus variációt tesznek lehetôvé.
142
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.6.6 STRUKTÚRA ÉS KIFEJEZÉS Az elôadásokban a metrikus idôzítések ritkán izokronok, inkább bizonyos fokú kifejezésbeli variáció figyelhetô meg rajtuk (lásd például GABRIELSSON, 1982; S LOBODA, 1983; CLARKE, 1985, 1989; SHAFFER , CLARKE ÉS TODD , 1985, valamint TODD, 1985). Azonban vannak olyan temporális mintázatok is, amiket kategorikusan különbözô tartamok alkotnak. Eric CLARKE (1987) kimutatta, hogy a ritmus-észlelés kategorikus percepió, kiegészítve FRAISSE (1956) és POVEL (1981) eredményeit, amik szerint a kis egész szám arányoknak elsôdlegessége van a ritmusok percepciójában és kognitív reprezentációjában. CLARKE (1987) szerint a ritmikus mintázatok észlelése egy metrikus kontextusban a kategorikus percepció bizonyos vonásait hordozza, köztük a hirtelen kategória-határokat és a nem-monoton megkülönböztetést. Amikor a hallgatókat arra kérik, hogy határozzák meg egy szekvencia utolsó két idô-intervallumát, a többértelmû tartam-arányokat (1:1 és 2:1 között) 2:1-ként kategorizálják hármas metrum kontextusában, míg ugyanezeket az arányokat 1:1-nek ítélik meg kettes metrum kontextusában. Egy diszkriminációs feladatban CLARKE (1987) nem-monoton diszkriminációs görbét fedezett fel maximumokkal a kategóriahatároknál. SCHULZE (1989) a metrikus kontextuson kívül is talált nem-monoton diszkciminációs görbéket, azonban ezek nem a klasszikus kategorikus percepció egyetlen maximumos görbéi voltak, hanem több maximumot is tartalmaztak. CLARKE (1987) kiváló kategóriák közötti diszkriminációt talált, sokkal erôsebbet, mint amit hagyományosan a kategorikus percepcióval kötnek össze (LIBERMAN ÉS MUNKATÁRSAI, 1957), ami arra utal, hogy ugyan perceptuális kategorizáció történik ritmikus kontextusban, azonban a jelenség komplexebb, mint amit hagyományosan „kategorikus percepciónak” neveznek. CLARKE (1988) szerint a zenében az akusztikus információ három különbözô típusú disztális eseményt határoz meg: (1) a hang konkrét forrását, (2) az absztrakt zenei struktúrát (például ritmus-struktúrát), valamint (3) a darab vagy stílus affektív tulajdonságait. CLARKE (1988) szerint a ritmikus struktúrát kategóriákban észleljük, amik kis egész-szám tartam-arányokon alapulnak. Hipotézise szerint a hallgató a tartam mintázatot elôször az alacsony-rendû egész-szám-arányok (például 1:1, 3:1, 1:1:2, 2:1:3) alapján kategorizálja, majd az „eltéréseket” (a kategorizáció után megmaradó információt; azaz a pontos arányoktól való eltérést) nem kategorikus jellegûnek ítéli, azaz „kifejezésnek”, „hangsúlynak”, vagy „rubatónak”. CLARKE (1988) szerint a hallgató ritmus-percepció közben az inger-mintázatot három „dimenzióban” értelmezi: (1) metrum - a taktusok kettes vagy hármas csoportosítása; (2) ritmikus kategória - egyenletes vagy egyenlôtlen tartamok; ha egyenlôtlen, akkor az aktuális arány a metrumtól függ; az ebbe bele nem illô arányok - még ha kis egész-szám-arányúak is - nem stabilak és így nem elkülönült kategóriák; (3) transzformáció - nem kategorikus adatok, amiket kifejezésnek vagy pontatlanságnak észlelünk. CLARKE (1988) kísérleti eredményeit elméleti kontextusba helyezi és két típusú ritmikus információt különböztet meg: (1) a passzus metrikus kategóriája, amit struktúrának és (2) eltérések a pontos metrumtól, amit kifejezésnek nevez. „A temporális információ struktúrára és kifejezésre osztása megoldja azt a látszólagos paradoxont, hogy kis egész számoknak megfelelô tartam-arányokat a legegyszerûbb észlelni és reprodukálni, miközben a valódi emberi produkciók nem felelnek meg ezeknek az egész-szám arányoknak” (31. oldal). DESAIN ÉS HONING (2002) szerint a kategorizáció az idô intervallumok sorozatának folytonos terét diszkrét, egész szám arányú szekvenciák szimbolikus területére képezi le. A specifikus zenei metrum elôhangolja a specifikus ritmikus mintázatok észlelését. CLARKE (1988) szerint a struktúra észlelése kategorikus, a kifejezés észlelése pedig folytonos percepció. Kísérlete elegánsan kimutatja, hogy a metrikusság a kategorikus percepció kritériumainak megfelel, azonban nincs hasonló empirikus bizonyítéka kiegészítô állítására, hogy a kifejezést folytonosan változónak észleljük. Neil T ODD (1988) metrikusan kapcsolt rubato modellje azt mutatja, hogy a metrumtól való eltérések sztereotipek, KRONMAN ÉS SUNDBERG (1988) szerint pedig a rallantando-k is sztereotipek. A jazz dobosok megkülönböztetik a „hot” vagy „sietôs” (push) dobosokat a „nyugis” (cool) vagy „késlekedô” (lag) dobosoktól a pontos metrumtól való eltérések alapján. Azaz könnyen lehet, hogy az értelmezô gesztusok diszkrétek és/vagy kategorikusan észlelhetôek - a metrikus kontextus percepciójától függetlenül. 143
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Különbözô formáiban a „struktúra/kifejezés”modell, amit Clarke vezetett be, a legáltalánosabb nézetté vált a zenei ritmusról. Intuitív értéke van részben azért, mert jól megfelel a nyugati zene hagyományos nézeteinek, azonban van néhány probléma a modellel. Az alapvetô (írott) zenei gesztusok és a gesztusok kifejezô vagy „értelmezô” transzformációja közötti különbségtevés kultúra-függô, lehet, hogy egyszerûen csak a nyugati zenemûvészetben szokássá vált zeneszerzô-elôadó munkamegosztásból származik. Nem minden elôadómûvészetre áll azonban ez a megkülönböztetés. Például az improvizáló táncosok nem alapvetô gesztusokban gondolkodnak, amelyeket aztán díszítenek vagy transzformálnak az értelmezô nüanszokkal. A legtöbb táncos a gesztust és az értelmezést elválaszthatatlannak és ekvivalensnek gondolja. Clarke különbségtevése a ”struktúra és kifejezés” között arra utal, hogy a metrikus kontextusnak nincs kifejezô minôsége, azaz az induló (egyszerû-dupla) és a gigue (összetett-dupla) nem különböznek zenei kifejezésük szempontjából. Egy másik probléma az, hogy a tempót kizárólag strukturálisnak képzeli el és nem kifejezô összetevônek; ami azt sugallja, hogy a disco-ütem lelassítása nem változtatja meg kifejezô tartalmát. A metrikus kontextus közvetlenül hozzájárul a kifejezô tartalomhoz: mondhatjuk egyértelmûen azt, hogy a zeneszerzô egy adott metrikus zsánert pusztán „strukturális” és nem „kifejezô” okokért választott? 2.6.6.1 MIKROIDÔZÍTÉS A metronomtól való apró idôzítési eltéréseket gyakran „tévedésnek” (KEIL, 1995), „motoros zajnak” vagy „pontatlanságnak” (RASCH, 1988) nevezik. Azonban ezek az eltérések gyakran információt hordoznak a zenei struktúráról. DRAKE ÉS PALMER (1993) szerint háromféle hangsúly-struktúra van: (1) ritmikus csoportosítás hangsúlyok, például a hosszabb hangot a ritmikus csoport végén és hangsúlyosnak észleljük („szünet”, ami elválasztja a csoportokat); (2) melodikus kontúr hangúlyok, amikor dallamfordulat vagy ugrás van a hangmagasság kontúrban; és (3) metrikus hangsúlyok, azaz „erôs mérôütések”. Számos klasszikus zongoraelôadás idôzítését tanulmányozva szisztematikus eltérést találtak a szigorú szabályosságtól az ilyen hangsúly-struktúráknak megfelelôen (DRAKE ÉS PALMER, 1993). Ritmikus csoportosítási hangsúly: az utolsó elem hangosabb, késlekedik és inkább staccato szólal meg; a csoporton belül crescendo játék; az artikulációk a hang-tartamokkal arányosak. Melodikus hangsúly: a dallamfordulatra esô esemény hangosabb és staccato szólal meg, a dallamfordulat vagy -ugrás elôtti esemény meghosszabbodik (azaz a melodikusan hangsúlyozott esemény késlekedik). Metrikus hangsúly: az erôsebb mérôütések hangosabbak, a metrikus ciklus utolsó mérôszakasza meghosszabbodik (azaz a hangsúlyos ütemrész késlekedik). Az erôsebb mérôütések kevésbé staccato szólalnak meg. Az idôzítés, intenzitás és tartam elôadásbeli variációi erôsítik a zenei struktúrát. DRAKE ÉS PALMER (1993) arra következtetett, hogy ezek az elôadásbeli variációk segítik a hallgatókat a zenei szekvenciák szegmentálásában, vagyis a hangsúly-struktúrák szerepe az, hogy a zenei szekvenciát kisebb, kezelhetôbb tömbökre bontsák. DRAKE ÉS PALMER (1993) szerint a ritmikus csoportosítás hangsúlyai felülírják a melodikus és a metrikus hangsúlyokat amikor a zene ellentmondó hangsúly-értelmezéseket tesz lehetôvé. Hogy a metrikus hangsúlyok felülíródnak, az nem meglepô, mivel várható, hogy a kifejezô idôzítés felbontja az ismétlôdô metrikus hangsúlyok szabályosságát. Azonban az a tény, hogy a ritmikus csoportosítás hatása elnyomja a melodikus hangsúly hatását, azt sugallja, hogy a ritmusnak elsôdlegessége van a melódiával szemben a produkcióban és az észlelésben is. A kifejezô variációk fokozatos változást, azaz rugalmas, folytonos variabilitást adnak. RASCH (1988) a zenészek között mért ingerkezdetek közötti különbségek statisztikai elemzését végezte el, zenekari elôadások felvételei alapján. A vonós trióban a hegedû hangja 5-10 ms-al siet, a cselló ezután következik, a viola középhangja pedig 5-10 ms-al késik. Nem világos, hogy milyen pontosak ezek az eredmények azonban, mivel minden egyes hangszer kb. 35 ms átlagos varianciával rendelkezett. Az európai klasszikus zene elôadásában a mérôszakaszokat valóban gyakran meghosszabbítják vagy rövidítik az elôadók. Azonban a gyenge és erôs mérôütésekbôl álló metrikus szervezôdés nem alkalmas a nyugat-afrikai vagy afro-amerikai zenék leírásárare, mivel ezekben a kontextusokban szó sincs az elôadás variációiban kifejezett metrikus hangsúlyról. BILMES (1993) a Los Muñequitos de Matanzas - egy afro-kubai rumba együttes - felvételén végzett idôzítés-elemzést. A percenként 110 mérôütéses átlagsebességû (a tizenhatod hang kb. 135 ms) zene 144
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
elôadásában a quinto és a segundo (vezetô és közép konga-dob) is általában 30 ms-al vezet. A tumbao (mély konga-dob) majdnem olyan gyakran késik, mint ahányszor siet. Ilyen esetekben a mérôütés pontos idejét nem határozza meg a három hangszeres játékos által felállított norma - ahogy a vonós trió esetében tette - a mérôütést egy referencia-hangszer adja, ebben az esetben a clave vagy a guagua. Ezért lehetséges, hogy mindhárom hangszer a nominális taktus elôtt legyen, nem úgy, mint a vonós-trió esetében. A mikro-idôzítési variációk gyakoriság-elemzése alapján BILMES (1993) azt állítja, hogy a mikro-idôzítési variációk nem véletlenszerûek. 2.6.6.2 I DÔZÍTÉS A NYUGAT-AFRIKAI ÜTÔHANGSZERES ZENÉBEN Az idôzítés a tradicionális nyugat-afrikai dob-együttes zenéjében összetett kérdés, számos tényezôvel. Ilyen tényezô a prozódia. Sok dob-mintázat imitálja a beszéd ritmusát és tónusát (JONES, 1959; LOCKE ÉS AGBELI, 1980; NKETIA, 1963, 1975). Ám a beszéd-alapú mintázatok általában ritmikusan összeegyeztethetôek a metronomikus szabályosság kialakulásával az együttes elôadásában (AGAWU, 1995; LOCKE ÉS AGBELI, 1980). Egy másik tényezô a motoros struktúra, mivel gyakorlatilag az összes hagyományos ritmikus mintázatnak lényegi motoros összetevôje van: nem csak az elôadó kézmozgásában, hanem a táncosok asszociált mozgás-mintázataiban is (AGAWU, 1995; N KETIA, 1975). Sok tanulmány jelzi, hogy az afrikai zenészek által létrehozott ritmikus-mintázatok különbözô mechanizmusok és elképzelések alapján mûködnek, mint a nyugati zenészek által használtak (pl. AGAWU, 1995; CHERNOFF, 1979; JONES, 1959; KOETTING, 1978; L OCKE, 1979; NKETIA, 1975; PANTALEONI , 1972). Az ilyen tanulmányok egyetértenek abban, hogy az (egyetlen) metrum és az annak megfelelô alapvetô mérôütés fogalma félrevezetô. A nyugat-afrikai dob-együttes zenéje a ritmus többsíkú megközelítése: a részek egy alap idôvonalhoz kapcsolódnak, amit gyakran a harang (bell) visz; ezért az idôvonalat általában harang-mintázatnak nevezik. A harang-mintázatok majdnem mindig tovább oszthatóak szabályos mérôütésekre (rendszerint 8, 12 vagy 16-ra). Az idôvonalak vagy harang-mintázatok aszimmetrikus konstrukciók és szinkopáltnak hangzanak a nyugati fülekben. A tradicionális nyugat-afrikai dob-együttesben, ami egy vagy több harangból (bell), csörgôkbôl (rattle) és dobokból (drum) áll, néhány hangszer általában erôsíti az alapul szolgáló gyors mérôütést, mások a harang-mintázat különbözô részeit dolgozzák ki, megint mások pedig a ritmusok - és talán metrumok összetett rétegzôdését adják. Gyakran hangoztatott alapelv az, hogy minden rész arra szolgál, hogy a harangmintázattal kapcsolatban mûködjön (JONES , 1959; KOETTING, 1978; L OCKE, 1979; PRESSING , 1983). Különbözô mintázatok kombinálódnak, hogy gazdagon rétegzett ritmikus textúrákat alkossanak, amelyek idôben aszimmetrikusak. Bár a szabályos lüktetés gyakori és funkcionális a zenében, a hagyományos kulturális szemlélet alapján ez mellékes az aszimmetrikus elrendezés kiemelkedô jelentôségéhez képest (JONES , 1959; KOETTING, 1978; LOCKE , 1979; PRESSING , 1983). A tradicionális afrikai nézet tehát erôs ellentétben áll a szabályosan felosztó (szabályos lüktetésû) nyugati alapelvekkel. Az afrikai idôvonal aszimmetriája nem redukálható tisztán az additív metrumra, ahogyan ezt a kifejezést használják az arab, indiai és dél európai zenében, vagy a XX. századi kompozíciókban (például Bartók Béla, Messiaen), mivel ezek a zenék nem párhuzamos izokron mérôütés-sorozatokon alapulnak, amik szabályos additív részeket alkotnak, a nyugat-afrikai zenében nagyobb számú - 6, 8, 12 vagy 24 - periodikus mérôütés szerepel.
145
DANCZI CSABA LÁSZLÓ : A ZENEI 2.6.6.3 TEMPORÁLIS
TÉR
FLUKTUÁCIÓK A ZENEI ELÔADÁSBAN
A zenei elôadás komplex idôzítése gyakran a zenész kísérletét tükrözi arra, hogy a zenei struktúra egy értelmezését adja át hallgatóinak. A nyugati tonális zenére jellemzô strukturális flexibilitás lehetôvé teszi, hogy az elôadók a zenei darabokat különbözôképpen értelmezzék. Az elôadók a zenei struktúra értelmezését a frekvencia, idôzítés, intenzitás és hangszín kifejezô variációival sugallják (vesd össze CLARKE, 1988; NAKAMURA, 1987; PALMER, 1997; REPP, 1992; SLOBODA , 1983). Különbözô elôadók ugyanazt a zenedarabot különbözô frázis-struktúrának megfelelôen értelmezhetik (PALMER, 1989) és az elôadás lelassul vagy szünetet tart a frázis-végzôdéseknek szánt eseményeknél, hasonlóan a beszéd frázis-záró meghosszabbodásához. A hallgatókat befolyásolják a temporális fluktuációk: a frázis-végzôdés meghosszabbodása befolyásolja a frázis-struktúra megítélését, tehát a jellemzô temporális fluktuációk információt hordoznak (PALMER, 1988). A zenei elôadás temporális fluktuációi arra szolgálnak, hogy strukturális kapcsolatokat fejezzenek ki, például frázis-struktúrát (CLARKE, 1982; GABRIELSSON , 1974). A zenei elôadás temporális fluktuációi jelölhetik a zene különbözô szólamainak viszonylagos fontosságát is. Az olyan zenei hangszerek, mint a zongora, kevés hangszín lehetôséggel szolgálnak az egyidôben elôforduló hangok (szólamok) megkülönböztetésére, ezért annak meghatározása, hogy melyik hang tartozik ugyanahhoz a szólamhoz, nehéz. A legtöbb nyugati tonális zene több idôben egybeesô szólamot tartalmaz és az elôadóknak van némi szabadságuk, hogy értelmezzék a szólamok viszonylagos fontosságát. Az elôadók általában temporális vagy intenzitás-fluktuációval hangsúlyozzák ki a melódiát vagy a legfontosabb szólamot (RANDEL, 1986). Zongora-elôadók korai felvételein a zongoristák az akkord (egyidejûként jelölt) hangjait általában egészen a hang-kezdetek közötti 70 ms aszinkróniáig játszották (HENDERSON, 1936; VERNON, 1936). PALMER (1996) zongoristák lejegyzett dallam-értelmezését (a legfontosabb szólamot kellett megjelölni) összehasonlította elôadásuk idôzítési mintázatával. A dallamként értelmezett események hangosabbak voltak és megelôzték az akkord többi összetevôjét 20-50 ms-al (amit dallam-sietésnek neveztek el). Bár az intenzitás és a temporális kulcsingerek relatív fontossága a dallam-észlelésben nem ismert (lásd még REPP, 1996), kizárólag temporális kulcsingerek is befolyásolják a dallam-intenciók észlelését néhány elôadásban (PALMER, 1996).
146
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.6.6.4 ASZINKRÓNIA RASCH (1988) beszámol egy korábbi, 1977-es kísérletérôl, amiben az ingerkezdet-aszinkrónia hatását vizsgálta a kvázi-egyidejû hangok észlelésére. Annak a határa, hogy észleljük két kvázi-szinkron hang közül a felsôt „drasztikusan lecsökkenthetô volt (0—20 dB-rôl kb. -60 dB-re) egy - mondjuk 30 ms-os ingerkezdet-különbséggel. Ilyenkor az észlelési határ nagyban független volt a nem teporális tényezôktôl... Szupra-határ helyzetekben az aszinkrónia hozzájárul ahhoz, hogy az összetétel több hangként szóljon” (RASH, 1988, 80. oldal). Olyan zenei helyzetben, ahol összeolvadásra van szükség, az aszinkrónia nem kívánatos. Azonban a ritmikus aszinkrónia segíti azt, hogy sok hangszínt - és a zeneészlelés ökológiai megközelítése szerint a hangszínek mögött emberi testek sokaságát (GIBSON, 1979; SHOVE ÉS REPP, 1995) - észleljünk, azaz a ritmikus aszinkrónia hozzájárul a heterogén hangzáshoz. Biztosak lehetünk abban, hogy a pontos szinkron lehetetlen csoportok esetében, sôt még olyankor sem létezik, ha a különbözô hangokat egyetlen ember játsza, mint a modern dobos. Az idôzítés variációi lehetôvé teszik a hangok által elfedett hangszer számára, hogy a figyelmet magára vonja. Egészen az automata gépek feltalálásáig az emberi fület nem szembesítették az embertelen ritmikus precizitással: az emberi test temporális korlátainak megjelenése a hangzásban általában kellemes, míg az embertelen ritmikus szabályosság kellemetlen hangzású. Alapjában véve a kifejezô mikro-idôzítés a szabályosságtól való eltérés és így megkönnyebbüléssel vesszük észre a szabályos háttérben. GIBSON (1975) szerint perceptuális rendszereink a környezet variánsaira és invariánsaira hangolódtak és a változást kódolják. A vibrato vagy trilla például figyelmünket egy adott hangszerre irányítja a máskülönben összeolvadó zenekari textúrában. Egyetlen hangmagasság mikro-variációja elég ahhoz, hogy a hang kiemelkedjen az auditoros jelenetbôl. 2.6.6.5 SWING A swing kifejezést, ami az afro-amerikai kultúrára jellemzô, a XX. század elsô felének jazz-zenéjére használják. A swing egy olyan struktúra, ami a fô mérôütés módosított kettes vagy hármas aprózása, avagy egyidôben mindkettô. Mint kettes aprózás a mérôszakasz intervallumát két egyenlôtlen részre osztja, amiben az elsô rész valamivel hosszabb. Idônként triolával jelölik, amiben egy negyedhangot egy nyolcadhang követ, de ez eltúlozza a tipikus swing-arányt, ami rendszerint a kettes és hármas aprózás között van és erôsen tempó-függô (többnyire kisebb gyors tempóknál és nagyobb lassúaknál). A zenészeknek preferált arányai és módszerei vannak manipulálására, ez alkotja az egyéni hangot és ritmikusérzéket, azaz a zenei személyiséget. FRAISSE (1982) tanulmányozta a zeneileg képzett és képzetlen kísérleti alanyok képességét, hogy különbözô komplexitású ritmikus mintázatokat reprodukáljanak. Az „aritmikus” szekvenciák - tetszôleges kapcsolatokkal az idô-intervallumok között - okozták a legtöbb nehézséget. Szabályosabb ritmusok esetén a kíséleti alanyok általában leegyszerûsítették az intervallumok közötti arányokat, majdnem mindig két kategóriát reprodukáltak hosszú (400-800 ms) és rövid (200-400 ms) intervallumokkal. Az emberek könnyebben észlelik az olyan ritmusokat, amelyekben csupán két intervallum-hossz van, nagyjából 2:1 arányban. Az elôadásban vagy „preferált arányként” ez az arány azonban kisebb - közelebb áll a swing-hez körülbelül 1,75:1 (kb. 57%). Az intervallum egyenlôtlen felosztása elôsegíti a magasabb-szintû ritmikus struktúra észlelését. A swing sugallja a magasabb-szintû hierarchikus szervezôdést. A swingelt hangok közül az elsô meghosszabbodása a mérôszakasz tartam-hangsúlyát hozza létre. A zenei gyakorlatban gyakran némi intenzitás-hangsúlyt adnak a második hangnak (talán hogy kompenzálják rövidebb tartamát).
147
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.6.6.6 A METRUM KULCSINGEREI Hogy milyen kulcsingerek jelzik a zenei elôadásokban a metrikus struktúrát? Habár számos kulcsingernek van valamilyen kapcsolata a metrummal, nincs egyetlen kulcsinger, amely jelezné a metrumot. A dallam-sietés általában egybeesik a metrummal; a zongoristák nagyobb aszinkróniával (a dallam megelôzi a többi hangeseményt) játszanak az erôs mérôütéseken, mint a gyengéken, begyakorolt és a gyakorlatlan elôadásokban egyaránt (PALMER, 1989, 1996). Az elôadók a metrumot az esemény-sûrûség vagy a tartam variációival jelzik (SHAFFER, C LARKE ÉS TODD , 1985; SLOBODA, 1983). Azonban azok a kulcsingerek, amelyek leginkább jelzik a metrumot, változhatnak a zenei kontextustól függôen. DRAKE ÉS PALMER (1993) megvizsgálta a metrikus, a melodikus és a ritmikus csoportosítási struktúrák kulcsingereit egyszerû dallamok és komp-lex, többszólamú zene zongora-elôadásaiban. A metrikus hangsúlyokat és a ritmikus csoportokat (rövid és hosszú tartamok csoportjai) az intenzitás jelezte erôs mérôütésekkel és hosszú lejegyzett tartamokkal, amiket hangosabban adtak elô, mint a többi eseményt. Azonban az elôadás fontos mérôütéseknél használt kulcsingerei változtak különbözô zenei kontextusokban, vagyis bizonyos kontextusokban az elôadás kulcsingerei önmagukban nem magyarázzák a hallgatók metrikus szabályosság-észlelését. 2.6.6.6.1 PERCEPTUÁLIS KULCSINGEREK A ZENEI
METRUM ÉSZLELÉSÉHEZ
A hallgatók több temporális periodicitást is észlelnek a komplex auditoros szekvenciákban (JONES ÉS YEE, 1997; PALMER ÉS KRUMHANSL, 1990; P OVEL, 1981). Ahhoz, hogy egy adott metrikus szint megvalósuljon egy zenei szekvenciában, szükséges, hogy elegendô számú egymást követô mérôütés szólaljon meg ahhoz, hogy megvalósítsa ezt a periodicitást. A zenei kompozíciók statisztikai elemzése azt jelzi, hogy a zeneszerzôk változtatják az események gyakoriságát a különbözô metrikus szinteken (PALMER ÉS KRUMHANSL, 1990; PALMER , 1996), ami elegendô információt ad a metrumok megkülönböztetéséhez (BROWN, 1992). A zenei szekvenciák perceptuális kulcsingereket tartalmaznak többszörös temporális periodicitásokhoz, amelyeket egyidejûleg észlelünk a ritmus-észlelés során. Az egyik probléma, amivel a metrum-észlelés modelljei szembesülnek annak meghatározása, hogy mely zenei események jelzik a metrikus hangsúlyokat. LONGUET-HIGGINS ÉS L EE (1982) modellje feltételezi, hogy a hosszú tartamú események nagyobb metrikus egységeket jeleznek, mivel perceptuálisan kiemelkedôbbbek, mint a rövid tartamú események. Modelljükben a hosszabb tartamok általában magasabb metrikus szintet jeleznek, mint a rövid tartamok. A komplexebb metrikus struktúrákban azonban a hosszú tartamok bárhová kerülhetnek a metrikus mintázaton belül - kezdeti, közbülsô, vagy záró helyre is. A helyzet flexibilitása ellene szól LONGUET-HIGGINS ÉS LEE (1982), P OVEL ÉS E SSENS (1985), LERDAHL ÉS J ACKENDOFF (1983), BENJAMIN (1984) és BERRY (1985) hipotéziseinek, amik a hosszabb tartamokat a metrikus hangsúllyal kötik össze (azaz a hosszú tartamok a hangsúlyos ütemrészek jelölôi, ha minden más egyenlô). A szomszédaiknál hangosabb vagy hosszabb tartamú eseményeket valóban hangsúlyosabbnak észleljük (WOODROW, 1932). Azonban a tartam és az intenzitás kulcsingereket a zenei kompozícióban és az elôadásban is befolyásolja a metrumon kívül még sok más tényezô is, köztük a frázis-struktúra, a dallamfontosság és az artikuláció (NAKAMURA , 1987; PALMER , 1988; SLOBODA , 1983). A metrum akusztikus kulcsingerei gyakran többértelmûek, interaktívak, vagy egyszerûen nem is léteznek; a hallgatók mégis meg tudják határozni a metrumot.
148
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.7 I DÔZÍTÉSI MODELLEK Több modellt is kifejlesztettek az emberi mozgás idôzítésének magyarázatára, különösen a poliritmusok produkálására. WING ÉS KRISTOFFERSON (1973a, b) egy két folyamatból álló (kétszintû) modellt javasolt az ismétlôdô ritmus egy kézzel történô kopogására. A modell azon az elképzelésen alapul, hogy a periodikus reakciótól való eltérések a kopogásban egy hipotetikus óraszerkezet pontatlanságából származnak, valamint egy temporális „zajból” az óra által elindított reakciók végrehajtásában. Az óra és a motoros folyamatok megkülönböztethetôek egymástól, ha a kopogási periódust változtatjuk. Az óra variabilitása növekszik a kopogás növekvô periódusával, míg a motoros variancia független a tempótól (TURVEY, SCHMIDT, ÉS ROSENBLUM , 1989; W ING, 1980). VORBERG ÉS HAMBUCH (1984) továbbfejlesztette Wing és Kristofferson két-folyamat modelljét olyan szekvenciákra, amelyek egyenlôtlen intervallumokból állnak és két kézzel egyidôben hozzák ôket létre. A modellben egyetlen központi idôzítô-rendszer generál motoros parancsokat, amiket szimultán küld a bal és a jobb kéz motoros alrendszerébe. Ahogy a Wing és Kristofferson modellben is, késés van a parancsok generálása és a megfelelô motoros végrehajtás között. Modelljük alapján Vorberg és Hambuch arra próbált választ adni, hogy a ritmus produkciója szeriálisan vagy hierarchikusan szervezôdik-e. Eredményeik szerint az egyenlôtlen intervallum-mintázatok több független órát igényelnek, amik hierarchikusan szervezôdnek és képesek egymástól függetlenül mûködni egy szabályos kognitív óra szinkronja alapján. Szerintük hierarchikus idôzítési mechanizmusok kontrolálják az egyenlôtlen idô intervallumú ritmusok produkcióját, azonban izokron ritmusok esetében egyszerû szeriális idôzítési struktúrát használunk (VORBERG ÉS HAMBUCH, 1978). HELMUTH ÉS IVRY (1996) összehasonlította az egykezes és a kétkezes kopogást. Megfigyeléseik szerint az egyes ujjak temporális variabilitása lecsökkent a kétkezes helyzetben. Amikor Wing-Kristoffersonelemzést (WING ÉS KRISTOFFERSON, 1973a, b) használtak, a javulás a variabilitás óra-összetevôjére korlátozódott. A kutatók ezt úgy értelmezték, hogy független órák szolgálják ki a két ujjat és az óra szignálok átlagolódnak a mozgásindítási idô meghatározásához. JAGACINSKI, MARSHBURN, KLAPP ÉS JONES (1988) zeneileg képzett kísérleti alanyokat kért, hogy az egyik oldalon kettôs, a másik oldalon hármas aprózású poliritmust folytassanak (két kézzel). A poliritmusokat két különbözô hangmagasságú hanggal mutatták be. Az egyik csoport tagjai szoros hangmagasságbeli közelségben hallották a hangokat, amivel integrált perceptuális szervezôdést sugalltak. A másik csoport tagjai olyan hangokat hallottak, amelyek hangmagasságban távol voltak, ami láncokra szakadt perceptuális szervezôdést sugallt. A kopogások közötti intervallumok kovariancia-elemzése szerint a kísérleti alanyok integrált motoros szervezôdést használnak. Azok a kísérleti alanyok, akik olyan hangokat hallottak, amelyek az integrált perceptuális szervezést sugallták, kisebb variabilitással teljesítettek, mint azok, akik olyan hangokat hallottak, amelyek láncokra szakadt észlelést sugalltak. A motoros szervezôdés integrált multiplikatív hierarchikus modelljét jobbnak találták a szerális modellnél és a független hierarchikus modellnél. SUMMERS ÉS MUNKATÁRSAI (1996) bizonyítékot talált az integrált motoros szervezôdésre egyszerû és összetettebb poliritmusok elôadásában. PETERS ÉS SCHWARTZ (1989) kimutatta, hogy két izokron ritmus elôadásában a bal kéz a jobb kéz megelôzô mozgásából kapja kulcsingerét és nem saját mozgásából. DEUTSCH (1983) is arra következtetett, hogy a poliritmusok produkálásakor az elôadó a mintázat integrált reprezentációját hozza létre és nem két külön párhuzamos láncot, mivel az elôadás pontossága fordítottan 149
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
arányos a mintázat komplexitásával. SUMMERS ÉS MUNKATÁRSAI (1993) úgy találták, hogy sem a kiterjedt tapasztalat, sem a két kéz mintázatának független tanulása nem indukálja a párhuzamos szervezôdést (SUMMERS ÉS KENNEDY, 1992). SUMMERS ÉS MUNKATÁRSAI (1993) poliritmus-produkciós modelljében a gyors-kéz reakciókat egy belsô óra indítja, míg a lassú-kéz reakciók az óra és egy számláló alapján indulnak, ami a gyors-kéz reakciókat számolja. Számos predikciójukat megerôsítették a kísérleti eredmények: növekszik a hibák száma, ahogy a poliritmusok komplexebbé válnak, gyors idôzítési variabilitás van a lassú-kéz reakciókban, míg a gyors-kéz reakciók viszonylag stabilak maradnak. PRESSING ÉS MUNKATÁRSAI (1996) tovább fejlesztette a modellt olyan folyamatokra, amik szerepet játszanak két kézzel elôadott 4:3 poliritmusokban. Modelljükben egy központi kognitív óra játszik szerepet, ami közvetlenül indítja az egyik ritmikus lánc - amit az egyik kéz (háttér) játszik - motoros késleltetési folyamatait. A másik ritmikus lánc (figura) motoros késleltetései - amit a másik kéz játszik - kulcsingerét a közvetlenül megelôzô másik (háttér) lánc órájától kapja egy közvetítô „szub-pulzus” folyamaton keresztül. A kognitív óráknak nem kell szabályos pulzusok láncát produkálnia, podukálhatnak aszimmetrikus - feltehetôen additív - pulzusokat is.
150
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
2.7.1 METRUM -ÉSZLELÉSI MODELLEK L ARGE (1994) kifejlesztett egy meggyôzô modellt a taktus percepcióra, amit késôbb (1997) a metrum észlelésére általánosított. A mérôütés-észlelést egy koordinációs mintázatként képzelte el, ami a belsôleg generált periodikus folyamat (vagy ön-fenntartó oszcillátor) és a komplex külsô ritmus periodicitása között keletkezik (L ARGE, 1994; LARGE ÉS KOLEN, 1994). A hallgatót és a zenei bemenetet egyetlen dinamikus rendszerként képzelte el, ami a külsô (meghajtó) ritmusból és a belsô oszcillátorból áll; a dinamikus rendszer attraktor állapotai pedig a begyakorolt példák. Feltételezi, hogy a belsô oszcillátor dinamikája adaptálódik a külsô periodicitáshoz és ezáltal az egyszerû mérôütés-észlelés alapján az emberi teljesítményekben elôforduló finom, szisztematikus idôzítési eltéréseket is modellezni tudja. L ARGE (1996) szerint az oszcillátorok hálózatai hierarchikusan kombinálódnak, hogy a meghajtó szignál több periodicitására reagáljanak. A begyakorlás hierarchiáival az alapvetô mérôütés frekvencia és alharmonikusai (a lassúbb periodicitások) különbözô fázis-relációkkal koordinálódnak. Míg a modell meggyôzô eredményeket szolgáltat kifejezô tempo-variációk esetén, nem veszi figyelembe perceptuális berendezésünk egyik lényeges vonását, ami alapján megkülönböztetjük a mérôütést és a metrumot. A mérôütés idô-tartománya az echoikus memória területére esik, míg a metrum nagyobb idôskálája a rövid-távú memória idô-tartománya (BROWER , 1993). TODD (1998) ritmus és idôzítés elmélete szerint a ritmikus szekvenciák észlelése és produkciója, ami mindenféle emberi kommunikációra jellemzô, a bal félteke még általánosabb szenzo-motoros szekvenciáló képességének (KIMURA, 1993) a része. A komputációs modell (TODD ÉS MUNKATÁRSAI, 1998) szimulálja azokat a fôbb agyi struktúrákat, amelyek szerepet játszanak a szekvenciák észlelésében: az auditoros kérget (a szignál intenzitás-spektrumát komputálja), a posterior parietális kérget (PPC, mozgási cél auditoros koordinátákban), a kisagyat (a motoros kimeneti rendszer elôre-csatolása), a motoros kérget (motoros parancs) és a motoros kimeneti rendszert. TODD (1998) szerint a zenében és a beszédben szerepet játszó temporális szekvencia pontos megfelelôje a testi mozgás vizuális irányításának. A szekvenciák észlelése a szekvenciát életre keltô mozdulatok követésének aktív folyamata. Az auditoros kéreg a temporális információt az auditoros képzet tér-idô intenzitás-spektrumaként reprezentálja. A követést a motoros kimeneti rendszer belsô modellje, vagy motoros képzete mediálja, amirôl úgy hiszik, hogy a kisagy képviseli, ami komputációsan mint ‚Smith Predictor’ modellezhetô (MIALL ÉS MUNKATÁRSAI, 1993). A motoros képzetet egy szenzo-motoros képzet hajtja meg, ami a posterior parietális kéreg (PPC) funkciója (STEIN , 1995), amely az auditoros kéregtôl bemeneteket kap, a kisaggyal pedig kölcsönös kapcsolatban van. A modell hangmintákat vételez és szinkronizál egy egyszerû dinamikus rendszert kimenetként. TODD ÉS MUNKATÁRSAI (1999) tovább fejlesztették a ritmus, idôészlelés és mérôütés-indukció szenzomotoros elméletét. Központi feltevésük az, hogy a mérôütés-indukció nem passzív folyamat, hanem szenzorosan vezérelt akció, amiben szerepet játszik az ezzel járó összes szenzoros és motoros összetevô, vagyis az idegrendszer és a muszkulo-szkeletális rendszer nagyrésze. A rendszer magasabb, gerinc feletti szintjei (‚a kontrol’) még olyankor is aktívak, amikor a muszkulo-szkeletális rendszer (‚az üzem’ a kontrol-elmélet terminológiájában) nem aktiválódik, azaz nincs motoros kimenet. A mérôütés-indukció a muszkulo-szkeletális rendszer belsô reprezentációján és annak dinamikus tulajdonságain alapul, amire a ‚kontrolnak’ van szüksége ‚visszacsatolási’ modellként. A szenzoros rendszerek interakciója a temporális információt a szenzoros képzet és a motoros rendszer energia-spektrumával fejezi ki, aminek bizonyos természetes frekvenciái vannak. Az elméletet komputációs modellként dolgozták ki, ami hang-szignálokat fogad bemenetként, majd szinkronizál egy lokomóciós mozgást, hogy szimulálja a mérôütés-indukciót. Az idôzítési viselkedés legtöbb elméletének központi fogalma a belsô óra. TODD (2000) egy alternatív magyarázatot ad az idôzítésre, ami a temporális reprezentáció szenzo-motoros elméletén alapul. Az óra egy aktív mechanizmus - Todd szûrôje azonban passzívan reagál a külsô ingerekre. Todd szerint a vizuális és az auditoros kéreg olyan receptív mezôket tartalmaz, amelyek temporális szûrôként mûködnek. A temporális receptív mezôk teljes populációjának reakciója a temporális gyakoriságok tartományában intenzitás spektrum, ami valamiféle szenzoros memóriaként képzelhetô el. Lehetôvé teszi az idôtartam-összehasonlítás és a betöltött intervallum illúzió modellezését valamint az idôtartam-megkülönböztetés bejósolását a különbözô ingerek szenzoros-memória képzeteinek a korrelációjával. 151
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Mivel a temporális követés szenzorosan irányított akció, a szinkronizáció modellezhetô úgy, hogy a szenzoros memória-képzet kontrolálja a muszkulo-szkeletális rendszert. Ez a modell folytatja viselkedését ha ‚hallja’ magát úgy, hogy visszacsatol egy ‚kopogást’ a szenzoros rendszerbe. Todd szerint nem „belsô óra”, hanem a külsô inger és a motoros-környezet belsô modelljei vezérlik a ritmusészlelést. TODD ÉS MUNKATÁRSAI (2000) elsô kísérletükben 160 zenei példát - különbözô ritmikus struktúrával és tempóval - mutattak be a kísérleti alanyoknak és a komputációs modellnek. A modell világos mérôütéssebesség reakciókat produkált az esetek 70 %-ában. A modell mérôütés-sebessége jól megfelelt a kísérleti alanyok mérôütés-sebességének. A második kísérletben 20 kísérleti alany viselkedésén vizsgálták - J.S. Bach Das Wohl-tempererierte Klavier-jének 48 fúga témájával - a modell-paraméterek (köztük a preferált tempó) hatását. Az eredmények szerint az emberi viselkedés csak egy preferált-tempó mechanizmussal magyarázható, a modell-paraméterek pedig megfelelô értelmezést adnak számos emberi teljesítményre. TODD ÉS MUNKATÁRSAINAK (1998) komputációs modellje figyelembe veszi a test természetes biomechanikus frekvenciáit, valamint az auditoros rendszer temporális jellemzôit, a mérôütés indukcióját pedig aktív és nem passzív folyamatnak tekinti. A hibája az, hogy túlhangsúlyozza a szenzori-motoros (testi) összetevôt és nem magyarázza meg azt, hogy a tanulás támogathatja vagy akár felül is írhatja ezt az összetevôt. Az egyetlen tanulás a modellben a szenzoros rendszereket a test dinamikájára, a motoros-kontrol rendszereket pedig a fizikai környezet temporális-mozgási tulajdonságaira hangolja. Azonban ahogy elkezdôdik a zene, tudjuk, hogy a zenei észlelés több, mint fizikai és nyers szenzoros bemenet. REPP (2000) szinkronizált-kopogás kísérletében a hallgatók motoros kompenzációját vizsgálta egyetlen hangkezdet-eltolódásra. A többi idôzítési eltéréssel (fázis eltolódások vagy tempo változások) szemben egyetlen hangkezdet-eltolódás kompenzálása maladaptív, mivel csökkenti a szinkronizáció pontosságát. A résztvevôket instruálta, hogy ne reagáljanak semmilyen észlelt eltérésre. Mindazonáltal a kopogások idôzítésében kompenzációs eltolódásokat talált - fázisban és ellen-fázisban kopogásnál is - attól függetlenül, hogy a hangkezdet-eltolódás detektálható volt vagy sem és még olyankor is, amikor a hangkezdet-eltolódás explicit módon meg lett jelölve és a várt helyen fordult elô. A kopenzáció mértéke növekedett a hangkezdet-eltolódás növekedésével egészen kb. a detekciós határig, aztán megállt egy szinten, azaz a szupra-liminális hangkezdet-eltolódás kompenzációja jelentôsen elnyomható, de nem teljesen. Aszimmetriát figyelt meg a sietô és a késô hangkezdetek kompenzálásában. . A hallgatók tartam-kategória észlelését egy auditoros szekvenciában befolyásolja a megalapozott metrum: ugyanaz az auditoros szekvencia értelmezhetô különbözô ritmikus mintázatként, ha különbözô metrikus kontextusokban mutatják be (CLARKE, 1987; PALMER ÉS KRUMHANSL , 1990). LARGE ÉS PALMER (2002) metrum-észlelési modelljében néhány belsô oszcillátor mûködik a metrikus hierarchia szintjeinek nagyjából megfelelô periódusokkal. Amikor a zenei ritmusok meghajtják ôket, az ilyen oszcillátorok fáziszárnak a külsô zenei eseményekhez. Elôzô kísérletek kimutatták, hogy az ilyen elrendezés flexibilitást ad a temporálisan fluktuáló ritmusok követéséhez (L ARGE ÉS KOLEN, 1994; LARGE, 1996), miközben lehetôvé teszi a temporális eltérések megkülönböztetését is (L ARGE ÉS JONES, 1999). LARGE (2000a) metrum-észlelési modelljében a zenei szekvencia egy mintázat-formáló dinamikus rendszer bemenete. LARGE ÉS PALMER (2002) modelljének a bemenete zenei darabok temporálisan szabályos (objektíven izokron taktusokkal) felvétele volt. A ritmikus ingerlés hatására a komputációs modell elkezd önfenntartó oszcillációkat és temporálisan strukturált oszcillációs mintázatokat produkálni. A létrejövô mintázatok dinamikusan megtestesítik a zenei taktusok észlelését több idôskálán is, amik a metrikus struktúra szintjeinek felelnek meg (pl. COOPER ÉS MEYER , 1960; HASTY, 1997; LERDAHL ÉS JACKENDOFF, 1983; YESTON, 1976). Ezek a mintázatok stabilak és mégis flexibilisek: kitartanak bemenet hiányában és ellentmondó információ ellenére, mégis képesek újraszervezôdni, ha elegendô jelzést kapnak egy új temporális struktúrára. A modell teljesítménye hasonló a szinkronizációs tanulmány eredményeihez (SNYDER ÉS KRUMHANSL, 2000), amelyet expliciten arra terveztek, hogy a metrum-indukciót teszteljék a zenében. Azonban a SNYDER ÉS KRUMHANSL (2000) által használt auditoros szekvenciákat komputerrel generálták és temporálisan szabályosak voltak, nem volt bennük temporális fluktuáció a kategorikus esemény tartamokon belül. LARGE ÉS PALMER (2002) feltételezi, hogy az emberek a ritmust - ami meghatározásuk szerint komplex, temporálisan mintázott tartam-szekvencia - egy belsô oszcillátorokból álló kis rendszer aktivitása alapján észlelik, ami a ritmus temporális struktúráját tükrözi. A belsô, ön-fenntartó oszcillátorok perceptuális megfelelôi a mérôütések; olyan belsô oszcillátorok, amelyek különbözô periódusokkal mûködnek (de meghatározott fázis- és periódus-kapcsolatban) felelnek meg a zenében észlelt temporális strukúra hierar152
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
chikus szintjeinek. A belsô oszcillátorok rendszere és az auditoros szekvencia külsô ritmusa közötti kapcsolat határozza meg a hallgatók idôtartam-kategorizációját valamint reakcióikat a temporális fluktuációkra mint eltérésekre a kategorikus elvárásoktól. A zenei mérôütés észlelése a modelljükben aktív, ön-fenntartó oszcilláció. Az ön-fenntartó jelleg Cooper és Meyer ütemérzékrôl adott leírásának matematikai megfogalmazásaként képzelhetô el: „ha egyszer megalapozódott, hajlamos folytatódni a hallgató elméjében és izomzatában még akkor is, ha ... az objektív mérôütések megszûnnek vagy nem esnek egybe egy ideig az elôzôleg megalapozott mérôütés-sorozattal” (COOPER ÉS MEYER, 1960, 3. oldal; vesd össze LARGE , 2000a). Az oszcillátor szinkronizálódik a külsô ritmikus szignállal. Azonban nem reagál bármilyen ingerkezdetre mint potenciális mérôütésre; csak olyan ingerkezdetekre reagál, amelyek annak közelében vannak, ahová várja a mérôütést. Az olyan ingerkezdet, ami a várt idô közelébe, de nem pontosan arra esik, az oszcillátor fázisának és periódusának kisebb elhangolását okozza. A szenzitív terület idôtartománya szabályozható. A várt idô szoros közelségében érkezô ingerkezdetek a szenzitív idôtartományt lecsökkentik; az olyan ingerkezdetek, amelyek a szenzitív területen belül vannak, de nem a várt idô közelében, a szenzitív területet növelik. A modellben a különbözô periódusú oszcillátorok kapcsolódása hierarchikus rétegzôdést ad a rendszernek. A modell korábbi munkákra épít (LARGE ÉS KOLEN, 1994; LARGE ÉS JONES , 1999) azzal a fontos különbséggel, hogy kombinálja az elôzô nézeteket egy temporális receptív mezôvel (a szenzitív területrôl) és egy figyelmi impulzussal (amely meghatározza a temporális fluktuációk perceptuális észrevehetôségét) az expektancia-függvény fogalmában. A modell L ARGE (2000a) modelljének matematikai egyszerûsítése. Az oszcillátorok induló periódusai, valamint invariáns fázis- és periódus-kapcsolataik elôre választottak, azaz feltételezik a metrikus struktúrát és a kezdeti mérôütés-periódust, amelyeket LARGE (2000a) teljesebb, folytonos-idô modellje szolgáltathat. Az oszcillátorok kapcsolódása javítja a modell mérôütés-követését; fôként azokon a metrikus szinteken segíti a mérôütés-követést, ahol a legnagyobb temporáis variabilitás található. A kapcsolódás az egyik metrikus szint másik szintre gyakorolt hatását jelenti és így az olyan oszcillátorok, amelyek sikeresen szinkronizálódnak, stabilizálják a sikertelenül szinkronizálódó oszcillátorokat. A zenei metrum olyan neurális hálózattal modellezhetô, amely elvárásokat generál az események relatív idôzítésérôl. A nyugati tonális zene elmélete a zenei események idôzítését legalább olyan fontosnak tartja, mint ugyanezen események hangmagasságát (COOPER ÉS MEYER, 1960; LERDAHL ÉS JACKENDOFF, 1983). Az olyan mérôütés-követési mechanizmus, amely a különbözô periodicitások kapcsolódásán alapul, megfelel azoknak a pszichológiai elképzeléseknek is, hogy az egyes szekvencia-események idôzítése korlátozza a környezô események észlelését a metrikus struktúra hierarchikus természete miatt (LARGE ÉS JONES , 1999; MARTIN, 1972; VORBERG ÉS W ING, 1996). L ARGE ÉS PALMER (2002) oszcillátor-modellje képes pontosan követni a zenei elôadások szélsôséges temporális fluktuációit (rubato). Ráadásul a modell jobban teljesít aszinkróniával, mint anélkül, azt sugallva, hogy az egyenletes, csekély temporális variabilitás (30-50 ms) zeneileg informatív lehet. A modell melódiakiemelése megnôtt, ha az elôadó dallam-sietése növekedett. Csak a szisztematikus hanginger-kezdet aszinkróniák segítették a fázis-beállítást a tempo-változáshoz, a véletlenszerûek nem. Ezek az eredmények azt sugallják, hogy az akkord-aszinkróniák információt hordoznak a metrumról és a dallamról is, egybehangzóan azokkal az eredményekkel, hogy a dallam-sietés általában nagyobb erôs mérôszakaszokon (PALMER , 1989, 1996). Hogyan lehetséges, hogy a metrikus struktúra kiszolgálja a kategorizációt és a diszkriminációt is? Mely temporális fluktuációk erôsítik az adaptációt, azaz a kategóriák strukturális átértelmezését? A dinamikus rendszer két alapvetô tulajdonsága magyarázza a megfigyelt jelenségeket. Elôször is, az ön-fenntartó oszcillátorok a szignáltól függetlenül léteznek, amely eredetileg aktiválta ôket. Azaz mûködhetnek olyan temporális-elvárás generátorként, amely néha ellentmond az inger-mintázat esemény-idôzítésének. Az ön-fenntartó oszcillátorok begyakorlódnak (entrainment) a külsô szignálhoz és amikor az események eltérnek az elvárástól, az oszcillátorok adaptálódnak a külsô ritmus változásához, megváltoztatva a késôbbi elvárásokat, hogy azok jobban megfeleljenek a múltban tapasztaltaknak (LARGE , 2000a, b).
153
DANCZI CSABA LÁSZLÓ : A ZENEI
154
TÉR
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Z ÁRÓ GONDOLATOK Szeretném megkérni a kedves olvasót, hogy olvassa el újra a könyv mottójául szánt Sextus Empiricus szöveget. Tulajdonképpen elölröl is kezdheti az egész írás olvasását: Ha valamilyen újdonságot hoztak az olvasottak, akkor a Sextus Empiricus szöveg mást jelent az újraolvasásban, mint elôször; valószínûleg az elsô fejezetek is másról szólnak majd, ahogy az egész írás valamilyen új színezetet (jelentést) kap. Szerettem volna megírni az észlelés hermeneutikáját. Ebbôl természetesen csak a hallás hermeneutikája kerekedett ki, az azonban a látáshoz, tapintáshoz, a többi észlelési modalitáshoz fûzôdô kapcsolatrendszerében. Azt a folyamatot szerettem volna leírni, ahogyan az ingerbôl hang lesz, a fizikai jellemzôkbôl észlelet. Mára egész könyvtárnyi irodalom keletkezett zenepszichológia könyvekbôl (többnyire angol nyelven), amelyek hagyományos megközelítésmódban (és összefüggésrendszerben) tárgyalják a zenei észlelést (DEUTSCH, 1982 nyomán DOWLING ÉS HARWOOD, 1986; valamint SLOBODA, 1995 stb.). A hallás neurológiájával viszonylag ritkán foglalkoznak. Ezért szerettem volna egy zenérôl szóló írásban összehozni anatómiai, neurológiai és pszichológiai adatokat. Mivel rengeteg írás szól a zenepszichológiáról, olyan megközelítést választottam, amelyet tudomásom szerint még egyetlen szerzô sem használt: a zenét tér- és idô-észlelésnek tekintem. A zene és a tér kapcsolata valószínûleg régi hagyomány az antik görög kultúrában (Szférák zenéje, Hérakleidész, Arisztoxenosz stb.) és legalábbis a középkor végéig kimutatható a zenérôl való gondolkodásban (Alberti, Palladius stb.). Nem bocsátkozom e történet megírásába, ez meghaladná a jelen írás terjedelmét. Az idôrôl való gondolkodásnak is hosszú története van (kezdve Szent Ágostontól illetve Sextus Empiricustól Husserlen és Heideggeren át Ricœur-ig), ezért megmaradtam az antik problémafelvetésnél: a történet tárgyalása jóval hosszabb terjedelmet igényelne, ráadásul Sextus Empiricus meglehetôsen világosan látja a problémát. Habár a filozófus (és a zenész) számára túl soknak tûnik az empirikus adat, az írás végére érve remélem belátja, hogy valóban filozófiai (esztétikai) kérdésekre kerestem a választ. Arra törekedtem, hogy minél több tudományterület követôje haszonnal forgathassa ezt a kis írást: a zeneszerzô számára a lehetséges zenei gondolkodás korlátait (illetve kötelezô szabályait) határoztam meg, az esztéta számára a zenei értékelés (univerzális) alapjait próbáltam felvázolni (illetve azt a kérdést feszegettem, hogy mi a zene). A pszichológus számára jó összefoglalást kívántam nyújtani a ritkán tárgyalt területekrôl (idô-észlelés és idô-alapú feldolgozás az auditoros rendszerben). A neurológus pedig remélem, hogy haszonnal forgatja a colliculus superiorról és a multiszenzoros integrációról (amelynek kutatása egyre jobban fellendül: lásd a Lovelace-által alapított MRF társaságot, amely évente tart konferenciát az újabb kutatásokból) szóló fejezeteket. Úgy gondolom, hogy rengeteg következtetést le lehet vonni a felsorolt adatokból és ezek egy részét az olvasóra hagyom, csak a legnyilvánvalóbbakat említem meg. Az auditoros rendszer nem “mechanikus” átalakító szerkezet, amely a szignálokat hangészleletekké alakítja, hanem egy intelligens dinamikus rendszer. Az auditoros rendszer számos alrendszerbôl áll, amelyek egymással (gyakran kölcsönös) kapcsolatban állnak, azaz az auditoros rendszer gyakorlatilag minden alrendszere képes befolyásolni a teljes rendszer állapotát. A hallórendszer kutatásának ma az egyik legdinamikusabban fejlôdô irányzata a dinamikus rendszerelméleti (számítógépes szimuláció) megközelítés. Az auditoros rendszer feldolgozásával kapcsolatban egyre nagyobb szerepet kap “a kitörlés elve” a kutatásban. Úgy tûnik, hogy a rendszer két információ összevetésével dolgozik: a “nyers” és a “kitörölt” (feldolgozott) adatokat hasonlítja össze. Ez az elképzelés további kísérleti tisztázásra vár. Világosan látszik, hogy az auditoros rendszer kölcsönös kapcsolatban áll a látással és a tapintással (valamint a motóriummal), amelyekkel közösen egy nagyobb rendszert alkot (amiben ezek befolyásolják egymás mûködését). Az egyik kulcsfontosságú struktúra a multiszenzoros integrációban a középagyi colliculus superior (és talán a kisagy), ami komplex mintázatelemzést végez. A colliculus superior (rendszer a kérgi kapcsolatokkal) a colliculus inferioron (IC) keresztül befolyásolja az auditoros észlelést. Egyenlôre nem világos, hogy az IC mit kezd az ide érkezô multiszenzoros információkkal és a colliculus superior - bár jelenleg az egyik legalaposabban vizsgált agyi struktúra - is tartogat még néhány meglepetést a kutatók számára. A zenével kapcsolatban gyakran említésre kerülô (auditoros-vizuális) szinesztézia tárgyalásába itt 155
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
nem bocsátkozom (mivel azt már megtettem egy írásomban). Úgy vélem a multiszenzoros integráció kutatási eredményeit megismerve csak az marad kérdéses, hogyan válik az élmény tudatossá, a tudat kérdéseivel pedig nem foglalkozom itt. A multiszenzoros integráció eredményei fontosak lehetnek az intermédiás mûvészet számára: lehetôséget adnak egy multimodális kontrapunkt létrehozására (amire egyébkén Eisenstein már tett kísérletet). Ahogy a vizuális (és taktilis) rendszer taglalását is kerültem, nem tárgyaltam a hallás filmes (képzômûvészeti) vonatkozásait: ezt a kedves olvasóra bízom. Inkább az a kérdés foglalkoztatott (a szinesztézia és a multimodális integráció határán), hogy miért van egy zenei hangnak “magassága”? Egyáltalán mit jelent az, hogy egy zenei hangnak “magassága” van? Miért magasabb a gisz, mint a gesz? Ez az a pont, ahol sajátosan zenei észleléssé változik a tér-észlelés. Mitôl érzünk egy hangot magasabbnak, mint egy másikat? A külsô fül spektrális átalakítása jelentôs kulcsinger a függôleges irány észleléséhez. A hallórendszer a spektrális összetétel egy részét “magasság”-információként értékeli, azaz a hangnak “magasságot” tulajdonít. A komplex spektrális tulajdonságok elemzését a kölcsönös kapcsolatban álló colliculus superior (SC) és inferior (IC) rendszer végzi (összevetve/összehangolva a többi modalitás információival). Hangmagasság alatt két különbözô észleletet nevezünk, amelyek egymásnak ellentmondóak lehetnek (lásd a Shepard-hangokat vagy Risset skáláját). A kétféle magasság egyike folytonos (az F0-t, azaz az alapfrekvenciát követi), a másik pedig ciklikus. A ciklus (kroma-kör) nagyjából az oktáv kapcsolatnak (a harmonikus-relációnak) megfelelô intervallumonként ismétlôdik. A kroma-kör és a hangmagasság disszociálható (Shepard és Risset hangjai), azaz - feltehetôen - két rendszer feladata ezek észlelése. Valószínûnek látszik, hogy a ciklikus kroma-kör (a külsô fül spektrális átalakítása miatt) az auditoros rendszer által “magasság” kulcsingerként kezelt spektrális információkból jön létre. Az is valószínûnek látszik, hogy a colliculus superior (rendszer az IC-vel és a kéreggel) a kroma-kör észlelésében jelentôs szerepet játszik. Fontosnak tartom azt a tényt, hogy a komplex mintázatok elemzésében szerepet játszó struktúrák (a colliculus superior és feltehetôen a kisagy) fontos szerepet játszanak a motórium szabályozásában. Az SC motoros szerepe az “odafigyelés” térbeli (motorikus) irányítása. A nagyobb rendszer (amelynek az SC csak egy részét képezi) a kulcsingerek térbeli-idôbeli-modalitásközi megfelelése alapján (és a kérgi kapcsolatok révén az objektumok “felismerésével”) az észlelés (nem tudatosodó) elôfokát képezi: ezt neveztem el annak idején “elsôdleges észlelésnek”. A zene sajátossága, hogy „begyakorlásra” (entraining), a hallottak követésére (illetve folytatására) késztet. Ambiguitási foka alapvetôen eltér a beszédtôl: a zene lényegéhez tartozik inherens ambiguitása. Ez hasonló a „költészet nyelve” és a „hétköznapi beszéd” közötti különbséghez: a zenében nem az a fontos hogy mit, hanem az, hogyan mondja. A mûvészet olyan kommunikációt hoz létre, amelyben a szándékolt (és nyilvánvaló) ambiguitás miatt a jelentés diffúzzá válik. Az ambiguitás hiánya a giccs. A mûalkotás több-rétegû jelentést alkot: az egyes jelentésegységek nagyobb jelentéskomplexumokat hoznak létre és végül az egész mûalkotás egy (totális) jelentést alkot (a mûvészettörténet nagyobb jelentésegységében), az emberi kultúra részét képezi (a dinamikus rendszerelmélet elképzeléseihez hasonóan). A beszéd a jelentés követésére és folytatására „szólít fel”, a zene a mozgás ismétlésére (együtt zenélésre) késztet. Az adatokból világosan látszik, hogy a zenei észlelés nagy része kulturálisan meghatározott. Valójában már az auditoros észlelés egy része is kultúrától függô (hiszen millieu-ként adott hang-objektumokat és nem frekvencia-spektrumokat hallunk). Az adott kulturális millieu meghatározza, hogy résztvevôi mit hallanak: a hallás kulturálisan szabályozott. Fôként ezért nem foglalkoztam a nyugati tonális zene generatív elméletével, vagy a zene és az érzelmek kapcsolatával. Az írásban szereplô európai és nem-európai vonatkozások a zenei diverzitást szemléltetik, illetve egy-egy kultúra sajátos zenei “gondolkodásmódját”. Végül pedig érdemes eltûnôdni azon, hogy a zenei hallásra különösen jellemzô a periodicitás, illetve az attól való eltérés észlelése. A különbözô “idô-ablakokban” más és más hang-észlelési mechanizmusok ám meglepôen hasonló szabályok szerint - lépnek mûködésbe. A harmónia és a ritmus hasonló események, ám radikálisan különbözô frekvenciatartományban. Ha a harmóniát „mikroszkóppal szemléljük”, azaz lelassítjuk addig, amíg a hangmagasságok impuzusokká válnak, 156
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
a harmonikus intervallumok szabályos ritmusokat alkotnak. Minél konszonánsabb egy intervallum, annál egyszerûbb a ritmusa. Ha a ritmust gyorsítjuk fel, azonos fizikai folyamatokat találunk, azaz a harmónia nagyon gyors ritmus. A harmonikus intervallumok - például a hármashangzatok - öt vagy tíz oktávval lefelé transzponálva ritmikus mintázattá válnak, szekvenciális mintázatok csoportjává. Minél konszonánsabb az intervallum vagy akkord, annál szabályosabb és matematikailag egyszerûbb a ritmikus mintázata. A fordítottja is igaz. A ritmus öttôl tíz oktávig emelése harmóniát hoz létre és inherens viszonylagos konszonanciája tökéletesen megfelel szabályosságának. További hangoknak a harmóniához adásával nô a disszonanciaszint és nô a komplexitás szintje a ritmikus mintázatban. Az oktávok száma, amivel a harmóniát csökkenteni kell, hogy ritmusnak halljuk vagy fordítva, az adott frekvenciatartománytól és a tempótól függ. Amit a közösség zeneileg konszonánsnak ítélt meg, az állandóan növekedett komplexitásában. A nyugati zeneelméletben az egyre kisebb intervallumok elfogadása egybeesik a ritmus matematikailag egyre szabálytalanabb felosztásával a gregorián énektôl Karlheinz Stockhausen-ig. Karlheinz STOCKHAUSEN (1988) harmonikus-ritmus megfigyeléseit egy egész zeneelméletté tágította, aminek valóban kozmikus arányai vannak. Szerinte a zene epiciklikus periodicitása az idô-tartamok teljes spektrumán áthalad a „big bang”-tól az ultraviola- és a röntgen-sugárzásig. Ennek megfelelôen a hangmagasságból ritmusba történô glissando Stockhausen Kontakte-jának középpontjához közel egy strukturális gesztus, ami a világ kolosszális egyesítô elvét fejezi ki.
157
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
KÖSZÖNETNYILVÁNÍTÁS Szeretnék köszönetet szeretnék mondani azoknak az embereknek, akik segítettek az írás létrehozásában. Elsôként Dr Maróthy Jánost, halott mesteremet említem, aki elindította gondolkodásomat (és ma is felismerem a gondolatok némelyikének eredetét mondjuk Zenei végtelen címû könyvének olvasásakor). Másodikként Keuler Jenô zeneszerzônek, barátomnak szeretnék köszönetet mondani, aki beteg szemével is többször átsilabizálta a kéziratokat és folyamatosan segített megjegyzéseivel, kérdéseivel, útmutatásával és bírálatával. Dr Kónya Anikónak pedig köszönöm azt, hogy felhívta figyelmemet a zenei (és az általában vett) idô problémájára. Utoljára Dr Radnóti Sándornak mondok köszönetet, hogy témavezetôként a nevét adta ehhez az íráshoz, valamint türelmével és segítségével lehetôvé tette a dolgozat leadását.
158
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
HIVATKOZÁSOK Aaltonen, G., et al. (1997): Perceptual magnet effect in the light of behavioral and psychophysiological data. J Acoust Soc America 101, 1090-1106. Abbott, L.F., Varela, J.A., Sen, K., Nelson, S.B. (1997): Synaptic depression and cortical gain control. Science 275, 220-224. Adams, J.C., and Mugnaini, E. (1984): Dorsal nucleus of the lateral lemniscus: A nucleus of GABAergic projection neurons. Brain Res Bull 13, 585-590. Adolphs, R. (1993): Bilateral inhibition generates neuronal responses tuned to interaural level differences in the auditory brainstem of the barn owl. J Neurosci 13, 3647-3668. Agawu, V.K. (1995): African rhythm: a Northern Ewe perspective. New York: Cambridge University Press. Aitkin, L. (1985): The auditory midbrain: structure and function in the central auditory pathway. Clifton, NJ: Humana Press Aitkin, L.M., Anderson, D.J., and Brugge, J.F. (1970): Tonotopic organization and discharge characteristics of single neurons in nuclei of the lateral lemniscus of the cat. J Neurophysiol 33, 421-440. Aitkin, L.M., Dickhaus, H., Schult, W., and Zimmermann, M. (1978): External nucleus of inferior colliculus: auditory and spinal somatosensory afferents and their interactions. J Neurophysiol 41, 837-847. Aitkin, L.M., Gates, G.R., Philips, S.C. (1984): Responses of neurons in the inferior colliculus to variations in sound source azimuth. J. Neurophysiol 52, 1-17. Aitkin, L.M., Pettigrew, J. D., Calford, M. B., Phillips, S. C., and Wise, L. Z. (1985): Representation of stimulus azimuth by low-frequency neurons in inferior colliculus of the cat. J Neurophysiol 53, 43-59. Aitkin, L.M., and Prain, S.M. (1974): Medial geniculate body: unit responses in the awake cat. J Neurophysiol 37, 512-521. Albe-Fessard, D., and Gillett, E. (1961): Convergences d’afferénces d’origines corticale et périphérique vers le centre médian du chat anesthésie ou éveille. Electroencephalogr Clin Neurophysiol 13, 257-269. Albus, J.S. (1971) A theory of cerebellar function. Math Biosci 10, 25-61 Alexander, G.E., DeLong, M.R., and Strick, P.L. (1986) Parallel organization of functionally segregated circuits linking basal ganglia and cortex. In: Cowan, W.M. Annual review of neuroscience (ed.), pp 357381. Washington, DC: Society for Neuroscience. Allen, G. et al. (1997) Attention activation of the cerebellum independent of motor involvement. Science 275, 1940-1943 Allison, T., Puce, A., McCarthy, G. (2000) Social perception from visual cues: role of the STS region.Trends Cogn Sci 4, 267 -278. Altman, J., and Carpenter, M.B. (1961): Fiber projections of the superior colliculus in the cat. J Comp Neurol 116, 157-177. Amassian, V.E., and Devito, R.V. (1954): Unit activity in the reticular formation and nearby structures. J Neurophysiol 17, 5575-603. Amat, J. (1983): Interaction between signals from vestibular and forelimb receptors in Purkinje cells of the frog vestibulocerebellum. Brain Res 278: 287-290. Amat, J., Matus-Amat, P., and Vanegas, H. (1984): Visual (optokinetic), somesthetic, and vestibular inputs to the frog cerebellum. Neuroscience 11, 877-884. Andersen R.A., Snyer R.L., Merzenich M.M.. (1980): The topographic organization of cortico-collicular projections from physiologically identified loci in the AI, AII, and auditory fields of the cat. J Comp Neurol 191, 479-494. Andersen, R.A., Knight, P.L., and Merzenich, M.M. (1980): The thalamocortical and corticothalamic connections of AI, AII and the anterior auditory field (AAF) in the cat: evidence for two largely segregated systems of connections. J Comp Neurol 194, 663-701. Andersen, R.A., and Mountcastle, V.B. (1983): The influence of the angle of gaze upon the excitability of the light-sensitive neurons of the posterior parietal cortex. J Neurosci 3, 532-548. Anderson, J. R. (1985): Cognitive psychology and its implications.W. H. Freeman, New York 159
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Apel, W. (1972): Harvard dictionary of music (2nd ed.). Cambridge, MA: Belknap Press of Harvard University Press Apter, J. (1945): Projection of the retina on the superior colliculus of cats. J Neurophysiol 8, 123-134. Armstrong, D.M. (1988): The supraspinal control of mammalian locomotion. J Physiol 405, 1-37. Arshavsky, Y.I., Deliagina, T.G., and Orlovsky, G.N. (1997): Pattern generation. Curr Opin Neurobiol 7, 781789. Arshavsky, Y.I., Gelfand, I.M., Orlovsky, G.N., and Pavlova, G.A. (1978): Messages conveyed by spinocerebellar pathways during scratching in the cat: I. Activity of neurons of the lateral reticularrnucleus. Brain Res 151, 479-491. Ashmead, D.H., Clifton, R.K., and Perris, E.E. (1987): Precision of auditory localization in human infants. Dev Psych 23, 641-647. Assmann, P. F. and Summerfield, Q. (1990): Modeling the perception of concurrent vowels: vowels with different fundamental frequencies. J Acoust Soc Am 88(2), 680-697. Atienza, M., and Cantero, J.L. (2001): Complex sound processing during human REM sleep by recovering information from long-term memory as revealed by the mismatch negativity (MMN). Brain Res 901, 151-160. Attneave, F., and Olson, R.K. (1971): Pitch as a medium: A new approach to psychophysical scaling. Am J Psychol 84, 147-165. Avanzini, G., Spreafico, R., Broggi, G., Biovannini, P., and Franceschetti, S. (1977): Topographic distribution of visual and somesthesic unitary responses in the pulp complex of the cat. Neurosci Lett 4, 135143. Azizi, S.A., and Woodward, D.J. (1984): Specific interactions of different sensory modalities in the paraflocculus of the rat. Soc Neurosci Abstr 9, 224, 1984 Balzano, G.J. (1980): The group-theoretic description of twelvefold and microtonal pitch systems. Computer Music Journal 4(4), 66-84. Banati, R.B., Goerres, G.W., Tjoa, C., Aggleton, J.P., Grasby, P. (2000): The functional anatomy of visualtactile integration in man: a study using positron emission tomography. Neuropsychologia 38, 115 124. Barker, J., and Cooke, M.P. (1999) Is the sine-wave speech cocktail party worth attending? Speech Communication, 27(3-4), 159-174. Baron, J., Doubell, T.P., and King, A.J. (1998): Back projection from the superficial layers of the ferret superior colliculus to its primary source of auditory input in the inferior colliculus. Soc Neurosci Abstr 24, 1882. Barth, D.S.,Goldberg, N., Bret, B., Di, S. (1995): The spatiotemporal organization of auditory,visual,and auditory-visual evoked potentials in rat cor ex. Brain Res 678, 177-190. Bartlett, J.C., and Dowling, W.J. (1988): Scale structure and similarity of melodies. Music Perception 5, 285314. Batra, R., Kuwada, S., and Fitzpatrick, D.C. (1997): Sensitivity to interaural temporal disparities of low- and high-frequency neurons in the superior olivary comples. II. Coincidence detection. J Neurophysiol 78, 1237-1247. Batra, R., Kuwada, S., and Stanford, T. R. (1989): Temporal coding of envelopes and their interaural delays in the inferior colliculus of the unanesthetized rabbit. J Neurophysiol 61, 257-268. Baylis, G.C., Rolls, E.T., Leonard,C.M. (1987): Functional subdivisions of the temporal lobe neocortex. J Neurosci 7, 330-342. Beck, J., and Shaw, W.A. (1961): The scaling of pitch by the method of magnitude estimation. Am J Psychol 74, 242-251. Beck, J., and Shaw, W.A. (1963): Single estimates of pitch magnitude. J Acoust Soc Am 35, 1722-1724. Beckstead, R.M., and Frankfurter, A. (1983): A direct projection from the retina to the intermediate gray layer of the superior colliculus demonstrated by anterograde transport of horseradish peroxidase in monkey, cat and rat. Exp Brain Res 52, 261-268. Behan, M. and Appell, P.P. (1992): Intrinsic Circuitry in the Cat Superior Colliculus: Projections From the Superificial Layers. J Comp Neurol 315, 230-243. Behan, M., and Appell, P.P. (1987): Local projections of neurons in the deep layers of the cat superior col160
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
liculus: A study using Phaseolus vulgaris leucoagglutinin (OHA-L). Soc Neurosci Abstr 13, 430. Beitel R.E., Kaas J.H. (1993): Effects of bilateral and unilateral ablation of auditory cortex in cats on the unconditioned head orienting response to acoustic stimuli. J Neurophysiol 70, 351-369. Bekesy, G.von (1960): Experiments in hearing. New York, McGraw-Hill Bell, A.H., Corneil, B.D., Meredith, M.A. Van Opstal, J., Abrahams, V.C., Munoz, D.P. (2000): Multisensory integration in the superior colliculus of awake behaving primates. Soc Neurosci Abstr 26, 1221. Bell, C., Sierra, G., Buendia, N., and Segundo, J.P. (1964): Sensory properties of neurons in the mesencephalic reticular formation. J Neurophysiol 27, 961-987. Benedek, G., Hicks, T.P. (1988): The visual insular cortex of the cat: organization, properties and modality specificity. Brain Res 75, 271-277. Benedetti F. Ferro, I. (1995): The effects of early postnatal modification of body shape on the somatosensory-visual organization in mouse superior colliculus. Eur J Neurosci 7, 412-418. Benevento, L. A., Coleman, P. D., and Loe, P. R. (1970): Responses of single cells in cat inferior colliculus to binaural click stimuli: combinations of intensity levels, time differences and intensity differences. Brain Res 17, 387-405. Benevento, L.A., Fallon, J., Davis, B.J., and Rezak, M. (1977): Auditory-visual interaction in single cells in the cortex of the superior temporal sulcus and orbital frontal cortex of the macaque monkey. Exp Neeurol 57, 849-872. Bengtsson, I., and Gabrielsson, A. (1983): Analysis and synthesis of musical rhythm. In: J. Sundberg (ed) Studies of music performance. Stockholm: Royal Swedish Academy of Music, 27-60. Benjamin, W.E. (1984): A theory of musical meter. Music Perception 1, 355-413. Benthal, E., Dafny, N., and Feldman, S. (1968): Convergence of auditory and visual stimuli on single cells in the primary visual cortex of unanesthetized, unrestrained cats. Exp Neurol 20, 341-351. Benveniste, E. (1951): La notion de ‘rythme’ dans son expression linguistique. Journal de Psychologie Normale et Patholoique 44, 401-411. Berkeley, K.J. (1973): Response properties of cells in ventrobasal and posterior group nuclei of the cat. J Neurophysiol 36, 940-952. Berman, A. (1961): Overlap of somatic and auditory cortical response fields in anterior ectosylvian gyrus of cat. J Neurophysiol 24, 608-620. Berman, N., and Cynader, M. (1975): Receptive fields in cat superior colliculus after visual cortex lesions. J Physiol Lond 245, 261-270. Berry, W. (1985): Metric and rhythmic articulation in music. Music Theory Spectrum 7, 7-33. Berson, D.M., and McIlwain, J.T. (1982): Retinal Y-cell activation of deep-layer cells in superior colliculus of the cat. J Neurophysiol 47, 700-714. Berson, D.M., and McIlwain, J.T. (1983): Visual cortical inputs to deep layerss of cat’s superior colliculus. J Neurophysiol 50, 1143-1155. Bertelson, P. (1994): The cognitive architetcure behind auditory-visual interaction in scene analysis and speech identification. Cah Psychol Cogn 13, 69-75. Bharucha, J.J. (1984a): Anchoring effects in music: The resolution of dissonance. Cognitive Psychology 16, 485-518. Bharucha, J.J. (1984b): Event hierarchies, tonal hierarchies and assimilation: A reply to Deutsch and Dowling. J Exp Psychol: General 113, 421-425. Bharucha, J.J., and Krumhansl, C.L. (1983): The representation of harmonic structure in music: Hierarchies of stability as a function of context. Cognition 13, 63-102. Bharucha, J.J., and Pryor, J.H. (1986): Disrupting the isochrony underlying rhythm: An asymmetry in discrimination. Perception and Psychophysics 40(3), 137-141. Bharucha, J.J., and Stoeckig, K. (1986): Reaction time and musical expectancy: Priming of chords. J Exp Psychol: Human Percept Perform 12, 1-8. Bigand, E. (1993a): Contributions of music to research on human auditory cognition. In: S. McAdams, and E. Bigand (eds) Thinking in sound: The cognitive psychology of human audition. Oxford: Oxford UP, 231-277. Bilmes, J.A. (1993): Timing is of the essence: Perceptual and Computational Techniques for representing, learning, and reproducing expressive timing in percussive rhythm. Masters thesis, Massachusetts 161
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Institute of Technology Binns, K.E., Salt, T.E. (1996a): Corticofugal influences on visual responses in cat superior colliculus: the role of NMDA receptors. Vis Neurosci 13, 683-694. Binns, K.E., Salt, T.E. (1996b): Importance of NMDA receptors for multimodal integration in the deep layers of the cat superior colliculus. J Neurophysiol 75, 920-930. Bisiach, E., and Luzzatti, C. (1978): Unilateral neglect of representational space. Cortex 14, 129-133 Blackwell, H.R., Schlossberg, H. (1943): Octave generalization, pitch discrimination, and loudness thresholds in the white rat. J Exp Psychol 33, 407-419. Blauert, J. (1969-1970): Sound localization in the median plane. Acoustica 22, 205-213. Blauert, J. (1983): Spatial hearing - the psychoacoustics of human sound localization. MIT Press, Cambride, MA Blauert, J. (1997): Spatial Hearing. MIT, Cambridge, MA Blauert, J. and Lindemann, W. (1986): Auditory spaciousness: Some further psychoacoustic analyses. J Acoust Soc Amer 80, 533-541 Bordi, F., and LeDoux, J.E. (1994): Response properties off singleunits in areas of rat auditory thalamus that project to the amygdala. I. Acoustic discharge patterns and frequency receptive fields. Exp Brain Res 98, 261-274. Borenstein, P., Bruner, J., and Buser, P. (1959): Organization neuronique et convergences heterosensorielles dans le complexe latéral postérieur „association“ du thalamus chez le chat. J Physiol Paris 51, 513514. Botte, M.C., McAdams, S., Drake, C. (1994): La perception des sons et de la musique. In: B. Lechevalier, and F. Eustache (eds) Perception et agnosies: Séminaire Jean-Louis Signoret. Brussels: De Boeck, 55-99. Boudreau, J.C., and Tsuchitani, C. (1968): Binaural interaction in the cat superior olive S segment. J Neurophysiol 31, 442-454. Boulez, P. (1987): Timbre and composition - timbre and language. In: Music and Psychology: A Mutual Regard. S. McAdams (ed) Contemporary Music Review 2(1), 161-172. Brainard, M.S., and Kundsen, E.I. (1993): Experience-dependent plasticity in the inferior colliculus: a site for visual calibration of the neural representation of auditory space in the barn owl. J Neurosci 13, 4589-4608. Braitenberg, V. (1983): The cerebellum revisited. J Theor Neurobiol 2, 237-241 Braitenberg, V. and Atwood, R.P. (1958): Morphological observations on the cerebellar cortex. J Comp Neurol 109, 1-34 Bregman, A.S. (1977): Perception and behavior as compositions of ideals. Cognitive Psychology 9, 250-292. Bregman, A.S. (1978): The formation of auditory streams. In: J. Requin (ed) Attention and Performance VII. Hillsdale, N.J. : Lawrence Erlbaum Associates Bregman, A.S. (1981): Asking the „what for“ question in auditory perception. In: M. Kubovy & J.R. Pomerantz (eds) Perceptual Organization. Hillsdale, NJ : Lawrence Erlbaum Associates, 99-118. Bregman, A.S. (1990): Auditory scene analysis. MIT, Cambridge, MA Bregman, A.S. (1993): Auditory scene analysis: Hearing in complex environments. In: S. McAdams, and E. Bigand (eds) Thinking in sound: The cognitive psychology of human audition. Oxford: Oxford UP, 10-36. Bregman, A.S., Levitan, R., and Liao, C. (1990): Fusion of auditory components: Effects of the frequency of amplitude modulation. Percept and Psychophys 47, 68-73. Bregman, A.S., and Campbell, J. (1971): Primary auditory stream segregation and perception of order in rapid sequences of tones. J Exp Psychol 89, 244-249. Bregman, A.S., and Dannenbring, G.L. (1973): The effect of continuity on auditory stream segregation. Perception and Psychology 13, 308-312. Bregman, A.S., and Rudnicky, A. I. (1975): Auditory segregation: Stream or streams? J Exp Psychol: Human Percept Perform 1, 263-267. Bricout-Berthout, A., Caston, J., and Reber, A. (1984): Influence of stimulation of auditory and somatosensory systems on the activity of vestibular nuclear neurons in the frog. Brain Behav Evol 24, 21-34. Brokx, J. P. L. and Nooteboom, S. G. (1982): Intonation and the perceptual separation of simultaneous voic162
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
es. Journal of Phonetics 10, 23-36. Brosch, M., Schreiner, C.E. (1977): Time course of forward masking tuning curves in cat primary auditory cortex, J Neurophys Brower, C. (1993): Memory and the perception of rhythm. Music Theory Spectrum 15(1), 19-35. Brown, H. (1988): The interplay of set content and temporal context in a functional theory of tonality perception. Music Perception 5, 219-249. Brown, J.C. (1992): Determination musical meter using the method of autocorrelation. J Acoust Soc Am 91, 2374-2375. Brown, R.G., and Marsden, C.D. (1988): Internal versus external cues and the control of attention in Parkinson’s disease. Brain 111, 323-345 Browne, R. (1981): Tonal implications of the diatonic set In: Theory Only 5(6-7), 3-21. Bruce, C., Desimone, R., Gross C.G. (1981): Visual properties of neurons in a polysensory area in superior emporal sulcus of he macaque. J Neurophysiol 46, 369-384. Brugge, J.F. (1992): Development of the lower auditory brainstem of the cat. In:R. Romand (ed): Development of Auditory and Vestibular Systems 2. Elsevier, New York, pp. 273-295. Brugge, J.F. et al. (1970): Responses of neurons in the dorsal nucleus of the lateral lemniscus of cat to binaural tonal stimulation. J Neurophysiol 33, 441-458. Brugge, J.F., Anderson, D.J., and Aitkin, L.M. (1970): Responses of neurons in the dorsal nucleus of the lateral lemniscus of cat to binaural tonal stimulation. J Neurophysiol 33, 441-58. Buiseret, P., and Maaffei, L. (1983): Suppression of visual cortical activity following tactile periorbital stimulation: its role in eye blinks. Exp Brain Res 51, 463-466. Bullock T.H. (1984): Physiology of the tectum mesencephali in elasmobranchs. In: Vanegas H (ed) Comparative neurology of the optic tectum. Plenum Press, New York, 47-68. Buonomano, D.V., and Mauk, M.D. (1994): Neural network model of the cerebellum. Neural Computat 6, 38-55. Buonomano, D.V., and Merzenich, M.M. (1995): Temporal information transformed into a spatial code by a neural network with realistic properties. Science 267, 1028-1030. Burger, R.M. et al. (1998): Analysis of the role of inhibition in shaping responses to sinusoidally amplitudemodulated signals in the inferior colliculus. J Neurophysiol 80, 1686-1701. Burger, R.M. et al. (2001): Reversible inactivation of the dorsal nucleus of the lateral lemniscus reveals its role in the processing of multiple sound sources in the inferior colliculus of bats. J Neurosci 21, 48304843. Burnham, D., Taplin, J., Henderson-Smart, D., Earnshaw-Brown, L., and O’Grady, B. (1993): Maturation of precedence effect thresholds: Full- and pre-term infants. Inf Behav Develop 16, 213-232. Burns, E.D., and Ward, W.D. (1982): Intervals, scales, and tuning. In: D. Deutsch (ed) The Psychology of Music. New York : Academic Press, 241-269. Burns, E.M., and Ward, W.I. (1978): Categorical perception - phenomenon or epiphenomenon: Evidence from experiments in the perception of melodic musical intervals. J Acoust Soc Am 63, 456-468. Buser, P., and Borenstein, P. (1959): Responses somesthesiques, visuelles et auditives, recueilles au niveau du cortex „associatif“ suprasylvien chez le chat curarise non anesthesie. Electroencephalogr Clin Neurophysiol 11, 285-304. Bushara, K.O., Grafman, J., Hallett, M. (2001): Neural correlates of auditory-visual stimulus onset asynchrony detection. J Neurosci 21, 300-304. Bushara, K.O., Weeks, R.A., Ishii, K., Catalan, M.J., Tian, B., Rauschecker, J.P., Halle, M. (1999): Modalityspecific frontal and parietal areas for auditory and visual spatial localization in humans. Nat Neurosci 2, 75 -766. Butler, D. (1979a): A further study of melodic channeling. Perception and Psychophysics 25, 264-268. Butler, D. (1979b): Melodic channeling in a musical environment. Research Symposium on the Psychology and Acoustics of Music, Kansas Butler, D., and Brown, H. (1984): Tonal structure versus function: Studies of the recognition of harmonic motion. Music Perception 2, 6-24. Butler, R.A. (1986): The bandwidth effect on monaural and binaural localization. Hear Res 21, 67-73. Butler, R.A. (1987): An analysis of the monaural displacement of sound in space. Percept Psychophys 41, 1163
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
7. Butler, R.A. and Helwig, C.C. (1983): The spatial attributes of stimulus frequency in the median sagittal plane and their role in sound localization. Am J Otolaryngol 4, 165-73. Butler, R.A. and Musicant, A.D. (1993): Binaural localization: influence of stimulus frequency and the linkage to covert peak areas. Hear Res 67, 220-9. Caird, D., and Klinke, R. (1983): Processing of binaural stimuli by cat superior olivary complex neurons. Exp Brain Res 52, 385-399. Calford, M.B. (1983): The parcellation of the medial geniculate body of the cat defined by the auditory response properties of single units. J Neurosci 3, 2350-2364. Calford, M.B., Wise, L.Z., and Pettigrew, J.D. (1985): Coding of sound location and frequency in the auditory midbrain of diurnal birds of prey, family Accipitridae and Falconidae. J Comp Physiol A 157, 149-160. Calford, M.B., and Webster, W.R. (1981): Auditoy representation within principal division of cat medial geniculate body: an electrophysiological study. J Neurophysiol 45, 1013-1028. Calford, M.B., et al. (1983): Ascending projections to the medial geniculate body of the cat: evidence for multiple, parallel auditory pathways through thalamus. J Neurosci 3, 2365-2380. Callan, D.E., Callan, A.M., Kroos, C., Vatikiotis-Bateson, E. (2001): Multimodal contribution to speech perception revealed by independent component analysis: a single-sweep EEG case study. Brain Res Cogn Brain Res 10, 349-353. Calver, G.A. (2001): Crossmodal processing in the human brain: Insights from functional neuroimaging studies. Cerebral Cortex 11, 110-1123. Calver, G.A., Brammer, M., Bullmore, E., Campbell, R., Iversen, S.D., David, A. (1999): Response amplification in sensory-specific cortices during crossmodal binding. NeuroReport 10, 2619-2623. Calver, G.A., Brammer, M.J., Iversen, S.D. (1998): Crossmodal identification. Trends Cogn Sci 2, 247-253. Calver, G.A., Bullmore, E.T., Brammer, M.J., Campbell, R., Williams, S.C., McGuire, P.K., Woodruff, P.W., Iversen, S.D., David, A.S. (1997): Activation of auditory cortex during silent lipreading. Science 276, 593-596. Calver, G.A., Campbell, R., Brammer, M.J. (2000): Evidence from functional magnetic resonance imaging of crossmodal binding in human heteromodal cortex. Curr Biol 10, 649-657. Calver, G.A., Hansen, P.C., Iversen, S.D., Brammer, M.J. (2001): Detection of multisensory integration sites by application of electrophysiological criteria o the BOLD response. NeuroImage 14, 427-438. Cariani, P.A., and Delgutte, B. (1996a): Neural correlates of the pitch of complex tones. I. Pitch and pitch salience. J Neurophysioll 76, 1698-1716. Cariani, P.A., and Delgutte, B. (1996b): Neural correlates of the pitch of complex tones. II. Pitch shift, pitch ambiguity, phase-invariance, pitch circularity, rate-pitch and the dominance region for pitch. J Neurophysiol 76, 17171-1734. Carlile, S. (1990a): The auditory periphery of the ferret. I: Directional response properties and the pattern of interaural level differences. J Acoust Soc Am 88, 2180-95. Carlile, S. and King, A.J. (1993): From outer ear to virtual space. Current Biology 3, 446-448. Carlile, S. and Pralong, D. (1994): The location-dependent nature of perceptually salient features of the human head-related transfer functions. J Acoust Soc Am 95, 3445-59. Carlson, R., Fant, G., and Granström, B. (1975): Two-formant models, pitch and vowel perception. In: G. Fant, and M.A.A. Tatham (eds) Auditory analysis and speech perception. Academic, London, 55-82. Carney, L.H., and Yin, T.C.T. (1989): Responses of low-frequency cells in the inferior colliculus to interaural time differences of clicks: excitatory and inhibitory components. J Neurophysiol 62, 144-161. Carr, C. E., and Konishi, M. (1990): A circuit for detection of interaural time differences in the brain stem of the barn owl. J Neurosci 10, 3227-46. Casagrande, V.A., Harting, J.K., Hall, W.C., Diamond, I.T. (1972): Superior colliculus of the tree shrew: a structural and functional subdivision into superficial and deep layers. Science 177, 444-447 Casseday, J.H., Ehrlich, D., and Covey, E. (1994): Neural tuning for sound duration: role of inhibitory mechanisms in the inferior colliculus. Science 264, 847-850. Castellano, Bharucha, J.J., and Krumhansl, C.L. (1984): Tonal hierarchies in the music of North India. J Exp Psychol: General 113, 394-412. 164
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Cavada, C., Goldman-Rakic, P.S. (1991): Topographic segregation of corticcostriatal projections from posterior parietal subdivisions in the macaque monkey. Neuroscience 42, 683-696. Chalikia, M., and Bregman, A.S. (1989): The perceptual segregation of simultaneous auditory signals: Pulse train segregation and vowel segregation. Percept and Psychophys 46, 487-496. Chalupa, L.M., Macadar, A.W., and Lindsley, D.B. (1975): Response plasticity of lateral geniculate neurons during and after pairing of auditory and visual stimuli. Science 190, 290-292. Chalupa, L.M., Rhoades, R.W. (1977): Responses of visual, somatosensory, and auditory neurones in the golden hamster’s superior colliculus. J Physiol 207, 595-626 Chalupa, L.M., and Fish, S.E. (1978): Response characteristics of visual and eytravisual neurons in the pulvinar and lateral posterior nuclei of the cat. Exp Neurol 61, 96-120. Chan, J.C.K., Yin, T.C.T., and Musicant, A.D. (1987): Effects of interaural time delays of noise stimuli on low-frequency cells in the cat’s inferior colliculus. II. Responses to band-pass filtered noises. J Neurophysiol 58, 543-561. Chavis, D.A., Pandya, D.N. (1976): Further observations on corticofrontal connections in the rhesus monkey. Brain Res 117, 369-386. Cheour, M., et al. (1998): Develpoment of language-specific phoneme representations in the infant brain. Nat Neurosci 1, 351-353. Chernoff, J.M. (1979): African rhythm and African sensibility: aesthetics and social action in Africal musi cal idioms. Chicago: University of Chicago Press Cherry, E.C. (1953): Some experiments on the recognition of speech, with one and two ears. J Acoust Soc Am 25, 975-979. Chowning, J. (1980): Computer synthesis of the singing voice. In: Sound generation in winds, strings, com puters. Royal Swedish Academy of Music, Stockholm, publ. no. 29. Clarey J.C., Irvine, D.R.F. (1986): Auditory response properties of neurons in the anterior ectosylvian sulcus of the cat. Brain Res 386, 12-19 Clarke, E.F. (1982): Timing in the performance of Erik Satie’s Vexations. Acta Psychologia 30, 1-19. Clarke, E.F. (1985): Structure and expression in rhythmic performance. In: P. Howell, I. Cross, and R. West (eds.). Music structure and cognition. London: Academic Press, 209-236. Clarke, E.F. (1987a): Categorical rhythm perception: an exological perspective, In: A. Gabrielsson (ed) Action and perception in rhythm and music. The Royal Swedish Academy of Music 55, 19-33. Clarke, E.F. (1987b): Levels of structure in musical time. In: Music and Psychology: A Mutual Regard. S. McAdams (ed) Contemporary Music Review 2(1), 211-238. Clarke, E.F. (1988) Generative principles in music performance. In: J.A. Sloboda (ed) Generative processes in music: the psychology of performance, improvisation, and composition. New York: Oxford University Press, 1-26. Clarke, E.F. (1989): The perception of expressive timing in music. Psychological Research 51, 2-9. Clarke, S. et al. (1996): Exploring the domain of cerebellar timing system. In: M.A. Pastor, and J. Artieda (eds) Time, internal clocks, and movement. Elsevier, 143-164. Clemo, H.R. and Stein, B.E. (1986): Effects of cooling somatosensory cortex on response properties of tactile cells in superior colliculus. J Neurophysiol 55, 1352-1368. Clemo, H.R., Dehner, L.R., Meredith, M.A. (2000): Cross-modal circuitry of anterior ectosylvian sulcal (AES) cortex: II. Functional connections from auditory Field AES to somatosensory SIV, Soc Neurosc. Abstr 26, 1221. Clemo, H.R., Meredith, M.A., Wallace, M.T., Stein, B.E. (1991): Is the cortex of cat anterior ectosylvian sulcus a polysensory area? Soc Neurosci Abstr 17, 1585. Clemo, H.R., and Stein, B.E. (1982): Somatosensory cortex: a ‘new’ somatotopic representation. Brain Res 235, 161-168 Clemo, H.R., and Stein, B.E. (1983): Organization of a fourth somatosensory area of cortex in cat. J Neurophysiol 50, 910-925. Clemo, H.R., and Stein, B.E. (1984): Topographic organization of somatosensory corticotectal influences in cat. J Neurophysiol 51, 843-858. Clifton, R.K. (1985): The precedence effect: Its implications for developmental questions. In: S.E. Trehub and B. Schneider (eds) Auditory Development in Infancy. Plenum, New York 165
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Clifton, R.K.,Morrongiello, B.A., Kulig, J., and Dowd, J. (1981): Newborns’ orientation toward sound: Possible implications for cortical development. Child De 52, 833-838. Clower, D.M., Hoffman, J.M., Votaus, J.R., Faber, T.L., Woods, R.P., Alexander, G.E. (1996): Role of posterior parietal cortex in the recalibration of visually guided reaching. Nature 383, 618-621. Clynes, M., and Walker, J. (1982): Neurobiologic functions of rhythm, time and pulse in music. In: M. Clynes (ed) Music, mind, and brain. New York: Plenum Press, 171-216. Cohen, Y.E., Knudsen, E.I. (1999): Maps versus clusters: different representations of auditory space in the midbrain and forebrain. TINS 22, 128-135. Cohen, Y.E., Wessinger, C.M.. (1999): Who goes there? Neuron 24, 769-771. Cooke, M.P. (1993): Modelling auditory processing and organisation. PhD Thesis. Published by Cambridge University Press Cooper, G., and Meyer, L.B. (1960): The rhythmic structure of music. Chicago: University of Chicago Press Corbetta, M. (1998): Frontoparietal cortical networks for directing attention and the eye to visual locations: identical, indepentent, or overlapping neural systems? Proc Natl Acad Sci USA 95, 831-838 Corbetta, M., Miezin, F.M., Shulman, G.L., Petersen, S.E. (1993): A PET study of visuospatial attention. J Neurosci 13, 1202-1226. Coull, J.T., Frith, C.D., Buchel, C., and Nobre, A.C. (2000): Orienting attention in time: behavioural and neuroanatomical distinction between exogenous and endogenous shifts. Neuropsychologia 38, 808-819. Coull, J.T., Frith, C.D., Frackowiak, R.S.J., Grasby, P.M. (1996): A frontoparietal network for rapid visuaal information processing: a PET study of sustained attention and working memory. Neuropsychologia 34, 1085-1095. Coull, J.T., and Nobre, A.C. (1998): Where and when to pay attention: the neural systems for directing attention to spatial locations and to time intervals as revealed by both PET and fMRI. J Neurosci 18, 74267435. Covey, E. (1993): Response properties of single units in the dorsal nucleus of the lateral lemniscus and paralemniscal zone of an echolocating bat. J Neurophysiol 69, 842-859. Cowan, N. (1984): On short and long auditory stores. Psychol Bulletin 96, 341-370. Cowan, N., Winkler, I., Teder, W., and Näätänen, R. (1993): Memory prerequisites of the mismatch negativity in the auditory event-related potential (ERP). J Exp Psychol: Learning, Memory, and Cognition 19, 909-921. Creutzfeldt, O., Hellweg, F.C., Schreiner, C. (1980): Thalamocortical transformation of responses to complex auditory stimuli. Exp Brain Res 39, 7-104. Cross, I. Howell, P., and West, R. (1985): Structural relationships in the perception of musical pitch. In: P. Howell, I. Cross, and R. West (eds) Musical Structure and Cognition. 121-142. Culling, J. F. and Darwin, C. J. (1993a): Perceptual separation of simultaneous vowels: within and acrossformant grouping by F0. J Acoust Soc Am 93, 3454-3467. Culling, J.F., and Summerfield, Q. (1995): Perceeptual segregation of concurrent speech sounds: absence of across-frequency grouping by common interaural delay. J Acoust Soc Am 98, 785-797. Cynader, M., and Berman, N. (1972): Receptive field organization of monkey superior colliculus. J Neurophysiol 35, 187-201. Czigler, I. (2001): Figyelem és észlelés. Kossuth Egyetemi Kiadó Dafney, N., and Feldman, S. (1970): Unit responses and convergence of sensory stimuli in the hypothalamus. Exp Neurol 17, 243-257. Dannenbring, G.L., and Bregman, A.S. (1976): Stream segregation and the illusion of overlap. J Exp Psychol: Human Percep Perform 2, 544-555. Darwin, C. J. and Culling, J. F. (1990): Speech perception seen through the ear. Speech Communication 9, 469-475. Davidson, R.J., Jacksson, C.J., and Larson, C.L. (2000): Human electroencephalography. In: J.T. Caciopppo, L.G. Tassinary, and G.G Bernston (eds) Handbook of psychophysiology (2nd ed). Cambridge University Press, 27-52. Davis, K.A. (2002): Evidence of a functionally segregated pathway from dorsal cochlear nucleus to inferior colliculus. J Neurophysiol 87, 1824-1835. Davis, K.A. et al. (1999): Single-unit responses in the inferior colliculus of decerebrate cats. II. Sensitivity 166
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
to interaural level differences. J Neurophysiol 82, 164-175. Dawe, L.A., Platt, J.R., and Welsh, E. (1998): Spectral-motion aftereffects and the tritone paradox among Canadian subjects. Percept Psychophys 60, 209-220. De Zeeuw, C.I., Simpson, J.I., Hoogenraad, C.C., Galjart, N., Koekkoek, S.K., and Ruigrok, T.J. (1998): Microcircuitry and function of the inferior olive. Trends Neurosci 21, 391-400. Dehner, L.R., Clemo, H.R., Meredith, M.A. (2000): Cross-modal circuitry of anterior ectosylvian sulcal (AES) cortex: I. Anatomical connections from auditory Field AES to somatosensory SIV, Soc Neurosci Abstr 26, 1221. Deliège, I. (1987): Grouping conditions in listening to music: An approach to Lerdahl and Jackendoff’s grouping preference rules. Music Perception 4, 325-360. Demany, L., and Armand, F. (1984): The perceptual reality of tone chroma in early infancy. J Acoust Soc Am 76, 57-66. Denham, S.L. (2001): Cortical synaptic depression and auditory prerception. In: S. Greenberg and M. Slaney (eds) Computational models of auditory function. IOS Press, 281-296. Desain, P. (1992): A (de)composable theory of thythm perception. Music Perception, 9(4), 439-454. Desain, P., and Honing, H. (1991): The quantization of musical time: A connectionist approach. In: P.M. Todd, and D.G. Loy (eds) Music and connectionism. Cambridge, MA: MIT Press, 150-167. Desain, P.W.M., and Honing,, H.J. (2002): Rhythmic stability as explanation of category size. In: Proceedings of the International Conference on Music Perception and Cognition. Sydney: UNSW Desimone, R., Gross, C.G. (1979): Visual areas in the temporal cortex of the macaque. Brain Res 178, 363380. Deutsch, D. (1974a): An auditory illusion. J Acoust Soc Am 55, S18-S19. Deutsch, D. (1974b): An auditory illusion. Nature 251, 307-309. Deutsch, D. (1975a): Musical illusions. Scientific American 233, 92-104. Deutsch, D. (1975b): Two-channel listening to musical scales. J Acoust Soc Am 57, 1156-1160. Deutsch, D. (1978a): Binaural integration of tonal patterns. J Acoust Soc Am 64, S146. Deutsch, D. (1978b): Delayed pitch comparisons and the principle of proximity. Perception and Psychophysics 23, 227-230. Deutsch, D. (1979): Binaural integration of melodic patterns. Perception and Psychophysics 25, 399-405. Deutsch, D. (1981): The octave illusion and auditory perceptual integration. In: J.V. Tobias and E.D. Schubert (eds) Hearing research and theory. (Volume I). Academic Press: New York Deutsch, D. (1982a): Grouping mechanisms in music. In: D. Deutsch (ed) The psychology of music. Orlando: Academic Press, 98-134. Deutsch, D. (1982b): The processing of pitch combinations. In: D. Deutsch (ed) The Psychology of Music. New York : Academic Press, 271-316. Deutsch, D. (1982c): The psychology of music. Orlando: Academic Press Deutsch, D. (1983): The generation of two isochronous sequences in parallel. Perception and Psychophysics 34, 334-337. Deutsch, D. (1984): Two issues concerning tonal hierarchies: Comment on Castellano, Bharucha and Krumhansl. J Exp Psychol: General 113, 413-416. Deutsch, D., and Feroe, J. (1981) The internal representation of pitch sequences in tonal music. Psychological Review 88, 503-522. Deutsch, D., and Roll, P.L. (1976): Separate ‘what’ and ‘where’decision mechanisms in processing a dichotic tonal sequence. Journal of Experimental Psychology: Human Perception and Performance 2, 2329. Divenyi, P.L., and Hirsch, I.J. (1972): Discrimination of the silent gap in two-tone sequences of different frequencies. J Acoust Soc Am 52, 166S. Divenyi, P.L., and Hirsch, I.J. (1974): Identification of temporal order in three-tone sequences. J Acoust Soc Am 56, 144-151. Dodd, B. (1977): The role of vision in the perception of speech. Perception 6, 31-40. Donnadieu, S., McAdams, S., and Winsberg, S. (1994): Caractérisation du timbre des sons complexes. I: Analyse multidimensionnelle. Journal de Physique 4(C5), 593-596. Dowlin, W.J. (1978): Scale and contour: Two components of a theory of memory for melodies. Psychol Rev 167
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
85, 341-354. Dowling, W.J., Lung, K.M.-T., and Herrbold, S. (1987): Aiming attention in pitch and time in the perception of interleaved melodies. Perception and Psychophysics 41(6), 642-656. Dowling, W.J., and Harwood, D.L. (1986): Music cognition. Academic Press, Orlando, Florida Drake, C., and Palmer, C. (1993): Accent structures in music performance. Music Perception 10, 343-378. Driver, J.(1996): Enhancemen of selective listening by illusory mis-location of speech sounds due to lip-reading. Nature 381(6577), 66-68. Dräger, U.C., Hubel, D.H. (1976): Topography of visual and somatosensory projections in mouse superior colliculus, J Neurophysiol 39, 91-101. Dräger, U.C., and Hubel, D.H. (1975): Responses to visual stimulation and relationship between visual, auditory, and somatosensory inputs in mouse superior colliculus. J Neurophysiol 38, 690-713. Dubner, R., and Rutledge, L.T. (1964): Recording and analysis of converging input upon neurons in cat association cortex. J Neurophysiol 27, 620-634. Dubner, R., and Rutledge, L.T. (1965): Intracellular recording of the convergence of input on neurons in cat association cortex. Exp Neurol 12, 349-369. Ducan, J. (2001): An adaptive coding model of neural function in prefrontal cortex. Nat Rev Neurosci 2, 820829. Duhamel, J-R., Colby, C.L., Goldberg, M.E. (1991): Congruent representations of visual and somatosensory space in single neurons of monkey ventral intraparietal cortex (area VIP). In: J. Paillard (ed) Brain and Space. Oxford University Press, New York, 223-236. Durlach, N.I. (1963): Equalization and cancellation theory of binaural masking-level differences. J Acoust Soc Am 35, 1206-1218. Ebner, F.F., Armstrong-James, M.A. (1990): Intracortical processes regulating the integration of sensory information. Prog Brain Res 86, 129-141. Edwards, S.B. (1977): The commissural projection of the superior colliculus in the cat. J Comp Neurol 173, 23-40. Eimer, M. (1999): Can attention be directed to opposite locations in different modalities? An ERP study. Clin Neurophysiol 110, 1252-1259. Erickson, R. (1975): Sound structure in music. Berkeley, California: University of California Press Erulkar, S.D. (1972): Comparative aspects of spatial localization of sounds. Physiol Rev 52, 237-360. Essens, P.J. (1986): Hierarchical organization of temporal patterns. Perception and Psychophysics 40(2), 6973. Ettlinger, G., Wilson, W.A. (1990): Cross-modal performance: behavioural processes, phylogenetic considerations and neural mechanisms. Behav Brain Res 40, 169-192. Faingold, C.L. et al. (1991): Involvement of GABA in acoustically-evoked inhibition in inferior colliculus neurons. Hear Res 52, 201-216. Faingold, C.L. et al. (1993): Stimulation or blockade of the dorsal ucleus of the lateral lemniscus alters binaural and tonic inhibition in contralateral inferior colliculus neurons. Hear Res 69, 98-106. Fallon, J.H., and Benevento, L.A. (1977): Auditory-visual interaction in cat orbital-insular cortex. Neurosci. Lett 6, 143-149. Fant, G. (1973): Speech sounds and features. Cambridge, Mass. : MIT Press Fechner, G. (1966/1860): Elements of psychophysics. New York: Holt (Original publication in German, 1860) Feldon, S., Feldon, P., and Kruger, L. (1970): Topography of the retinal projection upon the superior colliculus of the cat. Vision Res 10, 135-143. Feng, A.S., Hall, J.C., Siddique, S. (1991): Coding of temporal parameters of complex sounds by frog auditory nerve fibers. J Neurophysiol 65, 424-445. Feng, A.S., Hall, J.C., and Gooler, D.M. (1990): Neural basis of sound pattern recognition in anurans. Prog Neurobiol 34, 313-329. Fiez, J.A., Raichle, M.E., Miezin, F.M., Petersen, S.E., Tallal, P., Katz, W.F. (1995): PET studies of auditory and phonological processing effects of stimulus characteristics and task demands. J Cogn Neurosci 7, 357-375. Finlay, B.L., Schneps, S.E., Wilson, K.G., Schneider, G.E. (1978): Topography of visual and somatosensory projections to the superior colliculus of the golden hamster. Brain Res 142, 223-235. 168
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Fisher, H., and Freedman, S. (1968): The role of the pinna in auditory localisation. J Audit Res 8, 15-26. Fishman, M.C., and Michael, C.R. (1973): Integration of auditory information in the cat’s visual cortex. Vision Res 13, 1415-1419. Fitzgibbon, P.J., Pollatsek, A., and Thomas, I.B. (1974): Detection of temporal gaps within and between perceptual tonal groups. Perception and Psychophysics 16, 522-528. Fitzpatric, D.C., Kuwada, S., Batra, R., and Trahiotis, C. (1995): Neural responses to simple, simulaed echoes in the auditory brainstem of the unanesthetized rabbit. J Neurophysiol 74, 2469-2486. Fitzpatrick, K.A., Imig, T.J. (1978): Projections of auditory cortex upon the thalamus and midbrain of the owl monkey. J Comp Neurol 177, 537-536. Fortin, C., Rousseau, R., Bourque, P., and Kirouac, E. (1993): Time estimation and concurrent nontemporal processing: specific interference from short-term-memory demands. Percept Psychophys 53, 536548. Fortin, C., and Breton, R. (1995): Temporal interval production and processing in working memory. Percept Psychophys 57, 203-215. Foxe, J.J., Morocz, I.A., Murray, M.M., Higgins, B.A., Javitt, D.C., Schroeder, C.E. (2000): Multisensory auditory-somatosensory interactions in early cortical processing revealed by high-density electrical mapping. Cogn Brain Res 10, 77-83. Foxe, J.J., Simpson, G.V., Ahlfors, S.P. (1998): Parieto-occipital ~10 Hz activity reflects anticipatory state of visual attention mechanisms, NeuroReport 9, 3929-3933. Fraisse, P. (1956): Les structures rythmiques. Louvain: Editions Universitaires Fraisse, P. (1963): Psychology of time. New York: Harper Fraisse, P. (1978): Time and rhythm perception. In: E.C. Carterette and M.P. Friedman (eds) Handbook of perception, 8. New York: Academic Press Fraisse, P. (1982): Rhythm and tempo. In: D. Deutsch (ed) The psychology of music. New York: Academic Press, 149-180. Fraisse, P., Pichot, P., and Clairouin, G. (1949): Les aptitudes rythmiques. Etude comarée des oligophrènes et des enfants normaux. Journal de Psychologie Normale et Pathologique 42, 309-330. Francès, R. (1958): La perception de la musique. Paris: Vrin Francès, R. (1988): The perception of music. Hillsdale, N.J. : Lawrence Erlbaum Associates (trans. by W.J. Dowling from La perception de la musique, 2nd ed., Paris : Vrin, 1972) Francès, R. (1988): The perception of music. Hillsdale, N.J. : Lawrence Erlbaum Associates (trans. by W.J. Dowling from La perception de la musique, 2nd ed., Paris : Vrin, 1972) Frauenfelder, U.H. (1991): Une introduction aux modèles de reconnaissance des mots parlés. In: R. Kolinsky, J. Morais, and J. Segui (eds) La reconnaissance des mots dans les différentes modalités sensorielles: Etudes de psycholinguistique cognitive. Presses Universitaires de France, Paris, 7-36. Frauenfelder, U.H., and Tyler, L.K. (1987): The process of spoken word recognition: An introduction. Cognition 25, 1-20. Freeman, J.A. (1970): Responses of cat cerebellar Purkinje cells to convergent inputs from cerebral cortex and peripheral sensory systems. J Neurophysiol 33, 697-712. Frens, M.A., Van Opstal, A.J., Van der Willigen, R.F. (1995): Spatial and temporal factors determine audiovisual interactions in human saccadic eye movements. Percept Psychophysics 57, 802-816. Fries, W. (1984): Cortical projections to the superior colliculus in the macaque monkey: a retrograde study using horseradish peroxidase. J Comp Neurol 230, 55-76. Friston, K.J., Buechel, C., Fink, G.R., Morris, J., Rolls, E., Dolan, R..J (1997): Psychophysiological and modulatory interactions in neuroimaging. NeuroImage 6, 218-229. Fujita, I., and Konishi, M. (1991): The role of GABAergic inhibition in processing of interaural time difference in the owl’s auditory system. J Neurosci 11, 722-39. Gabrielsson, A. (1974): Performance of rhythm patterns. Scandinavian Journal of Psychollogy 15, 63-72. Gabrielsson, A. (1979): Experimental research on rhythm. The Humanities Association Review 30(1/2), 6992. Gabrielsson, A. (1982): Perception and performance of musical rhythm. In: M. Clynes (ed). Music, mind, and brain. New York: Plenum Press, 159-169. Gabrielsson, A. (1987): Once again: the theme from Mozart’s piano sonata in A major (K 331). In: A. 169
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Gabrielsson (ed) Action and perception in rhythm and music. Stockholm: Royal Swedish Academy of Music, 81-104. Gaffan, D., Harrison, S. (1991): Auditory-visual associations, hemispheric specialization and temporalfrontal interaction in the rhesus monkey. Brain 114, 2133-2144. Gardner, M.B., and Gardner, R.S. (1973): Problem of localization in the median plane, effect of pinae cavity occlusion. J Acoust Soc Am 53: 400-408. Giard, M.H., Peronnet, F. (1999): Auditory-visual integration during multi-modal object recognition in humans: a behavioral and electrophysiological study. J Cogn Neurosci 11, 473-490. Gibbon, Malapani, C., Dale, C.L., Gallister, C.R. (1997): Toward a neurobiology of temporal cognition: advances and challenges. Curr Opin Neurobiol 7, 170-184. Gibson, J.J. (1966): The senses considered as perceptual systems. Boston: Houghton-Mifflin Gibson, J.J. (1975): Events are perceivable but time is not. In: J.T. Fraser, and N. Lawrence (eds) The study of time II. New York: Springer-Verlag, 295-301. Gibson, J.J. (1979): The ecological approach to visual perception. Boston: Houghton-Mifflin (republished by L. Erlbaum Assoc., Hillsdale, N.J., 1986) Gilbert, C.D. (1993): Circuitry, architecture, and functional dynamics of visual cortex. Cereb Cortex 3, 373386. Gilbert, C.D. (1998): Adult cortical dynamics. Physiol Rev 78, 467-485. Gilbert, C.D., and Kelly, J.P. (1975): The projections of cells in differeent layers of the cat’s visual cortex. J Comp Neurol 163, 81-106. Gjerdingen, R.O. (1989): Meter as a mode of attending: A network simulation of attentional rhythmicity in music. Integral 3, 67-91. Gjerdingen, R.O. (1993): „Smooth’’ rhythms as probes of entrainment. Music Perception 10(4), 503-508. Glendenning, K. K., Brunso Bechtold, J. K., Thompson, G. C., and Masterton, R. B. (1981): Ascending auditory afferents to the nuclei of the lateral lemniscus. J Comp Neurol 197, 673-703. Goldberg, J.M.,, and Brown, P.B. (1969): Response of binaural neurons of dog superior olivary complex to dichotic tonal stimuli: some physioloical mechanisms of sound localization. J Neurophysiol 32, 613636. Goldberg, M.E., and Wurtz, R.H. (1972): Activity of superior colliculus in behaving monkey. II. Effect of attention on neuronal responses. J Neurophysiol 35, 560-574. Goldman-Rakic, P.S. (1987): Circuitry of primate prefrontal cortex and regulation of behavior by representational memory. In: V. Mountcastle, F. Plum (eds) The nervous system, higher functions of the brain, Vol 5, Handbook of physiology. Washington, DC: American Physiological Society, 373-417. Gomes, H. Ritter, W., and Vaughan, H.G., Jr. (1995): The nature of preattentive storage in the auditory system. J Cogn Neurosci 7, 81-94. Gomes, H. et al. (1997): Storage of feature conjunctions in transient auditory memory. Psychophysiol 34, 712-716. Gonzalo, D., Shallice, T., Dolan, R. (2000): Time-dependent changes in learning audiovisual associations: a single-trial fMRI study. NeuroImage 11, 243-255. Gooler, D.M., and Feng, A.S. (1992): Temporal coding in the frog auditory midbrain: the influence of duration and rise-fall time on the processing of complex amplitude-modulated stimuli. J Neurophysiol 67, 1-22. Gordon, B. (1973): Receptive fields in deep layers of cat superior colliculus. J Neurophysiol 36, 157-178. Graham, J. (1977): An autoradiographic study of the efferent connections of the superior colliculus in the cat. J Comp Neurol 173, 629-654. Graham, J., Lin, C.-S., and Kaas, J.H. (1979): J. Comp. Neurol. 187: 557-580. Graham, J., Pearson, H.D., Berman, N., and Murphy, E.H. (1981): Laminar organization of superior colliculus in rabbit: a study of receptive field properties of single units. J Neurophysiol 45, 915-932. Grantyn, A., and Grantyn, R. (1982): Axonal patterns and sites of termination of cat superior colliculus neurons projecting in the tecto-bulbo-spinal tract. Exp Brain Res 46, 243-256. Grantyn, R., Ludwig, R., and Eberhardt, W. (1984): Neurons of the superficial tectal gray. An intracellular HRP-study on the kitten superior colliculus in vitro. Exp Brain Res 55, 172-176. Graybiel, A.M. (1975): Anatomical organization of retinotectal afferents in the cat: an autoradiographyic 170
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
study. Brain Res 96, 1-23. Graziano, M.S., Yap, G.S., and Gross, C.G. (1994): Coding of visual space by premotor neurons. Science 266, 1054-1057. Graziano, M.S.A., and Gross, C.G. (1993): A bimodal map of space: somatosensory receptive fields in the macaque putamen with corresponding visual processing visual receptive fields. Exp Brain Res 97, 96109. Graziano, M.S.A., and Gross, C.G. (1997): Visuospatial properties of ventral premotor cortex, J Neurophysiol 77, 2268-2292. Graziano, M.S.A., and Gross, C.G. (1998): Spatial maps for the control of movement. Current Opin Neurobiol 8, 195-201. Green, D.M. (1976): An introduction to hearing. Hillsdale, N.J. : Lawrence Erlbaum Associates Greenberg, S., Marsh, J.T., Brown, W.S., and Smith, J.C. (1987): Neural temporal coding of low pitch. I. Human frequency-following responses to complex tones. Hearing Res 25, 91-114. Grey, J. M. (1977): Multidimensional perceptual scaling of musical timbres. J Acoust Soc Am 61, 1270-1277. Groh, J.M. and Werner-Reiss, U. (2002): Auditory and visual integration. Encyclopedia of the Human Brain Volume 4 Elsevier, 2002 Groh, J.M., Sparks, D.L. (1996): Saccades to somatosensory targets. III. Eye-position-dependent somatosensory activity in primate superior colliculus. J Neurophysiol 75, 439-453. Grothe, B. (1994): Interaction of excitation and inhibition in processing of pure tone and amplitude-modulated stimuli in the medial superior olive of he mustached bat. J Neurophysiol 71, 706-721. Guigon, E., Grandguillaume, P., Otto, I., Boukhil, L., and Burnod, Y. (1994): Neural network models of cortical functions based on the computational properties of the cerebral cortex. J Physiol Paris 88, 291308. Guitton, L., Munoz, D.P. (1991): Control of orienting gaze shifts by the tectoreticulospinal system in the head-free cat. I. Identification, localization, and effects of behavior on sensory responses. J Neurophysiol 66, 1605-1623. Guttman, N., and Pruzansky, S. (1962): Lower limits of pitch and musical pitch. Journal of Speech and Hearing Research 5, 207-214. Hackett, T.A., Stepniewska, I., Kaas, J.H. (1999): Prefrontal connections of the auditory parablet cortex in macaque monkeys. Brain Res 817, 45-58. Hadjikhani, N., Roland, P.E. (1998): Cross-modal transfer of information between the tactile and the visual representations in the human brain: a positron emission tomographic study. J Neurosci 18, 1072-1084. Hall, W.C., and Lee, P. (1997): Interlaminar connections of the superior colliculus in the tree shrew. III. The optic layer. Vis Neurosci 14, 647-661. Halpern, A.R. (1988): Perceived and imagined tempos of familiar songs. Music Perception 6(2), 193-202. Halsband, U. et al. (1993): The role of premotor and the supplementary motor area in the temporal control of movement in man. Brain 116, 243-266. Hardy, S.C., and Stein, B.E. (1988): Small lateral suprasylvian cortex lesions produce visual neglect and decreased visual activity in the superior colliculus. J Comp Neurol 273, 527-542. Hargreaves, D.J., and North, A. (eds) (1997): The social psychology of music. NewYork: Oxford University Press Harrington, D.L., Haaland, K.Y., Knight, R.T. (1998b): Cortical networks underlying mechanisms of time perception. J Neurosci 18, 1085-1095. Harris, L.R. (1980): The superior colliculus and movements of the head and eyes in cats. J Physiol 300, 367391. Harrison, R. (1941): Personal tempo and the interrelationships of voluntary and maximal rates of movement. Journal of General Psychology 24-25, 343.379. Harting, J.K. (1977): Descending pathways from the superior colliculus: an autoradiographic analysis in the rhesus monkey (Macaca mulatta). J Comp Neurol 173, 583-612. Harting, J.K., and Guillery, R.W. (1976): Organization of retinocollicular pathways in the cat. J Comp Neurol 273, 527-542. Hartline, P.H., Kass, K., Loop, M.S. (1978): Merging of modalities in the optic tectum: infrared and visual integration in rattlesnakes. Science 199, 1225-1229. 171
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Hartline, P.H., Pandey, Vimal, R.L., King, A.J., Kurylo D.D., Northmore, D.P.M. (1995): Effects of eye position on auditory localization and neural representation of space in superior colliculus of cats. Exp Brain Res 104, 402-408. Hasty, C.F. (1997): Meter as rhythm. NY: Oxford University Press Hazeltine, E., Helmuth, L.L., Ivry, R.B. (1997): Neural mechanisms of timing. Trends Cogn Sci 1, 163-169. He, J., Ojima, H., Hashikawa, T., Jones, E.G. (1994): Neuronal responses to noise-burst in and connection of anterodorsal region of cat primary auditory cortex. Soc Neurosci Abstr 20, 324. He, J.F., Hashikawa, T., Ojima, H., and Kinouchi, Y. (1997): Temporal integration and duration tuning in the dorsal zone of cat auditory cortex. J Neurosci 17, 2615-2625. Heath, C.J., and Jones, E.G. (1971): The anatomical organization of the suprasylcian gyrus of the cat. Ergebn Anat Entwicklungsgesch 45, 1-64. Heffner, H.E., Heffner, R.S. (1990): Effect of bilateral auditory cortex lesions on sound localization in Japanese macaques. J Neurophysiol 38, 1340-1358. Heilman, K.M., Watson, R.T., Valenstein, E. (1985): Neglect and related disorders. In: K.M. Heilman, E. Valenstein (eds) Clinical neuropsychology. New York: Ocford UP, 243-293. Helmholtz, H. von (1885/1954): On the Sensations of Tone. (republ. 1954, New York: Dover (trans. by A.J. Ellis from Die Lehre von den Tonempfindungen, 4th ed., 1877) Helmuth, L.L., and Ivry, R. B. (1996): When two hands are better than one: reduced timing variability during bimanual movements. J Exp Psychol Hum Percept Perform 22, 278-293 Henderson, M.T. (1936): Rhythmic organization in artistic piano performance. In: C.E. Seashore (ed) Objective analysis of musical performance. University of Iowa Studies in the Psychology of Music IV, 281-305. Hennevin, E., Maho, C., and Hars, B. (1998): Neuronal plasticity induced by fear conditioning is expressed during paradoxical sleep: evidence from simultaneous recordings in the lateral amygdala and the medial geniculate in rats. Behavioral Neuroscience 112(4), 839-862. Henning, G. B. (1974): Detectability of interaural delay in high-frequency complex waveforms. J Acoust Soc Am 55, 84-90. Hicks, T.P., Benedek, G., Thurlow, G.A. (1988): Modality specificity of neuronal responses within the cat’s insula. J Neurophysiol 60, 422-437. Hikosaka, K, Iwai, E, Saito, H, Tanaka, K (1988): Polysensory properties of neurons in the anterior bank of the caudal superior temporal sulcus of the macaque monkey. J Neurophysiol 60, 1615-1637. Hikosaka, O., and Wurtz, R.H. (1983): Visual and oculomotor functions of monkey substantia nigra pars reticulata. I. Relation of visual and auditory responses to saccades. J Neurophysiol 49, 1230-1252. Hikosaka, O., and Wurtz, R.H. (1985): J Neurophysiol 53, 292-308. Hillyard, S.A., Simpson, G.V., Woods, D.L., VanVoorhis, S., Munte, T.F. (1984): Event-related brain potentials and selective attention to different modalities, In: F. Reinoso-Suarez, C. Ajmone-Marsan (eds) Cortical Integration. Raven, New York, 395-415. Hind, J.E., Goldberg, J.E., Greenwood, D.D., and Rose, J.E. (1963): Some discharge characteristics of single neurons in the inferior colliculus of the cat. II. Timing of the discharges and observations on binaural stimulation. J Neurophysiol 26, 321-341. Hirsch, J. A., Chan, J. C., and Yin, T. C. (1985): Responses of neurons in the cat’s superior colliculus to acoustic stimuli. I. Monaural and binaural response properties. J Neurophysiol 53, 726-45. Hoffman, K.-P., and Cynader, M. (1976): Visual responses and direction selectivity in cells of superficial and deep laminae in the cat’s superior colliculus. Exp Brain Res Suppl 1, 537-540. Horn, G. (1965): The effect of somaesthetic and photic stimuli on the activity of units in the striate cortex of unanaesthetized, unrestrained cats. J Physiol Lond 179, 263-277. Horn, K.M., Miller, S.W., and Neilson, H.C. (1983): Visual modulation of neuronal activity within the rat vestibular nuclei. Exp Brain Res 52, 311-313. Horváth, J., Czigler, I., Sussman, E., and Winkler, I. (2001): Simultaneously active pre-attentive representations of local and global rules for sound sequences. Cogn Brain Res 12, 131-144. Hotta, T., and Kameda, K. (1963): Interactions between somatic and visual or auditory responses in the thalamus of the cat. Exp Neurol 8, 1-13. Hotta, T., and Terashima, S. (1965): Audiovisual interactions and its correlation with cortical stimulation in 172
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
the lateral thalamus. Exp Neurol 12, 146-158. Houk, J.C., and Barto, A.G. (1992): Distributed sensorimotor learning. In: G:E. Stelmach, and J. Requin (eds) Tutorials in Motor Behavior II. Elsevier, 71-100. Howard, I.P., Templeton, W.B. (1966): Human spatial orientation. Wiley, London Howells, T (1944): The experimental developmen of color-tone synesthesia. J Exp Psychol 34, 87-103. Huang, C.C., and Lindsley, D.B. (1973): Polysensory responses and sensory interaction in pulvinar and related posterolateral thalamic nuclei in cat. Eletroencephalogr Clin Neuophysiol 34, 265-280. Hubel, D.H., LeVay, S., and Wiesel, T.N. (1975): Brain Res 96, 25-40. Huerta, M.F., Harting, J.K. (1984): The mammalian superior colliculus: studies of its morphology and connections. In: H. Vanegas (ed) Comparative neurology of the optic tectum. Plenum Press, New York, 687-773. Huggins, W.H. (1952): A phase principle for complex frequency analysis and its implications in auditory theory. J Acoust Soc Am 24, 582-589. Huggins, W.H. (1953): A theory of hearing. In: W. Jackson (ed) Communication Theory. Butterworths, London, 303-379. Hughes, H.C., Reuter-Lorenz, P.A., Nozawa, G., Fendrich, R. (1994): Visual-auditory interactions in sensorimotor processing: saccades versus manual responses. J Exp Psychol Hum Percept Perform 20, 131153 Husain, M., Shapiro, K., Martin, J., Kennard, C. (1997): Abnormal temporal dynamics of visual attention in spatial neglect patients. Nature 385, 154-156. Hyde, P.S., Knudsen, E.I. (2000): A topographic projection from the optic tectum to the auditory space map in the inferior colliculus of the barn owl. J Comp Neurol 421, 146-160. Imada, T., et al. (1993): Mismatch fields evoked by a rhythm passage. In: L. Deecke, C. Baumgartner, G. Stroink, and S.J. Williamson (eds) Adv. biomagnetism. The 9th Int. Conference on Biomagnetism, Vienna, Austria, 118-119. Ingle, D., and Sprague, J.M. (1975): Sensorimotor Function of the Midbrain Tectum. Neurosciences Research Progress Bulletin 13(2) Cambridge: MIT Press Iriki, A., Tanaka, M., Iwamura, Y.(1996): Coding of modified body schema during tool use by macaque postcentral neurones. NeuroReport 7, 2325-2330. Irvine, D.R.F. (1987): A comparison of two methods for the measurement of neural sensitivity to interaural intensity differences. Hear Res 30, 169-180. Irvine, D.R.F. (1992): Physiology of the auditory brainstem. In: A. Popper and R. Fay (eds) The Mammalian Auditory Pathway: Neurophysiology. NY: Springer Irving, R., and Harrison, J.M. (1967): The superior olivary complex and audition: a comparative study. J Comp Neurol 130, 77-86 Ito, S.I. (1982): Prefrontal unit activity of macaque monkeys during auditory and visual reaction time tasks. Brain Res 247, 39-47. Itoh, K., Conley, M., and Diamond, I.T. (1981): Brain Res. 207, 147-152.Ivry, R. (1993) Cerebellar involvement in the explicit representation of temporal information. Ann New York Acad Sci 682, 214-230 Ivry, R. (1996): The representation of temporal information in perception and motor control. Curr Opin Neurobiol 6, 861-857. Ivry, R., Diener, H.C. (1991): Impaired velocity perception in patients with lesions of the cerebellum. J Cogn Neurosci 3, 355-366. Ivry, R., Keele, S., and Diener, H.C. (1988): Dissociation of the lateral and medial cerebellum in movement timing and movement execution. Exp Brain Res 73, 167-180. Ivry, R., and Hazeltine, R.E. (1995): Perception and production of temporal intervals across a range of durations: evidence for a common timing mechanism. J Exp Psychol Hum Percept Perform 21, 3-18. Ivry, R., and Keele, S. (1989): Timing functions of the cerebellum. J Cogn Neurosci 1, 136-152. Ivry, R., and Mangles, J. (1997): The many manifestations of a cerebellar timing mechanism. Presented at the fourth Annual Meeting of the Cognitive Neuroscience Society, March 23 Ivry, R.B. (1997): Cerebellar timing systems. Int Rev Neurobiol 41, 555-573. Jabbur, S.J., Atweh, S.F., Tomey, G.F., and Banna, N.R. (1971): Visual and auditory inputs into the cuneate nucleus. Science 174, 1146-1147. 173
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Jagacinski, R.J., Marchburn, L., Klapp, S.L., and Jones, M.R. (1988): Tests of parallel versus integrated structure in polyrhythmic tapping. Journal of Motor Behaviou, 20(4), 416-442. Jancke, L., Chah, N.J., and Peters, M. (200b): Cortical activations in primary and secondary motor areas for complex bimanual movements in proffessional pianists. Cognit Brain Res 10, 177-183. Jay, M.F., and Sparks, D.L. (1984): Auditory receptive fields in primate superior colliculus shift with changes in eye position. Nature Lond 309, 345-347. Jay, M.F., and Sparks, D.L. (1987a): Sensorimotor integration in the primate superior colliculus. I. Motor convergence. J Neurophysiol 57, 22-34. Jay, M.F., and Sparks, D.L. (1987b): Sensorimotor integration in the primate superior colliculus. II. Coordinates of audittory signals. J Neurophysiol 57, 35-55. Jeffress, L.A. (1948): A place theory of sound localization. J Comp Physiol Psychol 41, 35-39. Jeffrey, G. (1985): Retinotopic order appears before ocular separation in developing visual pathways. Nature 313, 575-576. Jen, L.S., and Au, C. (1986): Intercollicular fibers terminating in the superficial layers of the superior colliculus: A WGA-HRP study in the rat. Brain Res 379, 385-389. Jenkins, W.M., Masterton, R.B. (1982): Sound localization: effects of unilateral lesions in central auditory system. J Neurophysiol 47, 987-1016. Jenkins, W.M., Merzenich, M.M. (1984): Role of cat primary auditory cortex for sound localization behavior. J Neurophysiol 52, 819-847. Jeuptner, I.H., Rijntes, M., Weiller, C., Faiss, J.H., Timmann, D., Mueller, S.P., Diener, H.C. (1995) Localization of a cerebellar timing process using PET. Neurology 45, 1540-1545. Jeuptner, M., Flerich, L., Weiller, C., Mueller, S.P., and Hans-Christoph, D. (1996): The human cerebellum and temporal infromation processing: results from a PET expperiment. NeuroReport 7, 2761-2765. Jeuptner, M., Rijntjes, M., Weiller, C., Faiss, J.H., Timmann, D., Mueller, S.P., and Diener, H.C. (1995): Localization of a cerebellar timing process using PET. Neurology 45, 1540-1545. Jiang, H., Lepore, F., Pito, M., Guillemot, J.P. (1994): Sensory interactions in the anterior ectosylvian cortex of cats. Exp Brain Res 101, 385-396. Jiang, Z.D., King, A.J., and Moore, D.R. (1993): Topographic projection from the brachium of the inferior colliculus to the space-mapped region of the superior colliculus in the ferret. Br J Audiol 27, 344-345. Johnson, D. (1980): The relationship between spike rate and synchrony in responses of auditory-nerve fibres to single tones. J Acoust Soc Am 68, 1115-1122. Jones, A.M. (1959): Studies of African music (Vols. I and II). London: Oxford University Press. Jones, E.G., Powell, T.P.S. (1970): An anatomical study of converging sensory pathways within the cerebral cortex of the monkey. Brain 93, 793-820. Jones, M.R. (1976): Time, our lost dimension: Toward a new theory of perception, attention, and memory. Psychological Review 83(5), 323-355. Jones, M.R. (1986): Attentional rhythmicity in human perception. In: J. Evans, and M. Clynes (eds) Rhythm in psychological, linguistic, and musical processes. Springfield, III.: Charles Thomas Publishers, 8399. Jones, M.R. (1990a): Learning and the development of expectancies: An interactionist approach. Psychomusicology 9(2), 193-228. Jones, M.R. (1990b): Musical events and models of musical time. In: R.A. Block (ed) Cognitive models of psychological time. Hillsdale, NJ: Larence Erlbaum, 207-240. Jones, M.R. (1992): Attending to musical events. In: M.R. Jones, and S. Holleran (eds) Cognitive bases of musical communication. Washington, DC: American Psychological Association, 91-110. Jones, M.R. (1993): Understanding melody and music. Kow melody and rhythm fit together. In: T. Tighe and W.J. Dowlings (eds) Psychological approaches to understanding music. 67-92. Jones, M.R. and Boltz, M. (1989): Dynamic attending and responses to time. Psychological Review 96(3), 459-491. Jones, M.R., Kidd, G., and Wetzel, R. (1981): Evidence for rhythmic attention. Journal of Experimental Psychology: Human Perception and Performance 7(5), 1059-1073. Jones, M.R., and Yee, W. (1993): Attending to auditory events: the role of temporal organization. In: S. McAdams, and E. Bigand (eds) Thinking in sound: The cognitive psychology of human audition . 174
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Oxford: Oxford University Press, 69-112. Jones, M.R., and Yee, W. (1997): Sensitivity to time change: The role of context and skill. J Exp Psychol: Human Percept Perform 23, 693-709. Jordan, D., Shepard, R.N. (1987): Tonal schemas: Evidence obtained by probing distorted musical scales. Perception and Psychophysics 41, 489-504. Jordan, D.S. (1987): Influence of the diatonic tonal hierarchy at microtonal intervals. Perception and Psychophysics 41, 482-488. Joris, P.X., and Yin, T.C.T. (1998): Envelope coding in the lateral superior olive. III. Comparison with afferent pathways. J Neurophysiol 79, 253-269. Jung, R., Kornhuber, H.H., and DaFonseca, J.S. (1963): Multisensory convergence on cortical neurons: neuronal effects of visual, acoustic and vestibular stimuli in the superior convolutions of the cat’s cortex. Prog Brain Res 1, 207-234. Kaas, J.H., and Huerta, M.F. (1988): The subcortical visual system of primates. Comp Primate Biol 4, 327391. Kadunce DC, Vaughan JW, Wallace MT, Benedek G, Stein BE (1997): Mechanisms of within-modality and cross-modality supression in the superior colliculus. J Neurophysiol 78, 2834-2847. Kanaseki, T., and Sprague, J.M. (1974): Anatomical organization of pretextal nuclei and tectal laminae in the cat. J Comp Neurol 158, 319-338. Karnickaya, E.G., Mushnikov, V.N., Slopokurova, N.A., and Zhukov, S.J. (1975): Auditory processing of steady state vowels. In: G. Fant, and M.A.A. Tatham (eds) Auditory analysis and speech perception. Academic, London, 37-53. Kawamura, S. (1974): Topological organization of the extrageniculate visual system in the cat. Exp Neurol 45, 451-461. Kawamura, S., Sprague, J.M., and Niimi, K. (1974): Corticofugal projections from the visual cortices to the thalamus, pretectum, and superior colliculus in the cat. J Comp Neurol 158, 339-362. Kawashima, R., Okuda, J., Umetsu, A., Sugiura, M., Inoue, K., Suzuki, K., Tabuchi, M., Tsukiura, T., Narayan, S.L., Nagasaka, T., Yanagawa, I., Fujii, T., Takahashi, S., Fukuda, H., and Yamadori, A. (2000): Human cerebellum plays an important role in memory-timed finger movement: an fMRI study. J Neurophysiol 83, 1079-1087. Keele, S., et al. (1985): Do perception and motor production share a common timing mechanism? Acta Psychol 60, 173-193. Keil, Ch. (1995): The theory of participatory discrepancies: A progress report. Ethnomusicology 39(1), 1-20. Keller, C.H., and Takahashi, T.T. (1996): Responses to simulated echoes by neurons in the barn owl’s auditory space map. J Comput Phys 178, 499-512. Kelly, J.B. (1974): Localization of paired sound sources in the rat: small time differences. J Acoust Soc Am 55, 1277-1284. Kelly, J.B. et al. (1998): Monaural and binaural response properties of single neurons in the rat’s dorsal nucleus of the lateral lemniscus. Hear Res 122, 25-40. Kessler, E.J., Hansen, C., and Shepard, R.N. (1984): Tonal schemata in the perception of music in Bali and in the West. Music Perception 2, 131-165. Kim, J.J., and Thompson, R.F. (1997): Cerebellar circuits and synaptic mechanisms involved in classical eyeblink conditioning. Trends Neurosci 20, 177-181. Kimura, D. (1993): Neuromotor Mechanisms in Human Communication. OUP: Oxford King, A.J., Hutchings, M.E., Moore, D.R., and Blakemore, C. (1988): Developmental plasticity in the visual and auditory representations in the mammalian superior colliculus. Nature 332, 73-76. King, A.J., Jiang, Z.D., and Moore, D.R. (1998): Auditory brainstem projections to the ferret superior colliculus: anatomical contribution to the neural coding of sound azimuth. J Comp Neurol 390, 342-365. King, A.J., Schnupp, J.W.H., and Thompson, I.D. (1998): Signals from the Superficial Layers of the Superior Colliculus Enable the Development of the Auditory Space Map in the Deep Layers. J Neurosci 18(22), 9394-9408. King, A.J., and Carlile, S. (1989): Generation of an auditory space map in the ferret superior colliculus requires the presense of monaural localization cues. Soc Neurosci Abstr 15, 746. King, A.J., and Carlile, S. (1993): Changes induced in the representation of auditory space in the superior 175
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
colliculus by rearing ferrets with binocular eyelid suture. Exp Brain Res 94, 444-455. King, A.J., and Carlile, S. (1994): Neural coding for auditory space. In: M.S. Gazzaniga (ed) The cognitive neurosciences. Cambridge, MA: MIT Press, 279-293. King, A.J., and Palmer, A.R. (1983): Cells responsive to free-field auditory stimuli in guinea-pig superior colliculus: distribution and response properties. J Physiol Lond 342, 361-381. King, A.J., and Palmer, A.R. (1985): Integration of visual and auditory information in bimodal neurones in the guinea-pig superior colliculus. Exp Brain Res 60, 492-500. King, A.J., and Schnupp, J.W.H. (1999): Sensory convergence in neural function and development. In: M.S. Gazzaniga (ed) The new cognitive neurosciences. Cambridge, MA: MIT Press, 437-467. Klug, A., et al. (1995): Glycine and GABA influence binaural processing in the inferior colliculus of the mustache bat. J Neurophysiol 74, 1701-1713. Klug, A., et al. (1999): Multiple components of ipsilaterally evoked inhibition in the inferior colliculus. J Neurophysiol 82, 593-610. Knight, R.T., Hillyard, S.A., Woods, D.L., and Neville, H.J. (1981): The effects of frontal cortex lesions on event-related potentials during auditory selective attention. Electroencephalogr Clin Neurophysiol 52, 571-582. Knudsen, E.I. (1982): Auditory and visual maps of space in the optic tectum of the owl. J Neurosci 2, 11771194. Knudsen, E.I. (1983): Subdivisions of the inferior colliculus in the barn owl (Tyto alba). J Comp Neurol 218, 174-86. Knudsen, E.I. (1998): Capacity for plasticity in the adult owl auditory system expanded by juvenile experience. Science 279, 1531-1533. Knudsen, E.I. (1999): Mechanisms of experience-dependent plasticity in the auditory localization pathway of the barn owl. J Comp Physiol A 185, 305-321. Knudsen, E.I., and Brainard, M.S. (1991): Visual instruction of the neural map of auditory space in the developing optic tectum. Science 253, 85-87. Knudsen, E.I., and Brainard, M.S. (1995): Creating a unified representation of visual and auditory space in the brain. Annu Rev Neurosci 18, 19-43. Knudsen, E.I., and Knudsen, P.F. (1983): Space-mapped auditory projections from the inferior colliculus to the optic tectum in the barn owl (Tyto alba). J Comp Neurol 218, 187-96. Knudsen, E.I., and Konishi, M. (1978): A neural map of auditory space in the owl. Science 200, 795-7. Knudsen, E.I., du Lac, S., Easterly, S.D. (1987): Computational maps in the brain. Annu Rev Neurosci 10, 41-65. Koch, U., et al. (1998): GABAergic and glycinergic inhibition sharpens tuning for frequency modulations in the inferior colliculus of the big brown bat. J Neurophysiol 80, 71-82. Koelsch, S., Schröger, E., and Tervaniemi, M. (1999): Superior attentive and pre-attentive auditory processing in musicians. NeuroReport 10, 1309-1313. Koetting, J.T. (1978): An analytic study of Ashanti Kete drumming. Unpublished doctoral dissertation, University of California, Los Angeles Konishi, M. (1988): Neurophysiological and anatomical substrates of sound localisation in the owl. In: G. Edelman, W. Gall and W. Cowan (eds) Auditory Function. N.Y.: Wiley Konishi, M., Takahashi, T.T., Wagner, H., Sullivan, W.E., and Carr, C.E. (1988): Neurophysiological and anatomical substrates of sound localization in the owl. In: G.M. Edelman, W.E. Gall, and W.M. Cowan (eds) Auditory function - neurobiological bases of hearing. New York, Wiley, 721-745. Kramer, J.D. (1988): The time of music. New York: Schirmer Books. Kraus, N., et al. (1996): Central auditory system plasticity associated with speech discrimination training. J Cogn Neurosci 7, 25-32. Krimhoff, J., McAdams, S., Winsberg, S. (1994): Caractérisation du timbre des sons complexes. II: Analyses acoustiques et quantification psychophysique. Journal de Physique 4(C5), 625-628. Kronman, U., and Sundberg, J. (1987) Is the musical ritard an allusion to physical motion? In: A. Gabrielsson (ed) Action and perception in rhythm and music. Stockholm: Royan Academy of Music, 57-68. Krumhansl, C.L. (1979): The psychological representation of musical pitch in a tonal context. Cognitive Psychology 11, 346-374. 176
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Krumhansl, C.L. (1983): Perceptual structures for tonal music. Music Perception 1, 28-62. Krumhansl, C.L. (1987): General properties of musical pitch systems: Some psychological considerations. In: J. Sundberg (ed) Harmony and Tonality. Stockholm : Royal Swedish Academy of Music, publ. no. 54, 33-52. Krumhansl, C.L. (1989): Why is musical timbre so hard to understand? In: S. Nielzen & O. Olsson(eds) Structure and perception of electroacoustic sound and music. Elsevier, Amsterdam (Excerpta Medica 846), 43-53. Krumhansl, C.L. , Sandell, G.J., and Sergeant, D.C. (1987): The perception of tone hierarchies and mirror forms in twelve-tone serial music. Music Perception 5, 31-78. Krumhansl, C.L., and Shepard, R. N. (1979): Qualification of the hierarchy of tonal functions within a diatonic context. Journal of Experimental Psychology: Human Perception and Performance 5, 579-594. Kubota, T., Morimoto, M., Kanaseki, T., and Inomato, H. (1989): Projection from the superficial layers of the tectum to the pretectal complex in the cat. Brain Res Bull 22, 373-378. Kubovy, M., Cutting, J.E., and McGuire, R.M. (1974): Hearing with the third ear: Dichotic perception of a melody without monaural familiarity cues. Science 186, 272-274. Kudo, M., Tashiro, T., Higo, S. Matsuyama, T. and Kawamura, S. (1984): Ascending projections from the nucleus of the brachium of the inferior colliculus in the cat. Exp Brain Res 54, 203-211. Kuhl, P.K. (1991): Human adults and infants show a ‘perceptual magnet effect’ for the prototypes of speech categories, monkeys do not. Percept and Psychophys 50, 93-107. Kuwada, S., and Yin, T.C.T. (1983): Binaural interaction in low-frequency neurons in inferior colliculus of the cat. I. Effects of long interaural delays, intensity, and repetition rate on interaural delay function. J Neurophysiol 50, 981-999. Landgren, S., Silfvenius, H., and Wolsk, D. (1967): Vestibular, cochlear and trigeminal projections to the cortex in the anterior suprasylvian sulcus of the cat. J Physiol Lond 191, 561-573. Lane, R.H., Allman, J.M., and Kaas, J.H. (1971): Brain Res 26, 277-292. Langer, T.P. (1975): Cellular and fiber patterns in the superior colliculus. Thesis. University of Washington Larasson, J., Gulayas, B., and Roland, P.E. (1996): Cortical representation of self-paced finger movement. NeuroReport 7, 463-468. Large, E.W. (1994): Dynamic representation of musical structure. Unpublished PhD Dissertation. The Ohio State University Large, E.W. (1996): Modeling beat percepption with a nonlinear oscillator. In: Proceedings of the Eighteenth Music Perception and Cognition, August Large, E.W. (2000a): On synchronizing movements to music. Human Movement Science 19, 527-566. Large, E.W. (2000b): Rhythm categorization in context. In: Proceedings of the International Conference on Music Perception and Cognition, August. Large, E.W., McAuley, J.D., and Kolen, J.E. (1993): Adaptive oscillators for processing patterns of time. Paper presented at the meeting of the Society for Music Perception and Cognition, Philadelphia Large, E.W., and Jones, M.R. (1999): The dynamics of attending: how we track time varying events. Psychological Review 106 (1), 119-159. Large, E.W., and Kolen, J.F. (1994): Resonance and the perception of musical meter. Connection Science 6, 177-208. Large, W.E., and Palmer, C. (2002): Perceiving temporal regularity in music. Cognitive Science 26, 1-37. Larson, M., Stein, B.E. (1984): The use of tactile and olfactory cues in neonatal orientation and localization of the nipple. Dev Psychobiol 17, 423-436. LeBeau, F.E., et al. (2001): Iontophoresis in vivo demonstrates a key role for GABA(A) and glycinergic inhibition in shaping frequency response areas in the inferior colliculus of guinea pig. J Neurosci 21, 7303-7312. Lea, A. (1992): Auditory models of vowel perception. Unpublished doctoral dissertation. University of Nottingham, UK Lea, A. P. and Summerfield, Q. (1992): Monaural segregation of competing voices. Proc Acoust Soc Japan committee on Hearing H-92-31, 1-7. Lea, A. P. and Tsuzaki, M. (1993b): Segregation of voiced and whispered concurrent vowels in English and Japanese. J Acoust Soc Am 93, 2403 (A). 177
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Lea, A.P. and Tsuzaki, M. (1993a): Segregation of competing voices: perceptual experiments. Proc Acoust Soc Jap Spring session, 361-362. Lee, C.S. (1991): The perception of metrical structure: Experimental evidence and a model. In: P. Howell, R. West, and I. Cross (eds) Representing musical structure New York: Academic Press, 59-127. Lee, P., and Hall, W.C. (1995): Visual Neurosci 12, 573-588. Lee, P.H., Helms, M.C., Augustine, G.J., and Hall, W.C. (1997): Role of intrinsic circuitry in collicular sensorimotor integration. Proc Natl Acad Sci USA 94, 13299-13304. Lennartz, R.C., and Weinberger, N.M. (1992): Frequency selectivity is related to temporal processing in parallel thalamocortical auditory pathways. Brain Res 583, 81-92. Lerdahl, F. (1987): Timbral hierarchies. In: Music and Psychology: A Mutual Regard. S. McAdams (ed) Contemporary Music Review 2(1), 135-160. Lerdahl, F. (1988): Cognitive constraints on compositional systems. In: J. Sloboda (ed) Generative process es in music. Oxford : Oxford University Press Lerdahl, F., and Jackendoff, R. (1983): A generative theory of tonal music. Cambridge, MA: MIT Press Lerdahl, F., and Jackendoff, R. (1993): An overview of hierarchical structure in music. In: S.M. Schwanauer, and D.A. Levitt (eds) Machine models of music. Cambridge: MIT Press, 289-312. Lerdahl, F., and Jackendoff, R. (1996): A generative theory of tonal music. MIT Press Lester, J. (1986): The rhythms of tonal music. Carbondale: Southern Illinois University Press Lewis, J.W., Beauchamp, M.S., DeYoe, E.A. (2000): A comparison of visual and auditory motion processing in human cerebral cortex. Cereb Cortex 10, 888. Lewis, P.A., and Miall, R.Ch. (2003) Overview: An image of human neural timing. In: W.H. Meck (ed) Functional and neural mechanisms of interval timing. CRC Press, 515-532. Lewkowicz, D.J. (2000): The developmen of intersensory temporal perception: an epigenetic systems/limitations view. Psychol Bull 126, 281-308. Lewkowicz, D.J., Lickliter, R. (1994): The development of intersensory perception: Comparative perspec tives. Hillsdale, NJ. Erlbaum. Li, L., et al. (1992): Inhibitory influence of the dorsal nucleus of the lateral lemniscus on binaural responses in the rat’s inferior colliculus. J Neurosci 12, 4530-4539. Liberman, A.M., Harris, K.S., Hoffman, H.S., and Griffith, B.C. (1957): The discrimination of speech sounds within and across phoneme boundaries. J Exp Psychol: Human Percept Perform 54, 358-368. Liberman, A.M., and Prince, A. (1977): An stress and linguistic rhythm. Linguistic Inquiry 8, 249-336. Licklider, J.C.R. (1951a): A duplex theory of pitch perception. Experientia 7, 128-134. Licklider, J.C.R. (1951b): Basic correlates of the auditory stimulus. In: S.S. Stevens (ed) Handbook of Experimental Psychology. New York: Wiley, 985-1039. Licklider, J.C.R. (1959): Three auditory theories. In: S. Koch (ed) Psychology, a study of a science I. New York, Mcray-Hill, 41-144. Lindsay, P. H., and Norman, D. A. (1977): Human information processing: An introduction to psychology, 2nd ed. Academic Press, New York Litovsky, R.Y. (1997): Developmental changes in the precedence effect: Estimates of minimum audible angle. J Acoust Soc Am 102, 1739-1745. Litovsky, R.Y., and Ashmead, D.M. (1997): Developmental aspects of binaural and spatial hearing. In: R. H. Gilkey and T.R. Anderson (eds) Binaural and Spatial Hearing in Real and Virtual Environments. Erlbaum, Hillsdale, NJ Litovsky, R.Y., and Yin, T.C.T. (1998): Physiological studies of the precedence effect in the inferior colliculus of the cat. II. Neural mechanisms. J Neurophysiol 80, 1302-1316. Litovsky, R.Y., et al. (1999): The precedence effect. J Acoust Soc Am 106, 1633-1655. Locke, D. (1979): The music of Atsiabeko. Unpublished doctoral dissertation. Wesleyan University, Middletown, CL. Locke, D., and Agbeli, G. (1980): A study of drum language in Adzogbo. African Music 6(1), 32-51. Locke, S., and Kellar, L. (1973): Categorical perception in a nonlinguistic mode. Cortex 9, 355-369. Loe, P.R., and Benevento, L.A. (1969): Auditory-visual interaction in single units in the orbito-insular cortex of the cat. Electroencephalogr Clin Neurophysiol 26, 395-398. London, J.M. (1990): The interaction between meter and phase beginnings and endings in the mature instru 178
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
mental music of Haydn and Mozart. Unpublished doctoral dissertation, University of Pennsylvania, Philadelphia London, J.M. (1993): Loud rests and other strange metric phenomena, or meter as heard. Music Theory Online 0(2) London, J.M. (1995): Some examples of complex meters and their implications for models of metric perception. Music Perception 13(1), 59-77. Longuet-Higgins, H.C., and Lee, C.S. (1982): The perception of musical rhythms. Perception 11, 115-128. Longuet-Higgins, H.C., and Lee, C.S. (1984): The rhythmic interpretation of monophonic music. Music Perception 1, 424-441. Luethke, L.E., Krubitzer, L.A., Kaas, J.H. (1989): Connections of primary auditory cortex in the New World monkey, Saguinus. J Comp Neurol 285, 487-513. Luppino, G., Matelli, M., Carey, R.G., Fritzpatrick, D., and Diamond, I.T. (1988): New view of the organization of the pulvinar nucleus in Tupaia as revealed by tectopulvinar and pulvinar-cortical projections. J Comp Neurol 273, 67-86. Lutz, K., Specht, K., Shah, N.J., and Jancke, L. (2000): Tapping movements according to regular and irregular visual timing signals invertigated with fMRI. NeuroReport 11, 1301-1306. Lyon, R.F. (1983-1988): A computational model of binaural localization and separation. In: W. Richards (ed) Natural computation. Cambridge, Mass, MIT Press, 319-327. Mac Dougall, R. (1903): The structure of simple rhythm forms. Psychological Review, Monograph Supplement, 4, 309-416. Macaluso, E., Driver, J. (2001): Spatial attention and crossmodal interaction between vision and touch. Neuropsychologia 39, 1304-1316. Macaluso, E., Frith, C.D., Driver, J. (2000a): Modulation of human visual cortex by crossmodal spatial attention. Science 289, 1206-1208. Macaluso, E., Frith, C.D., Driver, J. (2000b): Selective spatial attention in vision and touch: unimodal and multimodal mechanisms revealed by PET. J Neurophysiol 83, 3062-3075. Macar, F., Grondin, S., Casini, L. (1994): Controlled attention sharing influences time estimation. Mem Cognit 22, 673-686. Mach, E. (1865): Untersuchungen über den Zeitsinn des Ohres. Sitzungeberichte der Wiener Akademie der Wissenschaften, Kl, 51. Malapani, C., Dubois, B., Rancurel, G., and Gibbon, J. (1998): Cerebellar disfunctions of temporal processing in the seconds range in humans. NeuroReport 9, 3907-3912. Manley, G. A., Koppl, C., and Konishi, M. (1988): A neural map of interaural intensity differences in the brain stem of the barn owl. J Neurosci 8, 2665-76. Mantyh, P.W. (1982): Forebrain projections to the periaqueductal grey in the monkey, with observations in the cat and rat. J Comp Neurol 206, 146-158. Maquet, P., Lejeune, H., Bonnet, M., Casini, L., Macar, F., Timsit Berthier, M., Vidal, F., Ferrara, A., Degueldre, C., Quaglia, L., Delfiore, G., Luxen, A., Woods, R., Mazziotta, J.C., and Comar, D. (1996): Brain activation induced by estimation of duration: a PET study. NeuroImage 3, 119-126. Marin, C.M.H., and McAdams, S. (1991): Segregation of concurrent sounds. II: Effects of spectral envelope tracing, frequency modulation coherence, and frequency modulation width. J Acoust Soc Am Markovitz, N.S., et al. (1993): The dorsal nucleus of the lateral lemniscus in the mustache bat: monaural properties. Hear Res 71, 51-63. Markovitz, N.S., et al. (1994): Binaural processing in the dorsal nucleus of the lateral lemniscus. Hear Res 73, 121-140. Markram, H., Lubke, J., Frotscher, M., Sakmann, B. (1997): Regulation of synaptic efficacy by coincidence of postsynaptic APs and EPSPs. Science 275, 213-215. Markram, H., Tsodyks, M. (1996): Redistribution of synaptic efficacy between neocortical pyramidal neurons. Nature 382, 807-810. Marr, D.A. (1969): A theory of cerebellar cortex. J Physiol 202, 437-470. Martin, J.G. (1972): Rhytmic (hierarchical) versus serial structure in speech and other behavior. Psychological Review 79, 487-509. Massaro, D.W. (1975): Experimental psychology and information processing. Rand McNally 179
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Masterton, R.B., Thompson, G.C., Bechtold, J.K., and Robards, M.J. (1975): Neuroanatomical basis of binaural phase difference analysis for sound localization: a comparative study. J Comp Physiol Psychol 89, 379-386. Mates, J., et al. (1994): Temporal integration in sensorimotor synchronization. J Cogn Neurosci 6, 332-340. Mathews, M.V., Pierce, J.R., and Roberts, L.A. (1987): Harmony and new scales. In: J. Sundberg (ed) Harmony and Tonality. Stockholm : Royal Swedish Academy of Music, publ. no. 54, 59-84. Mathews, M.V., and Pierce, J.R. (1980): Harmony and non-harmonic partials. J Acoust Soc Am 68, 12521257. Matin, J. (1972): Rhythmic (hierarchical) versus serial struture in speech and other behavior. Psychol Rev 79, 487-509. Matsuzaka, Y., Aizawa, H., and Tanji, J. (1992): A motor area rostral to the supplementary motor area (presupplementary motor area ) in the monkey: neuronal activity during a learned motor task. J Neurophysiol 68, 653-662. May, P.J., and Porter, J.D. (1992): The laminar ddistribution of macaque tecto-bulbar and tectospinal neurons. Visual Neurosci. 8, 257-276. May, P.J., and Porter, J.D. (1992): The laminar distribution of macaque tecto-bulbar and tectospinal neurons. Vis Neurosci 8, 257-276. Mays, L.E., and Sparks, D.L. (1980): Dissociation of visual and saccade-related responses in superior colliculus neurons. J Neurophysiol 43, 207-232. Mazzoni, P., Bracewell, R.M., Barash, S., and Andersen, R.A. (1996): Spatially tuned auditory responses in area LIP of macaques performing delayed memory saccades to acoustic targets. J Neurophysiol 75, 1233-1241. McAdams, S. (1984a): The auditory image: A metaphor for musical and psychological research on auditory organization. In: R. Crozier, and A. Chapman (eds) Cognitive processes in the perception of art. Amstrdam: North-Holland, 298-324. McAdams, S. (1984b): Spectral fusion, spectral parsing and the formation of auditory images. unpublished PhD. dissertation, Stanford University, Stanford, CA McAdams, S. (1987): Music: A science of the mind? In: Music and Psychology: A Mutual Regard. S. McAdams (ed) Contemporary Music Review 2(1), 1-61. McAdams, S. (1987): Music: A science of the mind? In: Music and psychology: A mutual regard. S. McAdams (ed.) Contemporary Music Review 2(1), 1-61. McAdams, S. (1989): Concurrent sound segregation. I: Effects of frequency modulation coherence. J Acoust Soc Am 86, 2148-2159. McAdams, S. (1993): Recognition of sound sources and events. In: S. McAdams, and E. Bigand (eds) Thinking in sound: The cognitive psychology of human audition. Oxford: Oxford UP, 146-198. McAdams, S., and Bregman, A.S. (1979): Hearing musical streams. Computer Music Journal 3(4), 26-43. McAdams, S., and Rodet, X. (1988): The role of FM-induced AM in dynamic spectral profile analysis. In: H. Duifhuis, J.W. Horst, and H.P. Wit (eds) Basic issues in hearing. Academic, London, 359-369. McAlpine, D., et al. (2002): Blocking GABAergic inhibition increases sensitivity to sound motion cues in the inferior colliculus. J Neurosci 22, 1443-1453. McDonald, J.J., Teder-Salejarvi, W.A., Ward, L.M. (2001): Multisensory integration and crossmodal attention effects in the human brain. Science 292, 1791. McDonald, J.J., Teder-Salejarvi, W.A., and Hillyard, S.A. (2000): Involuntary orienting to sound improves visual perception. Nature 407(6806), 906-908. McEvoy, L., Hari, R., Imada, T., and Sams, M. (1993): Human auditory cortical mechanisms of sound localization: II. Interaural time differences at sound onset. Hearing Res 67, 98-109 McGurk, H., MacDonald, J. (1976): Hearing lips and seeing voices. Nature 264, 746-748. McHaffie, J.G., Kao, C-Q., Stein, B.E. (1989): Nociceptive neurons in rat superior colliculus: response properties, topography and functional implications. J Neurophysiol 62, 510-525. McIlwain, J.T. (1975): Visual receptive fields and their images in superior colliculus of the cat. J Neurophysiol 38, 219-230. McIlwain, J.T. (1986): Effects of eye position on saccades evoked electrically from superior colliculus of alert cats. J Neurophysiol 55, 97-112. 180
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
McIlwain, J.T. (1990): Topography of eye-position sensitivity of saccades evoked electrically from the cat’s superior colliculus. Vis Neurosci 4, 289-298. McIlwain, J.T., and Buser, P. (1968): Receptive fields of single cells in the cat’s superior colliculus. Exp Brain Res 5, 314-325. McIlwain, J.T., and Fields, H.L. (1971): Interaction of cortical and retinal projections on single neurons of the cat’s superior collicullus. J Neurol 289, 687-707. McIntosh, A.R., Cabeza, R.E., Lobaugh, N.J. (1998): Analysis of neural interactions explains the activation of occipital cortex by an auditory stimulus. J Neurophysiol 80, 2790-2796. McNally, K.A., and Handel, S. (1977): Effect of element composition on streaming and the ordering of repeating sequences. J Exp Psychol: Human Percept Perform 3, 451-460. Meck, W.H. (1984): Attentional bias between modalitios: effect on the internal clock, memory, and decision stages used in animal time discrimination. Ann NY Acad Sci 423, 528-541. Meck, W.H. (1996): Neuropharmacology of timing and time perception. Cognit Brain Res 3, 227-242. Meddis, R., and Hewitt, M.J. (1992): Modeling the identification of concurrent vowels with different fundamental frequencies. J Acoust Soc Am 91, 233-245. Medina, J.F., Garcia, K.S., Nores, W.L., Taylor, N.M., and Mauk, M.D. (2000): Timing mechanisms in the cerebellum: testing predictions of a large-scale computer simulation. J Neurosci 20, 5516. Meredith, M.A., Clemo, H.R., and Stein, B.E. (1991): Somatotopic component of the multisensory map in the deep laminae of the cat superior colliculus. J Comp Neurol 312, 353-370. Meredith, M.A., Nemitz, J.W., and Stein, B.E. (1987): Determinants of multisensory integration in superior colliculus neurons. I. Temporal factors. J Neurosci 10, 3215-3229. Meredith, M.A., Wallace, M.T., and Stein, B.E. (1991): Integrating the different senses in neurons from cat association cortex (anterior ectosylvian sulcus). Soc Neurosci Abstr 17, 1585. Meredith, M.A., Wallace, M.T., and Stein, B.E. (1992): Visual, auditory and somatosensory convergence in output neurons of the cat superior colliculus: multisensory properties of the tecto-reticulo-spinal projection. Exp Brain Res 88, 181-186. Meredith, M.A., and Clemo, H.R. (1989): Auditory cortical projection from the anterior ectosylvian sulcus (field AES) to the superior colliculus in cat: an anatomical and electrophysiological study. J Comp Neurol 289, 687-707. Meredith, M.A., and Ramoa, A.S.(1998): Intrinsic circuitry of the superior colliculus: pharmacophysiological identification of horizontally-oriented inhibitory interneurons. J Neurophysiol 79, 1597-1602. Meredith, M.A., and Stein, B.E. (1983): Interactions among converging sensory inputs in the superior colliculus. Science 221, 389-391. Meredith, M.A., and Stein, B.E. (1985): Descending efferents from the superior colliculus relay integrated multisensory information. Science Wash. DC. 227, 657-659. Meredith, M.A., and Stein, B.E. (1986a): Visual, auditory, and somatosensory convergence on cells in superior colliculus results in multisensory integration. J Neurophysiol 56, 640-662. Meredith, M.A., and Stein, B.E. (1986b): Spatial factors determine the activity of multisensory neurons in cat superior colliculus. Brain Res 365, 350-354. Meredith, M.A., and Stein, B.E. (1990): The Visuotopic Component of the Multisensory Map in the Deep Laminae of the Cat Superior Colliculus. J Neurosci 10(11), 3727-3742. Meredith, M.A., and Stein, B.E. (1996): Spatial determinants of multisensory integration in cat superior colliculus neurons. J Neurophysiol 75, 1843-1857. Mesulam, M.M. (1990): Large scale neurocognitive networks and distributed processing for attention, language, and memory. Ann Neurol 28, 597-613. Mesulam, M.M., Mufson, E.J. (1982): Insula of the old world monkey. III: Efferent cortical output and comments on function. J Comp Neurol 212, 38-52. Meyer, L.B. (1956): Emotion and meaning in music. Chicago: University of Chicago Meyer, L.B. (1973): Explaining Music. Berkeley : University of California Press Miall, R.C., Weir, D.J., Wolpert, D.M., and Stein, J.F. (1993): Is the cerebellum a Smith Predictor? J Mot Behav 25(3), 203-216. Miall, R.C., Weir, D.J., and Stein, J.F. (1993): Intermittency in human manual tracking tasks. J motor Behav 25, 53-63. 181
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Michaels, C. F., and Carello, C. (1981): Direct perception. Prentice-Hall, Englewood Cliffs, NJ Michon, J.A. (1964): Studies on subjectiv duration. I. Differential sensitivity in the perception of repeated temporal intervals. Acta Psychologica 22, 441-450. Middlebrooks, J.C. (1999): Cortical representations of auditory space. In: M.S. Gazzaniga (ed) The new cog nitive neurosciences. Cambridge, MA: MIT Press. 425-436. Middlebrooks, J.C., and Knudsen, E.I. (1984): A neural code for auditory space in the cat’s superior colliculus. J Neurosci 4, 2621-2634. Middlebrooks, J.C., and Pettigrew, J.D. (1981): Functional classes of neurons in primary auditory cortex of the cat distinguished by sensitivity to sound location. J Neurosci 1, 107-120. Middlebrooks, J.C., and Zook, J.M. (1983): Intrinsic organizationof the cat’s medial geniculate body identified by projections to binaural response-specific bands in the primary auditory cortes. J Neurosci 3, 203-224. Middleton, F.A., Strick, P.L. (1994): Anatomical evidence for cerbellar and basal ganglia involvement in higher cognitive function. Science 266, 458-461. Miller, G.A. (1956): The magical number seven, plus or minus two: Some limits on our capacity for processing information. Psychological Review 63, 81-97. Mills, A.W. (1958): On the minimum audible anle. J Acoust Soc Am 30: 237-246. Mills, A.W. (1972): Auditory localisation. In: J. V. Tobias (ed) Foundations of Modern Auditory Theory. New York: Academic Press Mischima, J. (1965): Introduction to the morphology of human behavior. The experimental study of mental tempo. Tokyo: Tokyo Publishing Mistlin, A.J., Perrett, D.I. (1990): Visual and somatosensory processing in the macaque temporal cortex: the role of ‘expectation ‘. Exp Brain Res 82, 437-450. Mitriani, L. Shekerdijiiski, S., Gourevitch, A., and Yanev, S. (1997): Identification of short time intervals under LSD25 and mescaline. Act Nerv Sup 19, 103-104. Mize, R.R. (1983a): Patterns if convergence and divergence of retinal and cortical synaptic terminals in the cat superior colliculus. Exp Brain Res 51, 88-96. Mize, R.R. (1983b): Variations in the retinal synapses of the cat superior colliculus revealed using quantitative electron microscope autoradiography. Brain Res 269, 211-221. Mize, R.R., and Murphy, E.H. (1976): Alterations in receptive field properties of superior colliculus cells produced by visual cortex ablation in infant and adult cats. J Comp Neurol 168, 393-424. Mogdans, J., and Knudsen, E. I. (1994): Representation of interaural level difference in the VLVp, the first site of binaural comparison in the barn owl’s auditory system. Hear Res 74, 148-64. Mohler, C.W., and Wurtz, R.H. (1976): Organization of monkey superior olliculus: intermediate layer cells discharging before eye movements. J Neurophysiol 39, 722-744. Moiseff, A., and Konishi, M. (1983): Binaural characteristics of units in the owl’s brainstem auditory pathway: precursors of restricted spatial receptive fields. J Neurosci 3, 2553-62. Mooney, R.D., Huang, X., and Rhoades, R.W. (1992): Functional influence of interlaminar connections in the hamster’s superior colliculus. J Neurosci 12, 2417-2432. Mooney, R.D., Klein, B.G., Jacquin, M.F., and Rhoades, R.W. (1984): Dendrites of deep layer, somatosensory superior colliculus neurons extend into the superficial laminae. Brain Res 324, 361-365. Mooney, R.D., Nikoletseas, M.M., Hess, P.R., Allen, Z., Lewin, A.C., and Rhoades, R.W. (1988): The projection from the superficial to the deep layers of the superior colliculus: an intracellular horseradish peroxidase injection study in the hamster. J Neurosci 8, 1384-1399. Mooney, R.D., and Rhoades, R.W. (1990): Relationships between physiological and morphological properties of retinocollicular axons in hamster. J Neurosci 10, 3164-3177. Moore, D.R., Semple, M.N., Addison, P., Aitkin, L.M. (1984): Properties of spatial receptive fields in the central nucleus of the cat inferior colliculus. I. Responses to tones of low intensity. Hear Res 13 159-174. Moore, D.R., and Irvine, D.R.F. (1979a): A developmental study of the sound pressure transformation by the head of the cat. Acta Oto Laryngol 87, 434-440. Moore, M.J., et al. (1983): Strychnine blocks binaural inhibition in lateral superior olivary neurons. J Neurosci 3, 237-242. Moran, J., Desimone, R. (1985): Selective attention gates in the extrastriate cortex. Science 229, 782-784. 182
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Moschovakis, A.K. and Karabelas, A. B. (1985): Observations on the somatodendritic morphology and axonal trajectory of intracellulary HRP-labele efferent neurons located in the deep layers of the superior colliculus of the cat. J Comp Neurol 239, 276-308. Moschovakis, A.K., Karabelas, A.B., and Highstein, S.M. (1988a): Structure-function relationships in the primate superior colliculus. II. Morphological identity of presaccadic neurons. J Neurophysiol 60, 263302. Moschovakis, A.K., Karabelas, A.B., and Highstein, S.M. (1988b): Structure-function relationships in the primate superior colliculus. I. Morphological classification of efferent neurons. J Neurophysiol 60, 232-262. Mucke, L., Norita, M., Benedek, G., Creutzfeldt, O. (1982): Physiologic and anatomic investigation of a visual cortical area situated in the ventral bank of the anterior ectosylvian sulcus of the cat. Exp Brain Res 46, 1-11. Mufson, E.J., Mesulam, M.M. (1984): Thalamic connections of the insula in the rhesus monkey and comments on the paralimbic connectivity of the medial pulvinar nucleus. J Comp Neurol 227, 109-120. Muir, W.D., Clifton, R.K., and Clarkson, M.G. (1989): The development of a human auditory localization response: A U-shaped function. Can J Psychol 43, 199-216. Munoz, D.P., Istvan, P.J. (1998): Lateral inhibitory interactions in the intermediate layers of the monkey superior colliculus, J Neurophysiol 79, 1193-1209. Munoz, D.P., and Guitton, D. (1991): Control of orienting gaze shifts by the tectoreticulospunal system in the head-free cat. II. Sustained discharges during motor preparation and fixation. J Neurophysiol 66, 1624-1641. Munoz, D.P., and Wurtz, R.H. (1992): J Neurophysiol 67, 1000-1002. Murray, E.A., Malkova, L., Goulet, S. (1998): In: A.D. Milner (ed) Comparative neuropsychology. Oxford: Oxford University Press, 51-69. Murray, E.A., Mishkin, M. (1985): Amygdalectomy impairs crossmodal association in monkeys. Science 228, 604-606. Musicant, A.D. and Butler, R.A. (1984): The influence of pinnae-based spectral cues on sound localization. J Acoust Soc Am 75, 1195-200. Musicant, A.D., Chan, J.C. and Hind, J.E. (1990): Direction-dependent spectral properties of cat external ear: new data and cross-species comparisons. J Acoust Soc Am 87, 757-81. Møller, A.R. (1983): Auditory physiology. New York, Academic Press Nabelek, I.V., Nabelek, A.K., and Hirsch, I.J. (1973): Pitch of sound bursts with continuous or discontinuous change of frequency. J Acoust Soc Am 53, 1305-1312. Nakamura (1987): The communication of dynamics between musicians and listeners through musical performance. Perception and Psychophysics 41, 525-533. Nakatani, T., Okuno, H.G., and Kawabata, T. (1995): Residue-driven architecture for computational auditory scene analysis. Proc IJCAI, 165-172. Narmour, E. (1990): The analysis and cognition of basic melodic structures: The implication-realization model. Chicago: University of Chicago Press Narmour, E. (1992): The analysis and cognition of melodic complexity: The implication-realization model. Chicago: University of Chicago Press Nawrot, M., and Rizzo, M. (1995): Motion perception deicits from midline cerebellar lesions in human. Vis Res 35, 723-731. Neisser, U. (1976): Cognition and Reality. San Francisco : W.H. Freeman Nichelli, P., Alway, D., Grafman, J. (1996): Perceptual timing in cerebellar degeneration. Neuropsychologia 34, 863-871. Nichelli, P., Alway, D., and Grafman, J. (1996): Perceptual timing in cerebellar degeneration. Neuropsychologia 34, 863-871. Nickerson, R.S., and Freeman, B. (1974): Discrimination of the order of the components of repeating tone sequences: Effects of frequency separation and extensive practice. Perception and Psychophysics 16, 471-477. Nicolelis, M.A.L., Ghazanfar, A.A., Stambaugh, C.R., Oliviva, L.M.O., Laubach, M., Chapin, J.K., Nelson, R.J., Kaas, J.H. (1998): Simultaneous encoding of tactile information by three primate cortical areas. 183
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Nat Neurosci 1, 621-630. Nixon, P.D., and Passingham, R.E. (2000): The cerebellum and cognition: cerebellar lesions impair sequence learnin but not conditional visuomotor learning inmonkeys. Neuropsychologia 38, 1054-1072. Nketia, J.H. (1963): African music in Ghana. Evanston, II: Northwestern University Press Nketia, J.H. (1975): The music of Africa. London: Victor Gollanez Nobre, A.C., Dias, E.CC., Gitelman, D.R., Mesulam, M.M. (1998): The overlap of brain regions that control saccades and covert visual spatial attention revealed by fMRI. NeuroImage 7, 59. Nobre, A.C., Gitelman, D.R., Sebestyen, G.N., Meyer, J., Frackowiak, R.S.J., Frith, C.D., Mesulam, M.M. (1997): Functional localisation of the system for visuospatial attention using positron emission tomography. Brain 120, 515-533. Novak, G.P., Ritter,, W. Vaughan, H.G., Jr. (1992): The chronometry of attention-modulated processing and automatic mismatch detection. Psychophysiol 29, 412-430. Null, C. (1974): Symmetry in judgements of musical pitch. Unpublished doctoral dissertation. Michigan State University. Nygaard, L.C., Sommers, M.S., and Pisoni, D.B. (1994): Speech perception as a talker-contingent process. Psychological Science 5, 42-46. Näätänen, R., Gaillard, A.W.K., and Mäntysalo, S. (1978): Early selective attention effect on evoked potential reinterpreted. Acta Psychologica 42, 313-329. Näätänen, R., and Alho, K. (1997): Mismatch negativity (MMN) - the measure for central sound representation accuracy. Audiology Neuro-Otology 2, 341-353. Näätänen, R., and Picton, T.W. (1987): The N1 wave of the human electric and magnetic response to sound: A review and an analysis of the component structure. Psychophysiol 24, 375-425. Näätänen, R., and Winkler, I. (1999): The concept of auditory stimulus representation in cognitive neuroscience. Psychol Bulletin 125, 826-859. Näätänen, R., et al. (1993): Development of a memory trace for a complex sound in the human brain. NeuroReport 4, 503-506. Näätänen, R., et al. (2001): ‘Primitive intelligence’in the auditory cortex. Trends in Neurosci 24, 283-288. O ‘Hare, J.J. (1991): Perceptual integration. J Wash Acad Sci 81, 44-59. Ogasawara, K., McHaffie, J.G., and Stein, B.E. (1984): Two visual cortico-tectal systems in cat. J Neurophysiol 52, 1226-1245. Oldfield, S. R. and Parker, S. P. (1984): Acuity of sound localisation: a topography of auditory space. II. Pinna cues absent. Perception 13, 601-17. Oliver, D.L., et al. (1992): Inferior and superior colliculi. In: D.B. Webster et al. (eds) The Mammalian Auditory Pathway: Neuroanatomy (Vol. 1). Springer, 1168-222. Paailainen, P., Jaramillo, M., Näätänen, R., and Winkler, I. (1999): Neuronal populations extracting invariant relationships from acoustic variance. Neurosci Lett 265, 179-182. Paavilainen, P., et al. (2001): Preattentive extraction of abstract feature conjunctions from auditory stimulation as reflected by the mismatch negativityy (MMN). Psychophysiol 38, 359-365. Palmer, A.R., and King, A.J. (1982): The representation of auditory space in the mammalian superior colliculus. Nature 299, 248-9. Palmer, C. (1988): Timing in skilled music performance. Unpublished doctoral dissertation, Cornell University, Ithaca, NY Palmer, C. (1989): Mapping musical thought to musical performance. J Exp Psychol: Human Percept Perform 15, 331-346. Palmer, C. (1996): On the assignment of structure in music performance. Music Perception 14, 23-56. Palmer, C. (1997): Music performance. Annual Review of Psychology 48, 115-138. Palmer, C., and Krumhansl, C.L. (1990): Mental representations for musical meter. J Exp Psychol: Human Percept Perform 16, 728-741. Pandya, D.N., Yeterian, E.H. (1985): In: A. Peters, E.G. Jones (eds) Cerebral cortex. New York: Plenum Press, 3-61. Pantaleoni, H. (1972): Three principles of timing in Anlo dance drumming. African Music 5(2), 50-53. Pantev, C., Hoke, M., Lehnertz, K., and Lütkenhöner, B. (1989b): Neuromagnetic evidence of an ampliotopic organization of the human auditory cortex. Elecrtoencephal Clin Neurophysiol 72, 225-231. 184
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Pantev, C., Hoke, M., Lütkenhöner, B., and Lehnertz, K. (1989a): Tonotopic organization of the auditory cortex: Pitch versus frequency representation. Science 246, 486-488. Pardo, J.V., Fox, P.T., Raichle, M.E. (1991): Localization of a human system for sustained attention by positron emission tomography. Nature 3, 61-64. Park, T.J. (1998): IID sensitivity differs between two principal centers in the interaural intensity difference pathway: the LSO and the IC. J Neurophysiol 79, 2416-2431. Park, T.J., et al. (1993): GABA shapes sensitivity to interaural intensity disparities in the mustache bat’s inferior colliculus: implications for encoding sound location. J Neurosci 13, 2050-2067. Park, T.J., et al. (1994): Azimuthal receptive fields are shaped by GABAergic inhibition in the inferior colliculus of the mustache bat. J Neurophysiol 72, 1080-1102. Park, T.J., et al. (1996): Neural delays shape selectivity to interaural intensity differences in the lateral superior olive. J Neurosci 16, 6554-6566. Park, T.J., et al. (1997): Processing of interaural intensity differences in the LSO: role of interaural threshold differences. J Neurophysiol 77, 2863-2878. Park, T.J., et al. (1998): A novel circuit in the bat’s midbrain recruits neurons into sound localization processing. Naturwissenschaften 85, 176-179. Parncutt, R. (1994): A perceptual model of pulse salience and metrical accent in musical rhythms. Music Perception 11, 409-464. Parsons, L.M. (2001): Exploring the functional neuroanatomy of music performance, perception, and comprehension. In: R.J. Zatorre, and I. Peretz (eds) The biological foundations of music. Vol 930. New York Academy of Sciences, New York, 2111-230. Partch, H. (1974): Genesis of a music. 2nd ed. New York : Da Capo Press Paré, M., and Munoz, D.P. (1996): J Neurophysiol 76, 3666-3681. Passingham, R.E. (1996): Attention to action. Philos Trans R Soc Lond B Biol Sci 351, 1473-1479. Pastor, M.A., et al. (1992): Time estimation and reproduction is abnormal in Parkinson’s disease. Brain 115, 211-225. Patterson, R.D., Robinson, K., Holdsworth, J., McKeown, D., Zhang, C., and Allerhand, M. (1992): Complex sounds and auditory images. In: Y. Cazals, K. Horner, and L. Demany (eds) Auditory physiology and perception. Oxford, Pergamon Press, 429-446. Paulesu, E., Frith, C.D., Frackowiak, R.S. (1993): The neural correlates of the verbal component of working memory. Nature 362, 342-345. Pearson, R.C., Brodal, P., Gatter, K.C., Powell, T.P. (1982): The organization of the connections between the cortex and the claustrum in the monkey. Brain Res 234, 435-441. Peck, C.K. (1987): Visual-auditory interactions in cat superior colliculus: their role in control of gaze. Brain Res 420, 162-166. Peck, C.K., Baro, J.A., Warder, S.M. (1995): Effects of eye position on saccadic eye movements and on the neural responses to auditory and visual stimuli in cat superior colliculus. Exp Brain Res 103, 227-242. Penhune, B.B., Zatorre, R.J., and Evans, A.C. (1998): Cerebellar contributions to motor timing: a PET study of auditory and visual rhythm reproduction. J Cognit Neurosci 10, 752-766. Penhune, B.B., and Doyon, J. (2002): Dynamic cortical and subcorticcal networks in leraning and delayed recall of timed motor sequences. J Neurosci 22, 1397-1406. Perrett, S.P., Ruiz, B.P., and Mauk, M.D. (1993): Cerebellar cortex lesions disrupt learning-dependent timing of coditioned eyelid responses. J Neurosci 13, 1708-1718. Perrott, D.R., Saberi, K., Brown, K., Strybel, T.Z. (1990): Auditory psychomotor coordination and visual search performance. Percept Psychophysics 48, 214-226. Peters, M., and Schwartz, S. (1989): Coordination of the two hands and effects of attentional manipulation in the production of a bimanual 2:3 polyrhythm. Australian Journal of Psychology 41(2), 215-224. Pickles, J.O. (1988): An Introduction to the physiology of hearing (2nd Edition). Academic Press, London Picton, D.W., Alain, C., Otten, L.., and Ritter, W. (2000): Mismatch negativity: Different water in the same river. Audiology and Neuro-Otology 5, 111-139. Picton, T.W., Stapells, D.R., Campbell, K.B. (1981): Auditory evoked potentials from the human cochlea and bainstem. J Otolaryngology 10, 1-41. Pinheiro, A., Wu, M., and Jen, P.H. (1991): Encoding repetition rate and duration in the inferior colliculus of 185
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
the big brown bat, Eptesicus fuscus. J Comp Physiol [A] 169, 69-85. Pisoni, D.B. (1997): Some thoughts on ‘normalization’ in speech perception. In: K. Johnson, and J.W. Mullennix (eds) Talker variability in speech processing. San Diego: Academic Press, 9-32. Platel, H., Price, C., Baron, J-C, Wise, R., Lambert, J., Frackowiak, R.S.J., Lechevalier, B., Eustache, F. (1997): The structural components of music perception: a functional anatomical study. Brain 120, 229-243. Platón (1999): Összes mûvei kommentárokkal. A lakoma. Atlantisz, Budapest Plomp, R. (1976): Aspects of tone sensation: A psychophysical study. New York: Academic Press Poggio, G.F., and Mountcastle, V.B. (1960): A study of the functional contributions of the lemniscal and spinothalamic systems to somatic sensibility. Bull Johns Hopkins Hosp 106, 266-315. Pollak, G.D. (1997): Roles of GABAergic inhibition for the binaural processing of multiple sound sources in the inferior colliculus. Ann Otol hinol Laryngol Suppl 168, 44-54. Pollak, G.D., et al. (2002): Roles of inhibition for transforming binaural properties in the brainstem auditory system. Hear Res 168, 60-78. Populin, L.C., and Yin, T.C.T. (1998): Behavioral studies of sound localization in the cat. J Neurosci 18, 2147-2160. Poremba, A., and Gabriel, M. (1997:. Medial geniculate lesions block amygdalar and cingulothalamic learning-related neuronal activity. J Neurosci 17(21), 8645-8655. Posner, M.I., Petersen, S.E. (1990): The attention system of the human brain. Annu Rev Neurosci 13, 25-42. Posner, M.I., Snyder, C.R.R., Davidson, B.J. (1980): Attention and the detection of signals. J Exp Psychol Gen 109, 160-174. Posner, M.I., Walker, J.A., Friedrich, F.J., Rafal, R.D. (1984): Effects of parietal injury on covert orienting of attention. J Neurosci 4, 1863-1874. Posner, M.I., and Dehaene, S. (1994): Attentional networks. Trends Neurosci 17, 75-79. Potter, H.D. (1965): Patterns of acoustically evoked discharges of neurons in the mesencephalon of the bullfrog. J Neurophysiol 28, 1155-1184. Povel, D.-J. (1981): Internal representation of simple temporal patterns. J Exp Psychol: Human Percept Perform 7(1): 3-18. Povel, D.-J. (1984): A theoretical framework for rhythm perception. Psychological Research 45, 315-337. Povel, D.-J., and Essens, P. (1985): Perception of temporal patterns. Music Perception 2(4), 411-440. Pressing, J. (1983): Cognitive isomorphyisms in world music: West Africa, the Balkans, Thailand and Western tonality. Studies in music 17, 38-61. Pressing, J., Summers, J.J., and Magill, J.M. (1996): Cognitive multiplicity in polyrhythmic pattern perormance. Journal of Experimental Psychology: Human Performance and Perception 22, 1127-1148. Puel, J.L., Bonfils, P., and Pujol, R. (1988): Selective attention modifies the active micromechanial properties of the cochlea. Brain Res 447, 380-383. Pöppel, E. (1973): Nature 243, 231. Quessy, S., Sweatt, A.J., Stein, B.E., Stanford, T.R. (2000): The influence of stimulus intensity and timing on the responses of multisensory neurons in the superior colliculus: comparison to a model’s prediction. Soc Neurosci Abstr 30, 1221. Radeau, M. (1994): Auditory-visual spatial interaction and modularity. Curr Psychol Cogn 13, 3-51. Rafal, R., and Robertson, L. (1995): The neurology of visual attention. In: M.S. Gazzaniga (ed) The cogni tive neurosciences. Cambridge, MA: MIT, 625-648. Rafal, R.D., and Posner, M.I. (1987): Deficits in human spatial attention following thalamic lesions. Proc Natl Acad Sci USA 84, 7349-7353. Raij, T., Uutela, K., Har, R. (2001): Audiovisual integration of letters in the human brain. Neuron 28, 617625. Rajkowska, G., Goldman-Rakic, P.S. (1995b): Cytoarchitectonic definition of prefrontal areas in the normal human cortex: II. Variability in locations of areas 9 and 46 and relationship to the Talairach coordinate system. Cereb Cortex 5, 323-337. Ramachandran, R., Wallace, M.T., Clemo, H.R., Stein, B.E. (1993): Multisensory convergence and integration in rat cortex. Soc Neurosci Abstr 19, 1447. Ramachandran, R., et al. (1999): Single-unit responses in the inferior colliculus of decerebrate cats. I. 186
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Classification based on frequency response maps. J Neurophysiol 82, 152-163. Rammsayer, T. (1989): Dopaminergic and serotoninergic influence on duration discrimination and vigilance. Pharmacopsychiatry 22 (Suppl 1), 39-43. Rammsayer, T. (1993): On dopaminerg modulation of temporal infromation processing. Biol Psychol 36, 209-222. Rammsayer, T. (1999): Neuropharmacological evidence for different timing mechanisms in humans. Q J Exp Psychol 52B, 273-286. Rammsayer, T., and Lima, S.D. (1991): Duration discrimination of filled and empty auditory intervals: cognitive and perceptual factors. Percept Psychophys 50, 565-574. Rammsayer, T., and Vogel, W.H. (1992): Pharmacologic properties of the internal clock underlying time perception in humans. Neurophysobiology 26, 71-80. Ranck, J.B. (1973): Studies on single neurons in dorsal hippocampal formation and septum in unrestrained cats. I. Behavioral correlates and firing repetoires. Exp Neurol 41, 461-531. Randel, D.M. (1986): The new Harvard dictionary of music. Cambridge, MA: Harvard Univ Press Rao, S.M., Harrington, D. L., Haaland, K.Y., Bobholz, J.A., Cox, R.W., and Binder, J.R. (1997): Disstributed neural systems underlying the timing of movements. J Neurosci 17, 5528-5535. Rao, S.M., Mayer, A.R., and Harrington, D.L. (2001): The evolution of brain activation during temporal processing. Nat Neurosci 4, 317-323. Rasch, R.A. (1988): Timing and synchronization in ensemble performance. In: Sloboda (ed) Improvisation, and composition. Oxford: Clarendon Press, 70-90. Rauschecker, J.P., Tian, B., Pons, T., Mishkin, M. (1997): Serial and parallel processing in Rhesus monkey auditory cortex. J Comp Neurol 382, 89-103. Rayleigh, Third Baron (1909): On the perception of the direction of sound. Proc Roy Soc (Lond) (Ser. A) 83, 61-64. Raymond, J.E., Shapiro, K.L., and Arnell, K.M. (1992): Temporal suppression of visual processing in an RSVP task: an attentional blink? J Exp Psychol Hum Percept Perform 18, 849-860. Raymond, J.L., Liseberger, S.G., and Mauk, M.D. (1996): The cerebellum: a neuronal learning machine? Science 272, 1126-1131. Reisberg, D. (1987): In: B. Dodd and R. Campbell (eds) Hearing by eye: the psychology of lip-reading. Hillsdale, NJ: Lawrence Erlbaum Repp, B.H. (1990): Patterns of expressive timing in performances of a Beethoven munuet by nineteen famous pianists. J Acoust Soc Am 88, 622-641. Repp, B.H. (1992): Probing the cognitive representation of musical time: structural constraints on the perception of timint perturbations. Cognition 44, 241-281. Repp, B.H. (1996): Patterns of note onset asynchronies in expressive piano performance. J Acoust Soc Am 100, 3917-3932. Repp, B.H. (2000): Compensation for subliminal timing perturbations in perceptual-motor synchronization. Psychol Res 63, 106128. Repp, B.H., Liberman, A.M., Eccardt, T., and Pesetsky, D. (1978): Perceptual integration of acoustic cues for stop, fricative, and affricate manner. J Exp Psychol Hum Percept Perform 4, 621-637. Reser, D.H., Fishman, Y.I., Arezzo, J.C., and Steinschneider, M. (2000): Binaural interactions in primary auditory cortex of the awake macaque. Cerebral Cortex 10(6), 574-584. Restle, F. (1970): Theories of serial pattern learning: Structural trees. Psychological Review 77, 481-495. Reyes, A., Lujan, R., Rozov, A., Burnashev, N., Somogyi, P. and Sakmann, B. (1998): Target-cell-specific facilitation and depression in neocortical circuits. Nature Neuroscience 1(4), 279-285. Reynolds, J.H., Chelazzi, L., Desimone, R. (1999): Competitive mechanisms subserve attention in macaque areas V2 and V4. J Neurosci 19, 1736-1753. Rhoades, R.W., Mooney, R.D., Rohrer, W.H., Nikoletseas, M.M., and Fish, S.E. (1989): Organization of the projection from the superficial to the deep layers of the hamster’s superior colliculus as demonstrated by the anterograde transport of Phaseolus vulgaris leucoagglutinin. J Comp Neurol 283, 54-70. Rhode, W.S., and Smith, P.H. (1986): Encoding timing and intensity in the ventral cochlear of the cat. J Neurophysiol 56, 261-286. Rice, J.J., May, B.J., Spirou, G.A. and Young, E.D. (1992): Pinna-based spectral cues for sound localization 187
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
in cat.: Hear Res 58, 132-52. Richter, K., Hess, A., Scheich, H. (1999): Functional mapping of transsynaptic effects of local manipulation of inhibition in gerbil auditory cortex. Brain Res 831, 184-199. Risset, J.C. (1971): Paradoxes de hauteur: le concept de hauteur sonore n’est pas le meme pour tout le monde. Proceedings of the 7th International Congress on Acoustics. Budapest, Paper 20510. Risset, J.C. (1978): Musical acoustics. In: E.C. Carterette and M.P. Friedman (eds) Handbook of perception. (Volume 4, Hearing) New York: Academic Press, 521-564. Risset, J.C., and Wessel, D.L. (1982): Exploration of timbre by analysis and synthesis. In: D. Deutsch (ed) The Psychology of Music. New York : Academic Press, 26-58. Ritoók, Zs. (ed)(1982): Források az ókori görög zeneesztétika történetéhez. Akadémiai Kiadó, Budapest. Ritter, W., Sussman, E., and Molholm, S. (2000): Evidence that the mismatch negativity system works on the basis of objects. NeuroReport 11, 61-63. Rizzolatti, G., Camarda, R., Grupp, L.A., and Pisa, M. (1974): Inhibitory effect of remote visual stimuli on visual responses of cat superior colliculus: Spatial and temporal factors. J Neurophysiol 37, 12621275. Rizzolatti, G., Riggio, L., Dascola, I., Umilta, C. (1987): Reorienting attention across the horizontal and vertical meridians - evidence in favor of a premotor theory of attention. Neuropsychologia 25, 31-40. Rizzolatti, G., Scandolara, C., Matelli, M., Gentilucci, M. (1981a): Afferent properties of periarcuate neurons in macaque monkeys. I. Somato-sensory responses. Behav Brain Res 2, 125-146. Rizzolatti, G., Scandolara, C., Matelli, M., Gentilucci, M. (1981b): Afferent properties of periarcuate neurons in macaque monkeys. II. Visual responses. Behav Brain Res 2, 147-163. Robertson, R.T., Mayers, K.S., Teyler, L.A., Bettinger, L.A., Birch, H., Davis, J.L., Phillips, D.S., and Thompson, R.F. (1975): Unit activity in posterior association cortex of cat. J Neurophysiol 38, 780794. Robinson, D.A. (1972): Eye movements evoked by stimulation in the alert monkey. Vision Res 12, 17951808. Robinson, D.L., and Kertzman, C. (1995): Covert orienting of attention in macaques. III. Contributions of the superior colliculus. J Neurophysiol 74, 713-721. Roffler, S.K., and Butler, R.A. (1968): Factors that influence the localization of sounds in the vertival plane. J Acoust Soc Am 43: 1255-1259. Roland, P.E., Skinhoj, E., and Lassen, A. (1981): Focal activations of human cerebral cortex during auditory discrimination. J Neurophysiol 45, 1139-1151. Romanski, L.M., Tian, B., Fritz, J., Mishkin, M., Goldman-Rakic, P.S., Rauschecker, J.P. (1999): Dual streams of auditory afferents target multiple domains in the primate prefrontal cortex. Nat Neurosci 2, 1131-1136. Rosch, E. (1973): Natural categories. Cognitive Psychology 4, 328-350. Rosch, E. (1978): Principles of categorization. In: E. Rosch, and B.B. Lloyd (eds) Cognition and Categorization. Hillsdale, N.J. : Lawrence Erlbaum Associates, 28-71. Rose, J.E., Gross, N.B., Geisler, C.D., and Hind, J.E. (1966): Some neural mechanisms in the inferior colliculus of the cat which may be relevant to localization of a sound source. J Neurophysiol 29, 288314. Rose, S.A., Ruff, H.A. (1987): In: J. Osofsky (ed) Handbook of infant development, 2nd edn. New York: Wiley, 318-362. Rosenquist, A.C., and Palmer, L.A. (1971): Visual receptive field properties of cells of the superior colliculus after cortical lesions in the cat. Exp Neurol 33, 629-652. Rosner, B.S., and Meyer, L.B. (1982): Melodic processes and the perception of music. In: D. Deutsch (ed) The Psychology of Music. New York : Academic Press, 317-341. Rosner, B.S., and Meyer, L.B. (1986): The perceptual roles of melodic process, contour, and form. Music Perception 4, 1-40. Ross, L.S., et al. (1989): Differential ascending projections to aural regions in the 60 kHz contour of the mustache bat’s inferior colliculus. J Neurosci 9, 2819-2834. Ross, LS., et al. (1988): Origin of ascending projections to an isofrequency region of the mustache bat’s inferior colliculus. J Comp Neurol. 270, 488-505. 188
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Roth, G.L., Aitkin, L.M., Andersen, R.A., and Merzenich, M.M. (1978): Some features of the spatial organization of the central nucleus of the inferior colliculus of the cat. J Comp Neurol 182, 661-680. Rothstein, W.N. (1989): Phrase rhythm in tonal music. New York: Schirmer Books Roucoux, A., and Crommelinck, M. (1976): Eye movements evoked by superior colliculus stimulation in the alert cat. Brain Res 106, 349-363. Russell, I.J., and Sellick, P.M. (1978): Intracellular studies of hair cells in the mammalian cochlea. J Physiol (Lond) 284, 261-290. Russo, G.S., and Bruce, C.J. (1994): Frontal eye field activity preceding aurally guided saccades. J Neurophysiol 71(3), 1250-1253. Rutledge, L.T. (1963): Interactions of peripherally and centrally originating input to association cortex. Electroencephalogr Clin Neurophysiol 15, 958-968. Saint Marie, R.L., et al. (1997): Patterns of gamma-aminobutyric acid and glycine immunoreactivities reflect structural and functional differences of the cat lateral lemniscal nuclei. J Comp Neurol 389, 264-276. Sakai, K., Hikosaka, ÁÁO., Miyauchi, S., Takino, R. Tamada, T., Iwata, N.K., and Nielsen, M. (1999): Neural representation of a rhythm depends on its interval ratio. J Neurosci 19, 10074-10081. Sams, M., Aulanko, R., Hamalainen, M., Hari, R., Lounasmaa, O.V., Lu, S.T., and Simola, J. (1991): Seeing speech: visual information from lip movements modified activity in the human auditory cortex. Neurosci Lett 127, 141-145. Schachter, C. (1987): Rhythm and linear analysis: Aspects of meter. In: F. Salzer, and C. Schachter (eds) The msic forum. New York: Columbia University Press, 1-59. Schall, J.D. (1995): Rev Neurosci 6, 63-85. Schank, R., and Abelson, R.P. (1977): Scripts, plans, goals, and understandings: An inquiry into human knowledge structures. Hillsdale, N.J. : Lawrence Erlbaum Associates Scheffers, M.T.M. (1983): Sifting vowels: Auditory pitch analysis and sound integration. unpublished doctoral dissertation, University of Groningen, The Netherlands Scheibel, M., Scheibel, A., Mollica, A., and Moruzzi, G. (1955): Convergence and interaction of afferent impulses on single units of reticular formation. J Neurophysiol 18, 309-331. Schenker, H. (1973): Harmony. Cambridge, Massachusetts: MIT Press (Translated from original 1954 edition) Schenker, H. (1979): Free composition. (E. Oster, trans.) New York: Longman. (Original work published 1935) Scherg, M., Vajsar, J., and Picton, T.W. (1989): A source analysis of the late human auditory evoked potentials. J Cogn Neurosci 1, 336-355. Schiller, P.H., Sandell, J.H., and Maunsell, J.H.R. (1987): J Neurophysiol 57, 1033-1049. Schiller, P.H., and Koerner, F. (1971): Dicharge characteristics of single units in superior colliculus of the alert rhesus monkey. J Neurophysiol 34, 920-936. Schiller, P.H., and Stryker, M. (1972): Single-unit recording and stimulation in superior colliculus of the alert rhesus monkey. J Neurophysiol 35, 915-924. Schlag-Rey, M., Schlag, J., and Dassonville, P. J. (1992): Neurophysiol 67, 1003-1005. Schmidt, R. (1982): More on motor programs. In: J. Kelso (ed) Human Motor Behavior: An Introduction. Lawrence Erlbaum Associates, Hillsdale, NJ, 189-235. Schneider, A.S., and Davis, J.L. (1974): Interactions of the evoked responses to visual, somatic and auditory stimuli in polysensory areas of the cat cortex. Physiol and Behav 13, 365-372. Schneider, J.S., Denaro, F.J., and Lindsky, T.I. (1982): Basal ganglia: motor influences mediated by sensory interaction. Exp Neurol 77, 534-543. Schnupp, J.W.H., King, A.J., Smith, A.L., and Thompson, I.D. (1995): NMDA-receptor antagonists disrupt the formation of the auditory space map in the mammalian superior colliculus. J Neurosci 15(2), 1516-1531. Schnupp, J.W.H., and King, A.J. (1997): Coding for auditory space in the nucleus of the brachium of the inferior colliculus in the ferret. J Neurophysiol 78, 2717-2731. Schoenberg, A. (1975): Composition with twelve tones: (1) & (2). In: L. Stein (ed) Style and Idea. New York : Saint Martin’s Press (trans. by L. Black, (1) c. 1941, (2) c. 1948), 214-249. Schouten, J.F. (1938): The perception of subjective tones. Proceedings Kon Ned Akad Wetensch 41, 1086189
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
1093. Schreiner, C.E., Read, H.L. & Sutter, M.L. (2000): Modular organization of frequency integration in primary auditory cortex. Ann Rev Neurosci 23, 501-529. Schreiner, C.E., Urbas, J.V. (1988): Representation of amplitude modulation in the auditory cortex of the cat. I. Comparison between cortical fields. Hear Res 32, 49-64. Schroeder, C.E., Lindsley, R.W., Specht, C., Marcovici, A., Smiley, J.F., Javitt, D.C. (2001): Somatosensory input to auditory association cortex in the macaque monkey. J Neurophysiol 85, 1322-1327. Schröger, E. (1995): Processing of auditory deviants with changes in one versus two stimulus dimenssions. Psychophysiol 32, 55-65. Schröger, E. (1997): On the detection of auditory deviants: A pre-attentive activation model. Psychophysiol 34, 245-257. Schubert, T., von Cramon, D.Y., Niendorf, T., Pollmann, S., and Bublak, P. (1998): Cortical areas and the control of self-determined finger moveements: an fMRI study. NeuroReport 9, 3171-3176. Schubotz, R.I., Friederici, A.D., and von Cramon, D.Y. (2000): Time perception and motor timing: a common cortical and sugcortical basis revealed by fMRI. NeuroImage 11, 1-12. Schubotz, R.I., and von Cramon, D.Y. (2001): Interval and ordinal properties of sequences are associated with distinct premotor areas. Cereb Cortex 11, 210-222. Schulze, H.-H. (1978): The detectability of local and global displacements in regular rhythmic patterns. Psychological Research 40, 173-181. Schulze, H.-H. (1989) Categorical perception of rhythmic patterns. Psychological Research 51, 10-15. Seagraves, M.A., and Goldberg, M.E. (1987): Functional properties of corticotectal neurons in the monkey’s frontal eye field. J Neurophysiol 58, 1387-1419. Searle, C., Braida, L., Davis, M., and Colburn, H. (1976): Model for auditory localisation. J Acoust Soc Am 60, 1164. Segui, J. (1989): La perception du langage parlé. In: C. Bonnet, R. Ghiglione, and J.-F. Richard (eds) Traité de psychologie cognitive, vol. 1. Dunod, Paris, 199-234. Seltzer, B., and Pandya, D.N. (1978): Afferent cortical connections and architectonics of the superior temporal sulcus and surrounding cortex in the rhesus monkey. Brain Res 149, 1-24. Seltzer, B., and Pandya, D.N. (1980): Converging visual and somatic sensory cortical input to the intraparietal sulcus of the rhesus monkey. Brain Res 192, 339-351. Semple, M.N., Aitkin, L.M., Calford, M.B., Pettigrew, J.D., and Phillips, D.P. (1983): Spatial receptive fields in the cat inferior colliculus. Hear Res 10, 203-215. Semple, M.N., and Aitkin, L.M. (1979): Representation of sound frequency and laterality in units in central nucleus of the cat inferior colliculus. J Neurophysiol 42, 1626-1639. Shackford, C. (1961): Some aspects of perception. I. Journal of Music Theory 5, 162-202. Shackford, C. (1962): Some aspects of perception. II. Journal of Music Theory 6, 66-90. Shaffer, L.H., Clarke, E.E., and Todd, N.P. (1985): Metre and rhythm in piano playing. Cognition 20, 61-77. Shepard, R. (1982): Structural representations of musical pitch. In: D. Deutsch The psychology of music. Orlando: Academic Press, 343-390. Shepard, R.N., and Jordan, D.S. (1984): Auditory illusions demonstrating that tones are assimilated to an internalized musical scale. Science 226, 1333-1334. Shepard, R.N., and Metzler, J. (1971): Mental rotation of three-dimensional objects. Science 171, 701-703. Shneiderman, A., et al. (1988): Connections of the dorsal nucleus of the lateral lemniscus: an inhibitory parallel pathway in the ascending auditory system? J Comp Neurol 276, 188-208. Shneiderman, A., et al. (1993): Evidence for a GABAergic projection from the dorsal nucleus of the lateral lemniscus to the inferior colliculus. J Neurochem 60, 72-82. Shove, P., and Repp, B.H. (1995): Musical motion and performance: theoretical and empirical perspective. In: J. Rink (ed) The practice of performance. Cambridge, U.K.: Cambridge University Press, 55-83. Siegel, J.A., and Siegel, W. (1977a): Absolute identification of notes and intervals by musicians. Perception and Psychophysics 21, 143-152. Siegel, J.A., and Siegel, W. (1977b): Categorical perception of tonal intervals: Musicians can’t tell sharp from flat. Perception and Psychophysics 21, 399-407. Simon, H.A. (1962/1982): The architecture of complexity. Proceedings of the American Philosophical 190
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Society, 106, 467-482, republ. In: The Sciences of the Artificial, 2nd. ed. Cambridge, Mass. : MIT Press Singer, W., and Gray, C. (1995): Visual feature integration and the temporal correlation hypothesis. Annu Rev Neurosci 18, 555-586. Slattery, W. H., and Middlebrooks, J. C. (1994): Monaural sound localization: acute versus chronic unilateral impairment. Hear Res 75, 38-46. Slawson, W. (1985): Sound Color. Berkeley : University of California Press Sloboda, J.A. (1983): The communication of musical metre in piano performance. Q J Exp Psychol 35A, 377396. Sloboda, J.A. (1995): The musical mind. Oxford: Oxford University Press Small, A.M. (1936): An objective analysis of violin performance. University of Iowa Studies in the Psychology of Music 4, 172-231. Smith, E.E., Jonides, J., Koeppe, R.A. (1996): Dissociating verbal and spatial working memory using PET. Cereb Cortex 6, 11-20. Snider, C.J., and Chalupa, L.M. (1993): Specificity of the retinocollicular pathway in developing cat and ferret. Soc Neurosci Abstr 19, 454. Snyder, L.H., Grieve, K.L., Brotchie, P., and Andersen, R.A. (1998): Separate body- and world-referenced representations of visual space in parietal cortex. Nature 394, 887-891. Sparks, D.L. (1978): Functional properties of neurons in the monkey superior colliculus: coupling of neuronal activity and saccade onset. Brain Res 156, 1-16. Sparks, D.L. (1986): Translation of sensory signals into commands for control of saccadic eye movements: role of primate superior colliculus. Physiol Rev 66, 116-177. Sparks, D.L., and Nelson, J.S. (1987): Trends Neurosci 10: 312-317. Spinelli, D.N., Starr, A., and Barrett, T.W. (1968): Auditory specificityy in unit recordings from cat’s visual cortex. Exp Neurol 22, 75-84. Stecker, R.E., Steinfels, G.F., Abercombie, E.D., and Cacobs, B.L. (1985): Caudate unit activity in freely moving cats: effexts of phasic auditory and visual stimuli. Brain Res 329, 350-353. Stein, B.E. (1998): Neural mechanisms for synthesizing sensory information and producing adaptive behaviors. Exp Brain Res 123, 124-135. Stein, B.E., Clamann, H.P., and Goldberg, S.J. (1980): Superior colliculus: control of eye movements in neonatal kittens. Science 210, 78-80. Stein, B.E., Huneycutt, W.S., and Meredith, M.A. (1988): Neurons and behavior: the same rules of multisensory integration apply. Brain Res 448, 355-358. Stein, B.E., Labos, E., and Kruger, L. (1973): Sequence of changes in properties of neurons of superior colliculus of the kitten during maturation. J Neurophysiol 36, 667-679. Stein, B.E., London, N., Wilkinson, L.K., and Price, D.D. (1996): Enhancement of perceived visual intensity by auditory stimuli: a psychophysical analysis. J Cogn Neurosci 497-506. Stein, B.E., Magalhaes-Castro, B., and Kruger, L. (1975): Superior colliculus: visuotopic-somatotopic overlap. Science 189(4198), 224-226. Stein, B.E., Magalhaes-Castro, B., and Kruger, L. (1976): Relationship between visual and tactile representation in cat superior colliculus. J Neurophysiol 39, 401-419. Stein, B.E., Meredit, M.A., and Wallace, M.T. (1993): The visually responsive neuron and beyond: multisensory integration in cat and monkey. Prog Brain Res 95, 79-90. Stein, B.E., Meredith, M.A., Huneycutt, W.S., and McDade, L. (1989): Behavioral indices of multisensory integration: orientation to visual cues is affected by auditory stimuli. J Cogn Neurosci 1, 12-24. Stein, B.E., Meredith, M.A., and Huneycutt, W.S. (1988): Neurons and behavior: the same rules of multisensory integration apply. Brain Res 448, 355-358. Stein, B.E., Spencer, R.F., and Edwards, S.B. (1983): Corticotectal and corticothalamic efferent projections of SIV somatosensory cortex in cat. J Neurophysiol 50, 896-908. Stein, B.E., and Arigbede, M.O. (1972): Unimodal and multimodal response properties of neurons in the cat’s superior colliculus. Exp Neurol 36, 179-196. Stein, B.E., and Clamann, H.P. (1981): Control of pinna movements and sensorimotor register in cat superior colliculus. Brain Behav Evol 19, 180-192. 191
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Stein, B.E., and Dixon, J.P. (1979): Properties of superior colliculus neurons in the golden hamster. J Comp Neurol 183, 269-284. Stein, B.E., and Gaither, N. (1981): Sensory representation in reptilian optic tectum: some comparisons with mammals. J Comp Neurol 202, 69-87. Stein, B.E., and Gallagher, H. (1981): Maturation of cortical control over superior colliculus cells in cat. Brain Res 223, 429-435. Stein, B.E., and Magalhaes-Castro, B. (1975): Effects of neonatal cortical lesions upon the cat superior colliculus. Brain Res 83, 480-485. Stein, B.E., and Meredith, M.A. (1991): Functional organization of the superior colliculus. In: A.G. Leventhal (ed) The neural basis of visual function. Macmillan, Hampshire, 85-110. Stein, B.E., and Meredith, M.A. (1993): The merging of the senses. MIT Press, Cambridge Stein, B.E., and Wallace M.T. (1996): Comparison of cross-modality integration in midbrain and cortex. Prog Brain Res 112, 289-299. Stein, J. (1995): The posterior parietal cortex, the cerebellum and the visual guidance of movement. In: F.W. Cody (ed) Neural control of skilled human movement. PortlandPress, 31-49. Stevens, S.S. (1975): Psychophysics: Introduction to its perceptual, neural and social prospects. New York: Wiley Stevens, S.S., Volkman, J., and Newman, .B. (1937): A scale for the measurement of the psychological magnitude of pitch. J Acoust Soc Am 8, 185-190. Stevens, S.S., and Newman, E.D. (1934): The localization of pure tones. Proc Nat Acad Sci 20: 593-596. Stevens, S.S., and Volkman, J. (1940): The relation of pitch to frequency: A revised scale. Am J Psychol 53, 329-353. Straschill, M., and Hoffmann, K-P. (1970): Activity of movement sensitive neurones of the cat’s tectum opticum during spontaneous eye movements. Exp Brain Res 11, 318-326. Street, A. (1989): Superior myths, dogmatic allegories: The resistance to musical unity. Music Analysis 8, 77123. Stricanne, B., Andersen, R.A., and Mazzoni, P. (1996): Eye-centered, head-centered, and intermediate coding of remembered sound localizations in area LIP. J Neurophysiol 76, 2071-2076. Strick, P.L., Hoover, J.E., Mushiake, H. (1993): Evidence for „output channels“ in the basal ganglia in voluntary movement. In: N. Mano, I. Hamada, M.R. DeLong, (eds) New York: Elsevier Science, 171180. Strick, P.L., Hoover, J.E., Mushiake, H. (1993): Evidence for „output channels“ in the basal ganglia in voluntary movement. In: N. Mano, I. Hamada, M.R. DeLong, (eds) New York: Elsevier Science, 171180. Sumby, W.H., and Pollack, I. (1954): Visual contribution to speech intelligibility in noise. J Acoust Soc Am 26, 212-215. Summerfield, Q., and Assmann, P. F. (1991): Perception of concurrent vowels: effects of harmonic misalignment and pitch-period asynchrony. J Acoust Soc Am 89, 1364-1377. Summers, J.J., Ford, S.K., and Todd, J.A. (1996): Practice effects on the coordination of the two hands in a bimanual tapping tast. Human Movement Science 12(1-2), 111-133. Summers, J.J., Rosenbaum, D.A., Burns, B.D., and Ford, S.K. (1993): Production of polyrhythms. J Exp Psychol 19(2), 416-428. Summers, J.J., and Kennedy, I.M. (1992): Strategies in the production of a 5:3 polyrhythm. Human Movement Science 11, 101-112. Sussman, E., Ritter, W., and Vaughan, H.G., Jr. (1998a): Predictability of stimulus deviance and the mismatch negativity. NeuroReport 9, 4167-4170. Sussman, E., Ritter, W., and Vaughan, H.G., Jr. (1998b): Attention affects the organization of auditory input associated with the mismatch negativity system. Brain Res 789, 130-138. Sussman, E., Ritter, W., and Vaughan, H.G., Jr. (1999): An investigation of the auditory streaming efect using event-related brain potentials. Psychophysiol 36, 22-34. Sussman, E., et al. (2002): Top-down effects on stimulus-driven auditory oranization. Cogn Brain Res 13, 393-405. Sutter, M.L., and Schreiner, C.E. (1991): Physiology and topography of neurons with multipeaked tuning 192
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
curves in cat primary auditory cortex. J Neurophysiol 65, 1207-1226. Takahashi, T. T. (1989): The neural coding of auditory space. J Exp Biol 146, 307-322. Takahashi, T. T., and Keller, C. H. (1992): Commissural connections mediate inhibition for the computation of interaural level difference in the barn owl. J Comp Physiol A 170, 161-9. Takahashi, T. T., and Konishi, M. (1986): Selectivity for interaural time difference in the owl’s midbrain. J Neurosci 6, 3413-3422. Takahashi, T. T., and Konishi, M. (1988): Projections of the cochlear nuclei and nucleus laminaris to the inferior colliculus of the barn owl. J Comp Neurol 274, 190-211. Takegata, R., Paavilainen, P., Näätänen, R., and Winkler, I. (2001): Preattentive processing of spectral, temporal, and structural characteristics of acoustic regularities: A mismatch negativity study. Psychophysiol 38, 92-98. Tawil, R.N., Saade, N.E., Bitar, M., and Jabbur, S.J. (1985): Polysensory interactions on single neurons of cat inferior colliculus. Brain Res 329, 350-353. Terhardt, E. (1998): Akustische Kommunikation - Grundlagen mit Hörbeispielen. Springer, Berlin/Heidelberg Tervaniemi, M., Maury, S., and Näätänen, R. (1994): Neural representations of abstract stimulus features in the human brain as reflected by the mismatch negativity. NeuroReport 5, 844-846. Tervaniemi, M., et al. (2001): Superior formation of cortical memory traces for melodic patterns in musicians. Learning and Memory 8, 295-300. Thatch, W.T. (1996): ¡On the specific role of the cerebellum in motor learning and cognition: clues from PET activation and lesion studies in man. Behav Brain Sci 19, 501-502. Thompson, G.C., and Masterton, R.B. (1978): Brainstem auditory pathways involved in reflexive head orientation to sound. J Neurophysiol 41, 1183-1202. Thompson, R.F., Smith, H.E., and Bliss, D. (1963): Auditory, somatic sensory, and visual response interactions and interrelations in association and primary cortical fields of the cat. J Neurophysiol 26, 365378. Thomson, A.M., and Deuchars, J. (1994): Temporal and spatial properties of local circuits in neocortex. TINS 17(3), 119-126. Tiao, Y-C., Blakemore, C. (1976): Functional organization in the superior colliculus of the golden hamster. J Comp Neurol 168, 483-504. Tiitinen, H., May, P., Reinikainen, K., and Näätänen, R. (1994): Attentive novelty detection in humans is governed by pre-attentive sensory memory. Nature 372, 90-92. Tisserand, M., and Guillot, J. (1949-1950): Etude du tempo de 335 sujets masculins dans la région parisienne. Biotypologie 10(11), 89-94. Todd, N.P.M. (1985): A model of expressive timing in tonal music. Music Perception 3(1), 33-59. Todd, N.P.M. (1998): A model of auditory image fllow I: Architecture. Proc 16th International Congress of acoustics. Seattle. Vol II. 841-842. Todd, N.P.M., Cody, F., and Banks, J. (2000): A saccular origin of frequency tuning in myogenic vestibular evoked potentials?: Implications fro human responses to loud sounds. Hear Res 141, 180-188. Todd, N.P.M., Lee, C.S., and O’Boyle, D.J. (1999): A sensory-motor theory of rhythm, time perception and beat induction. J New Music Research 28(1), 5-29. Toldi, J., Rojik, I., and Feher, O. (1981): Two different polysensory systems in the suprasyévian gyrus of the cat. An electrophysiological and autoradiographic study. Neurosci 6, 2539-2545. Toldi, J., and Feher, O. (1984): Acoustic sensitivity and bimodal properties of cells in the anterior suprasylvian gyrus of the cat. Exp Brain Res 55, 180-183. Tramo, M., Bharucha, J., and Musiek, F. (1990): Music perception and cognition following bilateral lesions of auditory cortex. J Cogn Neurosci 2, 195-212. Tsuchitani, C. (1997): Input from the medial nucleus of the trapezoid body to an interaural level detector. Hear Res 105, 211-224. Turner, B.H., Mishkin, M., and Knapp, M. (1980): Organization of he amygdalopetal projections from modality-specific cortical association areas in the monkey. J Comp Neurol 191, 515-543. Turvey, M.T., Schmidt, R.C., and Rosenblum, L.D. (1989): ‘Clock’ and ‘motor’ components in absolute coordination of rhythmic movements. Neurosci 33(1), 1-10. Ungerleider LG, and Mishkin M. (1982): Two cortical visual systems. In: D.J. Ingle, M.A. Goodale, R.J.W. 193
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Mansfield (eds) Analysis of visual behavior. Cambridge, MA: MIT Press, 549-586. Vaadia, E., Benson, D.A., Hienz, R.D., and Goldstein, M.H.J. (1986): Unit study of monkey frontal cortex: active localization of auditory and of visual stimuli. J Neurophysiol 56, 934-952. Vernon, L.N. (1936): Synchronization of chords in artistics piano music. In: H. Seashore (ed) Objective analysis of musical performance. Iowa City: University of Iowa Press, 306-345. Victorov, I.V. (1968): Neuronal structure of superior colliculi of corpora quadrigemina. Arkh Anat Gistol Embriol 32, 1-15. Viemeister, N.F., Plack, C.J. (1993): Time analysis. In: W.A. Yost, A.N. Popper, and R.R. Fay (eds) Human psychophysics Viemeister, N.F., Plack, C.J. (1993): Time analysis. In: W.A. Yost, A.N. Popper, and R.R. Fay (eds) Human psychophysics Vierordt, K. (1868): Der Zeitsinn nach Versuchen. Tübingen: Laupp Vorberg, D., and Hambuch, R. (1978): On the temporal control of rhythmic performance. In: J. Requin (ed) Attention and performance (Vol. VII). Hillsdale, NJ: Lawrence Erlbaum Associates, 535-555. Vorberg, D., and Hambuch, R. (1984): Timing of two handed rhythmic performance. In: J. Gibbon, and L. Allan (eds) Timing and time perception. New York: New York Academy of Sciences, 390-406. Vorberg, D., and Wing, A. (1996): Modeling variability and dependence in timing. In: H. Hener, and S.W. Keele (eds) Handbook of perception and action: Vol 2. Motor skills. London: Academic Press 181262. Wallace, M.T., McHaffie, J.G., and Stein, B.E. (1995): Sensory response properties in the superior colliculus (SC) of the newborn rhesus monkey. Soc Neurosci Abstr 21, 655. Wallace, M.T., Meredith, M.A., and Stein, B.E. (1992): Integration of multiple sensory modalities in cat cortex. Exp Brain Res 91, 484-488. Wallace, M.T., Meredith, M.A., and Stein, B.E. (1993a): Converging influences from visual, auditory and somatosensory cortices onto output neurons of the superior colliculus. J Neurophysiol 69, 1797-1809. Wallace, M.T., Meredith, M.A., and Stein, B.E. (1993b): Integration of multisple sensory inputs in cat cortex. Exp Brain Res 91, 484-488. Wallace, M.T., Wilkinson, L.K., Stein, B.E. (1996): Representation and integration of multiple sensory inputs in primate superior colliculus. J Neurophysiol 76, 1246-1266. Wallace, M.T., and Fredens, K. (1989): Relationship of afferent inputs to the lattice of high NADPHdiaphorase activity in the mouse superior colliculus. Exp Brain Res 78, 435-445. Wallace, M.T., and Stein, B.E. (1994): Cross-modal synthesis in the midbrain depends on input from association cortex. J Neurophysiol 71, 429-432. Wallace, M.T., and Stein, B.E. (1997): Development of multisensory neurons and multisensory integration in cat superior colliculus. J Neurosci 17, 2429-2444. Wallach, H., Newman, E.B., and Rosenzweig, M.R. (1949) : The precedence effect in sound localization. J Am Psychol 57, 315-336. Wang, J., Caspary, D., Salvi, R.J. (2000): GABA-A antagonist causes dramatic expansion of tuning in primary auditory cortex. NeuroReport 11, 1137-1140. Ward, W.D. (1954): Subjective musical pitch. J Acoust Soc Am 26, 369-380. Ward, W.D. (1970): Musical pereption. In: J.V. Tobias, and E.D. Hubert (eds) Foundations of modern audi tory theory. (Volume 1). New York: Academic Press, 407-447. Warren, R.M. (1970): Perceptual restoration of missing speech sounds. Science 167, 392-3. Warren, R.M., Obusek, C.J., Farmer, R.M., and Warren, R.P. (1969): Auditory sequence: Confusions of patterns other than speech or music. Science 164, 586-587. Warren, R.M., and Byrnes, D.L. (1975): Temporal discrimination of recycled tonal sequences: Pattern matching and naming of order by untrained listeners. J Acoust Soc Am 18, 273-280. Watt, H.J. (1917): The psychology of sound. London and New York: The University of Cambridge Press Weintraub, M. (1985): A theory and computational model of auditory monaural sound separatio. University of Stanford unpublished doctoral dissertation. Welch, R.B., and Warren, D.H. (1986): Intersensory interactions. In: K.R. Boff, L. Kaufman, and J.P. Thomas (eds) Handbook of perception and human performance, vol I: sensory processes and perception. Wiley, New York, 1-36. 194
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Wenstrup, J. J., Ross, L. S., and Polack, G. D. (1985): A functional organisation of binaural responses in the inferior colliculus. Hear Res 17, 191-195. Wenstrup, J.J. et al. (1986): Binaural response organization within a frequency-band representation of the inferior colliculus: implications for sound localization. J Neurosci 6, 962-973. Wenstrup, J.J., et al. (1988): Binaural neurons in the mustache bat’s inferior colliculus. I. Responses of 60kHz EI units to dichotic sound stimulation. J Neurophysiol 60, 1369-1383. Wertheimer, M. (1923): Untersuchung zur Lehre von der Gestalt II. Psychologische Forschung 4, 301-350. Wespic, J.G. (1966): Multimodal sensory activation of cells in the magnocellular medial geniculate nucleus. Exp Neurol 15, 299-318. Wessel, D.L. (1978): Timbre space as a musical control structure. Rapports IRCAM Nr. 12 Wessel, D.L. (1979): Timbre space as a musical control structure. Computer Music Journal, 3(2) Wester, K.G., Irvine, D.R.F., and Thompson, R.F. (1974): Acoustic tuning of single cells in middle suprasylvian cortex of cat. Brain Res 76, 493-502. White, B.W. (1960): Recognition of distorted melodies. Am J Psychol 73, 100-107. Wickelgren, B.G. (1971): Science 173, 69-72. Wickelgren, B.G., and Sterling, P. (1969): Influence of visual cortex on receptive fields in the superior colliculus of the cat. J Neurophysiol 32, 16-23. Wiener, F.M., Pfeifferr, R.R., and Backus, A.S.N. (1966): On the sound pressure transformation by the head and auditory meatus of the cat. Acta Oto Laryngol 61, 255-269. Wightman, F. L., and Kistler, D. J. (1989): Headphone simulation of free-field listening. I: Stimulus synthesis. J Acoust Soc Am 85, 858-67. Wilkinson, L.K., Meredith, M.A., and Stein, B.E. (1996): The role of anterior ectosylvian cortex in crossmodality orientation and approach behavior. Exp Brain Res 112, 1-10. Williams, K.N., and Perrott, D.R. (1972): Temporal resolution of tonal pulses. J Acoust Soc Am 51, 644-647. Wilson, J.S., Hull, C.D., and Buchwald, N.A. (1983): Intracellular studies of the convergence of sensory input on caudate neurons of cat. Brain Res 270, 197-208. Winer, J.A. (1992): Functional architecture of the medial geniculate body and primary auditory cortex. In: D.R. Webster et al. (eds) The Mammalian Auditory Pathway: Neuroanatomy (Vol. 1). Springer, 222409. Winer, J.A., Diamond, I.T., and Raczkowski, D. (1977): Subdivisions of the auditory cortex of the cat: the retrograde transport of horseradish peroxidase to the medial geniculate body and posterior thalamic nuclei. J Comp Neurol 176, 387-418. Winer, J.A., et al. (1995): GABA and glycine in the central auditory system of the mustache bat: structural substratess for inhibitory neuronal organization. J Comp Neurol 355, 317-353. Wing, A. (1980): The long and short of timing in response sequences. In: G. Stelmach and J. Requin (eds) Tutorials in motor behavior. North-Holland, 469-486. Wing, A.M., and Kristofferson, A.B. (1973a): Response delays and timing of discrete motor responses. Perception and Psychophysics 14, 5-12. Wing, A.M., and Kristofferson, A.B. (1973b): The timing of interresponse intervals. Perception and Psychophysics 13, 455-460. Winkler, I. (2003): Hangok szervezése és leképezése. In: Pléh Cs., Kovács Gy. és Gulyás B. (eds) Kognitív idegtudomány. Osiris Kiadó, Budapest, 151-170. Winkler, I., Karmos, G., and Näätänen, R. (1996a): Adaptive modeling of the unattended acoustic environment reflexted in the mismatch negativity event-related potential. Brain Res 742, 239-252. Winkler, I., Schröger, E., and Cowan, N. (2001): The role of large-scale perceptual organization in the mismatch negativity event-related brain potential. J Cogn Neurosci 13, 59-71. Winkler, I., Tervaniemi, M., and Näätänen, R. (1997): Two separate codes for missing-fundamental pitch in the human auditory cotex. J Acoust Soc Am 102, 1072-1082. Winkler, I., and Czigler, I. (1998): Mismatch negativity: deviance detection or the maintenance of the ‘standard’. NeuroReport 9, 3809-3813. Winkler, I., and Schröger, E. (1995): Neural representation for the temporal structure of sound patterns. NeuroReport 6, 690-694. Winkler, I., et al. (1996b): Interactions between transient and long-term auditory memory as reflexted by the 195
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
mismatch negativity. J Cogn Neurosci 8, 403-415. Winkler, I., et al. (1998): Temporal constrains of auditory event synthesis: Evidence from ERPs. NeuroReport 9, 495-499. Winkler, I., et al. (2002): Retention of acoustic information in the human auditory cortex. Psychophysiol 39, 530-534. Wise, L.Z., and Irvine, D.R.F. (1984): Interaural intensity difference sensitivity based on facilitatory binaural interaction in cat superior colliculus. Hear Res 16, 181-7. Wise, L.Z., and Irvine, D.R.F. (1985): Topographic organization of interaural intensity difference sensitivity in deep layers of cat superior colliculus: implications for auditory spatial representation. J Neurophysiol 54, 185-211. Withington, D.J. (1992): The effect of binocular eyelid suture on auditory responses in the guinea-pig superior colliculus. Neurosci Lett 136, 153-156. Wojcciulik, E., and Kanwisher, N. (1998): A general visual attention mechanism in the human brain: evidence from fMRI. NeuroImage 7, 578. Woodrow, H. (1932): The stratification of musical rhythm. New Haven: Yale University Press Woolsey, C.N. (1964): Electrophysiological studies on thalamocortical relations in the auditory system. In: A. Abrams, H.H. Garner, J.E.P. Tamam (eds) Unfinished tasks in the bahavioral sciences. Cambridge, MA: MIT, 235-257. Worden, M.S., Foxe, J.J., Wang, N., and Simpson, G.V. (2000): Anticipatory biasing of visuospatial attention indexed by retinotopically specific-band electroencephalography increases over occipital cortex. J Neurosci 20, RC63. Wright, J.K., and Bregman, A.S. (1987): Auditory stream segregation and the control of dissonance in polyphonic music. In: Music and Psychology: A Mutual Regard. S. McAdams (ed) Contemporary Music Review 2(1), 1-61. Wurtz, R.H., and Goldberg, M.E. (1972): Activity of superior colliculus in behaving monkey. III. Cells discharging before eye movements. J Neurophysiol 35, 575-586. Wurtz, R.H., and Albano, J.E. (1980): Visual-motor function of the primate superior colliculus. Annu Rev Neurosci 3, 189-226. Wyttenbach, R.A., and Hoy, R.R. (1989): Demonstration of the precedence effect in an insect. J Acoustic Soc Am 85, 858-867. Yabe, H., et al. (2001): Organizing sound sequences in the human brain: The interplay of auditory streaming and temporal integration. Brain Res 897, 222-227. Yang, L., et al. (1992): GABAergic circuits sharpen tuning curves and modify response properties in the mustache bat inferior colliculus. J Neurophysiol 68, 1760-1774. Yang, L., et al. (1994a): The roles of GABAergic and glycinergic inhibition on binaural processing in the dorsal nucleus of the lateral lemniscus of the mustache bat. J Neurophysiol 71, 1999-2013. Yang, L., et al. (1994b): GABA and glycine have different effects on monaural response properties in the dorsal nucleus of the lateral lemniscus of the mustache bat. J Neurophysiol 71, 2012-2024. Yang, L., et al. (1994c): Binaural inhibition in the dorsal nucleus of the lateral lemniscus of the mustache bat affects responses for multiple signals. Aud Neurosci 1, 1-17. Yang, L., et al. (1996): Afferent connections to the dorsal nucleus of the lateral lemniscus of the mustache bat: evidence for two functional subdivisions. J Comp Neurol 373, 575-592. Yee, W., Holleran, S., and Jones, M.R. (1994): Sensitivity to event timing in regular and irregular sequences: Influences of musical skill. Perception and Psychophysics 56(4), 461-471. Yeston, M. (1976): The stratification of musical rhythm. New Haven: Yale University Press Yin, T.C. (1994): Physiological correlates of the precedence effect and summing localization in the inferior colliculus of the cat. J Neurosci 14, 5170-5186. Yin, T.C., Chan, J.C., and Carney, L.H. (1987): Effects of interaual time delays of noise stimuli on low-frequency cells in the cat’s inferior colliculus. III. Evidence for cross-correlation. J Neurophysiol 58, 562-583. Yin, T.C., Chan, J.C., and Irvine, D.R. (1986): Effects of interaural time delays of noise stimuli on low-frequency cells in the cat’s inferior colliculus. I. Responses to wideband noise. J Neurophysiol 55, 280300. 196
DANCZI CSABA LÁSZLÓ : A ZENEI
TÉR
Yin, T.C., Kuwada, S., and Sujaku, Y. (1984): Interaural time sensitivity of high-frequency neurons in the inferior colliculus. J Acoust Soc Am 76, 1401-1410. Yin, T.C., and Chan, J.C. (1990): Interaural time sensitivity in medial superior olive of cat. J Neurophysiol 64, 465-488. Yin, T.C., and Kuwada, S. (1983): Binaural interaction in low-frequency neurons in inferior colliculus of the cat. II. Effects of changing rate and direction of interaural phase,. J Neurophysiol 50, 1000-1019. Yin, T.C., and Litovsky, R. (1995): Physiological studies of the precedence effect in the inferior colliculus of the cat. In: G.A. Manley, G.M. Klump, C. Koppl, H. Fastl, and H. Oeckinghaus (eds) Advances in hearing research: Proceedings of the 10th international symposium on hearing. World Scientific, Singapore Zahn, J.R., Abel, L.A., Dell’Osso, L.F. (1978): Audio-ocular response characteristics. Sens Proc 2, 32-37. Zangenehpour, S., Chaudhuri, A. (1999): Multisensory neurons of the superior colliculus revealed by dual fluorescent ICC/ ISH labeling using c-fos and zif268 expression profiles. Soc Neurosci Abstr 29, 1414. Zarzeki, P., Blum, P.S., Bakker, D.A., and Herman, D. (1983): Convergence of sensory inputs on projection neurons of somatosensory cortex: vestibular, neck, head and forelimb inputs. Exp Brain Res 50, 408414. Zatorre, R.J. (1989): Effects of temporal neocortical excisions on musical processing. Contemporary Music Review 4, 265-278. Zatorre, R.J., Halpern, A.R., Perry, D.W., Meyer, E., and Evans, A.C. (1996): Hearing in the mind’s ear: a PET investigation of musical imagery and perception. J Cognit Neurosci 8, 29-46. Zattore, R.S., and Halpern, A.R. (1979): Identification, discrimination, and selective adaptation of simultaneous musical intervals. Perception and Psychophysics 26, 384-395. Zurek, P.M. (1987): The precedence effect. In: W.A. Yost and G. Gourevitch (eds) Directional Hearing. Springer-Verlag, Berlin Zwicker, U.T. (1984): Auditory recognition of diotic and dichotic vowel pairs. Speech Communication 3, 256-277. de Cheveigné, A. (1993): Separation of concurrent harmonic sounds: Fundamental frequency estimation and a time-domain cancellation model of auditory processing. J Acoust Soc Am 93, 3271-3290. de Cheveigné, A. (1997): Concurrent vowel segregation III: A neural model of harmonic interference cancellation. J Acoust Soc Am 101, 2857-2865. de Cheveigné, A., and Kawahara, H. (1997): Modeling the perception of multiple pitches. Proc IJCAI workshop on Computational Auditory Scene Analysis, Nagoya de Cheveigné, A., and Kawahara, H. (1998): Multiple period estimation and pitch perception model. Speech Communication de Chevigné, A., Kawahara, H., Tsuzaki, M., and Aikawa, K. (1997): Concurrent vowel identification I: Effects of relative level and F0 difference. J Acoust Soc Am 101, 2839-2847. van Adel, B.A., et al. (1999): Contribution of the commicure of Probst to binaural evoked responses in the rat’s inferior colliculus: interaural time differences. Hear Res 130, 115-130. van Noorden, L.P.A.S. (1975): Temporal coherence in the perception of tone sequences. PhD Thesis, Eindhoven University of Technology von Steinbuchet, N., Wittman, M., and Poeppel, E. (1996): Timing in perceptual and motor tasks after disturbances of the brain. In: M.A. Pastor, and J. Artieda (eds) Time, internal clocks, and movement. Elsevier, 281-304.
197