Struktura korpusu ORAL2006
Marie Kopřivová
Všechny nahrávky v korpusu ORAL2006 pocházejí z let 2002 - 2006.
Nahrávky jsou pořízeny v neformálních situacích, to znamená, že mluvčí se vzájemně znali, měli k sobě přátelský vztah (tykali si) a nikdo z nich zde nehovoří jako představitel své profese v rámci svého zaměstání.
Mluvčí byli rozhovorům fyzicky přítomni, korpus neobsahuje přepisy telefonní konverzace.
Mluvčí nebyli předem informováni o účelu nahrávání, ten jim byl sdělen po ukončení nahrávání a všichni souhlasili s použitím nahrávky pro korpusové zpracování.
Korpus ORAL2006 obsahuje přepisy 221 nahrávek, ve kterých vystupuje 754 mluvčích. Celkový čas nahrávek je asi 111,5 hodiny. Jejich přepis obsahuje 1 000 798 slov, což odpovídá 1 312 282 korpusovým pozicím (= slova + interpunkce).
Nejedná se o korpus vyvážený, obsahuje nahrávky především mladých lidí, převažují ženy a lidé s vysokoškolským vzděláním. Jde však o korpus, který se poprvé pokouší zachytit jazyk mluvčích ze všech nářečních oblastí Čech a zachycuje jejich mluvu z počátku 21. století.
V následujících tabulkách je složení korpusu podle jednotlivých parametrů uváděno počtem pozic v korpusu. Tyto parametry jsou dostupné při vyhledávání v korpusu jako zdroje.
Tab 1. Počet nahrávek podle roků
|
Tab 2. Počet nahrávek podle počtu mluvčích
|
||||||||||||||||||||||||||||||||
Tab 3. Počet mluvčích a pozic podle vzdělání
|
Tab 4. Počet mluvčích a pozic podle pohlaví
|
||||||||||||||||||||||||||||||||
Tab 5. Počet mluvčích a pozic podle věku
|
Tab 6. Počet mluvčích a pozic podle nářečních oblastí
|
Počet mluvčích podle věku:



