hledat:    
 

Sociolingvistické značky a charakteristiky v korpusu SCHOLA2010

Hana Goláňová

V korpusu SCHOLA2010 se nacházejí specifické sociolingvistické charakteristiky nevyskytující  se v ostatních mluvených korpusech: informace o sondě (navíc – region, místo pořízení sondy, velikost sídla), o škole, o třídě, o vyučovacím předmětu, o vyučovací hodině a doplňující údaje o mluvčím (jedinečný kód mluvčího; věkové skupiny platné pro učitele, cizí dospělé osoby, žáky a cizí žáky; aprobace pro učitele a cizí dospělé osoby; profese u cizí dospělé osoby; zvláštní poznámky pro žáka a cizího žáka; pobyt mluvčích v dětství – stát; současná nářeční oblast pobytu mluvčího; údaje o médiu).
Mluvčím v tomto korpusu může být: učitel, žák, cizí dospělá osoba, cizí žák, společně mluvící osoby, třída v roli mluvčího, médium v roli mluvčího a komentář, který se octl v pozici mluvčího (např. smích).
Sociolingvistické charakteristiky uváděné v korpusu SCHOLA2010 byly konzultovány se sociologem PhDr. Ondřejem Hubáčkem.

Na základě sociolingvistických značek je možné si v korpusu SCHOLA2010 vytvořit i menší subkorpusy, viz Vyhledávání v korpusu SCHOLA2010 a vytváření subkorpusů.

Ve vyhledávacím programu Bonito si můžeme repliky mezi jednotlivými mluvčími zobrazit následujícím způsobem: menu Zobrazení/Struktury/sp.
Zobrazení hodnot sociolingvistických charakteristik u jednotlivých slovních výskytů v korpusu SCHOLA2010 můžeme provést kliknutím pravým tlačítkem počítačové myši.

ZNAČKA    POPIS
DOKUMENT/
SONDA
 
doc.id Kód sondy. Např. N001-S01-U01-T001; první část kódu vyjadřuje označení sondy, druhá část za pomlčkou je značka pro školu, pak následuje značka pro učitele, poslední část kódu je označení pro třídu.
doc.temp Rok pořízení sondy. Může nabývat hodnot: 2005–2008.
doc.pocetml Celkový počet mluvčích v sondě. Do sumy je zahrnuta také třída v roli mluvčího i médium v roli mluvčího, pokud se v sondě tyto typy mluvčích vyskytují.
doc.promluva Typ promluvy. U všech sond se vyskytuje kategorie F – formální promluva (u typu promluvy jsme si vědomi poměrně velkého zjednodušení, důvody jsou vysvětleny v úvodním textu).
doc.region Název regionu, v němž byla sonda pořízena. Původní nabídka hodnot: Čechy; Morava; Slezsko. Sondy ze Slezska se do výzkumu zařadit nepodařilo.
doc.oblast Název nářeční oblasti, v níž byla sonda nahrána. Původní nabídka hodnot: středočeská; severovýchodočeská; jihozápadočeská; česko–moravská; pohraničí české; pohraničí moravské; středomoravská; východomoravská; slezská. Vymezení nářečních oblastí se opírá o pojetí Běličovo, Nástin české dialektologie, 1972, a o členění nářečních oblastí v Českém jazykovém atlasu, 1992–2005. Sondy z těchto oblastí se do výzkumu zařadit nepodařilo: severovýchodočeská, česko–moravská, pohraničí moravské, středomoravská, slezská.
doc.misto Místo pořízení sondy. Může nabývat hodnot: Praha; mimopražská sonda.
doc.sidlo Velikost sídla, v němž byla sonda nahrána. Může nabývat hodnot: nad 100 tis.; nad 50 tis.; nad 10 tis.; nad 5 tis.; méně než 5 tis.
ŠKOLA  
sk.typ1 Typ školy podle instituce. Může nabývat hodnot: ; G; G víceleté; SOŠ. Ostatní typy škol se do výzkumu nepodařilo zařadit.
sk.typ2 Typ školy podle zřizovatele. Může nabývat hodnot: státní škola; soukromá škola; církevní škola.
sk.typ3 Typ školy sociologicky. Může nabývat hodnot: tradiční městská zástavba; sídlištní škola, venkovská škola.
sk.gvicelete Víceleté gymnázium. Tato kategorie je vyplněna pouze u víceletých gymnázií. Může nabývat hodnot: šestileté a osmileté.  Sedmileté gymnázium se do výzkumu zařadit nepodařilo.
TŘÍDA  
tr.trida Třída ZŠ nebo odpovídající třída víceletého gymnázia. Může nabývat hodnot: 1–9. (kromě 4. třídy). V ostatních případech tato kategorie zůstává nevyplněná.
tr.rocnik Ročník SŠ, gymnázia nebo odpovídající ročník víceletého gymnázia. Může nabývat hodnot: 1–5. Sondy z 5. ročníku (vyskytuje se u některých typů SOŠ) se do výzkumu zařadit nepodařilo. V ostatních případech tato kategorie zůstává nevyplněná.
tr.gvicelete Třída víceletého gymnázia. Může nabývat hodnot: prima; sekunda; tercie; kvarta; kvinta; sexta; septima; oktáva. V ostatních případech tato kategorie zůstává nevyplněná.
tr.typ Typ třídy. Může nabývat hodnot: standardní třída (1 třída = jeden postupný ročník);  smíšená třída (1 třída = žáci z více postupných ročníků ZŠ); sloučená třída (1 třída = žáci z několika tříd jednoho ročníku, většinou semináře na G).
tr.pocet_z Počet žáků ve třídě. Může nabývat hodnot: do 20 žáků; nad 20 žáků.
PŘEDMĚT  
pr.predmet Zkratka vyučovacího předmětu. Může nabývat hodnot: Čjl; Ma; Fy; Che; Př/Bi – přírodopis, biologie; Ze/Ge – zeměpis, geografie; Dě/Hi – dějepis, historie; Ov/Zsv – občanská výchova, základy společenských věd; Esv – estetická výchova; Hv; Vv; Nv/Kv – náboženství, křesťanská výchova; Vl – vlastivěda; Prv – prvouka; – pracovní činnosti; Inf – informatika; odborný (předmět); dále ojediněle předmět „humanitní základ“; Rv – rodinnou výchovu se nám do výzkumu nepodařilo zařadit. Zkratky vyučovacích předmětů jsou lematizovány, ve skutečnosti se mohou názvy vyučovacích předmětů od zkratek lišit.
pr.predmskup Zařazení do skupiny vyučovacích předmětů. Může nabývat hodnot: český jazyk a literatura; matematický a přírodovědný blok; společenskovědní a výchovný blok; informační, technický a profesní blok.
pr.cjl Český jazyk a literatura. Platné pouze pro uvedený předmět, v ostatních případech zůstává tato kategorie nevyplněná. Může nabývat hodnot: převážně jazyková hodina; převážně slohově-komunikační hodina; převážně literární hodina.
pr.typ Typ vyučovacího předmětu. Může nabývat hodnot: povinný předmět; volitelný předmět; nepovinný předmět.
VYUČ. HODINA  
vh.tema Téma vyučovací hodiny. Nabývá různých hodnot podle toho, jak tuto kategorii zaznamenali učitelé.
vh.poradirozvrh Pořadí vyučovací hodiny v rozvrhu hodin. Může nabývat hodnot: 1.–8. hodina. Vyučovací  hodiny mající jiné pořadí v rozvrhu hodin se do výzkumu zařadit nepodařilo.
vh.delka Vyučovací hodina podle délky. Může nabývat hodnot: standardní h. (cca 45 min.); nebo dvouhodinovka (cca 90 min).
vh.typdidakticky Typ vyučovací hodiny – didakticky. Může nabývat hodnot: klasická hodina; jiná hodina – může se jednat např. o skupinovou práci apod.
vh.typfunkce Typ vyučovací hodiny – podle funkce. Může nabývat hodnot: převážně výkladová hodina; procvičovací hodina – procvičuje se učivo z minulých v. hodin; opakovací hodina – opakuje se např. čtvrtletní, pololetní učivo; prověřovací hodina – převážně se zkouší nebo se píše písemná práce; smíšená hodina; jiná hodina – referáty, práce s texty aj.
vh.misto Místo vyučovací hodiny. Může nabývat hodnot: ve třídě; venku; jinde – speciální učebny, školní knihovna apod.
MLUVČÍ  
sp.num Kód mluvčího. Určitému typu mluvčího odpovídá i typ kódu:
učitel - např. U01 (kód je obsažen v celkovém kódu nahrávky), do této kategorie mluvčích jsou zahrnuti učitelé i učitelky;
žák - např. Z01, do této kategorie mluvčích jsou zahrnuti žáci i žákyně;
cizí dospělá osoba - např. CD01 (učitel/učitelka z jiné třídy, sekretářka aj.);
cizí žák - např. CZ01 (žák/žákyně z jiné třídy);
společně mluvící mluvčí - např. U01, Z01 nebo Z01, Z02 nebo U01, T001 aj.;
třída v roli mluvčího - např. T001 (kód je obsažen v celkovém kódu nahrávky);
médium v roli mluvčího - např. M01;
komentář, který se octl v pozici mluvčího, má vždy stejný a jednotný kód – K (např. smích).
V případě společně mluvících mluvčích, třídy v roli mluvčího, média, komentáře v pozici mluvčího nejsou vyplněny sociolingvistické charakteristiky, které pak následují: sp.pohlavi až sp.soucasnaoblast.
sp.inum Jedinečný kód mluvčího. Je vyplněn pouze u mluvčích, které lze označit jako osoby: učitel, žák, cizí dospělá osoba, cizí žák.
sp.osoba Charakteristika mluvčího. Může nabývat hodnot: učitel; žák; cizí dospělá osoba; cizí žák. Tato kategorie je vyplněna pouze u mluvčích, které lze označit jako osoby.
sp.pohlavi Pohlaví mluvčího. Může nabývat hodnot: Z – žena; nebo M – muž. Tato kategorie je vyplněna pouze u těch mluvčích, u nichž je to relevantní.
sp.veknum Věk mluvčího v době pořízení sondy. U žáků může nabývat hodnot 6–23 let (např. 6); u učitele a cizí dospělé osoby 23–69 let (např. 23). Starší osoby se v korpusu nevyskytují.
sp.vek Věková kategorie užívaná v mluvených korpusech, např. PMK, BMK, ORAL2006 aj. Může nabývat hodnot:  I – do 35 let, všichni žáci a cizí žáci; nebo V – nad 35 let.
sp.vek_u Věkové skupiny platné pro učitele a cizí dospělé osoby – po dekádách. Může nabývat hodnot: do 30 let; 31 - 40 let; 41 - 50 let; 51 - 60 let; nad 60 let. Tato kategorie je vyplněná pouze u učitele a cizí dospělé osby v roli mluvčího.
sp.vek_z Věkové skupiny platné pro žáky a cizí žáky. Může nabývat hodnot: do 11 let; 12 - 15 let; nad 15 let. Tato kategorie je vyplněná pouze u žáka a cizího žáka v roli mluvčího.
sp.vzdelani Vzdělání mluvčího I. (Jede o typ užívaný ve všech mluvených korpusech. Může nabývat hodnot: A – VŠ; nebo B –ZŠ, SŠ – všichni žáci a cizí žáci.)
sp.vzdelanityp Vzdělání mluvčího II. Jde o typ užívaný v mluvených korpusech ORAL. Může nabývat hodnot: ; ; . Žáky jsme zařadili do ZŠ, nebo SŠ podle typu započatého studia.
sp.aprobace_u Aprobace učitele nebo cizí dospělé osoby. Nabídka hodnot vychází z charakteristiky – pr.predmet, ... odborný předmět, navíc jsou zařazeny hodnoty: cizí jazyk; první stupeň, speciální (aprobace); žádná aprobace. Tato kategorie je vyplněná pouze u učitele, popřípadě u cizí dospělé osoby v roli mluvčího.
sp.profese_cd Profese u cizí dospělé osoby. Může nabývat hodnot: učitel,-kajiná (profese). Tato kategorie je vyplněná pouze u cizí dospělé osoby v roli mluvčího.
sp.poznamky_z Zvláštní poznámky u žáka a cizího žáka. Může nabývat hodnot: s poruchou učení; s poruchou chování; cizinec; jiné – zdravotní postižení a další komentáře. Tato kategorie nebyla vyplněná u všech žáků a cizích žáků.
sp.pobytstat Pobyt mluvčího v dětství – stát. Může nabývat hodnot: ČR; jiný (cizí stát). Tento údaj umožňuje vyhledat osoby, které žily v cizině nebo jsou cizinci – zejména žáky. Tato kategorie není vyplněna u všech žáků.
sp.detstvioblast Pobyt mluvčího v dětství – nářeční oblast. Nabídka hodnot je stejná jako u charakteristiky doc.oblast. Nářeční oblast pobytu mluvčího v dětství (cca do 15 let) se může lišit jednak od nářeční oblasti, kde byla sonda pořízena, a také od nářeční oblasti, kde v současné době mluvčí žije. U mluvčích nebylo zjištěno, že by v dětství pobývali v nářeční oblasti česko–moravské a v pohraničí moravském. Tato kategorie ale nebyla vyplněna u všech mluvčích.
sp.soucasnaoblast Současný pobyt mluvčího – nářeční oblast. Nabídka hodnot je stejná jako u charakteristiky doc.oblast. Nářeční oblast pobytu mluvčího se může lišit od oblasti, kde byla sonda pořízena. U mluvčích nebylo zjištěno, že by v současné době pobývali v nářeční oblasti česko–moravské a v pohraničí moravském.
sp.medium Typ média. Může nabývat hodnot: CD; školní rozhlas. Původní nabídka typů médií byla širší. Tato kategorie je vyplněna pouze u média v roli mluvčího.