hledat:    
 

Doprovodné charakteristiky v KSK

Obsah:
Sociologické a nářeční značkování
Vyhledávání v KSK podle doprovodných charakteristik
Statistické hodnoty doprovodných charakteristik v KSK

Sociologické a nářeční značkování

Každý korespondenční text uložený v KSK je opatřen značkami zachycujícími základní sociologické charakteristiky, konkrétně informace o pohlaví (žena - muž), věku (4 věkové stupně) a vzdělání (2 stupně) pisatele i adresáta. V jmenovaných parametrech KSK v zásadě udržuje kompatibilitu s korpusy PMK a BMK, které jsou rovněž součástí Českého národního korpusu.

Jako novum KSK uvádí teritoriální nářeční zázemí pisatelů (prostřednictvím lokalizačních údajů a číselných značek zařazujících lokalitu do nářečních oblastí podle Českého jazykového atlasu, viz níže).

U každého dokumentu je dále připojena charakteristika vztahu mezi pisatelem a adresátem (4 možnosti) a údaje o roku napsání dopisu a jeho formě.

Vyhledávací program Bonito umožňuje zobrazení hodnot doprovodných charakteristik u všech slovních výskytů v korpusu (viz menu Zobrazení > Reference).

Vyhledávání v KSK podle doprovodných charakteristik

(Přehled značek užívaných v korpusovém manažeru Bonito)


značka popis
doc.id  Identifikační číslo dokumentu. Pořadové číslo dokumentu v rámci souboru. Může nabývat hodnot: 1-2000.
doc.signatura  Signatura dokumentu. Souhrn hlavních charakterizačních údajů o dokumentu v pořadí: pohlaví pisatele, věk pisatele, vzdělání pisatele, teritoriální zázemí pisatele, vztah mezi pisatelem a adresátem, pohlaví adresáta, věk adresáta, vzdělání adresáta, rok napsání korespondenčního textu. Signatura spojuje údaje týkající se většiny následujících samostatných doprovodných charakteristik. 
doc.archiv  Archivační číslo dokumentu. Číslo odkazující k archivnímu uložení originálu dokumentu v ÚČJ FF MU v Brně. (Pro běžného uživatele KSK je tento údaj irelevantní.)
doc.pispohl  Pohlaví pisatele. Pohlaví autora korespondenčního textu. Může nabývat hodnot: F (žena), M (muž).
doc.pisvek  Věk pisatele. Věk autora korespondenčního textu. Může nabývat hodnot: 1 (do 15 let), 2 (od 15 do 30 let), 3 (od 30 do 50 let), 4 (nad 50 let).
doc.pisvzdel  Vzdělání pisatele. Dosažené vzdělání autora korespondenčního textu. Může nabývat hodnot: B (pouze základní nebo středoškolské), A (vysokoškolské ukončené nebo probíhající v době vzniku dopisu).
doc.pispobyt  Dlouhodobý pobyt pisatele. Místo, které během pisatelova života nejvíce ovlivnilo jeho idiolekt. Může nabývat mnoha hodnot. Způsob označení i míra přesnosti (např. Jihlava; u Prahy; Plzeňsko; Vysočina) reflektují podobu uvedenou dárcem dopisu. Pokud je připojen další údaj v závorce, jde pouze o sekundární informaci o místě pisatelova studia, případně o jeho delším zahraničním pobytu v době vzniku dopisu: např. Jihlava (Brno); Jihlava (USA).
doc.pister  Teritoriální jazykové zázemí pisatele = místo pisatelova dlouhodobého pobytu (které nejvíce ovlivnilo jeho idiolekt) převedené do číselného kódu. Číselné značení se opírá o dělení nářečních oblastí v Českém jazykovém atlasu (Praha: Academia 1993, s. 43). Může nabývat hodnot: 1 (severovýchodočeská nářečí), 2 (středočeská nářečí), 3 (jihozápadočeská nářečí - západní část), 4 (jihozápadočeská nářečí - jižní část), 5 (českomoravská nářečí), 6 (středomoravská nářečí), 7 (východomoravská nářečí), 8 (slezská nářečí); 9 (nově osídlené pohraničí bez tradičního nářečí). V KSK jsou navíc přidány ještě značky pro tři vyčleněná velká města: 2v (Praha), 6v (Brno), 8v (Ostrava).
doc.vztah  Vztah pisatele a adresáta. Může nabývat hodnot: K (kamarádský), R (rodinný), M (milenecký, partnerský), Z (vztah pouhé známosti).
doc.adrpohl  Pohlaví adresáta. Může nabývat hodnot: F (žena), M (muž). V případě skupinového adresáta může být hodnota parametru vyplněna jako s (skupina).
doc.adrvek  Věk adresáta. Může nabývat hodnot: 1 (do 15 let), 2 (od 15 do 30 let), 3 (od 30 do 50 let), 4 (nad 50 let). V případě skupinového adresáta může být hodnota parametru vyplněna jako s (skupina).
doc.adrvzdel  Vzdělání adresáta. Může nabývat hodnot: B (pouze základní či středoškolské), A (vysokoškolské ukončené nebo probíhající v době vzniku dopisu). V případě skupinového adresáta může být hodnota parametru vyplněna jako s (skupina).
doc.rok  Rok napsání dopisu. Může nabývat hodnot: 1990 - 2004.
doc.forma  Forma dopisu. Může nabývat hodnot: R (rukopis), S (strojopis), P (výtisk textu psaného na počítači, ale zaslaného klasickou poštou).

Chybějící nebo nejasná hodnota je u každé charakteristiky vyjadřovaná značkou ?.

Statistické hodnoty doprovodných charakteristik v KSK

Pohlaví pisatele

F (žena)  1422 71,10 %
M (muž) 578 28,90 %

Věk pisatele

1 (do 15 let) 239 11,95 %
2 (od 15 do 30 let) 1419 70,95 %
3 (od 30 do 50 let) 148 7,40 %
4 (nad 50 let) 191 9,55 %
? (údaj není znám) 3 0,15 %

Vzdělání pisatele

B (pouze základní nebo středoškolské) 1431 71,55 %
A (vysokoškolské ukončené i probíhající) 556 27,80 %
? (údaj není znám) 13 0,65 %

Dlouhodobý pobyt pisatele

Vzhledem k velké šíři hodnot statisticky nezpracováno.

Teritoriální jazykové zázemí pisatele

1 (severovýchodočeská nářečí) 207 10,35 %
2 (středočeská nářečí) 120 6,00 %
3 (jihozápadočeská nářečí - západní část) 47 2,35 %
4 (jihozápadočeská nářečí - jižní část) 105 5,25 %
5 (českomoravská nářečí) 125 6,25 %
6 (středomoravská nářečí) 329 16,45 %
7 (východomoravská nářečí) 217 10,85 %
8 (slezská nářečí) 127 6,35 %
9 (nově osídlené pohraničí bez tradičního nářečí) 191 9,55 %
2v (Praha) 114 5,70 %
6v (Brno) 238 11,90 %
8v (Ostrava) 70 3,50 %
? (údaj není znám) 110 5,50 %

Vztah pisatele a adresáta

K (kamarádský) 1314 65, 70 %
R (rodinný) 382 19,10 %
M (milenecký, partnerský) 172 8,60 %
Z (vztah pouhé známosti) 131 6,55 %
? (údaj není znám) 1 0,05 %

Pohlaví adresáta

F (žena) 1580 79,00 %
M (muž) 301 15,50 %
s (skupina) 5 0,25 %
? (údaj není znám) 114 5,70 %

Věk adresáta

1 (do 15 let) 212 10,60 %
2 (od 15 do 30 let) 1523 76,15 %
3 (od 30 do 50 let) 75 3,75 %
4 (nad 50 let) 99 4,95 %
s (skupina) 5 0,25 %
? (údaj není znám) 86 4,30 %

Vzdělání adresáta

B (pouze základní či středoškolské) 1171 58,55 %
A (vysokoškolské ukončené i probíhající) 708 35,40 %
s (skupina) 5 0,25 %
? (údaj není znám) 116 5,80 %

Rok napsání dopisu

1990  16 0,80 %
1991 41 2,05 %
1992 47 2,35 %
1993 50 2,50 %
1994 64 3,20 %
1995 97 4,85 %
1996 137 6,85 %
1997 191 9,55 %
1998 261 13,50 %
1999 249 12,45 %
2000 252 12,6 %
2001 272 13,6 %
2002 246 12,30 %
2003 62 3,10 %
2004 2 0,10 %
? (údaj není znám) 13 0,65 %

Forma dopisu

R (rukopis) 1862 93,10 %
S (strojopis) 48 2,40 %
P (výtisk textu psaného na počítači, ale zaslaného klasickou poštou) 88 4,40 %
? (údaj není znám) 2 0,10 %