Doprovodné charakteristiky v KSK
Obsah:
Sociologické a nářeční značkování
Vyhledávání v KSK podle doprovodných charakteristik
Statistické hodnoty doprovodných charakteristik
v KSK
Sociologické a nářeční značkování
Každý korespondenční text uložený v KSK je opatřen značkami
zachycujícími
základní sociologické charakteristiky, konkrétně informace o pohlaví
(žena - muž), věku (4 věkové stupně) a vzdělání (2 stupně) pisatele i
adresáta.
V jmenovaných parametrech KSK v zásadě udržuje kompatibilitu s korpusy
PMK a BMK, které jsou rovněž součástí Českého národního korpusu.
Jako novum KSK uvádí teritoriální nářeční zázemí pisatelů (prostřednictvím
lokalizačních údajů a číselných značek zařazujících lokalitu do nářečních
oblastí podle Českého jazykového atlasu, viz níže).
U každého dokumentu je dále připojena charakteristika vztahu mezi pisatelem
a adresátem (4 možnosti) a údaje o roku napsání dopisu a jeho formě.
Vyhledávací program Bonito umožňuje zobrazení hodnot doprovodných charakteristik u všech slovních výskytů v korpusu (viz menu Zobrazení > Reference).
Vyhledávání v KSK podle doprovodných charakteristik
(Přehled značek užívaných v korpusovém manažeru Bonito)
| značka |
popis |
| doc.id |
Identifikační číslo dokumentu. Pořadové číslo dokumentu
v rámci souboru. Může nabývat hodnot: 1-2000. |
| doc.signatura |
Signatura dokumentu. Souhrn hlavních charakterizačních
údajů o dokumentu v pořadí: pohlaví pisatele, věk pisatele, vzdělání pisatele,
teritoriální zázemí pisatele, vztah mezi pisatelem a adresátem, pohlaví
adresáta, věk adresáta, vzdělání adresáta, rok napsání korespondenčního
textu. Signatura spojuje údaje týkající se většiny následujících samostatných
doprovodných charakteristik. |
| doc.archiv |
Archivační číslo dokumentu. Číslo odkazující k archivnímu
uložení originálu dokumentu v ÚČJ FF MU v Brně. (Pro běžného uživatele
KSK je tento údaj irelevantní.) |
| doc.pispohl |
Pohlaví pisatele. Pohlaví autora korespondenčního
textu. Může nabývat hodnot: F (žena), M (muž). |
| doc.pisvek |
Věk pisatele. Věk autora korespondenčního textu.
Může nabývat hodnot: 1 (do 15 let), 2 (od 15 do 30 let),
3 (od 30 do 50 let), 4 (nad 50 let). |
| doc.pisvzdel |
Vzdělání pisatele. Dosažené vzdělání autora korespondenčního
textu. Může nabývat hodnot: B (pouze základní nebo středoškolské),
A (vysokoškolské ukončené nebo probíhající v době vzniku dopisu). |
| doc.pispobyt |
Dlouhodobý pobyt pisatele. Místo, které během pisatelova
života nejvíce ovlivnilo jeho idiolekt. Může nabývat mnoha hodnot. Způsob
označení i míra přesnosti (např. Jihlava; u Prahy; Plzeňsko;
Vysočina) reflektují podobu uvedenou dárcem dopisu. Pokud je připojen
další údaj v závorce, jde pouze o sekundární informaci o místě pisatelova
studia, případně o jeho delším zahraničním pobytu v době vzniku dopisu:
např. Jihlava (Brno); Jihlava (USA). |
| doc.pister |
Teritoriální jazykové zázemí pisatele = místo pisatelova
dlouhodobého pobytu (které nejvíce ovlivnilo jeho idiolekt) převedené do
číselného kódu. Číselné značení se opírá o dělení
nářečních oblastí v Českém jazykovém atlasu (Praha: Academia
1993, s. 43). Může nabývat hodnot: 1 (severovýchodočeská nářečí),
2 (středočeská nářečí), 3 (jihozápadočeská nářečí - západní
část), 4 (jihozápadočeská nářečí - jižní část), 5 (českomoravská
nářečí), 6 (středomoravská nářečí), 7 (východomoravská nářečí),
8 (slezská nářečí); 9 (nově osídlené pohraničí bez tradičního
nářečí). V KSK jsou navíc přidány ještě značky pro tři vyčleněná velká
města: 2v (Praha), 6v (Brno), 8v (Ostrava). |
| doc.vztah |
Vztah pisatele a adresáta. Může nabývat hodnot: K
(kamarádský), R (rodinný), M (milenecký, partnerský),
Z (vztah pouhé známosti). |
| doc.adrpohl |
Pohlaví adresáta. Může nabývat hodnot: F (žena),
M (muž). V případě skupinového adresáta může být hodnota parametru
vyplněna jako s (skupina). |
| doc.adrvek |
Věk adresáta. Může nabývat hodnot: 1 (do 15
let), 2 (od 15 do 30 let), 3 (od 30 do 50 let), 4 (nad
50 let). V případě skupinového adresáta může být hodnota parametru vyplněna
jako s (skupina). |
| doc.adrvzdel |
Vzdělání adresáta. Může nabývat hodnot: B (pouze
základní či středoškolské), A (vysokoškolské ukončené nebo probíhající
v době vzniku dopisu). V případě skupinového adresáta může být hodnota
parametru vyplněna jako s (skupina). |
| doc.rok |
Rok napsání dopisu. Může nabývat hodnot: 1990
- 2004. |
| doc.forma |
Forma dopisu. Může nabývat hodnot: R (rukopis),
S (strojopis), P (výtisk textu psaného na počítači, ale zaslaného
klasickou poštou). |
Chybějící nebo nejasná hodnota je u každé charakteristiky vyjadřovaná
značkou ?.
Statistické hodnoty doprovodných charakteristik
v KSK
Pohlaví pisatele
| F (žena) |
1422 |
71,10 % |
| M (muž) |
578 |
28,90 % |
Věk pisatele
| 1 (do 15 let) |
239 |
11,95 % |
| 2 (od 15 do 30 let) |
1419 |
70,95 % |
| 3 (od 30 do 50 let) |
148 |
7,40 % |
| 4 (nad 50 let) |
191 |
9,55 % |
| ? (údaj není znám) |
3 |
0,15 % |
Vzdělání pisatele
| B (pouze základní nebo středoškolské) |
1431 |
71,55 % |
| A (vysokoškolské ukončené i probíhající) |
556 |
27,80 % |
| ? (údaj není znám) |
13 |
0,65 % |
Dlouhodobý pobyt pisatele
Vzhledem k velké šíři hodnot statisticky nezpracováno.
Teritoriální jazykové zázemí pisatele
| 1 (severovýchodočeská nářečí) |
207 |
10,35 % |
| 2 (středočeská nářečí) |
120 |
6,00 % |
| 3 (jihozápadočeská nářečí - západní část) |
47 |
2,35 % |
| 4 (jihozápadočeská nářečí - jižní část) |
105 |
5,25 % |
| 5 (českomoravská nářečí) |
125 |
6,25 % |
| 6 (středomoravská nářečí) |
329 |
16,45 % |
| 7 (východomoravská nářečí) |
217 |
10,85 % |
| 8 (slezská nářečí) |
127 |
6,35 % |
| 9 (nově osídlené pohraničí bez tradičního nářečí) |
191 |
9,55 % |
| 2v (Praha) |
114 |
5,70 % |
| 6v (Brno) |
238 |
11,90 % |
| 8v (Ostrava) |
70 |
3,50 % |
| ? (údaj není znám) |
110 |
5,50 %
|
Vztah pisatele a adresáta
| K (kamarádský) |
1314 |
65, 70 % |
| R (rodinný) |
382 |
19,10 % |
| M (milenecký, partnerský) |
172 |
8,60 % |
| Z (vztah pouhé známosti) |
131 |
6,55 % |
| ? (údaj není znám) |
1 |
0,05 %
|
Pohlaví adresáta
| F (žena) |
1580 |
79,00 % |
| M (muž) |
301 |
15,50 % |
| s (skupina) |
5 |
0,25 % |
| ? (údaj není znám) |
114 |
5,70 %
|
Věk adresáta
| 1 (do 15 let) |
212 |
10,60 % |
| 2 (od 15 do 30 let) |
1523 |
76,15 % |
| 3 (od 30 do 50 let) |
75 |
3,75 % |
| 4 (nad 50 let) |
99 |
4,95 % |
| s (skupina) |
5 |
0,25 % |
| ? (údaj není znám) |
86 |
4,30 %
|
Vzdělání adresáta
| B (pouze základní či středoškolské) |
1171 |
58,55 % |
| A (vysokoškolské ukončené i probíhající) |
708 |
35,40 % |
| s (skupina) |
5 |
0,25 % |
| ? (údaj není znám) |
116 |
5,80 %
|
Rok napsání dopisu
| 1990 |
16 |
0,80 % |
| 1991 |
41 |
2,05 % |
| 1992 |
47 |
2,35 % |
| 1993 |
50 |
2,50 % |
| 1994 |
64 |
3,20 % |
| 1995 |
97 |
4,85 % |
| 1996 |
137 |
6,85 % |
| 1997 |
191 |
9,55 % |
| 1998 |
261 |
13,50 % |
| 1999 |
249 |
12,45 % |
| 2000 |
252 |
12,6 % |
| 2001 |
272 |
13,6 % |
| 2002 |
246 |
12,30 % |
| 2003 |
62 |
3,10 % |
| 2004 |
2 |
0,10 % |
| ? (údaj není znám) |
13 |
0,65 %
|
Forma dopisu
| R (rukopis) |
1862 |
93,10 % |
| S (strojopis) |
48 |
2,40 % |
| P (výtisk textu psaného na počítači, ale zaslaného
klasickou poštou) |
88 |
4,40 % |
| ? (údaj není znám) |
2 |
0,10 %
|