Menu Konkordance
Souhrn
V dolní části programu zobrazí souhrnné informace o konkordanci: jméno korpusu, velikost konkordance a seznam jednotlivých operací (počínaje dotazem), které vedly k vytvoření konkordance. Tyto údaje se zobrazují vždy po zadání dotazu, ale zmizí, pokud rozšíříme kontext dvojitím kliknutím na konkordanční řádek. Pomocí této položky můžeme souhrnné informace opět vyvolat.
Uložení
klávesová zkratka: F2Uložení všech nebo jen některých konkordančních řádků na disk počítače. Podrobný popis uložení konkordančních řádků najdete ve kapitole Uložení řádků.
Kódování
Umožňuje zvolit kódování češtiny uložených řádků. Na výběr jsou tyto
možnosti:
| cp1250 | kódování češtiny pro operační systém Windows |
| iso8859-2 | kódování ISO-Latin 2 |
| kam | kódování češtiny bratrů Kamenických
(pro některé aplikace operačního systému MS DOS) |
| macCentEuro | kódování pro počítače Macintosh |
| utf-8 | kódování unicode |
| ascii | uloží text bez diakritiky |
Hlavička
Před vlastní konkordanční řádky je přidán krátký informační text, který
obsahuje údaje o dotazu a počtu výskytů. Je možné zvolit podrobnější variantu
(volba úplná) nebo zjednodušenou
(volba jednoduchá). Případně
lze konkordanční seznam uložit bez úvodních informací (volba žádná).
Zobrazené řádky
Uloží pouze řádky, které jsou zobrazené v okně manažeru.
Všechny řádky
Uloží všechny řádky, tedy i ty, které nejsou právě zobrazené v okně
manažeru.
Číslovat řádky
Před každým řádkem konkordančního seznamu uvede pořadové číslo.
Zarovnat KWIC
Uloží konkordanční řádky tak, že hledané slovo bude zarovnané do sloupce
uprostřed.
Tlačítkem Kontext je možné před uložením změnit kontext hledaného výrazu. Kontext je implicitně shodný s kontextem pro zobrazování (viz menu Zobrazení > Kontext).
Po stisku tlačítka Uložit zadáme nebo vybereme jméno souboru, do kterého se má konkordanční seznam uložit.
Tisk
Vytiskne na tiskárně všechny nebo jen vybrané konkordanční řádky.
Kódování
Umožňuje zvolit kódování češtiny tisknutých řádků. Na výběr jsou tyto možnosti:
| cp1250 | kódování češtiny pro operační systém Windows |
| iso8859-2 | kódování ISO-Latin 2 |
| kam | kódování češtiny bratrů Kamenických
(pro některé aplikace operačního systému MS DOS) |
| macCentEuro | kódování pro počítače Macintosh |
| utf-8 | kódování unicode |
| ascii | vytiskne text bez diakritiky |
Hlavička
Před vlastní konkordanční řádky je přidán krátký informační text, který
obsahuje údaje o dotazu a počtu výskytů. Je možné zvolit podrobnější
variantu
(volba full) nebo zjednodušenou
(volba simple). Případně
lze konkordanční seznam vytisknout bez úvodních informací (volba none).
Zobrazené řádky
Vytiskne pouze řádky, které jsou zobrazené v okně manažeru.
Všechny řádky
Vytiskne všechny řádky, tedy i ty, které nejsou právě zobrazené v okně
manažeru. Před tiskem uvažte, kolik vydrží vaše tiskárna.
Číslovat řádky
Před každým řádkem konkordančního seznamu uvede pořadové číslo.
Zarovnat KWIC
Uloží konkordanční řádky tak, že hledané slovo bude zarovnané do
sloupce uprostřed.
Tlačítkem Kontext je možné před uložením změnit kontext hledaného výrazu. Kontext je implicitně shodný s kontextem pro zobrazování (viz menu Zobrazení > Kontext).
Po stisku tlačítka Vytisknout vytiskne Bonito konkordanční seznam na tiskárně připojené k počítači.
Smazání vybraných
Smaže vybrané řádky konkordančního seznamu (viz menu Výběr). Řádek je možné vybrat tak, že na něj klikneme myší. Vybrané řádky jsou označené modře.
Smazání vybraných řádků potvrdíme stisknutím tlačítka OK.
Redukce
Redukce počtu řádků konkordančního seznamu. Při velkém množství výskytů hledaného výrazu je takřka nemožné prohlédnout všechny konkordanční řádky. Proto je možné počet řádků omezit. Nejprve vybereme, které řádky mají být zachovány. Z nabídky vybereme jednu z následujících možností:
- Prvních - zůstanou zachovány řádky ze začátku seznamu,
- Prostředních - zůstanou zachovány řádky uprostřed seznamu,
- Posledních - zůstanou zachovány řádky z konce seznamu,
- Náhodných - zůstanou zachovány řádky, které program vybere náhodně z celého seznamu.
Do vstupního pole napíšeme číslo, které bude vyjadřovat, kolik řádků má být zachováno. V následující nabídce upřesníme, zda číslo, které jsme zadali, vyjadřuje absolutní nebo relativní počet řádků. Z nabídky vybereme ze tří možností: řádků, procent, 1/100 procent.
Problému určení spolehlivosti měření metodou náhodných vzorků se věnuje speciální kapitola.
Jednoduché třídění
Klávesová zkratka: Ctrl-OUmožňuje setřídit konkordanční seznam podle kritérií, které se zadavájí v následujících volbách:
Počet tříděných pozic
Číslo, které zadáme do tohoto vstupního pole, vyjadřuje počet pozic
(slov, lemmat, značek), podle kterých se bude seznam třídit. Například
hodnota 1 znamená, že se seznam setřídí podle prvního slova (resp.
lemmatu, značky) vpravo (resp. vlevo) od vyhledaného výrazu a podle následujících
pozic se třídit už nebude.
Třídící klíč
Udává, které pozice z konkordančního
řádku se budou při třídění porovnávat.
V následujícím schematu
předpokládáme, že položka Počet tříděných pozic
má hodnotu 3. Číslo 1 znamená nejvýznamnější pozici (bude
se podle ní třídit nejdříve), číslo 3 nejméně významnou pozici (bude
se podle ní třídit až nakonec).
...... < KWIC > ......
levý kontext
3 2 1 < >
KWIC odleva
<1 2 3 >
KWIC odprava
<3 2 1 >
pravý kontext
< > 1 2 3
levý kontext - seznam se bude třídit podle slov pozice vlevo
od hledaného výrazu.
KWIC odleva, KWIC odprava - setřídí
hledané výrazy (červeně
označený sloupec) odleva, resp. odprava. Tato volba nemá
smysl při třídění,
kdy hledaným výrazem je jeden konkrétní
slovní tvar. Zadávání hodnot
vyšších
než 1 u položky Počet tříděných pozic má smysl jen tehdy, je-li
hledaným výrazem skupina slov.
pravý kontext - seznam se bude třídit podle slov pozice vpravo
od hledaného výrazu.
Ignorovat velikost
Pokud je položka zatržená nebude při třídění záležet na velikosti písmen.
Retrográdně
Jednotlivá slova se budou třídit od posledního písmene k prvnímu.
Atribut
Zde můžeme zvolit, podle kterého pozičního atributu se má třídění provádět.
K dispozici jsou tyto volby:
word - třídit se bude podle konkrétních slovních tvarů,
lemma - třídit se bude podle lemmat příslušných slovních tvarů,
tag - třídit se bude podle morfologické značky přiřazené ke
tříděným slovům.
Obecné třídění
Setřídí konkordanční seznam podle zadaných třídicích intervalů. Každý třídicí interval určuje jednu podmínku, podle které se budou jednotlivé řádky porovnávat. Po aktivování jsou připravena vstupní pole pro zadání jedné takové podmínky. Další intervaly se zadávají pomocí tlačíkta Přidat.
Vynechat duplicity
Pokud je zatrženo, ze všech řádků, které se shodují v zadaných třídicích
intervalech, se ve výsledku ponechá pouze jeden; redukuje se tak počet
konkordančních řádků. Tuto volbu nemá smysl aktivovat, když je hledaným
výrazem pouze jeden určitý slovní tvar - v konkordančním seznamu by pak
zbyl pouze jeden řádek. Poznámka: pokud zadáte atribut lemma, zůstane
po setřídění v konkordančním seznamu pouze jeden řádek od každého lemmatu.
Přidat
Přidá další interval pro třídění.
Smazat
Smaže vybraný interval. Výběr se provádí kliknutím myší.
OK
Stisknutím tohoto tlačítka se spustí třídění konkordančního seznamu
podle zadaných kritérií.
Zavřít
Zavře okno bez jakéhokoli třídění.
Každý třídicí interval obsahuje položky:
Druh tříděného atributu
Z nabídky můžeme vybrat jeden ze tří atributů, podle kterého se bude
třídit:
word - konkordanční seznam se bude třídit podle slovních tvarů,
lemma - konkordanční seznam se bude třídit podle lemmat přiřazených
ke slovním tvarům,
tag - konkordanční seznam se bude třídit podle morfologických
značek přiřazených ke slovním tvarům.
AaAa
Pokud je volba zaškrtnutá, nebude při třídění rozhodovat velikost písmen.
udazdO (Odzadu)
Pokud je volba zaškrtnutá, bude se konkordanční seznam třídit retrográdně,
tj. od posledního písmene slova.
Třídit pozici
Hodnoty čísla v tomto vstupním poli vyjadřují velikost intervalu, který
se bude třídit. Záporné hodnoty zastupují pozice vlevo od hledaného výrazu,
kladná čísla zastupují pravý kontext. Nula vyjadřuje hledaný výraz, pokud
jím je jedno slovo. Zde je příklad:
-4 -3 -2 -1
0 1 2 3
4
němž byl zlatem vyšitý lev judský
po stranách s
od
Tato položka je důležitá, pokud hledaný výraz, který chceme setřídit,
obsahuje více než jedno slovo.
Při zvolení <KWIC bude zadání hodnoty 0 v položce
Třídit
pozici znamenat setřídění konkordančního seznamu podle prvního slova
v hledaném sousloví. Po zadání hodnoty 1 se seznam setřídí podle
druhého slova atd. Při zadání záporných hodnot se seznam setřídí podle
pozic nalevo od vyhledaného výrazu tak, jak je uvedeno výše.
Při zvolení KWIC> bude zadání hodnoty 0 v položce Třídit
pozici znamenat setřídění konkordančního seznamu podle posledního slova
v hledaném sousloví. Po zadání hodnoty -1 se seznam setřídí podle
předposledního slova sousloví atd. Kladná čísla hodnot umožňují třídění
kontextu vpravo za hledaným výrazem.
Třídění podle skupin
Setřídí konkordanční seznam podle čísel, kterými uživatel označil jednotlivé konkordanční řádky. Řádka se označí stisknutím klávesy s požadovaným číslem. Toto číslo se zobrazí vedle vyhledaného výrazu v kulatých závorkách zvýrazněné modře.
Třídění podle skupin nefunguje, pokud je nastaven náhodný výběr konkordančních řádek pomocí menu Zobrazení > Rozsah nebo Konkordance > Redukce.
Statistiky
Tato položka zpřístupňuje statistické funkce programu Bonito: výpočet frekvenční distribuce, výpočet nejčastějších kolokací a grafické zobrazení rozložení výskytů hledaného výrazu v korpusu.
Frekvenční distribuce
Klávesová zkratka: Ctrl-FSpočítá četnosti slov nebo jiných atributů nebo jejich posloupností v zadaných intervalech. Zadávání intervalů je obdobné jako při Obecném třídění.
Limit
Do výsledku se budou počítat a tedy i zobrazovat pouze posloupnosti
s četností vyšší než je zadaný limit. Implicitní limit 0 znamená,
že se budou počítat všechny hodnoty. Pro konkordanční seznam s velkým počtem
řádků to může znamenat velké množství zpracovávaných dat a tím i dlouhý
výpočet.
Pokud se má zobrazit více řádků
(konkrétní číslo závisí na
výkonu počítače,
běžně více než 500), může jejich zobrazení trvat
příliš dlouho.
Každý interval obsahuje volby:
Atribut:
Z nabídky vybereme jeden ze tří atributů (word,
lemma,
tag)
Ignorovat velikost
Při zatržení této položky nebude při vytváření frekvenčního seznamu
brán zřetel na velikost písmen.
Pozice
Do vstupního pole zapíšeme číselnou hodnotu vyjadřující pozici, pro
kterou chceme vytvořit frekvenční seznam. Pro zadávání hodnot platí stejné
podmínky jako u položky Obecené třídění, tj. záleží na nastavení
položky od : Pro víceslovný hledaný výraz znamená nastavení
<KWIC
a hodnoty 0 vytvoření frekvenčního seznamu podle prvního slova vyhledaného
sousloví, hodnota 1 znamená druhé slovo,
-1 první slovo v
levém kontextu před hledaným výrazem atd.
Při nastavení KWIC> znamená hodnota 0 vytvoření frekvenčního
seznamu podle posledního slova, -1 podle předposledního slova, 1
podle prvního slova v levém kontextu za vyhledaným výrazem.
Pokud vyhledaný výraz obsahuje jednu pozice platí, že záporné hodnoty
zastupují pozice vlevo od hledaného výrazu, kladná čísla zastupují pravý
kontext. Nula vyjadřuje hledaný výraz. Zde je příklad:
-4 -3 -2 -1
0 1 2 3
4
němž byl zlatem vyšitý lev judský
po stranách s
Přidat
Slouží k přídání dalšího třídícího intervalu.
Smazat
Smaže třídící interval
Zavřít
Zavře okno pro frekvenční distribuci.
Po stisku tlačítka OK se provede výpočet a zobrazí se okno s
výsledky.
Popis okna s výsledky výpočtu frekvenční distribuce:
Limit:
Do tohoto vstupního pole je možné - stejně jako při zadávání výpočtu
- zadat číslo, které vyjadřuje minimální četnost vyhledaného výrazu. Zobrazí
se tedy jen ty řádky, které mají spočítanou četnost menší nebo rovnu zadanému
limitu. Počet zobrazených řádků se vždy spočítá a ukáže vedle.
Pro každý zadaný interval je možné vybrat ze tří možností:
zobrazit
Posloupnosti slov daného intervalu se budou normálně zobrazovat.
součet
Posloupnosti slov daného intervalu se budou zobrazovat a navíc se pro
ně bude počítat mezisoučet. Pro poslední interval jsou volby
zobrazit
a součet totožné, protože se pro něj součet počítá vždy.
schovat
Daný interval se v přehledu vůbec nebude počítat a zobrazovat.
Po libovolné změně limitu nebo zobrazovacích podmínek se provede nové zobrazení výsledku.
Kolokace
Vypočítá nejčetnější kolokace v zadaném kontextu podle následujících parametrů:
Atribut
Jméno atributu (z výběru pozičních atributů korpusu).
V rozsahu od, do
Počáteční resp. konečná pozice kontextu. Kladné hodnoty se počítají
doprava od konce KWIC, záporné se počítají od začátku KWIC doleva.
Minimální četnost v korpusu
Statistiky se budou počítat pouze pro slova s celkovou četností v korpusu
vyšší než je zadaná četnost.
Minimální četnost v daném rozsahu
Statistiky se budou počítat pouze pro slova s četností v zadaném kontextu
vyšší než je zadaná četnost.
Maximální počet zobrazených řádků
Pokud je ve výsledku více řádků, zobrazí se pouze zadaný počet nejčetnějších.
Setřídit podle četnosti
Udává třídění, podle kterého se
zobrazí výsledné řádky. Je důležité
pouze pro výběr nejčetnějších řádků (viz
předchozí parametr), zobrazené
řádky lze potom třídit podle kterékoliv
statistiky.
Třídění podle absolutní četnosti je blízké T-score, třídění podle relativní četnosti je shodné s MI-score.
Výsledek je zobrazen ve formě tabulky, kterou lze uložit do souboru pomocí tlačítka Uložit. Tabulku je možné setřídit podle libovolného sloupce kliknutím pravým tlačítkem myši na nadpis požadovaného sloupce. Šířku jednotlivých sloupců lze upravit tažením nadpisu sloupce levým tlačítkem myši.
Hodnoty v jednotlivých sloupcích mají následující význam:
1. sloupec
je nadepsaný jménem počítaného atributu (např. word). Obsahuje hodnoty
daného atributu (např. slova), pro které se statistiky počítaly.
MI-score
MI-score (vzájemná informace) slova a konkordance,
T-score
T-score slova a konkordance,
Rel. f
relativní četnost slova (kolik procent ze všech výskytů slova v korpusu
je ve zvoleném kontextu),
Abs. f
absolutní četnost slova (kolikrát se slovo objevilo v zadaném kontextu).
Rozložení
Zobrazí okno, ve kterém je graficky znázorněné rozložení jednotlivých řádků výsledku v rámci celého korpusu. Na ose x jsou jednotlivé pozice korpusu, na ose y je počet výskytů v daném místě korpusu.
Pokud jsou řádky konkordančního seznamu v celém korpusu rovnoměrně rozloženy, jsou jednotlivé čáry v grafu stejně dlouhé a jsou zobrazeny rovnoměrně po celé délce okna. Pokud je naopak většina řádků pouze z jednoho "místa" korpusu (například z jednoho dokumentu), je v části okna výrazně více delších čar. Míru rovnoměrnosti rozložení hledaného výrazu v korpuse vyjadřuje redukovaná četnost.
Skupiny
Spočítá frekvence skupin, které před tím uživatel označil čísly 1-9 (řádky se označují stisknutím klávesy s číslicí 1-9). Po aktivaci tohoto menu se objeví okno, ve kterém jsou dva sloupce. V prvním sloupci (Skupina) jsou čísla skupin (1-9). V druhém sloupci (Četnost) jsou pak uvedené frekvence jednotlivých skupin. Implicitně je seznam seřazen podle čísel skupin (od nejnižšího čísla k nejvyššímu). Pokud chceme seznam setřídit podle frekvence, klikneme na záhlaví sloupce Četnost. Seznam se setřídí podle fekvence tak, že na prvním místě bude skupina s nejnižší frekvencí a na konci skupina s nejvyšší frekvencí. Klikneme-li znovu na tento sloupec, seznam se setřídí sestupně (od nejvyšší k nejnižší frekvenci). Podobně setřídíme i sloupec Skupina.
Pomocí tlačítka Smazat označené skupiny je možné vymazat z konkordančního seznamu řádky zařazené do libovolné skupiny. Klikneme na číslo skupiny v seznamu (řádek se označí), stiskneme toto tlačítko a konkordanční řádky označené zvoleným číslem zmizí z konkordančního seznamu.
Seznam četnosti skupin zavřeme pomocí tlačítka Zavřít nebo křížkem v pravém horním rohu okna.
Prohození KWIC a kolokace
Zamění ve vyhledaných konkordančních řádcích vyhledané slovo (KWIC) a jeho kolokaci, která byla dodatečně vyhledána a je také označena červeně.
Zpět k předchozí
Klávesová zkratka: Ctrl-ZUmožňuje se vrátit k předchozímu konkordančnímu seznamu bez nutnosti znovu zadat a vyhodnotit dotaz
Vpřed k následující
Klávesová zkratka: Ctrl-XUmožňuje přejít od dříve vyhledaného konkordančního seznamu k novějšímu bez nutnosti znova zadat a vyhodnotit dotaz.
Pojmenovat
Pojmenuje zobrazenou konkordanci. Po zvolení této položky napíšeme do vstupního pole Jméno konkordance název, kterým chceme pojmenovat aktuální konkordanční seznam. Zvolené jméno potvrdíme stisknutím tlačítka OK nebo klávesou Enter. Takto pojmenované konkordance jsou pak přímo dostupné v Konkordance>Pojmenované.
Pokud potřebujeme pracovat opakovaně s výsledkem jediného dotazu, pojmenujeme si výslednou konkordanci a můžeme se k ní kdykoliv rychle vrátit, aniž by se musel znovu vyhodnocovat dotaz.
Smazání pojmenovaných
Slouží k zrušení vybraných pojmenovaných konkordancí. Zobrazí se seznam všech pojmenovaných konkordancí. Výběrem ze seznamu a stisknutím tlačítka OK se zvolená konkordance vymaže ze seznamu pojmenovaných konkordancí.