hledat:    
 

Popis BMK

Každá nahrávka (formální i neformální promluvy) vytváří samostatný očíslovaný dokument. Číslo dokumentu lze u každého konkordančního řádku zobrazit zvolením položky menu Zobrazení >Zdroje v korpusovém manažeru Bonito a vybráním značky doc.

V případě formálního rozhovoru nejsou zapisovány otázky tazatele, pokud zhruba odpovídaly dotazníku. Zasahoval-li však tazatel do mluvy respondenta poznámkami či podotázkami, je zapsán i jeho projev. Repliky tazatelů jsou označeny jednotně kódem T namísto čísla mluvčího.

Neformální rozhovor je přepsán vždy celý, nevynechává se pochopitelně ani žádný mluvčí. Pokud se v ojedinělých případech v nahrávce objeví kratičký zásah mluvčího, který se jinak dialogu neúčastní, např. zvolání dítěte, je taková replika uvedena kódem C.

Každý dokument (nahrávka) se skládá z jednotlivých promluv, které jsou označené značkou sp. Podobně jako u dokumentů lze také tuto značku zobrazit a zjistit tak sociolingvistický kód mluvčího. Každá promluva je v textu uzavřena mezi značkami <sp> a </sp>, které se vyskytují vždy při změně mluvčího. Jsou také použity ve formální promluvě jako oddělení odpovědí na jednotlivé otázky, kde sice ke změně mluvčího nedochází, výpověď však již byla přerušena tím, že tazatel položil mluvčímu další otázku.

Každý dokument je také interně opatřen podrobnější informací o mluvčích, roce nahrávání a případně relevantními informacemi o situaci promluvy. Tato informace se však prozatím z technických důvodů nezobrazuje.

Každá pozice v korpusu má kromě atributu word také atribut pron (pronunciation), jehož hodnota je fonetickým přepisem skutečné výslovnosti daného slova. Pokud je tato hodnota "-", což se týká velké většiny pozic v korpusu, znamená to, že se mluvčí reálnou výslovnosti neodchýlil od spisovné varianty.

Zásady přepisu

Tradiční interpunkce je nahrazena interpunkcí "pauzovou", tj. pauza je podle délky trvání označena pomocí jedné, dvou nebo tří teček. Hranice vět a souvětí není vyznačována velkými písmeny. V souladu s tradiční interpunkcí je však užíván otazník.

Písmena i-y jsou zapisována ve shodě s pravopisem: bylina, babička. Taktéž ě: mně-mě, pěnkava, mor. mět. Pouze střmor. tvary komparativu a superlativu, jejichž odvozovací základ je zakončen na retnici nebo dentálu, jsou z technických důvodů (vzhledem k obtížnosti zápisu dlouhého ě) zapisovány takto: hlópjéši, blbjéši, známňéši, hravjéši; hrďéši, vlasaťéši, hodňéši.

Délka vokálů je zapisována podle skutečné výslovnosti: např. mor. dat, brat, střmor. řikat, vubec. Polodlouhé vokály jsou označovány jako dlouhé nebo jako krátké podle toho, k čemu mají nejblíže. Emfáze není zaznamenávána. Protetické v- je zapisováno ve shodě s reálnou výslovností: vokno.

Částice -li je zapisována s mezerou a bez pomlčky: budu li. Jiné spojovníky, např. u složenin, se zapisují bez mezer.

Asimilace znělosti je zapisována v zásadě ve shodě s pravopisem, tedy ne foneticky. Speciálně jsou zaznamenávány - a to ve fonetickém zápisu jako atribut pron vedle zápisu reflektujícího pravopis - pouze takové realizace znělostní asimilace, které jsou v rozporu se spisovnou normou, tzn. vycházejí z normy některého ze substandardních jazykových útvarů nebo jsou součástí idiolektu mluvčího. Pozornost je věnována zejména nářeční asimilaci ve skupinách souhláska + jedinečná souhláska (r, l, m, n, ň, j,/v/). Stejně je zapisována i "moravská" výslovnost skupiny sh, přestože je považována za spisovnou výslovnostní variantu.
Příklad: Vyslovil-li mluvčí skouška, v korpusu je ve shodě s pravopisem zapsáno zkouška (protože výslovnost s počátečním s- je spisovná). Vysloví-li však zme, je v korpusu zapsáno ve shodě s pravopisem sme a jako hodnota atributu pron je připojen fonetický přepis reflektující skutečnou výslovnost [zme]; podobně vysloví-li gvúli, zapisuje se kvůli [gvúli], vysloví-li nazhledanou, zapisuje se na shledanou [nazhledanou] apod. Stejně je řešen i zápis mor. výslovnosti typu zešit: sešit [zešit].

Zdvojené souhlásky jsou zapisovány ve shodě s pravopisem. Pokud jsou skutečně vysloveny obě souhlásky, je na tuto skutečnost jako na odchylku od neutrální spisovné výslovnosti upozorněno opět připojením fonetického zápisu.

Ostatní artikulační asimilace a zjednodušování souhláskových skupin jsou zapisovány pokud možno co nejpřesněji (nehledě na pravopisný úzus) tak, jak byly vysloveny, a to přímo do textu, nikoliv do atributu pron: např. čtyři-štyři-štyry-čtyry, přijď-přiď, dcera-cera, hanba-hamba, tkanička-kanička, který-kerý, šestnáct-šesnáct-šesnác, vždycky-dycky, ženská-žencká, jablko-jabko, sedm-sedum-sedn, jdu-du, jsem-sem, pocem, pudu, takovýdle, vyjde-výde, tenhle-tendle-tenle, když-dyž, vždyť-dyť, vzpomenu-zpomenu, vzbudit-zbudit, vzteklý-zteklý, vlastně-vlasně, prázdnej-práznej, říc, rožčílit se, protože-protoe-prože-proe...

Cizí slova (včetně cizích proprií) jsou zapisována citátově (podle pravopisných pravidel výchozího jazyka) a následně je zpravidla připojen fonetický přepis skutečné realizované výslovnosti. V případě spisovných zdomácnělých slov cizího původu (spisovných přejatých slov) je užita kodifikovaná pravopisná podoba; fonetický zápis je připojen pouze v případě, že reálná výslovnost neodpovídala kodifikované spisovné výslovnosti. Kritériem spisovnosti je především SSJČ, SSČ a Akademický slovník cizích slov. Výslovnost nespisovných (slangových) zdomácnělých slov cizího původu bývá zachycena přímo v textu.

Přitakání: hm.

Odmítnutí: mm nebo ee.

Hezitační zvuk je zapisován znakem @.

Smích je zapisován jednotně chachacha.

Veškeré doplňující komentáře (např. ukazuje na dveře; následující 4 slova se smíchem apod.), které byly v původních přepisech, se prozatím z technických důvodů nezobrazují.

Nesrozumitelný úsek je zachycen sérií tří pomlček ---. Stejně jsou značeny vynechávky některých identifikujících informací, např. příjmení, telefonního čísla apod.

Simultánní úsek je zapisován | xxx |, přičemž znak | stojí vždy samostatně, nikdy není připojen ke slovu. Zápis simultánního hovoru tedy vypadá tak, že replika prvního mluvčího je přerušena v okamžiku, kdy končí její simultánní úsek, následuje zápis simultánní vložky druhého mluvčího a teprve potom pokračuje zápis hovoru prvního mluvčího.


Př.:
<sp> jo to číslo vlasně nám dali | posledně | </sp>
<sp> | no no to jak | </sp>
<sp> ale řikal ne abyste tam volali kvuli . dyž dojde papír </sp>