hledat:    
 

Naše publikace

Statistiky češtiny (2009)
Slovník Bohumila Hrabala (2009)
Valence českých substantiv (2009)
Regulace jazyka a Koncept minimální intervence (2008)
Čestina v mluveném korpusu (2008)
Morfologie mluvené češtiny: Frekvenční analýza (2008)
Slovník Karla Čapka (2007)
Frekvenční slovník mluvené češtiny (2007)
Vidová morfologie českého slovesa (2007)
Korpusová lingvistika: Stav a modelové přístupy (2006)
Kolokace (2006)
Víceslovné předložky v současné češtině (2006)
Valence českých adjektiv (2006)
Jak využívat Český národní korpus (2005)
Jazyky a jazykověda. Sborník k 65. narozeninám prof. Františka Čermáka (2005)
Frekvenční slovník češtiny (2004)
... publikace z let 1999-2001


Statistiky češtiny

Tomáš Bartoň, Václav Cvrček, František Čermák, Tomáš Jelínek, Vladimír Petkevič

Příručka umožňuje uživateli udělat si ucelenou představu o frekventovaném jádru fonologických, morfologických a syntagmatických jevů v češtině na jedné straně a perifériích jazykového systému na straně druhé, což je informace, kterou klasické gramatické příručky podávají zřídka, nebo ji – ve většině případů – úplně opomíjejí. Doplňuje se tak popis systému češtiny o důležitý aspekt frekvenční, který nám jednoznačně ukazuje, že často je věnována intenzivní pozornost jevům marginálním, zatímco rozsáhlé neprobádané oblasti jevů frekventovaných (např. problematika kombinatoriky slovních druhů) zůstávají nepovšimnuty.

Bartoň, T. a kol.: Statistiky češtiny. Nakladatelství Lidové noviny, Praha 2009.
ISBN 978-80-7106-5944
Statistiky češtiny - obálka

Slovník Bohumila Hrabala

František Čermák, Václav Cvrček (eds.)

Slovník Bohumila Hrabala je pokusem o komplexní popis jazyka výjimečného slovesného tvůrce druhé poloviny 20. století. Z různých pohledů se tu zkoumá Hrabalův lexikon, specifičnosti jeho morfologie i frazeologie, stejně jako statistické aspekty jeho tvorby. Vedle úplného slovníku Hrabalových lexémů zde čtenář najde i soubor Hrabalových myšlenek a originálních výroků. K publikaci je připojeno CD, které obsahuje kompletní korpus Hrabalových děl spolu s obslužným programem, seznamy hrabalovských kolokací a frekvenční slovník.

Čermák, F. - Cvrček, V..: Slovník Bohumila Hrabala. Nakladatelství Lidové noviny, Praha 2009.
ISBN 978-80-7106-488-6

Slovník Bohumila Hrabala - obálka

Valence českých substantiv

Anna Čermáková

Valence substantiv se v knize pojímá jako jev lexikologický pro substantiva svébytný, a nikoli (nutně) odvozený od sloves, mající ve svém úhrnu povahu odlišnou a výrazně sémantickou, což naznačuje i řada uváděných subklasifikací. Pojetí valence a zvláště jejích formálních exponentů se přitom soustřeďuje na všechny formální a kategoriální rysy, které ji v korpusu vyjadřují, bez apriorní (a zpravidla omezující) teorie.

Čermáková, A.: Valence českých substantiv. Nakladatelství Lidové noviny, Praha 2009.
ISBN 978-80-7106-426-800

Valence českých
substantiv

Regulace jazyka a Koncept minimální intervence

Václav Cvrček

Tento svazek představuje první pokus, jak na základě korpusových metod vystavět plán jazykově regulační činnosti založené na minimální intervenci do jazyka a řečové činnosti – Koncept minimální intervence (KMI). Přijatým předpokladem tohoto konceptu je fakt, že jazyk se samovolně vyvíjí v účelný nástroj dorozumívání bez pomoci ze strany lingvistů, a není proto důvod, proč by jazykověda měla do vývoje jazyka svými preskriptivními intervencemi zasahovat. V polemice s předcházejícími koncepty jazykově regulační činnosti (Teorie jazykové kultury, puristický koncept apod.) vychází KMI striktně z informací, které nám o jazykových prostředcích může poskytnout korpus, mezi něž nepatří kritéria hodnocení na ose spisovný – nespisovný (nebo správný – nesprávný). Zároveň tato publikace přináší obecnější Teorii intervencí, která slouží jako zastřešující teoretický model nad jednotlivými koncepty jazykově regulační činnosti, a korpusové sondy měřící míru preskriptivismu v českém prostředí a dopad kodifikačních intervencí na jazyk.

Cvrček, V.: Regulace jazyka a Koncept minimální intervence. Nakladatelství Lidové noviny, Praha 2008.
ISBN 978-80-7106-600-2

Regulaca jazyka a Koncept
minimální intervence

Čestina v mluveném korpusu

Marie Kopřivová - Martina Waclawičová (eds.)

Svazek přináší soubor příspěvků z mezinárodní a interdisciplinární konference Čeština v mluveném korpusu konané v roce 2007 na Filozofické fakultě Univerzity Karlovy v Praze. Texty se shodně věnují velmi aktuální a dříve opomíjené mluvené formě jazyka z hlediska řady aspektů. Představují ji tak, jak je zachycena v různých autentických mluvených korpusech, a podrobují ji zkoumání korpusovými metodami. Témata knihy, první svého druhu, zahrnují široké pole od problematiky budování mluvených korpusů přes zkoumání obecných rysů mluvenosti a variantnosti v mluveném jazyce až po různé aspekty gramatického popisu mluveného jazyka.

Kopřivová, M. -  Waclawičová (eds.):  Čeština v mluveném korpusu. Nakladatelství Lidové noviny, Praha 2008.
ISBN 978-80-7106-982-9

Čeština v mluveném korpusu

Morfologie mluvené češtiny: Frekvenční analýza

Jitka Šonková

Tento svazek podává první soustavnou charakteristiku skloňování a časování v mluvené češtině. Studie vychází z kvantitativní analýzy Pražského mluveného korpusu, tvořeného přepisy více než 304 nahrávek z Prahy a okolí, a zaměřuje se především na konkurenci spisovných a nespisovných tvarů v běžné komunikaci českých mluvčích.

Šonková, J.: Morfologie mluvené češtiny: Frekvenční analýza. Nakladatelství Lidové noviny, Praha 2008.
ISBN 978-80-7106-956-0

Morfologie mluvené češtiny

Slovník Karla Čapka

František Čermák (ed.)

Tímto svazkem se začíná nová řada v sérii korpusových publikací o jazyku nazvaná Korpusová lexikografie. Představí postupně řadu slovníků určitého důležitého období či autorských slovníků významných jednotlivců národní kultury, které zpravila není třeba představovat a kteří se významně podepsali na podobě své doby i jejího jazyka. Prvním v této řadě je Slovník Karla Čapka, jednoho z nejvýznamnějších českých spisovatelů a myslitelů vůbec.

Slovník Karla Čapka mapuje Čapkův jazyk v řadě parametrů a způsobem, jakým dřívější a většinou ručně sestavované slovníky slavných autorů (od antiky přes Shakespeara až po Otokara Březinu) postupovat nemohly. Vedle vlastního slovníku tu zájemce najde nejenom několik odborných studií, ale také soubor Čapkových myšlenek k jeho době. Kniha je doprovázena CD s korpusem celého Čapkova díla v počítačové podobě, díky němuž se uživateli nabízí široká možnost vlastního studia celého materiálu, na kterém je slovník založen.

S omluvou uveřejňujeme seznam chyb nalezených po vydání slovníku.

Čermák, F. (ed.):  Slovník Karla Čapka. Nakladatelství Lidové noviny, Praha 2007
ISBN 978-80-7106-915-7

Slovník Karla Čapka - obálka

Frekvenční slovník mluvené češtiny

František Čermák (ed.)

Frekvenční slovník mluvené češtiny je vůbec první slovník svého druhu, představující autentickou mluvenou češtinu, která tu stojí v protikladu k češtině spisovné a psané. Ukazuje, jak lidé skutečně mluví, tj. bez kodifikačních zásahů a deformací. Slovník vychází z Pražského mluveného korpusu, založeného na sociolingvisticky reprezentativních nahrávkách rozhovorů.  Na přiloženém CD je k dispozici celý tento korpus i s obslužným programem, pomocí kterého si uživatel může podle zájmu vyhledávat mnoho dalšího, a to především v autentickém kontextu, kde se daný skutečně výraz užívá. Nabízí se tu takto mimořádná možnost studia skutečného mluveného jazyka v kontextu včetně jeho statistického vyhodnocení, která až dosud k dispozici nebyla ani pro vědecké ani například pedagogické účely.

Čermák, F. (ed.): Frekvenční slovník mluvené češtiny. Karolinum, Praha 2007.
ISBN 978-80-246-1425-0

Frekvenční slovník mluvené češtiny

Vidová morfologie českého slovesa

François Esvan

Tento svazek představuje podrobný popis vidové morfologie českých sloves z hlediska jejich tvoření, a to na základě stomiliónového korpusu současné češtiny SYN2000. Tento popis je zachycen v podobě relační databáze obsahující údaje o frekvenci všech sloves nacházejících se v korpusu SYN2000 a o vztazích mezi těmito lexémy z vidového hlediska. Detailně jsou zpracovány a frekvenčně zachyceny způsoby tvoření vidových derivátů: prefixace, sufixace a iterativní sufixace.

Esvan, F.: Vidová morfologie českého slovesa. Nakladatelství Lidové noviny, Praha 2007.
ISBN 978-80-7106-913-300

Vidová morvologie českého slovesa

Valence českých adjektiv

Marie Kopřivová

Tato práce se věnuje valenci českých adjektiv a využívá při tom rozsáhlého korpusového materiálu, který poskytuje korpus psané češtiny SYN2000. Jejím východiskem je lexikologické pojetí valence a zaměřuje se na popis formálních exponentů adjektivní valence. Nejedná se o vyčerpávající popis valence adjektiv, spíše o naznačení možností, jak k jejímu zkoumání využít korpusový materiál.

Kopřivová, M.: Valence českých adjektiv. Nakladatelství Lidové noviny, Praha 2006.
ISBN 80-7106-862-4

Valence adjektiv

Víceslovné předložky v současné češtině

Renata Blatná

Tento svazek představuje všeobecný popis víceslovných předložek, např. (v rámci něčeho, vzhledem k něčemu, spolu s něčím), kterých jsou v jazyce řádově stovky (kolem 400). Od jednoslovných předložek, např. (v, na, proti) apod., kterých jsou řádově desítky, se víceslovné předložky liší především sémanticky. Uvedený popis víceslovných předložek vychází z velkého korpusu SYN2000 a navazuje na zpracování těchto jednotek ve Slovníku české frazeologie a idiomatiky. Výrazy neslovesné.

Blatná, R.:  Víceslovné předložky v současné češtině. Nakladatelství Lidové noviny, Praha 2006.
ISBN 80-7106-865-9

Predlozky

Kolokace

František Čermák - Michal Šulc (eds.)

Svazek Kolokace je tematickým sborníkem, prvním českým věnovaným dané oblasti. Téma kolokací, "společného výskytu slov", je dnes centrálním pojmem korpusové lingvistiky, jehož rozmanitost a rozpětí od víceslovných termínů a idiomů až k náhodným kombinacím klade na uchopení problematiky i její zpracování velké nároky.

Čermák, F. - Šulc, M. (eds.): Kolokace. Nakladatelství Lidové noviny, Praha 2006.
ISBN 80-7106-863-2

Kolokace

Korpusová lingvistika: Stav a modelové přístupy

František Čermák - Renata Blatná (eds.)

Tento svazek předkládá čtenářům korpusově založené studie (tzv. case studies), které se věnují takovým základním jazykovým jevům a problémům, jako je např. hranice mezi lexikonem a gramatikou, hranice mezi psaným a mluveným jazykem apod., jejichž řešení lze chápat jako modelové pro zkoumání obdobných případů, tj. jejichž závěry lze extrapolovat.

Čermák, F. - Blatná, R. (eds.): Korpusová lingvistika: Stav a modelové přístupy. Nakladatelství Lidové noviny, Praha 2006.
ISBN 80-7106-861-6

Korpusova lingvistika

Jak využívat Český národní korpus

František Čermák - Renata Blatná (eds.)

Studijní pomůcka pro přemýšlivé studenty středních škol, žáky vyšších ročníků základních škol i studenty vysokoškolské, kteří chtějí vniknout do zákonitostí českého jazyka poněkud jinak, než je v tradičníchučebnicích obvyklé. Pracuje se s Českým národním korpusem, který při svém rozsahu 100 mil. slovních tvarů umožňuje interpretovat jazykové jevy ze zcela nových hledisek, především s využitím frekvence slov a tvarů a různých statistických funkcí. Příručka provede studenta jednoduchým i detailně sofistikovaným vyhledáváním jazykových jevů v Českém národním korpusu i problematikou spojenou s různými jazykovými rovinami od hláskosloví až po slovní zásobu a slovní spojení (kolokace). Na své si při práci s touto knihou přijdou především ti pedagogové a studenti, které baví práce s počítačem a současně je zajímá naše mateřština. Přemýšlivějším a otevřenějším se tu nabízí inspirativní cesta, jak překonat dříve neslučitelné zájmy, češtinu a matematiku.

Hlavní části:

  • Práce s ČNK krok za krokem - úkoly na jevy z hláskosloví, tvoření slov, tvarosloví, slovní zásoby, syntaxe a slovních spojení.
  • Co říká o různých slovech korpus a co slovníky - úkoly na zjištění významu méně frekventovaných slov.
  • Význam slova prozrazuje kontext - úkoly, v nichž je třeba na základě kontextu odhalit vynechané slovo nebo slovní spojení, popř. odlišit slova formálně podobná.
  • Úkoly pro náročnější - úkoly na zadávání sofistikovaných korpusových dotazů.
  • Práce se subkorpusy - úkoly s různými typy textu.

Studijní příručka Jak využívat ČNK byla na jaře 2007 vydána v reedici s opravami, které nabízíme ke stažení ve formátech RTF a PDF.

Čermák, F. - Blatná, R. (eds.): Jak využívat Český národní korpus. Nakladatelství Lidové noviny, Praha 2005.
ISBN 80-7106-736-9

Jak
využívat ČNK - obálka

Jazyky a jazykověda

Renata Blatná - Vladimír Petkevič (eds)

Při příležitosti 65. narozenin prof. Františka Čermáka vyšel sborník Jazyky a jazykověda. Sborník představuje práce kolegů a doktorandů prof. Františka Čermáka z různých oblastí jeho odborného zájmu, neboť jubilující prof. František Čermák svými publikacemi zasáhl do mnoha lingvistických oborů a navíc se stal průkopníkem naprosto nového oboru, korpusové lingvistiky. Svými kolegy a studenty však není vnímán pouze jako vědec světového věhlasu, ale také jako skvělý člověk a organizátor, který dokázal podnítit řadu spolupracovníků k práci na projektech světového významu, a neméně skvělý pedagog, který mezi studenty zasel řadu obecnělingvistických, frazeologických a korpusových "semínek".

Obsah sborníku naleznete zde. Publikaci je možné zakoupit v ÚČNK za 350 Kč (17,80 euro / 23,20 USD).

Blatná, R. - Petkevič, V. (eds): Jazyky a jazykověda. Sborník k 65. narozeninám prof. Františka Čermáka. ÚČNK FF UK, Praha 2005.
ISBN 80-7308-079-6

Jazyky a jazykověda

Frekvenční slovník češtiny

František Čermák - Michal Křen (eds.)

Koncem listopadu 2004 byl vydán v Nakladatelství Lidové noviny Frekvenční slovník češtiny. Je založen na korpusu FSC2000, jehož složení bylo proporčně vyváženo tak, aby věrně zachycovalo současný psaný jazyk. Korpus byl zpracován automatickými metodami, po kterých však následovaly rozsáhlé manuální korekce. Tento lingvistický vklad spolu s dostatečně velkým reprezentativním korpusem, na němž je slovník založen, zajišťují vysokou spolehlivost předkládaných dat. 

V hlavní části slovníku najdete:

  • 50 000 nejběžnějších apelativ (slov obecných) spolu s údaji o jejich frekvencích, pořadí podle těchto frekvencí, a také procentuálně vyjádřené typičnosti jejich užití v hlavních žánrech: beletrii, odborné literatuře a publicistice
  • 2 000 nejčastějších vlastních jmen
  • 1 000 nejčastějších zkratek

Z dodatků se dále dozvíte:

  • jaká interpunkční znaménka jsou nejpoužívanější,
  • která písmena jsou v českém textu nejfrekventovanější,
  • jak velkou část textu pokrývají tvary ve slovníku uváděných hesel.

Ke slovníku je přiložené CD, které umožňuje pohodlné prohlížení hesláře v elektronické podobě, jeho třídění a prohledávání podle nejrůznějších kritérií, a samozřejmě také ukládání vybraných hesel pro další zpracování.

Čermák, F. - Křen, M. (eds.): Frekvenční slovník češtiny. Nakladatelství Lidové noviny, Praha 2004.
ISBN 80-7106-676-1

Frekvenční slovník češtiny