hledat:    
 

Co je korpus?

Korpus je soubor počítačově uložených textů (v případě mluveného jazyka - přepisů záznamu mluvy), který primárně slouží k jazykovému výzkumu. K práci s korpusy slouží speciální vyhledávací program. S jeho pomocí je možné vyhledávat slova a slovní spojení v kontextu a zjistit jejich frekvenci v korpuse i původní textový zdroj. Umožňuje i další zpracování nalezeného (např. abecední třídění apod.). U některých korpusů lze vyhledávat i podle slovních druhů.

Český národní korpus (ČNK) je akademický projekt zaměřený na budování rozsáhlého počítačového korpusu především psané češtiny. Pracuje na něm Ústav Českého národního korpusu na Filozofické fakultě Univerzity Karlovy v Praze (ÚČNK). Od svého založení roku 1994 má ÚČNK na starosti budování ČNK, jeho rozvoj a rovněž činnosti související, zvláště v oblasti výuky a pěstování oboru korpusová lingvistika.

Aktuality

Korpusový průzkum variant - SyD
Od konce září 2011 je k dispozici program SyD, který umožňuje srovnávání jazykových variant. SyD je dostupný pro všechny zájemce zde.

Sborníky z konference
Vyšly sborníky z konference Korpusová lingvistika Praha 2011 konané ve dnech 22. - 24. září 2011. Příspěvky jsou rozděleny do tří svazků: InterCorp, Výzkum a výstavba korpusů a Gramatika a značkování korpusů.

Velký slovník rýmů
Na začátku července 2011 vyšel v Nakladatelství Lidové noviny Velký slovník rýmů. Více...