hledat:    
 

Co je korpus?

Korpus je soubor počítačově uložených textů (v případě mluveného jazyka - přepisů záznamu mluvy), který primárně slouží k jazykovému výzkumu. K práci s korpusy slouží speciální vyhledávací program. S jeho pomocí je možné vyhledávat slova a slovní spojení v kontextu a zjistit jejich frekvenci v korpuse i původní textový zdroj. Umožňuje i další zpracování nalezeného (např. abecední třídění apod.). U některých korpusů lze vyhledávat i podle slovních druhů.

Český národní korpus (ČNK) je akademický projekt zaměřený na budování rozsáhlého počítačového korpusu především psané češtiny. Pracuje na něm Ústav Českého národního korpusu na Filozofické fakultě Univerzity Karlovy v Praze (ÚČNK). Od svého založení roku 1994 má ÚČNK na starosti budování ČNK, jeho rozvoj a rovněž činnosti související, zvláště v oblasti výuky a pěstování oboru korpusová lingvistika.

Koláč

Aktuality

Nové publikace
Koncem května 2010 byly vydány tyto publikace: Lexikon a sémantika Františka Čermáka a Čeština, jak ji neznáte Věry Schmiedtové.
Korpus SYN2009PUB
Dne 7. května 2010 byl zveřejněn korpus SYN2009PUB. Jedná se o dosud největší korpus české publicistiky o velikosti 700 milionů textových slov, který v mnoha ohledech navazuje na svého předchůdce, korpus SYN2006PUB.
Dnešní skloňování substantiv typů kámen, břímě
20. 4. 2010 vyšla v řadě Studie z korpusové lingvistiky publikace Dnešní skloňování substantiv typů kámen, břímě. Autorem knihy je Josef Šimandl.
Více
...
Mluvnice současné češtiny
8. 4. 2010 vyšla Mluvnice současné češtiny. Jedná se o kolektivní dílo autorů z FF UK a MFF UK pod vedením Václava Cvrčka. Více...
On-line registrace
Od 12. června 2009 je možné pro získání plného přístupu ke korpusům ÚČNK použít elektronický formulář.