hledat:    
 

Co je korpus?

Korpus je soubor počítačově uložených textů (v případě mluveného jazyka - přepisů záznamu mluvy), který primárně slouží k jazykovému výzkumu. K práci s korpusy slouží speciální vyhledávací program. S jeho pomocí je možné vyhledávat slova a slovní spojení v kontextu a zjistit jejich frekvenci v korpuse i původní textový zdroj. Umožňuje i další zpracování nalezeného (např. abecední třídění apod.). U některých korpusů lze vyhledávat i podle slovních druhů.

Český národní korpus (ČNK) je akademický projekt zaměřený na budování rozsáhlého počítačového korpusu především psané češtiny. Pracuje na něm Ústav Českého národního korpusu na Filozofické fakultě Univerzity Karlovy v Praze (ÚČNK). Od svého založení roku 1994 má ÚČNK na starosti budování ČNK, jeho rozvoj a rovněž činnosti související, zvláště v oblasti výuky a pěstování oboru korpusová lingvistika.

Tvorba korpusu

Aktuality

Staňte se našimi doktorandy!
Máte dokončené magisterské studium lingvistického zaměření? Přihlašte se k doktorskému studiu při Ústavu Českého národního korpusu. Více...

Korpusový průzkum variant - SyD
Od konce září 2011 je k dispozici program SyD, který umožňuje srovnávání jazykových variant. SyD je dostupný pro všechny zájemce zde.

Sborníky z konference
Vyšly sborníky z konference Korpusová lingvistika Praha 2011 konané ve dnech 22. - 24. září 2011. Příspěvky jsou rozděleny do tří svazků: InterCorp, Výzkum a výstavba korpusů a Gramatika a značkování korpusů.

Velký slovník rýmů
Na začátku července 2011 vyšel v Nakladatelství Lidové noviny Velký slovník rýmů. Více...

A Frequency Dictionary of Czech
Na začátku ledna 2011 vyšel v nakladatelství Routledge A Frequency Dictionary of Czech: Core Vocabulary for Learners. Více...