• Přednášky Alana Partingtona

  19. dubna 2016

  Srdečně zveme na přednášky korpusového lingvisty Alana Partingtona. První přednáška proběhne v úterý 3. 5. v rámci interního semináře ÚČNK a druhá ve středu 4. 5. v hlavní budově FF UK. Více informací a registrační formuláře.

 • SYN2015

  18. prosince 2015

  V prosinci 2015 byl zveřejněn nový reprezentativní korpus SYN2015, který je pokračovatelem řady SYN. Ve srovnání se svými předchůdci však přináší celou řadu podstatných změn a vylepšení, zejména revidovanou klasifikaci textů a syntaktickou anotaci.

 • Diakorp verze 6

  18. prosince 2015

  Korpus diachronní složky ČNK Diakorp byl ve verzi 6 rozšířen na 3,4 mil. slovních tvarů; spolu s tím došlo také k významným změnám ve struktuře textů Diakorpu.

 • Korpusová lingvistika Praha 2016

  2. prosince 2015

  ČNK zve všechny své uživatele a příznivce na další ročník konference Korpusová lingvistika Praha 2016, který ponese podtitul „Od mluvené češtiny k psané“. Více informací na konferenčních stránkách.

 • Nový nástroj (nejen) pro překladatele

  26. listopadu 2015

  Nevíte, jak nejlépe přeložit nějaké slovo? Potřebujete vymyslet vhodné synonymum? Zkuste Treq! Treq je sbírka oboustranných česko-cizojazyčných slovníků ve 38 jazycích, vytvořených automaticky z paralelního korpusu InterCorp.

 • Webové korpusy Aranea

  18. června 2015

  V červnu 2015 byla aktualizována rodina nereferenčních srovnatelných webových korpusů Aranea sestavených Vladimírem Benkem; pokrývá již celkem 14 jazyků (cs, de, en, es, fi, fr, hu, it, nl, pl, pt, ru, sk, zh).

 • Intercorp verze 8

  4. června 2015

  Začátkem června 2015 byla zveřejněna verze 8 paralelního korpusu InterCorp. Celkový rozsah cizojazyčných textů dosáhl 194 mil. slov v jádře a 1,2 mld. slov v kolekcích.

 • Ukončení provozu starších rozhraní

  8. dubna 2015

  Na konci března byla ukončena podpora aplikací Bonito, Park a NoSkE. Pro uživatele těchto aplikací jsme připravili užitečné rady pro přechod na nové rozhraní KonText.
  Podrobnosti najdete zde.

 • Referenčnost korpusů

  22. prosince 2014

  Počínaje InterCorpem verze 7 budou všechny nově zveřejněné korpusy referenční, součástí jejich názvu bude také číslo verze. Starší verze korpusů zůstanou všem uživatelům přístupné.

 • Intercorp verze 7

  22. prosince 2014

  V prosinci 2014 byl zveřejněn korpus InterCorp verze 7, ve kterém oproti verzi 6 přibyl velký balík filmových titulků. Celkový rozsah cizojazyčných textů dosáhl 173 mil. slov v jádře a 1,2 mld. slov v kolekcích, počet cizích jazyků se zvýšil na 38.

 • Ukončení provozu starších rozhraní

  22. prosince 2014

  Vzhledem k tomu, že nové rozhraní KonText je nyní schopno plně zastoupit starší rozhraní pro práci s korpusy, oznamujeme ukončení provozu rozhraní Bonito, Park a NoSketch Engine v ČNK, k němuž dojde s největší pravděpodobností na konci března 2015.

 • Webové korpusy Aranea

  13. května 2014

  V květnu 2014 byla v ČNK zveřejněna rodina nereferenčních srovnatelných webových korpusů Aranea sestavených Vladimírem Benkem. V současné době pokrývá celkem 7 jazyků (de, en, fr, nl, pl, ru, sk).

 • Další přírůstek do řady ORAL

  20. prosince 2013

  V prosinci byl zveřejněn nový korpus ORAL2013, který mapuje neformální mluvenou češtinu v celé ČR a zahrnuje propojení přepisu s mluvenou stopou. Celkem tak v ČNK najdete téměř 5 mil. slov přepisů prototypického mluveného jazyka.

 • Korpusy SYN překročily hranici 2 miliard

  20. prosince 2013

  Se zveřejněním publicistického korpusu SYN2013PUB (935 mil. slov) došlo k aktualizaci nereferenčního korpusu současné psané češtiny SYN, jehož velikost tak přesáhla 2,2 miliardy slov.

 • V. Cvrček: Kvantitativní analýza kontextu

  20. prosince 2013

  V pořadí už 18. svazek řady Studie z korpusové lingvistiky zkoumá kvantitativní zákonitosti textového okolí jazykových jevů. Vedle otázek kolokability a syntagmatiky se dotýká i obecnější problematiky vztahu kontextu a vlastností jazykových jednotek.

 • Jazykové změny v současnosti

  20. prosince 2013

  Nová kniha v řadě Studie z korpusové lingvistiky od M. Křena s názvem Odraz jazykových změn v synchronních korpusech se zaměřuje na možnosti a meze detekce vývojových tendencí v jazyce s pomocí korpusů řady SYN.

Co je to korpus?
Jazykový korpus je elektronický soubor autentických textů (psaných nebo mluvených), v němž je možné jednoduše vyhledávat jazykové jevy (zejm. slova a slovní spojení) a zobrazovat je v jejich přirozeném kontextu.
více...
Kdo jsme?Logo ČNK

Český národní korpus je akademický projekt založený v roce 1994 při FF UK a spravovaný Ústavem Českého národního korpusu. Jeho cílem je systematicky mapovat češtinu a další jazyky ve srovnání s ní. Korpusy ČNK jsou po bezplatné registraci otevřeny všem zájemcům o jazyk, kteří touží vědět, jak se čeština používá.více...

Podpora a zdroje informací
 1. Korpusy ČNK
 2. Biblio
 3. Wiki
 4. Podpora