• Korpusový workshop

    3. února 2015

    Ústav Českého národního korpusu srdečně zve všechny zájemce na celodenní praktický workshop, který se bude konat v sobotu 25. 4. 2015 na Filozofické fakultě Univerzity Karlovy v Praze. Podrobnosti a registrační formulář. Stáhněte si předběžný program.

  • Intercorp verze 7

    22. prosince 2014

    V prosinci 2014 byl zveřejněn korpus InterCorp verze 7, ve kterém oproti verzi 6 přibyl velký balík filmových titulků. Celkový rozsah cizojazyčných textů dosáhl 173 mil. slov v jádře a 1,2 mld. slov v kolekcích, počet cizích jazyků se zvýšil na 38.

  • Referenčnost korpusů

    22. prosince 2014

    Počínaje InterCorpem verze 7 budou všechny nově zveřejněné korpusy referenční, součástí jejich názvu bude také číslo verze. Starší verze korpusů zůstanou všem uživatelům přístupné.

  • Ukončení provozu starších rozhraní

    22. prosince 2014

    Vzhledem k tomu, že nové rozhraní KonText je nyní schopno plně zastoupit starší rozhraní pro práci s korpusy, oznamujeme ukončení provozu rozhraní Bonito, Park a NoSketch Engine v ČNK, k němuž dojde s největší pravděpodobností na konci března 2015.

  • Webové korpusy Aranea

    13. května 2014

    V květnu 2014 byla v ČNK zveřejněna rodina nereferenčních srovnatelných webových korpusů Aranea sestavených Vladimírem Benkem. V současné době pokrývá celkem 7 jazyků (de, en, fr, nl, pl, ru, sk).

  • Další přírůstek do řady ORAL

    20. prosince 2013

    V prosinci byl zveřejněn nový korpus ORAL2013, který mapuje neformální mluvenou češtinu v celé ČR a zahrnuje propojení přepisu s mluvenou stopou. Celkem tak v ČNK najdete téměř 5 mil. slov přepisů prototypického mluveného jazyka.

  • Korpusy SYN překročily hranici 2 miliard

    20. prosince 2013

    Se zveřejněním publicistického korpusu SYN2013PUB (935 mil. slov) došlo k aktualizaci nereferenčního korpusu současné psané češtiny SYN, jehož velikost tak přesáhla 2,2 miliardy slov.

  • V. Cvrček: Kvantitativní analýza kontextu

    20. prosince 2013

    V pořadí už 18. svazek řady Studie z korpusové lingvistiky zkoumá kvantitativní zákonitosti textového okolí jazykových jevů. Vedle otázek kolokability a syntagmatiky se dotýká i obecnější problematiky vztahu kontextu a vlastností jazykových jednotek.

  • Jazykové změny v současnosti

    20. prosince 2013

    Nová kniha v řadě Studie z korpusové lingvistiky od M. Křena s názvem Odraz jazykových změn v synchronních korpusech se zaměřuje na možnosti a meze detekce vývojových tendencí v jazyce s pomocí korpusů řady SYN.

Co je to korpus?
Jazykový korpus je elektronický soubor autentických textů (psaných nebo mluvených), v němž je možné jednoduše vyhledávat jazykové jevy (zejm. slova a slovní spojení) a zobrazovat je v jejich přirozeném kontextu.
více...
Kdo jsme?Logo ČNK

Český národní korpus je akademický projekt založený v roce 1994 při FF UK a spravovaný Ústavem Českého národního korpusu. Jeho cílem je systematicky mapovat češtinu a další jazyky ve srovnání s ní. Korpusy ČNK jsou po bezplatné registraci otevřeny všem zájemcům o jazyk, kteří touží vědět, jak se čeština používá.více...

Podpora a zdroje informací
  1. Korpusy ČNK
  2. Biblio
  3. Wiki
  4. Podpora