• Rafał Ludwik Górski

    22. září 2016

    Srdečně zveme na přednášky, které přednese profesor Rafał Ludwik Górski ve dnech 11. 10. od 13 hodin v ÚČNK a 12. 10. od 17:30 na FF UK.

  • SYN verze 4

    16. září 2016

    Dne 16. 9. 2016 byla zveřejněna verze 4 korpusu SYN, jehož velikost po zahrnutí textů SYN2015 a dosud nezveřejněné publicistiky převážně z let 2010–2014 přesáhla 3,6 mld. slov.

  • InterCorp verze 9

    9. září 2016

    Dne 9. 9. 2016 byla zveřejněna verze 9 paralelního korpusu InterCorp. Celkový rozsah cizojazyčných textů dosáhl 232 mil. slov v jádře a 1,2 mld. slov v kolekcích, podrobnosti najdete na wiki ČNK.

  • Korpusy v kontrastivní lingvistice a translatologii (KOLT)

    7. září 2016

    Kolokvium se koná 25. 11. 2016. Vítáme příspěvky z oblasti kontrastivního a translatologického výzkumu ze všech oblastí popisu jazyka. Abstrakty zasílejte e-mailem do 2. 10. 2016. Více informací.

  • Korpusová lingvistika Praha 2016

    7. září 2016

    ČNK zve všechny své uživatele a příznivce na další ročník konference Korpusová lingvistika Praha 2016, který ponese podtitul „Od mluvené češtiny k psané“. Více informací na konferenčních stránkách.

  • Aktualizace Morfio a KWords

    31. května 2016

    Nově zveřejněné verze aplikací Morfio a KWords přinášejí kromě opravy chyb i možnost pracovat s korpusem SYN2015. Výpočetní mechanizmus KWords navíc prošel zásadní proměnou, která umožňuje rychlejší vyhodnocování výsledků.

  • SYN2015

    18. prosince 2015

    V prosinci 2015 byl zveřejněn nový reprezentativní korpus SYN2015, který je pokračovatelem řady SYN. Ve srovnání se svými předchůdci však přináší celou řadu podstatných změn a vylepšení, zejména revidovanou klasifikaci textů a syntaktickou anotaci.

  • Diakorp verze 6

    18. prosince 2015

    Korpus diachronní složky ČNK Diakorp byl ve verzi 6 rozšířen na 3,4 mil. slovních tvarů; spolu s tím došlo také k významným změnám ve struktuře textů Diakorpu.

  • Nový nástroj (nejen) pro překladatele

    26. listopadu 2015

    Nevíte, jak nejlépe přeložit nějaké slovo? Potřebujete vymyslet vhodné synonymum? Zkuste Treq! Treq je sbírka oboustranných česko-cizojazyčných slovníků ve 38 jazycích, vytvořených automaticky z paralelního korpusu InterCorp.

  • Webové korpusy Aranea

    18. června 2015

    V červnu 2015 byla aktualizována rodina nereferenčních srovnatelných webových korpusů Aranea sestavených Vladimírem Benkem; pokrývá již celkem 14 jazyků (cs, de, en, es, fi, fr, hu, it, nl, pl, pt, ru, sk, zh).

  • InterCorp verze 8

    4. června 2015

    Začátkem června 2015 byla zveřejněna verze 8 paralelního korpusu InterCorp. Celkový rozsah cizojazyčných textů dosáhl 194 mil. slov v jádře a 1,2 mld. slov v kolekcích.

  • Ukončení provozu starších rozhraní

    8. dubna 2015

    Na konci března byla ukončena podpora aplikací Bonito, Park a NoSkE. Pro uživatele těchto aplikací jsme připravili užitečné rady pro přechod na nové rozhraní KonText.
    Podrobnosti najdete zde.

  • Referenčnost korpusů

    22. prosince 2014

    Počínaje InterCorpem verze 7 budou všechny nově zveřejněné korpusy referenční, součástí jejich názvu bude také číslo verze. Starší verze korpusů zůstanou všem uživatelům přístupné.

  • InterCorp verze 7

    22. prosince 2014

    V prosinci 2014 byl zveřejněn korpus InterCorp verze 7, ve kterém oproti verzi 6 přibyl velký balík filmových titulků. Celkový rozsah cizojazyčných textů dosáhl 173 mil. slov v jádře a 1,2 mld. slov v kolekcích, počet cizích jazyků se zvýšil na 38.

  • Ukončení provozu starších rozhraní

    22. prosince 2014

    Vzhledem k tomu, že nové rozhraní KonText je nyní schopno plně zastoupit starší rozhraní pro práci s korpusy, oznamujeme ukončení provozu rozhraní Bonito, Park a NoSketch Engine v ČNK, k němuž dojde s největší pravděpodobností na konci března 2015.

  • Webové korpusy Aranea

    13. května 2014

    V květnu 2014 byla v ČNK zveřejněna rodina nereferenčních srovnatelných webových korpusů Aranea sestavených Vladimírem Benkem. V současné době pokrývá celkem 7 jazyků (de, en, fr, nl, pl, ru, sk).

  • Další přírůstek do řady ORAL

    20. prosince 2013

    V prosinci byl zveřejněn nový korpus ORAL2013, který mapuje neformální mluvenou češtinu v celé ČR a zahrnuje propojení přepisu s mluvenou stopou. Celkem tak v ČNK najdete téměř 5 mil. slov přepisů prototypického mluveného jazyka.

  • Korpusy SYN překročily hranici 2 miliard

    20. prosince 2013

    Se zveřejněním publicistického korpusu SYN2013PUB (935 mil. slov) došlo k aktualizaci nereferenčního korpusu současné psané češtiny SYN, jehož velikost tak přesáhla 2,2 miliardy slov.

  • V. Cvrček: Kvantitativní analýza kontextu

    20. prosince 2013

    V pořadí už 18. svazek řady Studie z korpusové lingvistiky zkoumá kvantitativní zákonitosti textového okolí jazykových jevů. Vedle otázek kolokability a syntagmatiky se dotýká i obecnější problematiky vztahu kontextu a vlastností jazykových jednotek.

  • Jazykové změny v současnosti

    20. prosince 2013

    Nová kniha v řadě Studie z korpusové lingvistiky od M. Křena s názvem Odraz jazykových změn v synchronních korpusech se zaměřuje na možnosti a meze detekce vývojových tendencí v jazyce s pomocí korpusů řady SYN.

Co je to korpus?
Jazykový korpus je elektronický soubor autentických textů (psaných nebo mluvených), v němž je možné jednoduše vyhledávat jazykové jevy (zejm. slova a slovní spojení) a zobrazovat je v jejich přirozeném kontextu.
více...
Kdo jsme?Logo ČNK

Český národní korpus je akademický projekt založený v roce 1994 při FF UK a spravovaný Ústavem Českého národního korpusu. Jeho cílem je systematicky mapovat češtinu a další jazyky ve srovnání s ní. Korpusy ČNK jsou po bezplatné registraci otevřeny všem zájemcům o jazyk, kteří touží vědět, jak se čeština používá.více...

Podpora a zdroje informací
  1. Korpusy ČNK
  2. Biblio
  3. Wiki
  4. Podpora
  5. Jazyková data