Co je to korpus?
Jazykový korpus je elektronický soubor autentických textů (psaných nebo mluvených), v němž je možné jednoduše vyhledávat jazykové jevy (zejm. slova a slovní spojení) a zobrazovat je v jejich přirozeném kontextu.
Korpusy ČNK zahrnují současnou psanou (tištěnou) češtinu (v rozsahu přes 5 mld. slov), češtinu internetovou (přes 6 mld. slov), spontánní mluvenou češtinu, češtinu historickou, a také paralelní korpus InterCorp obsahující překlady z nebo do více než 60 jazyků.

