Aplikace KonText představuje základní vyhledávací program pro práci s korpusy projektu ČNK (nahrazuje tak původní NoSkE). Umožňuje tvorbu a vyhodnocení jednoduchých i komplexních dotazů, zobrazení formou konkordančních řádků, vypočtení frekvenční distribuce, asociačních měr kolokací a další práci s jazykovými daty. Přehledně jsou všechny funkce KonTextu popsány v manuálu.

Jak to vlastně je?

Jak mluvíme? Vlastně jako ani moc nevíme? Podívejme se na časté výplňové slůvko vlastně do korpusu mluveného jazyka a srovnejme, jak se například liší mluva mladších a starších. Více se dozvíte v manuálu práce s korpusem.

V korpusu ORAL2008 vyberte typ dotazu slovní tvar, zadejte: vlastně.

V rámci Fóra uživatelů, jehož členem se automaticky stává každý registrovaný uživatel ČNK, můžete klást dotazy ohledně použití našich korpusů a nástrojů, upozorňovat na chyby, vyjadřovat svoje názory i žádat nové funkce. Stálým orgánem Fóra uživatelů je Vědecká rada ČNK, která byla ustavena v letošním roce, aby poskytovala fundovanou odbornou zpětnou vazbu tvůrcům projektu ČNK. Těšíme se na vaše připomínky a náměty.

Internetová příručka uživatele korpusů ČNK obsahuje ve formě wiki přehledný návod pro práci s korpusy doplněný o slovníček lingvistických termínů, seznam korpusů ČNK spolu s jejich specifikací a další užitečné informace.

Morfio

Nástroj Morfio slouží pro vyhledávání slovotvorných vztahů mezi jednotkami v korpusech, např. lovit - úlovek. Umožňuje najít všechny dvojice slov tvořené stejným způsobem a vyhodnotit morfologickou produktivitu jejich tvoření.

KWords

Aplikace KWords poskytuje základní východisko pro empiricky podloženou interpretaci textů tím, že analyzuje slova v zadaném textu a porovnává jejich frekvenci s referenčním korpusem. Výsledkem takové analýzy je identifikace klíčových slov (tzv. keywords), tj. jednotek vyskytujících se signifikantně častěji v analyzovaném textu než v korpusu, který představuje neutrální jazykový úzus.

Projekt ČNK sdružuje vedle rozsáhlých jazykových korpusů řadu nástrojů pro jejich vytěžování. Vedle hlavních aplikací uvedených v liště tohoto portálu se jedná zejména o: NoSkE, SkE, Paradigma a další. Všechny je spolu s krátkým popisem najdete na speciální stránce věnované aplikacím.

Zveřejnili jsme předběžnou verzi programu (28. 8. 2014) konference Korpusová lingvistika 2014. Konference se bude konat ve dnech 17.-19. září 2014.

Český národní korpus je akademický projekt založený v roce 1994 při FF UK a spravovaný Ústavem Českého národního korpusu. Jeho cílem je systematicky mapovat vývoj češtiny (psané i mluvené) ve všech jejích podobách a žánrech. Korpusy ČNK jsou po bezplatné registraci otevřeny všem zájemcům o jazyk, kteří touží vědět, jak se čeština používá - více informací.

Jazykový korpus je rozsáhlý soubor autentických textů, v němž lze pomocí speciálních nástrojů vyhledávat jazykové jevy (např. slova a slovní spojení). Korpus zobrazuje jazykové jevy v jejich přirozeném kontextu, a umožňuje tak vytvářet na reálných datech podložený jazykový výzkum v rozsahu, který byl dříve nemyslitelný.

Projekt Český národní korpus nabízí uživatelům mnoho jazykových korpusů pro různé typy výzkumů. K dispozici jsou korpusy psaného jazyka, spontánního mluveného jazyka, paralelní korpus InterCorp s více než 30 jazyky a mnoho korpusů specializovaných. Jejich přehled s podrobnějšími informacemi naleznete zde.

Nástroj SyD je určen pro všestranný průzkum variant jak v současném jazyce, tak v průběhu jeho vývoje. Využívá korpusů ČNK, s jejichž pomocí zjišťuje, jak často se která varianta užívá v současnosti a užívala v průběhu vývoje češtiny. Pro jeho vyzkoušení stačí zadat dvě varianty jednoho jevu, které si vzájemně konkurují, např. téměř × skoro.

Pod zkratkou Park (paralelní korpusy) se skrývá starší, ale stále používané rozhraní pro přístup k vícejazyčnému paralelnímu korpusu InterCorp. InterCorp obsahuje české texty spolu s jejich překlady do mnoha jazyků a slouží jako zdroj dat pro teoretické studie, lexikografii, výuku i překladatele.

Jazyková data

Není pro vaše výzkumné cíle přístup ke korpusům přes vyhledávací rozhraní dostačující? ČNK poskytuje také jazyková data připravená podle potřeb jednotlivých vědeckých institucí. Jde o datové balíčky odvozené od zveřejněných korpusů způsobem, který respektuje omezení vyplývající z dohod uzavřených s poskytovateli textů, z autorského zákona a dalších platných předpisů. Pokud máte o jazyková data ČNK zájem, napište nám!