Aplikace KonText představuje základní vyhledávací program pro práci s korpusy projektu ČNK (nahrazuje tak původní NoSkE). Umožňuje tvorbu a vyhodnocení jednoduchých i komplexních dotazů, zobrazení formou konkordančních řádků, vypočtení frekvenční distribuce, asociačních měr kolokací a další práci s jazykovými daty. Přehledně jsou všechny funkce KonTextu popsány v manuálu.

Nástroj Morfio slouží pro vyhledávání slovotvorných vztahů mezi jednotkami v korpusech, např. lovit - úlovek. Umožňuje najít všechny dvojice slov tvořené stejným způsobem a vyhodnotit morfologickou produktivitu jejich tvoření.

Aplikace umožňuje snadné vyhledávání překladových ekvivalentů v oboustranných česko-cizojazyčných slovnícícch vytvořených automaticky na základě dat paralelního korpusu InterCorp.

Program paradigma je v současnosti nevyvíjenou aplikací na analýzu morfologických paradigmatických vztahů v korpusu. Umožňuje zadat celkem 9 paralelních dotazů a zjišťovat jejich průnik na rovině lemmat nebo slovních tvarů.

Inverse Text Sort čte text z jednoho nebo více textových souborů (prostý text), rozdělí text na slova, odstraní zadané nežádoucí znaky a slova obsahující ony nežádoucí znaky, slova inverzně setřídí a výstup uloží do nového textového souboru (prostý text). Lze zvolit z několika výstupních formátů - s frekvencí i bez, zarovnávání vlevo nebo vpravo.

Nástroj SyD je určen pro všestranný průzkum variant jak v současném jazyce, tak v průběhu jeho vývoje. Využívá korpusů ČNK, s jejichž pomocí zjišťuje, jak často se která varianta užívá v současnosti a užívala v průběhu vývoje češtiny. Pro jeho vyzkoušení stačí zadat dvě varianty jednoho jevu, které si vzájemně konkurují, např. téměř × skoro.

Aplikace KWords poskytuje základní východisko pro empiricky podloženou interpretaci textů tím, že analyzuje slova v zadaném textu a porovnává jejich frekvenci s referenčním korpusem. Výsledkem takové analýzy je identifikace klíčových slov (tzv. keywords), tj. jednotek vyskytujících se signifikantně častěji v analyzovaném textu než v korpusu, který představuje neutrální jazykový úzus.

InterText je editor zarovnaných paralelních textů. Byl vyvinut pro projekt InterCorp pro potřeby úprav a správu zarovnání několika paralelních jazykových verzí textů na úrovni vět. Při jeho návrhu byl kladen důraz na flexibilitu, podporuje vlastní XML dokumenty a znakovou sadu Unicode.

Sketch Engine (SkE) je komerční webové rozhraní pro práci s korpusy vyvíjené společností Lexical Computing Ltd. - www.sketchengine.co.uk. Z licenčních důvodů může mít přístup k lokální instalaci SkE v ČNK pouze omezený počet zaměstnanců a studentů Univerzity Karlovy.

Při práci s rozsáhlými jazykovými daty je v mnoha případech třeba provádět měření na náhodných vzorcích omezeného rozsahu. Pro určení spolehlivosti takto získaných výsledků by měla sloužit jednoduchá kalkulačka, která poměřuje velikost prozkoumaných vzorků s distribucí hledaných jevů.