AppsApps

Lexikální databáze DeriNet jako formální model tvoření slov v češtině

Date
Speaker
  1. Magda Ševčíková
  2. Zdeněk Žabokrtský
Abstract

V přednášce shrneme hlavní vlastnosti slovotvorné sítě DeriNet vyvíjené pro češtinu v Ústavu formální a aplikované lingvistiky MFF UK. Nastíníme rozmanitost podobně zaměřených databází vznikajících pro jiné jazyky, jakož i neskromné vyhlídky na jejich syntézu ve stopách Universal Dependencies. Dále se budeme věnovat dvěma tématům, kterými se v souvislosti s DeriNetem zabýváme v poslední době. První souvisí s aplikovatelností tzv. paradigmatického přístupu k odvozování v češtině, kontrastovaného se stromovým přístupem zvoleným v DeriNetu. Druhým tématem je segmentace českých lemmat na morfémy; jakkoli je morfém jedním z “nejklasičtějších” lingvistických pojmů, jeho rigorózní datové uchopení se zdá být překvapivě nesnadnou výzvou.