Stáhnout
5. 1. 2010
ver. 2.00
Jan 5, 2010
Download
Inverse Text Sort čte text z jednoho nebo více textových souborů (prostý text), rozdělí text na slova, odstraní zadané nežádoucí znaky a slova obsahující ony nežádoucí znaky, slova inverzně setřídí (viz níže) a výstup uloží do nového textového souboru (prostý text). Lze zvolit z několika výstupních formátů - s frekvencí i bez, zarovnávání vlevo nebo vpravo. K dispozici je řada možností pro zpracování textu, např. před zpracováním převést text na malá písmena, vypustit slova delší než zadaný počet znaků, vypustit slova obsahující víc než zadaný počet pomlček (spojovníků), a další. Tzv. Text Options Sets umožňují uložit a později znovu použít libovolný počet kombiancí nastavení pro zpracování textů. Součástí programu jsou nástroje (zatím pouze jeden) pro práci se setříděnými slovy. Podporované kódové stránky pro vstupní text: Central European Windows (1250) a Western European Windows (1252). Co je inverzní třídění? Slova se normálně třídí zleva doprava, což znamená, že jednotlivá písmena (obecně znaky) se porovnávají zleva doprava, počínaje prvním písmenem slov. Při inverzním třídění se jednotlivá písmena (obecně znaky) porovnávají zprava doleva, počínaje posledním písmenem slov. Nástroje, jež jsou součástí programu: Jediný nástroj, který je nyní k dispozici, se jmenuje "Word Endings Picker". Poskytuje prostředky pro rozdělování slov do skupin podle jejich koncovek zadaných buď počtem shodných znaků nebo explicitní koncovkou (např. "ice"). Na úrovni skupin jsou sčítány frekvence; vybrané nebo všechny skupiny lze exportovat do souboru (prostý text) nebo do schránky Windows. Grafické uživatelské rozhraní (GUI) programu Inverse Text Sort je pouze v angličtině.
The Inverse Text Sort reads text from one or multiple plain-text file(s), cuts the text to words, removes given unwanted characters and words containing those unwanted characters, performs inverse sort of the words (see below) writing the output to a new plain-text file. Several output formats are provided - with or without frequency, justified left or right. Multiple text processing options are available, e.g. converting the text to lower cases prior to processing it, selecting which characters are word separators and which are unwanted, removing words longer than given number of characters, removing words with more than given number of hyphens, and more. Any number of text processing options collections can be saved and reused later in so called Text Options Sets. There are built-in tools (so far only one) to work with the sorted words. Supported code pages for the input text: Central European Windows (1250) and Western European Windows (1252). What's an inverse sort of words? Normally, words are sorted from left to right, meaning the particular letters (generally characters) are compared from left to right, starting with the first letter of the words. Upon an inverse sort the particular letters (generally characters) are compared from right to left, starting with the last letter of the words. Built-in tools: The only tool currently available is named "Word Endings Picker". It provides means to group words by their endings given either by a number of identical characters or by an explicit ending (e.g. "ing"). Frequencies at the group level are summed; selected or all groups can be exported to a plain-text file or into the Windows clipboard. Inverse Text Sort's GUI is available in English only.
Česky
Inverse Text Sort
English
ukázky
grafického
uživatelského
rozhraní
(GUI)
5 a 1 řada 1 několika 1 Na 2 na 3 písmena 2 doprava 1 zprava 1 doleva 2 zleva 1 Slova 5 slova 1 malá 1 znamená 2 jednotlivá 1 víc 1 před 1 Word 1 ice 1 více 1 frekvence 4 je 2 počínaje 1 Nástroje 1 nástroje 1 jmenuje 1 Poskytuje 1 podle 5 se 2 Inverse 1 čte 1 Lze 1 lze 2 pouze 1 že 1 níže 1 Grafické 1 uživatelské 1 zadané 1 vybrané 1 Podporované 1 kódové 1 jejich 1 výstupních 1 zadaných 1 shodných 1 textových 1 GUI 1 i 1 práci 2 dispozici 1 později 1 setříděnými 1 úrovni 1 Při 2 obecně 1 angličtině 1 normálně 1 inverzně 2 obsahující 1 kombiancí 1 frekvencí 2 nežádoucí 1 třídí 1 setřídí 2 porovnávají 1 umožňují 1 rozdělí 1 rozhraní 1 odstraní 1 zarovnávání 2 zpracování 1 rozdělování 1 nastavení 2 třídění 1 vstupní 1 explicitní 1 nyní 1 inverzní 1 další 1 delší 1 Součástí 1 součástí 1 možností 1 uloží 1 buď 1 nástroj 1 K 1 k 1 pomlček 1 koncovek 1 Central 2 písmenem 1 počtem 1 zpracováním 1 posledním 1 prvním 1 inverzním 1 zatím 2 European 1 jeden 2 skupin 1 Western 5 nebo 1 Co 4 do 1 nového 1 textového 1 jednoho 5 pro 1 vpravo 1 vlevo 2 např 1 výstup 1 Picker 1 s 1 Endings 1 Options 1 Sets 3 Windows 1 exportovat 3 počet 1 zvolit 2 vypustit 1 uložit 1 použít 2 Sort 1 převést 3 Text 7 text 3 programu 1 koncovkou 3 jsou 2 souboru 1 textu 1 znovu 2 znaků 1 spojovníků 1 souborů 1 formátů 1 textů 1 v 3 slov 1 Tzv 4 znaky 1 prostředky 1 schránky 1 stránky 1 sčítány 1 všechny 1 skupiny 1 ony 1 slovy 2 zadaný 1 Jediný 1 libovolný 1 který 3 prostý 2 z 1 bez 1 viz 1 jež 2 než 1 což
3 a 1 provided 1 justified 1 called 1 named 1 summed 2 compared 1 reused 1 selected 3 unwanted 1 Supported 1 exported 2 sorted 1 saved 5 and 1 clipboard 1 Word 1 word 2 e 2 be 1 code 1 see 2 The 14 the 3 available 3 file 1 Multiple 1 multiple 2 one 9 are 1 There 2 more 1 those 2 Inverse 3 inverse 8 of 2 g 1 ing 1 ending 1 meaning 1 containing 3 processing 1 selecting 1 writing 2 starting 1 converting 2 removing 2 which 1 English 5 with 1 GUI 1 work 1 identical 1 Several 1 Central 1 level 1 all 1 tool 4 from 3 an 2 can 2 European 2 than 4 given 2 in 1 Built-in 1 built-in 1 Upon 1 Western 2 so 10 to 1 into 2 group 1 far 2 particular 4 number 1 longer 1 either 1 Picker 1 later 2 letter 1 lower 1 their 6 or 1 for 1 prior 3 s 1 reads 11 words 1 provides 1 pages 1 Frequencies 1 cases 1 removes 1 Endings 1 endings 2 is 2 tools 1 performs 1 means 1 hyphens 1 collections 1 Options 2 options 1 groups 7 characters 2 letters 1 separators 1 formats 1 Sets 1 cuts 3 Windows 1 at 1 What 4 left 4 right 1 It 1 it 1 explicit 2 Sort 3 sort 1 last 1 first 1 without 1 input 2 output 3 Text 6 text 3 plain-text 1 new 1 below 3 by 1 frequency 1 Normally 2 generally 3 only 1 currently 1 Any
graphical
user
interface
samples
(GUI)
Český národní korpus
Czech National Corpus