├── data ├── abbreviations │ ├── tlg_e_unicode_ascii_selection.txt │ ├── abbreviations_loci.txt │ ├── index_thomisticus_abbreviations_loci.txt │ ├── abbreviations_critical_apparatus.txt │ ├── abbreviations.txt │ ├── abbreviations.json │ └── athenaeus_ascii.txt ├── greek_paradigms │ ├── spho_dual.txt │ ├── no_dual.txt │ ├── ampho.txt │ ├── humos.txt │ ├── humeis.txt │ ├── poteros.txt │ ├── tis_accented.txt │ ├── hapas.txt │ ├── hosper.txt │ ├── medeis.txt │ ├── sautou.txt │ ├── hemeis.txt │ ├── hekastos.txt │ ├── hemautou.txt │ ├── sos.txt │ ├── hekateros.txt │ ├── spheis.txt │ ├── posos.txt │ ├── su.txt │ ├── oudeis.txt │ ├── allelon.txt │ ├── humeteros.txt │ ├── hos.txt │ ├── hoios.txt │ ├── poios.txt │ ├── tis.txt │ ├── tosoutos.txt │ ├── ho_articles.txt │ ├── pas.txt │ ├── emos.txt │ ├── hemos.txt │ ├── toioutos.txt │ ├── amphoteros.txt │ ├── ego.txt │ ├── polus.txt │ ├── hosos.txt │ ├── allos.txt │ ├── heautou.txt │ ├── hemeteros.txt │ ├── heteros.txt │ ├── houtos.txt │ ├── enantios.txt │ ├── autos.txt │ ├── hode.txt │ ├── hostis.txt │ ├── ekeinos.txt │ ├── phemi.txt │ ├── ekho.txt │ ├── eimi.txt │ └── gignomai.txt ├── latin_paradigms │ ├── nihil.txt │ ├── aliquis.txt │ ├── quisquis.txt │ ├── nemo.txt │ ├── inquam.txt │ ├── sui.txt │ ├── quis.txt │ ├── res.txt │ ├── quisnam.txt │ ├── nos.txt │ ├── aio.txt │ ├── quisque.txt │ ├── ullus.txt │ ├── quisquam.txt │ ├── talis.txt │ ├── tu.txt │ ├── ego.txt │ ├── quivis.txt │ ├── vos.txt │ ├── iste.txt │ ├── aliqui.txt │ ├── quidam.txt │ ├── omnis.txt │ ├── suus.txt │ ├── meus.txt │ ├── alter.txt │ ├── multus.txt │ ├── quicumque.txt │ ├── fio.txt │ ├── idem.txt │ ├── ceter.txt │ ├── noster.txt │ ├── qualis.txt │ ├── ipse.txt │ ├── tuus.txt │ ├── nullus.txt │ ├── tantus.txt │ ├── ille.txt │ ├── hic.txt │ ├── alius.txt │ ├── plus_plures.txt │ ├── is.txt │ ├── quantus.txt │ ├── qui.txt │ ├── vester.txt │ ├── possum.txt │ ├── sum.txt │ ├── do.txt │ ├── habeo.txt │ ├── dico.txt │ ├── facio.txt │ ├── fero.txt │ └── video.txt ├── phi_data │ ├── phi_100_not_in_latin_v_1.txt │ ├── phi_top_100.txt │ ├── phi_top_1000_selection.txt │ ├── phi_500_not_in_latin_v_1.txt │ ├── phi_1000_not_in_latin_v_1.txt │ └── phi_top_500.txt ├── tlg_data │ ├── tlg_100_not_in_greek_v_1.txt │ ├── tlg_top_100.txt │ ├── tlg_top_1000_selection.txt │ ├── tlg_500_not_in_greek_v_1.txt │ ├── tlg_1000_not_in_greek_v_1.txt │ └── tlg_top_500.txt ├── homer_data │ ├── iliad_100_not_in_tlg_100_selection.txt │ ├── odyssey_100_not_in_tlg_100_selection.txt │ ├── iliad_100_not_in_tlg_100.txt │ ├── odyssey_100_not_in_tlg_100.txt │ ├── odyssey_lem_1000_not_in_tlg_lem_1000_selection.txt │ ├── iliad_lem_1000_not_in_tlg_lem_1000_selection.txt │ ├── odyssey_candidates_not_in_current_greek.txt │ ├── iliad_candidates_not_in_current_greek.txt │ ├── homer_all_candidates.txt │ ├── odyssey_1000_not_in_tlg_1000_selection.txt │ ├── iliad_1000_not_in_tlg_1000_selection.txt │ ├── odyssey_candidates_union_100_1000.txt │ ├── iliad_all_candidates_1000.txt │ └── odyssey_all_candidates_1000.txt ├── praenomina.txt ├── dem_top_500.txt ├── cic_top_500.txt └── data_dcc │ └── dcc_greek_core_list_lemmas.txt ├── ancientstopwords ├── NAMESPACE ├── .Rbuildignore ├── DESCRIPTION └── ancientstopwords.Rproj ├── .gitignore ├── test ├── test_json_txt │ ├── test_output.md │ ├── test_input.json │ ├── test_r_to_json.json │ └── convert_json_to_txt.R └── voyant_test_files │ ├── voyant_test_el.txt │ ├── voyant_test_grc_oxia.txt │ ├── voyant_test_grc_tonos_nfc.txt │ ├── voyant_test_el_split.txt │ ├── voyant_test_grc_oxia_split.txt │ ├── voyant_test_grc_oxia_split_nfc.txt │ └── voyant_test_grc_tonos_nfc_split.txt ├── stopwords_addenda.md ├── reference ├── 2017-07_burns_stopwords.pdf ├── 2018-01-12_tlg_precomposed_unicode.pdf └── 2018-02-09_maurer_apparatus_abbreviations.pdf ├── stopwords.Rproj ├── stopwords_greek_odyssey.txt ├── stopwords_greek_iliad.txt ├── README.md ├── stopwords_greek_homer.txt ├── stopwords_for_quanteda └── stopwords_quanteda.R ├── CITATION.cff ├── versions ├── stopwords_latin_v1_0.txt └── stopwords_greek_v1_0.txt └── make_lists.R /data/abbreviations/tlg_e_unicode_ascii_selection.txt: -------------------------------------------------------------------------------- 1 | -------------------------------------------------------------------------------- /ancientstopwords/NAMESPACE: -------------------------------------------------------------------------------- 1 | exportPattern("^[[:alpha:]]+") 2 | -------------------------------------------------------------------------------- /.gitignore: -------------------------------------------------------------------------------- 1 | .Rproj.user 2 | .Rhistory 3 | .RData 4 | .Ruserdata 5 | -------------------------------------------------------------------------------- /ancientstopwords/.Rbuildignore: -------------------------------------------------------------------------------- 1 | ^.*\.Rproj$ 2 | ^\.Rproj\.user$ 3 | -------------------------------------------------------------------------------- /data/greek_paradigms/spho_dual.txt: -------------------------------------------------------------------------------- 1 | σφώ 2 | σφῶι 3 | σφῶιν 4 | σφῷ 5 | σφῷν 6 | -------------------------------------------------------------------------------- /data/greek_paradigms/no_dual.txt: -------------------------------------------------------------------------------- 1 | νώ 2 | νῶι 3 | νῶιν 4 | νῶν 5 | νῷ 6 | νῷν 7 | -------------------------------------------------------------------------------- /data/greek_paradigms/ampho.txt: -------------------------------------------------------------------------------- 1 | ἁμφοῖν 2 | ἄμφω 3 | ἀμφοῖν 4 | κἀμφοῖν 5 | τἄμφω 6 | τἀμφοῖν 7 | -------------------------------------------------------------------------------- /data/latin_paradigms/nihil.txt: -------------------------------------------------------------------------------- 1 | nihil 2 | nihilne 3 | nihilque 4 | nil 5 | nilne 6 | nilque 7 | -------------------------------------------------------------------------------- /test/test_json_txt/test_output.md: -------------------------------------------------------------------------------- 1 | # TYPOGRAPHICAL SYMBOLS 2 | : 3 | [ 4 | ] 5 | { 6 | } 7 | " 8 | -------------------------------------------------------------------------------- /stopwords_addenda.md: -------------------------------------------------------------------------------- 1 | # Temporary list of addenda, with named sources 2 | 3 | # Greek 4 | 5 | # Latin 6 | -------------------------------------------------------------------------------- /data/latin_paradigms/aliquis.txt: -------------------------------------------------------------------------------- 1 | aliquid 2 | aliquidque 3 | aliquidue 4 | aliquis 5 | aliquisne 6 | aliquisque 7 | aliquo 8 | -------------------------------------------------------------------------------- /data/latin_paradigms/quisquis.txt: -------------------------------------------------------------------------------- 1 | quaqua 2 | quemquem 3 | quicquid 4 | quidquid 5 | quiqui 6 | quiquidem 7 | quisquis 8 | quoquo 9 | -------------------------------------------------------------------------------- /reference/2017-07_burns_stopwords.pdf: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/aurelberra/stopwords/HEAD/reference/2017-07_burns_stopwords.pdf -------------------------------------------------------------------------------- /data/phi_data/phi_100_not_in_latin_v_1.txt: -------------------------------------------------------------------------------- 1 | quoque 2 | nihil 3 | nunc 4 | causa 5 | m 6 | potest 7 | omnia 8 | i 9 | c 10 | s 11 | tantum 12 | -------------------------------------------------------------------------------- /reference/2018-01-12_tlg_precomposed_unicode.pdf: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/aurelberra/stopwords/HEAD/reference/2018-01-12_tlg_precomposed_unicode.pdf -------------------------------------------------------------------------------- /reference/2018-02-09_maurer_apparatus_abbreviations.pdf: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/aurelberra/stopwords/HEAD/reference/2018-02-09_maurer_apparatus_abbreviations.pdf -------------------------------------------------------------------------------- /data/latin_paradigms/nemo.txt: -------------------------------------------------------------------------------- 1 | nemine 2 | neminem 3 | neminemne 4 | nemini 5 | neminis 6 | neminisque 7 | nemo 8 | nemon 9 | nemone 10 | nemoque 11 | nemost 12 | -------------------------------------------------------------------------------- /test/test_json_txt/test_input.json: -------------------------------------------------------------------------------- 1 | { 2 | "TYPOGRAPHICAL SYMBOLS": [ 3 | ":", 4 | "[", 5 | "]", 6 | "{", 7 | "}", 8 | "\\", 9 | "\"", 10 | "," 11 | ] 12 | } 13 | -------------------------------------------------------------------------------- /test/test_json_txt/test_r_to_json.json: -------------------------------------------------------------------------------- 1 | {"TYPOGRAPHICAL SYMBOLS1":"!","TYPOGRAPHICAL SYMBOLS2":"$","PRONOUNS.ego1":"ego","PRONOUNS.ego2":"egon","PRONOUNS.meus1":"mea","PRONOUNS.meus2":"meae"} 2 | -------------------------------------------------------------------------------- /data/latin_paradigms/inquam.txt: -------------------------------------------------------------------------------- 1 | inquam 2 | inquamst 3 | inque 4 | inquiebat 5 | inquies 6 | inquiet 7 | inquii 8 | inquimus 9 | inquin 10 | inquis 11 | inquisti 12 | inquit 13 | inquito 14 | inquiunt 15 | -------------------------------------------------------------------------------- /data/greek_paradigms/humos.txt: -------------------------------------------------------------------------------- 1 | οὑμαί 2 | οὑμόν 3 | οὑμός 4 | οὑμοί 5 | ὑμά 6 | ὑμάς 7 | ὑμᾶς 8 | ὑμαί 9 | ὑμαῖς 10 | ὑμέ 11 | ὑμέων 12 | ὑμή 13 | ὑμήν 14 | ὑμῆς 15 | ὑμόν 16 | ὑμός 17 | ὑμῶ 18 | ὑμῶν 19 | ὑμῶς 20 | -------------------------------------------------------------------------------- /data/latin_paradigms/sui.txt: -------------------------------------------------------------------------------- 1 | se 2 | secum 3 | secumque 4 | secumue 5 | secumve 6 | semet 7 | sen 8 | sese 9 | sest 10 | sibi 11 | sibimet 12 | sibine 13 | sibique 14 | sui 15 | suimet 16 | suique 17 | suist 18 | -------------------------------------------------------------------------------- /data/latin_paradigms/quis.txt: -------------------------------------------------------------------------------- 1 | quid 2 | quidlibet 3 | quidne 4 | quidni 5 | quidpiam 6 | quidue 7 | quidve 8 | quis 9 | quiscumque 10 | quisue 11 | quisve 12 | quo 13 | quon 14 | quone 15 | quost 16 | quoue 17 | quove 18 | -------------------------------------------------------------------------------- /data/latin_paradigms/res.txt: -------------------------------------------------------------------------------- 1 | re 2 | rebus 3 | rebusque 4 | rei 5 | reique 6 | reist 7 | rem 8 | remque 9 | remst 10 | remve 11 | reque 12 | rerum 13 | rerumne 14 | rerumque 15 | res 16 | resne 17 | resque 18 | rest 19 | resve 20 | -------------------------------------------------------------------------------- /data/latin_paradigms/quisnam.txt: -------------------------------------------------------------------------------- 1 | cuinam 2 | cuiusnam 3 | quaenam 4 | quaenamst 5 | quamnam 6 | quanam 7 | quarumnam 8 | quasnam 9 | quemnam 10 | quibusnam 11 | quidnam 12 | quidnamst 13 | quinam 14 | quisnam 15 | quodnam 16 | quosnam 17 | -------------------------------------------------------------------------------- /data/latin_paradigms/nos.txt: -------------------------------------------------------------------------------- 1 | nobis 2 | nobiscum 3 | nobiscumque 4 | nobismet 5 | nobisne 6 | nobisque 7 | nos 8 | nosmet 9 | nosne 10 | nosque 11 | nost 12 | nostri 13 | nostrique 14 | nostrive 15 | nostrum 16 | nostrumne 17 | nostrumque 18 | -------------------------------------------------------------------------------- /data/latin_paradigms/aio.txt: -------------------------------------------------------------------------------- 1 | aiant 2 | aias 3 | aiat 4 | aibant 5 | aibas 6 | aibat 7 | aiebam 8 | aiebamus 9 | aiebant 10 | aiebas 11 | aiebat 12 | aiebatis 13 | ain 14 | aio 15 | ais 16 | aisne 17 | ait 18 | aitque 19 | aiunt 20 | aiuntque 21 | -------------------------------------------------------------------------------- /data/latin_paradigms/quisque.txt: -------------------------------------------------------------------------------- 1 | cuique 2 | cuiquest 3 | cuiusque 4 | quaeque 5 | quamque 6 | quaque 7 | quarumque 8 | quasque 9 | quemque 10 | quibusque 11 | quicque 12 | quidque 13 | quique 14 | quisque 15 | quodque 16 | quorumque 17 | quosque 18 | -------------------------------------------------------------------------------- /data/greek_paradigms/humeis.txt: -------------------------------------------------------------------------------- 1 | οὑμές 2 | ὕμιν 3 | ὕμμιν 4 | ὗμιν 5 | ὑμᾶς 6 | ὑμέ 7 | ὑμέας 8 | ὑμές 9 | ὑμέων 10 | ὑμείων 11 | ὑμεῖς 12 | ὑμίν 13 | ὑμῖν 14 | ὑμῶν 15 | ὔμμ' 16 | ὔμμε 17 | ὔμμες 18 | ὔμμι 19 | ὔμμιν 20 | χὔμιν 21 | χὐμεῖς 22 | χὐμῖν 23 | -------------------------------------------------------------------------------- /data/latin_paradigms/ullus.txt: -------------------------------------------------------------------------------- 1 | ulla 2 | ullae 3 | ullam 4 | ullamve 5 | ullane 6 | ullarum 7 | ullas 8 | ullast 9 | ullave 10 | ulli 11 | ulline 12 | ullis 13 | ullius 14 | ullo 15 | ullorum 16 | ullos 17 | ullum 18 | ullumve 19 | ullus 20 | ullusne 21 | ullust 22 | -------------------------------------------------------------------------------- /data/greek_paradigms/poteros.txt: -------------------------------------------------------------------------------- 1 | κότερα 2 | κότερον 3 | πότερ' 4 | πότερα 5 | πότεραι 6 | πότεροι 7 | πότερον 8 | πότερος 9 | ποτέρα 10 | ποτέραν 11 | ποτέρας 12 | ποτέρᾳ 13 | ποτέρην 14 | ποτέροις 15 | ποτέροισι 16 | ποτέρου 17 | ποτέρους 18 | ποτέρωι 19 | ποτέρων 20 | ποτέρως 21 | ποτέρῳ 22 | -------------------------------------------------------------------------------- /data/greek_paradigms/tis_accented.txt: -------------------------------------------------------------------------------- 1 | τέοισι 2 | τέων 3 | τεῦ 4 | τί 5 | τίν' 6 | τίνα 7 | τίνας 8 | τίνε 9 | τίνες 10 | τίνι 11 | τίνοιν 12 | τίνος 13 | τίνων 14 | τίς 15 | τίσι 16 | τίσιν 17 | τίωι 18 | τίῳ 19 | τοῖσ' 20 | τοῖσι 21 | τοῖσιν 22 | τοῦ 23 | τοῦπερ 24 | τῶι 25 | τῷ 26 | τῷπερ 27 | -------------------------------------------------------------------------------- /data/latin_paradigms/quisquam.txt: -------------------------------------------------------------------------------- 1 | cuiquam 2 | cuiquamst 3 | cuiusquam 4 | quamquam 5 | quamquamst 6 | quaquam 7 | quaquamst 8 | quemquam 9 | quemquamne 10 | quemquamst 11 | quicquam 12 | quicquamne 13 | quicquamst 14 | quidquam 15 | quiquam 16 | quisquam 17 | quisquamne 18 | quisquamst 19 | quoquam 20 | -------------------------------------------------------------------------------- /data/latin_paradigms/talis.txt: -------------------------------------------------------------------------------- 1 | tale 2 | talem 3 | talemque 4 | taleque 5 | tales 6 | talesne 7 | talesque 8 | talest 9 | tali 10 | talia 11 | taliane 12 | taliaque 13 | talibus 14 | talibusque 15 | talin 16 | taline 17 | talique 18 | talis 19 | talisque 20 | talisve 21 | taliter 22 | talium 23 | taliumque 24 | -------------------------------------------------------------------------------- /data/latin_paradigms/tu.txt: -------------------------------------------------------------------------------- 1 | te 2 | tecum 3 | tecumque 4 | ted 5 | temet 6 | ten 7 | tenve 8 | tenveque 9 | tenvis 10 | teque 11 | test 12 | teve 13 | tibi 14 | tibimet 15 | tibin 16 | tibique 17 | tibist 18 | tu 19 | tui 20 | tuin 21 | tuine 22 | tuique 23 | tun 24 | tune 25 | tuque 26 | tute 27 | tutemet 28 | -------------------------------------------------------------------------------- /data/latin_paradigms/ego.txt: -------------------------------------------------------------------------------- 1 | ego 2 | egon 3 | egone 4 | egoque 5 | me 6 | mecum 7 | mecumque 8 | mecumst 9 | med 10 | medem 11 | mei 12 | mein 13 | meique 14 | meme 15 | memet 16 | men 17 | mene 18 | meque 19 | mest 20 | mi 21 | mihi 22 | mihin 23 | mihine 24 | mihique 25 | mihist 26 | min 27 | mine 28 | mist 29 | -------------------------------------------------------------------------------- /data/latin_paradigms/quivis.txt: -------------------------------------------------------------------------------- 1 | cuiuis 2 | cuiusuis 3 | cuiusvis 4 | cuivis 5 | quaeuis 6 | quaevis 7 | quamuis 8 | quamvis 9 | quarumvis 10 | quasvis 11 | quauis 12 | quavis 13 | quemuis 14 | quemvis 15 | quibusuis 16 | quibusvis 17 | quiduis 18 | quidvis 19 | quiuis 20 | quivis 21 | quoduis 22 | quodvis 23 | quosvis 24 | -------------------------------------------------------------------------------- /data/tlg_data/tlg_100_not_in_greek_v_1.txt: -------------------------------------------------------------------------------- 1 | τοῦτο 2 | αὐτοῦ 3 | εἶναι 4 | ταῦτα 5 | αὐτῶν 6 | αὐτὸν 7 | αὐτῷ 8 | ἦν 9 | ἐστιν 10 | πάντα 11 | τούτων 12 | δι 13 | ὥσπερ 14 | αὐτοῖς 15 | πάλιν 16 | νῦν 17 | ὧν 18 | ἔχει 19 | μόνον 20 | οἷον 21 | μᾶλλον 22 | ἡμῖν 23 | πῶς 24 | α 25 | ἡμῶν 26 | ἔστι 27 | σου 28 | λέγει 29 | μοι 30 | -------------------------------------------------------------------------------- /data/latin_paradigms/vos.txt: -------------------------------------------------------------------------------- 1 | uestri 2 | uestrique 3 | uobis 4 | uobiscum 5 | uobisque 6 | uos 7 | uosmet 8 | uosne 9 | uosque 10 | uostrum 11 | vestri 12 | vestrique 13 | vobis 14 | vobiscum 15 | vobismet 16 | vobisne 17 | vobisque 18 | von 19 | vos 20 | vosmet 21 | vosne 22 | vosque 23 | vostrum 24 | vostrumque 25 | vostrumst 26 | -------------------------------------------------------------------------------- /data/greek_paradigms/hapas.txt: -------------------------------------------------------------------------------- 1 | ἅπαις 2 | ἅπαν 3 | ἅπανθ' 4 | ἅπαντ' 5 | ἅπαντα 6 | ἅπαντας 7 | ἅπαντες 8 | ἅπαντι 9 | ἅπαντος 10 | ἅπας 11 | ἅπασ' 12 | ἅπασα 13 | ἅπασαι 14 | ἅπασαν 15 | ἅπασι 16 | ἅπασιν 17 | ἁπάντων 18 | ἁπάσαις 19 | ἁπάσαισιν 20 | ἁπάσας 21 | ἁπάσηι 22 | ἁπάσης 23 | ἁπάσῃ 24 | ἁπάσῃσι 25 | ἁπασέων 26 | ἁπασῶν 27 | -------------------------------------------------------------------------------- /data/greek_paradigms/hosper.txt: -------------------------------------------------------------------------------- 1 | αἵπερ 2 | αἷσπερ 3 | οἵπερ 4 | οἷσιπερ 5 | οἷσπερ 6 | οὕσπερ 7 | οὗπερ 8 | χὤπερ 9 | χὤσπερ 10 | χὥπερ 11 | χὥσπερ 12 | χὦιπερ 13 | χὦνπερ 14 | ἅνπερ 15 | ἅπερ 16 | ἅσπερ 17 | ἇιπερ 18 | ἥνπερ 19 | ἥπερ 20 | ἧσπερ 21 | ὅνπερ 22 | ὅπερ 23 | ὅσπερ 24 | ὥπερ 25 | ὧιπερ 26 | ὧνπερ 27 | ᾇπερ 28 | ᾧπερ 29 | 30 | -------------------------------------------------------------------------------- /stopwords.Rproj: -------------------------------------------------------------------------------- 1 | Version: 1.0 2 | 3 | RestoreWorkspace: Default 4 | SaveWorkspace: Default 5 | AlwaysSaveHistory: Default 6 | 7 | EnableCodeIndexing: Yes 8 | UseSpacesForTab: Yes 9 | NumSpacesForTab: 4 10 | Encoding: UTF-8 11 | 12 | RnwWeave: Sweave 13 | LaTeX: XeLaTeX 14 | 15 | AutoAppendNewline: Yes 16 | StripTrailingWhitespace: Yes 17 | -------------------------------------------------------------------------------- /data/latin_paradigms/iste.txt: -------------------------------------------------------------------------------- 1 | ista 2 | istae 3 | istaec 4 | istam 5 | istamque 6 | istanc 7 | istane 8 | istaque 9 | istarum 10 | istas 11 | istast 12 | iste 13 | istest 14 | isti 15 | istimet 16 | istique 17 | istis 18 | istisne 19 | istisve 20 | istius 21 | isto 22 | iston 23 | istorum 24 | istos 25 | istuc 26 | istud 27 | istum 28 | istumne 29 | istunc 30 | -------------------------------------------------------------------------------- /data/greek_paradigms/medeis.txt: -------------------------------------------------------------------------------- 1 | μηδέν 2 | μηδέν' 3 | μηδένα 4 | μηδένας 5 | μηδένες 6 | μηδένων 7 | μηδέσι 8 | μηδέσιν 9 | μηδείς 10 | μηδεμία 11 | μηδεμίαν 12 | μηδεμίας 13 | μηδεμίᾳ 14 | μηδεμίην 15 | μηδεμιᾶι 16 | μηδεμιᾶς 17 | μηδεμιᾷ 18 | μηδεμιῆς 19 | μηδεμιῇ 20 | μηδενί 21 | μηδενός 22 | μηθέν 23 | μηθέν' 24 | μηθένα 25 | μηθείς 26 | μηθενί 27 | μηθενός 28 | -------------------------------------------------------------------------------- /data/greek_paradigms/sautou.txt: -------------------------------------------------------------------------------- 1 | σαυτήν 2 | σαυτῆι 3 | σαυτῆς 4 | σαυτῇ 5 | σαυτό 6 | σαυτόν 7 | σαυτός 8 | σαυτούς 9 | σαυτοῦ 10 | σαυτῶ 11 | σαυτῶι 12 | σαυτῶν 13 | σαυτῷ 14 | σεαυτήν 15 | σεαυτῆι 16 | σεαυτῆς 17 | σεαυτῇ 18 | σεαυτό 19 | σεαυτόν 20 | σεαυτοῦ 21 | σεαυτῶι 22 | σεαυτῶν 23 | σεαυτῷ 24 | σεωτοῦ 25 | σεωυτήν 26 | σεωυτόν 27 | σεωυτοῦ 28 | σεωυτῷ 29 | -------------------------------------------------------------------------------- /data/latin_paradigms/aliqui.txt: -------------------------------------------------------------------------------- 1 | alicui 2 | alicuius 3 | aliqua 4 | aliquae 5 | aliqualibet 6 | aliquam 7 | aliquan 8 | aliquane 9 | aliquarum 10 | aliquas 11 | aliquast 12 | aliquaue 13 | alique 14 | aliquem 15 | aliquemque 16 | aliqui 17 | aliquibus 18 | aliquis 19 | aliquisne 20 | aliquisque 21 | aliquit 22 | aliquod 23 | aliquodue 24 | aliquorum 25 | aliquos 26 | -------------------------------------------------------------------------------- /data/greek_paradigms/hemeis.txt: -------------------------------------------------------------------------------- 1 | ἅμες 2 | ἅμμιν 3 | ἁμ' 4 | ἁμέ 5 | ἁμίν 6 | ἁμῶν 7 | ἄμμ' 8 | ἄμμε 9 | ἄμμες 10 | ἄμμι 11 | ἄμμιν 12 | ἀμμέων 13 | ἥμιν 14 | ἧμας 15 | ἧμιν 16 | ἡμᾶς 17 | ἡμέας 18 | ἡμέων 19 | ἡμείων 20 | ἡμεῖς 21 | ἡμίν 22 | ἡμῖν 23 | ἡμῶν 24 | κἄμμ' 25 | κἄμμε 26 | κἄμμες 27 | χἡμᾶς 28 | χἡμεῖς 29 | χἡμῖν 30 | χἠμᾶς 31 | χἠμεῖς 32 | χἠμῖν 33 | χἠμῶν 34 | -------------------------------------------------------------------------------- /data/latin_paradigms/quidam.txt: -------------------------------------------------------------------------------- 1 | cuidam 2 | cuiusdam 3 | quadam 4 | quaedam 5 | quaedamque 6 | quaedamst 7 | quamdam 8 | quandam 9 | quandamque 10 | quarumdam 11 | quasdam 12 | quasdamque 13 | quemdam 14 | quendam 15 | quibusdam 16 | quidam 17 | quidamque 18 | quidamst 19 | quiddam 20 | quiddamst 21 | quoddam 22 | quorumdam 23 | quosdam 24 | quosdamque 25 | quosdamve 26 | -------------------------------------------------------------------------------- /ancientstopwords/DESCRIPTION: -------------------------------------------------------------------------------- 1 | Package: ancientstopwords 2 | Type: Package 3 | Title: Ancient Greek and Latin Stopwords (Title Case) 4 | Version: 0.1.0 5 | Author: Aurélien Berra 6 | Maintainer: Aurélien Berra 7 | Description: Ancient Greek and Latin stopwords for textual analysis. 8 | License: CC BY-NC-SA 9 | Encoding: UTF-8 10 | LazyData: true 11 | -------------------------------------------------------------------------------- /data/latin_paradigms/omnis.txt: -------------------------------------------------------------------------------- 1 | omnem 2 | omnemque 3 | omni 4 | omnibus 5 | omnibusne 6 | omnibusque 7 | omnibust 8 | omnibusue 9 | omnin 10 | omnique 11 | omnis 12 | omnisne 13 | omnisque 14 | omnist 15 | omnium 16 | omniumque 17 | omniumst 18 | omne 19 | omnene 20 | omneque 21 | omnest 22 | omnia 23 | omnian 24 | omniane 25 | omniaque 26 | omnes 27 | omnesne 28 | omnesque 29 | -------------------------------------------------------------------------------- /data/latin_paradigms/suus.txt: -------------------------------------------------------------------------------- 1 | sua 2 | suae 3 | suaeque 4 | suai 5 | suam 6 | suamne 7 | suamque 8 | suane 9 | suaque 10 | suarum 11 | suarumque 12 | suas 13 | suasque 14 | suaue 15 | sue 16 | sui 17 | suique 18 | suis 19 | suisne 20 | suisque 21 | suist 22 | suo 23 | suom 24 | suone 25 | suoque 26 | suorum 27 | suorumque 28 | suorumue 29 | suos 30 | suosque 31 | suum 32 | suumque 33 | suus 34 | suusque 35 | -------------------------------------------------------------------------------- /data/latin_paradigms/meus.txt: -------------------------------------------------------------------------------- 1 | mea 2 | meae 3 | meaeque 4 | meai 5 | meam 6 | meamne 7 | meamque 8 | mean 9 | meane 10 | meaque 11 | mearum 12 | mearumque 13 | meas 14 | measque 15 | meast 16 | mee 17 | mei 18 | mein 19 | meique 20 | meis 21 | meisque 22 | meo 23 | meon 24 | meone 25 | meoque 26 | meost 27 | meum 28 | meumque 29 | meumst 30 | meumve 31 | meus 32 | meusque 33 | meust 34 | mi 35 | min 36 | mine 37 | mist 38 | -------------------------------------------------------------------------------- /data/greek_paradigms/hekastos.txt: -------------------------------------------------------------------------------- 1 | ἕκασθ' 2 | ἕκαστ' 3 | ἕκαστα 4 | ἕκασται 5 | ἕκαστοι 6 | ἕκαστον 7 | ἕκαστος 8 | ἑκάστ' 9 | ἑκάστα 10 | ἑκάσταις 11 | ἑκάσταισι 12 | ἑκάσταν 13 | ἑκάστας 14 | ἑκάστᾳ 15 | ἑκάστη 16 | ἑκάστηι 17 | ἑκάστην 18 | ἑκάστης 19 | ἑκάστῃ 20 | ἑκάστῃσι 21 | ἑκάστοις 22 | ἑκάστοισι 23 | ἑκάστοισιν 24 | ἑκάστου 25 | ἑκάστους 26 | ἑκάστω 27 | ἑκάστωι 28 | ἑκάστων 29 | ἑκάστως 30 | ἑκάστῳ 31 | ἑκαστοτέρω 32 | -------------------------------------------------------------------------------- /data/greek_paradigms/hemautou.txt: -------------------------------------------------------------------------------- 1 | 'μαυτόν 2 | 'μαυτοῦ 3 | 'μαυτῷ 4 | ἐμαυτήν 5 | ἐμαυτῆι 6 | ἐμαυτῆς 7 | ἐμαυτῇ 8 | ἐμαυτόν 9 | ἐμαυτούς 10 | ἐμαυτοῦ 11 | ἐμαυτῶ 12 | ἐμαυτῶι 13 | ἐμαυτῶν 14 | ἐμαυτῷ 15 | ἐμεωυτόν 16 | ἐμεωυτοῦ 17 | ἐμεωυτῷ 18 | ἐμωυτόν 19 | ἐμωυτοῦ 20 | κἀμαυτήν 21 | κἀμαυτῆς 22 | κἀμαυτόν 23 | κἀμαυτοῦ 24 | κἀμαυτῶι 25 | κἀμαυτῷ 26 | κἠμαυτόν 27 | τἀμαυτῆς 28 | τἀμαυτοῦ 29 | τἠμαυτοῦ 30 | τοὐμαυτῆς 31 | τοὐμαυτοῦ 32 | -------------------------------------------------------------------------------- /data/latin_paradigms/alter.txt: -------------------------------------------------------------------------------- 1 | alter 2 | altera 3 | alterae 4 | alteram 5 | alteramque 6 | alteramue 7 | alteraque 8 | alterarum 9 | alteras 10 | alterast 11 | alterave 12 | alteri 13 | alteris 14 | alterius 15 | alteriusque 16 | alteriusue 17 | alterive 18 | altero 19 | alteroque 20 | alterorum 21 | alteros 22 | alteroue 23 | alterove 24 | alterque 25 | alterue 26 | alterum 27 | alterumque 28 | alterumue 29 | alterumve 30 | alterve 31 | -------------------------------------------------------------------------------- /data/latin_paradigms/multus.txt: -------------------------------------------------------------------------------- 1 | multa 2 | multae 3 | multaeque 4 | multaeve 5 | multam 6 | multamque 7 | multane 8 | multaque 9 | multarum 10 | multarumque 11 | multas 12 | multasque 13 | multi 14 | multique 15 | multis 16 | multisne 17 | multisque 18 | multisve 19 | multo 20 | multoque 21 | multorum 22 | multorumque 23 | multos 24 | multosque 25 | multost 26 | multosve 27 | multum 28 | multumque 29 | multumst 30 | multus 31 | multusque 32 | -------------------------------------------------------------------------------- /data/latin_paradigms/quicumque.txt: -------------------------------------------------------------------------------- 1 | cuicumque 2 | cuicunque 3 | cuiuscumque 4 | cuiuscunque 5 | quacumque 6 | quacunque 7 | quaecumque 8 | quaecunque 9 | quamcumque 10 | quamcunque 11 | quarumcumque 12 | quascumque 13 | quascunque 14 | quemcumque 15 | quemcunque 16 | quibuscumque 17 | quibuscunque 18 | quicumque 19 | quicumquest 20 | quicunque 21 | quocumque 22 | quodcumque 23 | quodcunque 24 | quorumcumque 25 | quoscumque 26 | quoscunque 27 | -------------------------------------------------------------------------------- /data/latin_paradigms/fio.txt: -------------------------------------------------------------------------------- 1 | fi 2 | fiam 3 | fiamque 4 | fiamus 5 | fiant 6 | fiantque 7 | fias 8 | fiat 9 | fiatque 10 | ficumque 11 | fiebam 12 | fiebant 13 | fiebat 14 | fient 15 | fientque 16 | fierem 17 | fierent 18 | fieres 19 | fieret 20 | fieretque 21 | fieretue 22 | fieri 23 | fierine 24 | fierique 25 | fieriue 26 | fies 27 | fiet 28 | fietque 29 | fimus 30 | fin 31 | fio 32 | fis 33 | fit 34 | fite 35 | fitque 36 | fiunt 37 | fiuntque 38 | -------------------------------------------------------------------------------- /data/greek_paradigms/sos.txt: -------------------------------------------------------------------------------- 1 | σ' 2 | σά 3 | σάν 4 | σάς 5 | σάων 6 | σᾶι 7 | σᾶν 8 | σᾶς 9 | σᾷ 10 | σαί 11 | σαῖν 12 | σαῖς 13 | σαῖσι 14 | σαῖσιν 15 | σέ 16 | σέων 17 | σή 18 | σήν 19 | σῆι 20 | σῆισιν 21 | σῆς 22 | σῇ 23 | σῇς 24 | σῇσι 25 | σῇσιν 26 | σόφ' 27 | σόν 28 | σός 29 | σοί 30 | σοίπερ 31 | σοῖν 32 | σοῖο 33 | σοῖς 34 | σοῖσ' 35 | σοῖσι 36 | σοῖσιν 37 | σούς 38 | σοῦ 39 | σοῦπερ 40 | σώ 41 | σώς 42 | σῶ 43 | σῶι 44 | σῶν 45 | σῶς 46 | σῷ 47 | -------------------------------------------------------------------------------- /data/homer_data/iliad_100_not_in_tlg_100_selection.txt: -------------------------------------------------------------------------------- 1 | # Candidates for Iliad stopwords 2 | ὣς 3 | τ 4 | οἳ 5 | αὐτὰρ 6 | ἄρ 7 | μιν 8 | τοι 9 | ἄρα 10 | οὐδ 11 | περ 12 | ἐπεὶ 13 | ἦ 14 | ἐς 15 | οὔ 16 | καί 17 | ὅ 18 | ὅτε 19 | ἐνὶ 20 | κεν 21 | ὅς 22 | ἐπ 23 | γ 24 | ἐγὼ 25 | οὐδέ 26 | ἔπειτα 27 | ῥ 28 | κε 29 | μάλα 30 | σὺ 31 | ἀμφὶ 32 | ὃς 33 | εἴ 34 | ῥα 35 | με 36 | ἣ 37 | μή 38 | οἵ 39 | ἠδὲ 40 | κ 41 | μέν 42 | ὥς 43 | σε 44 | τὼ 45 | θ 46 | -------------------------------------------------------------------------------- /data/greek_paradigms/hekateros.txt: -------------------------------------------------------------------------------- 1 | ἑκάτερ' 2 | ἑκάτερα 3 | ἑκάτεραι 4 | ἑκάτερᾳ 5 | ἑκάτεροι 6 | ἑκάτερον 7 | ἑκάτερος 8 | ἑκατέρα 9 | ἑκατέραι 10 | ἑκατέραιν 11 | ἑκατέραις 12 | ἑκατέραν 13 | ἑκατέρας 14 | ἑκατέρᾳ 15 | ἑκατέρη 16 | ἑκατέρην 17 | ἑκατέρης 18 | ἑκατέρῃ 19 | ἑκατέρῃσι 20 | ἑκατέροιν 21 | ἑκατέροις 22 | ἑκατέροισι 23 | ἑκατέροισιν 24 | ἑκατέρου 25 | ἑκατέρους 26 | ἑκατέρω 27 | ἑκατέρωι 28 | ἑκατέρων 29 | ἑκατέρως 30 | ἑκατέρῳ 31 | ἑκατερᾶν 32 | -------------------------------------------------------------------------------- /ancientstopwords/ancientstopwords.Rproj: -------------------------------------------------------------------------------- 1 | Version: 1.0 2 | 3 | RestoreWorkspace: Default 4 | SaveWorkspace: Default 5 | AlwaysSaveHistory: Default 6 | 7 | EnableCodeIndexing: Yes 8 | UseSpacesForTab: Yes 9 | NumSpacesForTab: 4 10 | Encoding: UTF-8 11 | 12 | RnwWeave: Sweave 13 | LaTeX: XeLaTeX 14 | 15 | AutoAppendNewline: Yes 16 | StripTrailingWhitespace: Yes 17 | 18 | BuildType: Package 19 | PackageUseDevtools: Yes 20 | PackageInstallArgs: --no-multiarch --with-keep.source 21 | -------------------------------------------------------------------------------- /data/greek_paradigms/spheis.txt: -------------------------------------------------------------------------------- 1 | ἄσφ' 2 | ἄσφε 3 | ἄσφι 4 | σφ' 5 | σφάς 6 | σφᾶς 7 | σφας 8 | σφε 9 | σφε' 10 | σφέ 11 | σφέα 12 | σφέας 13 | σφέων 14 | σφεα 15 | σφεά 16 | σφεᾶς 17 | σφεας 18 | σφείων 19 | σφεῖς 20 | σφεών 21 | σφεων 22 | σφι 23 | σφί 24 | σφίν 25 | σφίσι 26 | σφίσιν 27 | σφῖν 28 | σφῖσι 29 | σφιν 30 | σφισι 31 | σφισί 32 | σφισίν 33 | σφισιν 34 | σφω 35 | σφω' 36 | σφώ 37 | σφῶ 38 | σφῶε 39 | σφῶιν 40 | σφῶν 41 | σφῷν 42 | σφωε 43 | σφωέ 44 | σφωίν 45 | σφωιν 46 | -------------------------------------------------------------------------------- /data/greek_paradigms/posos.txt: -------------------------------------------------------------------------------- 1 | κόσα 2 | κόσαι 3 | κόσαν 4 | κόσας 5 | κόσης 6 | κόσοι 7 | κόσον 8 | κόσος 9 | κόσου 10 | κόσῳ 11 | πόσ' 12 | πόσα 13 | πόσαι 14 | πόσαις 15 | πόσας 16 | πόσε 17 | πόση 18 | πόσην 19 | πόσης 20 | πόσῃ 21 | πόσῃσι 22 | πόσοι 23 | πόσοις 24 | πόσον 25 | πόσος 26 | πόσου 27 | πόσους 28 | πόσσ' 29 | πόσσα 30 | πόσσαις 31 | πόσση 32 | πόσσοι 33 | πόσσοισι 34 | πόσσον 35 | πόσσος 36 | πόσσους 37 | πόσσω 38 | πόσω 39 | πόσωι 40 | πόσων 41 | πόσως 42 | πόσῳ 43 | ποσέων 44 | -------------------------------------------------------------------------------- /data/homer_data/odyssey_100_not_in_tlg_100_selection.txt: -------------------------------------------------------------------------------- 1 | # Candidates for Odyssey stopwords 2 | ὣς 3 | τ 4 | τοι 5 | αὐτὰρ 6 | ἦ 7 | ἐνὶ 8 | ἐπεὶ 9 | μιν 10 | ἐς 11 | ἄρα 12 | ἄρ 13 | καί 14 | οὔ 15 | ἐγὼ 16 | περ 17 | γ 18 | κεν 19 | ἔνθα 20 | ἠδὲ 21 | ἐπ 22 | οὐδ 23 | οὐδέ 24 | μ 25 | ἔπειτα 26 | ὅτε 27 | σε 28 | μάλα 29 | με 30 | ὅς 31 | μή 32 | ὅ 33 | πολλὰ 34 | εἴ 35 | ῥ 36 | σὺ 37 | δή 38 | μέν 39 | κε 40 | τίς 41 | κ 42 | οἵ 43 | πάντες 44 | ὄφρα 45 | ὦ 46 | ἐγώ 47 | ἥ 48 | θ 49 | ἤδη 50 | -------------------------------------------------------------------------------- /data/latin_paradigms/idem.txt: -------------------------------------------------------------------------------- 1 | eadem 2 | eademne 3 | eademque 4 | eademst 5 | eademve 6 | eaedem 7 | eaedemque 8 | eandem 9 | eandemque 10 | earumdem 11 | easdem 12 | easdemne 13 | easdemque 14 | eidem 15 | eidemque 16 | eisdem 17 | eisdemque 18 | eiusdem 19 | eiusdemque 20 | eodem 21 | eodemque 22 | eorundem 23 | eosdem 24 | eosdemne 25 | eosdemque 26 | eundem 27 | eundemne 28 | eundemque 29 | idem 30 | idemne 31 | idemque 32 | idemst 33 | iisdem 34 | iisdemque 35 | isdem 36 | isdemne 37 | isdemque 38 | -------------------------------------------------------------------------------- /data/greek_paradigms/su.txt: -------------------------------------------------------------------------------- 1 | ξύ 2 | θ' 3 | σ' 4 | σε 5 | σέ 6 | σέο 7 | σέθεν 8 | σεῖ' 9 | σεῖο 10 | σεο 11 | σευ 12 | σεῦ 13 | σοι 14 | σοί 15 | σοίπερ 16 | σοῖ 17 | σου 18 | σού 19 | σούπερ 20 | σοῦ 21 | σοῦπερ 22 | σύ 23 | σύγ' 24 | σύγε 25 | σύπερ 26 | τ' 27 | τέ 28 | τέ' 29 | τέο 30 | τέος 31 | τείν 32 | τεο 33 | τεό 34 | τεοῖο 35 | τεοῦ 36 | τεοῦς 37 | τευ 38 | τεύ 39 | τεῦ 40 | τεῦς 41 | τίν 42 | τίνη 43 | τοι 44 | τοί 45 | τοίπερ 46 | τοῖ 47 | τυ 48 | τύ 49 | τύγ' 50 | τύγα 51 | τύγε 52 | τύνη 53 | -------------------------------------------------------------------------------- /data/homer_data/iliad_100_not_in_tlg_100.txt: -------------------------------------------------------------------------------- 1 | ὣς 2 | τ 3 | οἳ 4 | αὐτὰρ 5 | ἄρ 6 | μιν 7 | τοι 8 | ἀχαιῶν 9 | ἄρα 10 | οὐδ 11 | περ 12 | ἐπεὶ 13 | ἦ 14 | ἐς 15 | οὔ 16 | καί 17 | ὅ 18 | ὅτε 19 | ἐνὶ 20 | κεν 21 | ὅς 22 | ἐπ 23 | γ 24 | ἕκτωρ 25 | ἀνδρῶν 26 | μέγα 27 | τρώων 28 | ἐγὼ 29 | οὐδέ 30 | ἔπειτα 31 | ῥ 32 | κε 33 | ἵππους 34 | μάλα 35 | σὺ 36 | ἀμφὶ 37 | διὸς 38 | νῆας 39 | ὃς 40 | εἴ 41 | θυμὸν 42 | ῥα 43 | με 44 | ἣ 45 | μή 46 | οἵ 47 | ἠδὲ 48 | κ 49 | μέν 50 | τρῶες 51 | ὥς 52 | σε 53 | τὼ 54 | θ 55 | ζεὺς 56 | -------------------------------------------------------------------------------- /data/latin_paradigms/ceter.txt: -------------------------------------------------------------------------------- 1 | caetera 2 | caeterae 3 | caeteram 4 | caeteras 5 | caeteri 6 | caeteris 7 | caeterisque 8 | caeteros 9 | caeterus 10 | cetera 11 | ceterae 12 | ceteraeque 13 | ceteraeve 14 | ceteram 15 | ceteramque 16 | ceteraque 17 | ceterarum 18 | ceterarumque 19 | ceteras 20 | ceterasque 21 | ceteri 22 | ceterique 23 | ceteris 24 | ceterisque 25 | ceterisue 26 | ceterive 27 | cetero 28 | ceteroque 29 | ceterorum 30 | ceterorumque 31 | ceterorumue 32 | ceteros 33 | ceterosque 34 | ceterum 35 | ceterus 36 | -------------------------------------------------------------------------------- /data/latin_paradigms/noster.txt: -------------------------------------------------------------------------------- 1 | noster 2 | nosterque 3 | nostra 4 | nostrae 5 | nostraeque 6 | nostrai 7 | nostram 8 | nostramne 9 | nostramque 10 | nostrane 11 | nostraque 12 | nostrarum 13 | nostrarumque 14 | nostras 15 | nostrasne 16 | nostrasque 17 | nostrast 18 | nostri 19 | nostrique 20 | nostris 21 | nostrisque 22 | nostrisve 23 | nostrive 24 | nostro 25 | nostrone 26 | nostroque 27 | nostrorum 28 | nostrorumque 29 | nostrorumst 30 | nostros 31 | nostrosque 32 | nostrost 33 | nostrum 34 | nostrumne 35 | nostrumque 36 | -------------------------------------------------------------------------------- /data/greek_paradigms/oudeis.txt: -------------------------------------------------------------------------------- 1 | κοὐδέν 2 | κοὐδέν' 3 | κοὐδείς 4 | κοὐδεμί' 5 | κοὐδενί 6 | κοὐδενός 7 | οὐδέν 8 | οὐδέν' 9 | οὐδένα 10 | οὐδένας 11 | οὐδένες 12 | οὐδένων 13 | οὐδέσι 14 | οὐδέσιν 15 | οὐδείς 16 | οὐδεμί' 17 | οὐδεμία 18 | οὐδεμίαι 19 | οὐδεμίαν 20 | οὐδεμίας 21 | οὐδεμίᾳ 22 | οὐδεμίη 23 | οὐδεμίην 24 | οὐδεμιᾶι 25 | οὐδεμιᾶς 26 | οὐδεμιᾷ 27 | οὐδεμιῆς 28 | οὐδεμιῇ 29 | οὐδεμιῶν 30 | οὐδενί 31 | οὐδενός 32 | οὐθέν 33 | οὐθέν' 34 | οὐθένα 35 | οὐθένας 36 | οὐθένες 37 | οὐθένων 38 | οὐθείς 39 | οὐθενί 40 | οὐθενός 41 | -------------------------------------------------------------------------------- /data/greek_paradigms/allelon.txt: -------------------------------------------------------------------------------- 1 | ἄλλαλα 2 | ἄλληλ' 3 | ἄλληλα 4 | ἀλλάλαις 5 | ἀλλάλαισι 6 | ἀλλάλαισιν 7 | ἀλλάλας 8 | ἀλλάλοις 9 | ἀλλάλοισ' 10 | ἀλλάλοισι 11 | ἀλλάλοισιν 12 | ἀλλάλους 13 | ἀλλάλων 14 | ἀλλάλως 15 | ἀλλαλᾶν 16 | ἀλλήλα 17 | ἀλλήλαιν 18 | ἀλλήλαις 19 | ἀλλήλαισι 20 | ἀλλήλαισιν 21 | ἀλλήλας 22 | ἀλλήληισι 23 | ἀλλήληισιν 24 | ἀλλήλῃσι 25 | ἀλλήλῃσιν 26 | ἀλλήλοιιν 27 | ἀλλήλοιν 28 | ἀλλήλοις 29 | ἀλλήλοισ' 30 | ἀλλήλοισι 31 | ἀλλήλοισιν 32 | ἀλλήλους 33 | ἀλλήλω 34 | ἀλλήλων 35 | ἀλλήλως 36 | ἀλληλέων 37 | τἀλλήλων 38 | -------------------------------------------------------------------------------- /data/greek_paradigms/humeteros.txt: -------------------------------------------------------------------------------- 1 | ὑμέτερ' 2 | ὑμέτερα 3 | ὑμέτεραι 4 | ὑμέτερε 5 | ὑμέτεροι 6 | ὑμέτερον 7 | ὑμέτερονδ' 8 | ὑμέτερονδε 9 | ὑμέτερος 10 | ὑμετέρα 11 | ὑμετέραι 12 | ὑμετέραιν 13 | ὑμετέραις 14 | ὑμετέραισιν 15 | ὑμετέραν 16 | ὑμετέρας 17 | ὑμετέρᾳ 18 | ὑμετέρη 19 | ὑμετέρην 20 | ὑμετέρης 21 | ὑμετέρῃ 22 | ὑμετέρῃσι 23 | ὑμετέρῃσιν 24 | ὑμετέροιν 25 | ὑμετέροιο 26 | ὑμετέροις 27 | ὑμετέροισι 28 | ὑμετέροισιν 29 | ὑμετέρου 30 | ὑμετέρους 31 | ὑμετέρω 32 | ὑμετέρωι 33 | ὑμετέρων 34 | ὑμετέρῳ 35 | ὑμετεράων 36 | ὑμετερέων 37 | -------------------------------------------------------------------------------- /data/latin_paradigms/qualis.txt: -------------------------------------------------------------------------------- 1 | quale 2 | qualecumque 3 | qualecunque 4 | qualem 5 | qualemcunque 6 | qualemque 7 | qualemve 8 | quales 9 | qualescumque 10 | qualescunque 11 | qualeslibet 12 | qualesque 13 | qualest 14 | qualesve 15 | quali 16 | qualia 17 | qualiacunque 18 | qualiaque 19 | qualibus 20 | qualicumque 21 | qualicunque 22 | qualine 23 | qualique 24 | qualis 25 | qualiscunque 26 | qualislibet 27 | qualisque 28 | qualisve 29 | qualiter 30 | qualitercumque 31 | qualitercunque 32 | qualiterque 33 | qualium 34 | qualiumcumque 35 | -------------------------------------------------------------------------------- /data/greek_paradigms/hos.txt: -------------------------------------------------------------------------------- 1 | αἵ 2 | αἷν 3 | αἷς 4 | αἷσι 5 | αἷσιν 6 | οἵ 7 | οἷ' 8 | οἷν 9 | οἷο 10 | οἷς 11 | οἷσ' 12 | οἷσι 13 | οἷσιν 14 | οὕς 15 | οὗ 16 | χαἴ 17 | χοἴ 18 | χοὔς 19 | χοὖ 20 | χἄ 21 | χἄν 22 | χἤ 23 | χἤν 24 | χὤ 25 | χὤν 26 | χὤς 27 | χὥ 28 | χᾦ 29 | ἅ 30 | ἅν 31 | ἅς 32 | ἇι 33 | ἇν 34 | ἇς 35 | ἑοῖ 36 | ἑοῦ 37 | ἑῆς 38 | ἕων 39 | ἥ 40 | ἥν 41 | ἧι 42 | ἧισι 43 | ἧισιν 44 | ἧς 45 | ὁοῦ 46 | ὅ 47 | ὅν 48 | ὅνδε 49 | ὅου 50 | ὅς 51 | ὥ 52 | ὥς 53 | ὧ 54 | ὧι 55 | ὧν 56 | ᾇ 57 | ᾗ 58 | ᾗσ' 59 | ᾗσι 60 | ᾗσιν 61 | ᾧ 62 | -------------------------------------------------------------------------------- /data/latin_paradigms/ipse.txt: -------------------------------------------------------------------------------- 1 | ipsa 2 | ipsae 3 | ipsaeque 4 | ipsam 5 | ipsamque 6 | ipsane 7 | ipsaque 8 | ipsarum 9 | ipsarumque 10 | ipsas 11 | ipsasque 12 | ipsast 13 | ipse 14 | ipsemet 15 | ipsene 16 | ipseque 17 | ipsest 18 | ipsi 19 | ipsimet 20 | ipsine 21 | ipsique 22 | ipsis 23 | ipsisne 24 | ipsisque 25 | ipsist 26 | ipsius 27 | ipsiusque 28 | ipso 29 | ipson 30 | ipsoque 31 | ipsorum 32 | ipsorumque 33 | ipsos 34 | ipsosne 35 | ipsosque 36 | ipsost 37 | ipsum 38 | ipsumne 39 | ipsumque 40 | ipsus 41 | ipsusne 42 | ipsusque 43 | ipsust 44 | -------------------------------------------------------------------------------- /data/homer_data/odyssey_100_not_in_tlg_100.txt: -------------------------------------------------------------------------------- 1 | ὣς 2 | τ 3 | τοι 4 | αὐτὰρ 5 | ἦ 6 | ἐνὶ 7 | ἐπεὶ 8 | μιν 9 | ἐς 10 | ἄρα 11 | ἄρ 12 | καί 13 | οὔ 14 | ἐγὼ 15 | περ 16 | γ 17 | κεν 18 | ἔνθα 19 | ἠδὲ 20 | ἐπ 21 | οὐδ 22 | οὐδέ 23 | ὀδυσσεύς 24 | μ 25 | ἔπειτα 26 | ὅτε 27 | σε 28 | μάλα 29 | με 30 | ὅς 31 | μή 32 | ὅ 33 | ἀνδρῶν 34 | πολλὰ 35 | εἴ 36 | ῥ 37 | τηλέμαχος 38 | σὺ 39 | δή 40 | μέν 41 | κε 42 | τίς 43 | θυμῷ 44 | μέγα 45 | ἀθήνη 46 | γαῖαν 47 | κ 48 | οἵ 49 | πάντες 50 | ὄφρα 51 | ὦ 52 | ἐγώ 53 | ἥ 54 | θ 55 | ἤδη 56 | νῆα 57 | δῖος 58 | προσέφη 59 | -------------------------------------------------------------------------------- /test/voyant_test_files/voyant_test_el.txt: -------------------------------------------------------------------------------- 1 | Στο πρώτο μέρος του διαλόγου αυτού συζητούν ο Σωκράτης και ο Γοργίας και επιχειρούν να προσδιορίσουν επακριβώς τη φύση και τη σωστή χρήση της ρητορικής τέχνης. Αρχικά ο Γοργίας όρισε την αρετή ως την κατ' εξοχήν τέχνη του λόγου και στη συνέχεια ως πειθοῦς δημιουργόν. Ο Σωκράτης παρατήρησε ότι ο ρήτορας απλώς πείθει, δεν διδάσκει, και ότι για την εκλογή ειδικών τεχνιτών, επιστημόνων ή στρατηγών ή για τα πιο εξειδικευμένα θέματα, όπως η ιατρική, η ναυπηγική και ο πόλεμος, αρμόδιοι να συμβουλεύσουν δεν είναι οι ρήτορες αλλά οι ειδικοί. 2 | -------------------------------------------------------------------------------- /data/greek_paradigms/hoios.txt: -------------------------------------------------------------------------------- 1 | οἵα 2 | οἵαι 3 | οἵαιπερ 4 | οἵαις 5 | οἵαισι 6 | οἵαισιν 7 | οἵαισπερ 8 | οἵαν 9 | οἵανπερ 10 | οἵαπερ 11 | οἵας 12 | οἵασπερ 13 | οἵᾳ 14 | οἵᾳπερ 15 | οἵη 16 | οἵην 17 | οἵηνπερ 18 | οἵηπερ 19 | οἵης 20 | οἵῃ 21 | οἵῃσι 22 | οἵῃσιν 23 | οἵοιν 24 | οἵοις 25 | οἵοισι 26 | οἵοισιν 27 | οἵοισπερ 28 | οἵου 29 | οἵουπερ 30 | οἵους 31 | οἵουσπερ 32 | οἵω 33 | οἵωι 34 | οἵων 35 | οἵωνπερ 36 | οἵως 37 | οἵῳ 38 | οἵῳπερ 39 | οἷ' 40 | οἷα 41 | οἷαι 42 | οἷαιπερ 43 | οἷαπερ 44 | οἷοι 45 | οἷοιπερ 46 | οἷον 47 | οἷος 48 | οἷοσπερ 49 | χοἶα 50 | χοἶον 51 | -------------------------------------------------------------------------------- /data/latin_paradigms/tuus.txt: -------------------------------------------------------------------------------- 1 | tua 2 | tuae 3 | tuaen 4 | tuaeque 5 | tuaest 6 | tuaique 7 | tuam 8 | tuamne 9 | tuamque 10 | tuamst 11 | tuamve 12 | tuan 13 | tuane 14 | tuaque 15 | tuarum 16 | tuarumque 17 | tuas 18 | tuasne 19 | tuasque 20 | tuast 21 | tuasue 22 | tue 23 | tuest 24 | tui 25 | tuin 26 | tuine 27 | tuique 28 | tuis 29 | tuisne 30 | tuisque 31 | tuo 32 | tuom 33 | tuomque 34 | tuomst 35 | tuon 36 | tuoque 37 | tuorum 38 | tuorumque 39 | tuos 40 | tuosne 41 | tuosque 42 | tuost 43 | tuosve 44 | tuum 45 | tuumne 46 | tuumque 47 | tuus 48 | tuusque 49 | tuusue 50 | -------------------------------------------------------------------------------- /data/greek_paradigms/poios.txt: -------------------------------------------------------------------------------- 1 | κοία 2 | κοίαν 3 | κοίας 4 | κοίοιο 5 | κοίου 6 | κοίους 7 | κοίως 8 | κοίῳ 9 | κοῖ' 10 | κοῖα 11 | κοῖαι 12 | κοῖον 13 | κοῖος 14 | ποί' 15 | ποία 16 | ποίαι 17 | ποίαιν 18 | ποίαις 19 | ποίαισι 20 | ποίαισιν 21 | ποίαν 22 | ποίας 23 | ποίᾳ 24 | ποίη 25 | ποίηι 26 | ποίην 27 | ποίης 28 | ποίῃ 29 | ποίῃσιν 30 | ποίοιν 31 | ποίοις 32 | ποίοισι 33 | ποίοισιν 34 | ποίου 35 | ποίους 36 | ποίω 37 | ποίωι 38 | ποίων 39 | ποίως 40 | ποίῳ 41 | ποῖ' 42 | ποῖα 43 | ποῖαι 44 | ποῖοι 45 | ποῖον 46 | ποῖος 47 | ποιᾶν 48 | ποιέων 49 | ποιότατον 50 | ποιότατος 51 | -------------------------------------------------------------------------------- /data/latin_paradigms/nullus.txt: -------------------------------------------------------------------------------- 1 | nulla 2 | nullae 3 | nullaene 4 | nullaeque 5 | nullam 6 | nullamne 7 | nullamque 8 | nullan 9 | nullane 10 | nullaque 11 | nullarum 12 | nullas 13 | nullasne 14 | nullasque 15 | nullast 16 | nullave 17 | nulli 18 | nulline 19 | nullique 20 | nullis 21 | nullisne 22 | nullisque 23 | nullius 24 | nulliusque 25 | nullo 26 | nullon 27 | nullone 28 | nulloque 29 | nullorum 30 | nullorumque 31 | nullos 32 | nullosne 33 | nullosque 34 | nullum 35 | nullumne 36 | nullumque 37 | nullumst 38 | nullus 39 | nullusne 40 | nullusnest 41 | nullusque 42 | nullust 43 | -------------------------------------------------------------------------------- /data/greek_paradigms/tis.txt: -------------------------------------------------------------------------------- 1 | ἄσσα 2 | ἀσσά 3 | ἀττα 4 | τέ' 5 | τέο 6 | τέωι 7 | τέων 8 | τέῳ 9 | τεο 10 | τεό 11 | τευ 12 | τεύ 13 | τεῦ 14 | τεῶι 15 | τεῶν 16 | τεῷ 17 | τεωι 18 | τεων 19 | τεῳ 20 | τι 21 | τῖνε 22 | τῖς 23 | τῖσιν 24 | τιν' 25 | τινα 26 | τινά 27 | τινάς 28 | τινας 29 | τινε 30 | τινέ 31 | τινές 32 | τινες 33 | τινι 34 | τινί 35 | τινός 36 | τινοῖν 37 | τινοιν 38 | τινος 39 | τινών 40 | τινῶν 41 | τινων 42 | τιπερ 43 | τις 44 | τισι 45 | τισί 46 | τισίν 47 | τισιν 48 | τόυ 49 | του 50 | τού 51 | τώι 52 | τῴ 53 | τῶι 54 | τῷ 55 | τῷπερ 56 | τωι 57 | τωῖ 58 | τῳ 59 | τῷ 60 | -------------------------------------------------------------------------------- /data/greek_paradigms/tosoutos.txt: -------------------------------------------------------------------------------- 1 | τοσαύτα 2 | τοσαύται 3 | τοσαύταις 4 | τοσαύτας 5 | τοσαύτᾳ 6 | τοσαύτη 7 | τοσαύτηι 8 | τοσαύτην 9 | τοσαύτης 10 | τοσαύτῃ 11 | τοσαύτῃσι 12 | τοσαύτων 13 | τοσαῦθ' 14 | τοσαῦτ' 15 | τοσαῦτα 16 | τοσαῦται 17 | τοσαυτασί 18 | τοσούτοις 19 | τοσούτου 20 | τοσούτους 21 | τοσούτω 22 | τοσούτωι 23 | τοσούτων 24 | τοσούτως 25 | τοσούτῳ 26 | τοσοῦθ' 27 | τοσοῦτ' 28 | τοσοῦτα 29 | τοσοῦτο 30 | τοσοῦτοι 31 | τοσοῦτον 32 | τοσοῦτος 33 | τοσουτέων 34 | τοσουτονί 35 | τοσουτουσί 36 | τοσσαύτας 37 | τοσσαῦτ' 38 | τοσσαῦται 39 | τοσσούτους 40 | τοσσοῦτοι 41 | τοσσοῦτον 42 | -------------------------------------------------------------------------------- /data/homer_data/odyssey_lem_1000_not_in_tlg_lem_1000_selection.txt: -------------------------------------------------------------------------------- 1 | # Candidates for Odyssey stopwords from Odyssey lemmatised 2 | # first list 3 | δήν 4 | τί 5 | τοιγάρ 6 | ἆσσον 7 | δηθά 8 | ποθι 9 | ἔντοσθε 10 | πάγχυ 11 | διέκ 12 | ἑκάς 13 | ἐκεῖθι 14 | # list completed 15 | ἀτάρ 16 | ἠδέ 17 | ἐμός 18 | ἑός 19 | σφεῖς 20 | σός 21 | τῷ 22 | τόσος 23 | αὐτοῦ 24 | ὁπότε 25 | τάχα 26 | ἄψ 27 | ἆρα 28 | πῶς 29 | ἠμέν 30 | ἠμί 31 | ὀπίσω 32 | τεός 33 | ὄπισθεν 34 | πρόσθεν 35 | νόσφι 36 | αὐτόθι 37 | ἄλλοτε 38 | ἀμφίς 39 | ἰθύς 40 | παρέξ 41 | ἄντα 42 | ἀπάνευθε 43 | ἐγγύς 44 | εὖτε 45 | ὄσσα 46 | ὁμῶς 47 | -------------------------------------------------------------------------------- /data/greek_paradigms/ho_articles.txt: -------------------------------------------------------------------------------- 1 | αἱ 2 | αἵ 3 | αἵπερ 4 | αἷ 5 | ἡ 6 | ἥ 7 | ἥπερ 8 | ἧ 9 | ἧπερ 10 | ὁ 11 | ὅ 12 | ὁ̄ 13 | οἱ 14 | οἵ 15 | οἵπερ 16 | οἷ 17 | τά 18 | τάπερ 19 | τάς 20 | ταῖν 21 | ταῖς 22 | ταῖσι 23 | ταῖσιν 24 | τέων 25 | τήν 26 | τήνπερ 27 | τῆι 28 | τῆισι 29 | τῆισιν 30 | τῆς 31 | τῇ 32 | τῇπερ 33 | τῇσ' 34 | τῇσι 35 | τῇσιν 36 | τό 37 | τόν 38 | τόπερ 39 | τοῖν 40 | τοῖς 41 | τοῖσ' 42 | τοῖσι 43 | τοῖσιν 44 | τοῖσπερ 45 | τούς 46 | τοῦ 47 | τοῦπερ 48 | τώ 49 | τῶι 50 | τῶν 51 | τῶνπερ 52 | τῷ 53 | τῷπερ 54 | χαἰ 55 | χαἴ 56 | χἡ 57 | χἠ 58 | χἤ 59 | χοἰ 60 | χοἴ 61 | χὡ 62 | χὥ 63 | χὠ 64 | χὤ 65 | -------------------------------------------------------------------------------- /data/greek_paradigms/pas.txt: -------------------------------------------------------------------------------- 1 | πάν 2 | πάνπερ 3 | πάνθ' 4 | πάντ' 5 | πάντα 6 | πάντας 7 | πάντες 8 | πάντεσι 9 | πάντεσσ' 10 | πάντεσσι 11 | πάντεσσιν 12 | πάντοιν 13 | πάντων 14 | πάσα 15 | πάσαι 16 | πάσαις 17 | πάσαισι 18 | πάσαισιν 19 | πάσαν 20 | πάσας 21 | πάσᾳ 22 | πάσηι 23 | πάσηισι 24 | πάσηισιν 25 | πάσης 26 | πάσῃ 27 | πάσῃς 28 | πάσῃσι 29 | πάσῃσιν 30 | πᾶν 31 | πᾶς 32 | πᾶσ' 33 | πᾶσα 34 | πᾶσαι 35 | πᾶσαν 36 | πᾶσι 37 | πᾶσιν 38 | παίσαι 39 | παίσαις 40 | παίσας 41 | παῖς 42 | παῖσα 43 | παῖσαι 44 | παῖσαν 45 | παῖσι 46 | πανθ' 47 | παντ' 48 | παντί 49 | παντός 50 | πασάων 51 | πασᾶν 52 | πασέων 53 | πασῶν 54 | -------------------------------------------------------------------------------- /data/greek_paradigms/emos.txt: -------------------------------------------------------------------------------- 1 | ἔμ' 2 | ἐμ' 3 | ἐμά 4 | ἐμάν 5 | ἐμάς 6 | ἐμᾶι 7 | ἐμᾶν 8 | ἐμᾶς 9 | ἐμᾷ 10 | ἐμαί 11 | ἐμαῖν 12 | ἐμαῖς 13 | ἐμαῖσι 14 | ἐμαῖσιν 15 | ἐμέ 16 | ἐμέων 17 | ἐμή 18 | ἐμήν 19 | ἐμῆι 20 | ἐμῆισι 21 | ἐμῆς 22 | ἐμῇ 23 | ἐμῇς 24 | ἐμῇσι 25 | ἐμῇσιν 26 | ἐμόν 27 | ἐμός 28 | ἐμοί 29 | ἐμοῖν 30 | ἐμοῖο 31 | ἐμοῖς 32 | ἐμοῖσ' 33 | ἐμοῖσι 34 | ἐμοῖσιν 35 | ἐμούς 36 | ἐμοῦ 37 | ἐμώ 38 | ἐμῶ 39 | ἐμῶι 40 | ἐμῶν 41 | ἐμῶς 42 | ἐμῷ 43 | κἄμ' 44 | κἤμ' 45 | κἠμέ 46 | κἠμοί 47 | οὕμ' 48 | οὑμαί 49 | οὑμόν 50 | οὑμός 51 | οὑμοί 52 | τἠμά 53 | τἠμῆι 54 | τἠμῇ 55 | τοὐμέ 56 | τοὐμόν 57 | τοὐμοί 58 | τοὐμοῦ 59 | τοὐμῷ 60 | -------------------------------------------------------------------------------- /data/greek_paradigms/hemos.txt: -------------------------------------------------------------------------------- 1 | 'μ' 2 | 'μά 3 | 'μαί 4 | 'μέ 5 | 'μή 6 | 'μῆι 7 | 'μῆς 8 | 'μῇ 9 | 'μός 10 | 'μοί 11 | 'μοῦ 12 | 'μῷ 13 | ἀμ' 14 | ἀμά 15 | ἀμάς 16 | ἀμᾶν 17 | ἀμέ 18 | ἀμέων 19 | ἀμή 20 | ἀμήν 21 | ἀμῆς 22 | ἀμῇ 23 | ἀμόν 24 | ἀμός 25 | ἀμοῖς 26 | ἀμοῦ 27 | ἀμώς 28 | ἀμῶν 29 | ἀμῶς 30 | ἡμά 31 | ἡμάς 32 | ἡμᾶν 33 | ἡμᾶς 34 | ἡμέ 35 | ἡμέων 36 | ἡμή 37 | ἡμῆς 38 | ἡμῶν 39 | κἀμ' 40 | κἀμά 41 | κἀμάς 42 | κἀμέ 43 | κἀμήν 44 | κἀμῆι 45 | κἀμῆς 46 | κἀμόν 47 | κἀμός 48 | κἀμοί 49 | κἀμοῖς 50 | κἀμούς 51 | κἀμοῦ 52 | κἀμῶν 53 | τἄμ' 54 | τἀμά 55 | τἀμοῦ 56 | τὠμώ 57 | τὠμῶι 58 | τὠμῷ 59 | χἡμᾶς 60 | χἠμᾶς 61 | χἠμῶν 62 | -------------------------------------------------------------------------------- /data/greek_paradigms/toioutos.txt: -------------------------------------------------------------------------------- 1 | τοιαύτα 2 | τοιαύται 3 | τοιαύταις 4 | τοιαύταισι 5 | τοιαύταν 6 | τοιαύτας 7 | τοιαύτᾳ 8 | τοιαύτη 9 | τοιαύτηι 10 | τοιαύτην 11 | τοιαύτης 12 | τοιαύτῃ 13 | τοιαύτῃσι 14 | τοιαύτῃσιν 15 | τοιαύτων 16 | τοιαῦθ' 17 | τοιαῦτ' 18 | τοιαῦτα 19 | τοιαῦται 20 | τοιαυτέων 21 | τοιαυτησί 22 | τοιαυτί 23 | τοιούτοιν 24 | τοιούτοις 25 | τοιούτοισι 26 | τοιούτοισιν 27 | τοιούτου 28 | τοιούτους 29 | τοιούτω 30 | τοιούτωι 31 | τοιούτων 32 | τοιούτως 33 | τοιούτῳ 34 | τοιοῦθ' 35 | τοιοῦτ' 36 | τοιοῦτο 37 | τοιοῦτοι 38 | τοιοῦτον 39 | τοιοῦτος 40 | τοιουτέων 41 | τοιουτονί 42 | τοιουτοσί 43 | τοιουτουσί 44 | -------------------------------------------------------------------------------- /data/latin_paradigms/tantus.txt: -------------------------------------------------------------------------------- 1 | tanta 2 | tantadem 3 | tantae 4 | tantaene 5 | tantaeque 6 | tantam 7 | tantamne 8 | tantamque 9 | tantan 10 | tantandem 11 | tantane 12 | tantaque 13 | tantarum 14 | tantarumque 15 | tantas 16 | tantasque 17 | tantast 18 | tante 19 | tanti 20 | tantidem 21 | tantidemst 22 | tantine 23 | tantique 24 | tantis 25 | tantisque 26 | tantist 27 | tanto 28 | tanton 29 | tantone 30 | tantoque 31 | tantorum 32 | tantorumque 33 | tantos 34 | tantosque 35 | tantove 36 | tantum 37 | tantumdem 38 | tantumdemst 39 | tantumne 40 | tantumque 41 | tantumst 42 | tantundem 43 | tantundemque 44 | tantundemst 45 | tantus 46 | tantusque 47 | -------------------------------------------------------------------------------- /data/latin_paradigms/ille.txt: -------------------------------------------------------------------------------- 1 | illa 2 | illae 3 | illaeque 4 | illam 5 | illamne 6 | illan 7 | illane 8 | illaque 9 | illarum 10 | illas 11 | illasque 12 | illast 13 | illave 14 | ille 15 | illene 16 | illest 17 | illi 18 | illique 19 | illis 20 | illisque 21 | illist 22 | illisue 23 | illiue 24 | illius 25 | illiusque 26 | illiust 27 | illo 28 | illoque 29 | illorum 30 | illos 31 | illosque 32 | illost 33 | illud 34 | illudne 35 | illudque 36 | illum 37 | illumne 38 | illumque 39 | illumst 40 | illumve 41 | olla 42 | ollae 43 | ollam 44 | ollarum 45 | ollas 46 | olle 47 | olli 48 | ollique 49 | ollis 50 | ollisque 51 | ollius 52 | ollo 53 | ollos 54 | ollosque 55 | -------------------------------------------------------------------------------- /data/latin_paradigms/hic.txt: -------------------------------------------------------------------------------- 1 | hac 2 | hacne 3 | hae 4 | haec 5 | haecine 6 | haecinest 7 | haecne 8 | haeque 9 | haeve 10 | han 11 | hanc 12 | hancine 13 | hancne 14 | hancque 15 | hann 16 | harum 17 | harumque 18 | has 19 | hasce 20 | hascine 21 | hasne 22 | hasque 23 | hi 24 | hic 25 | hicine 26 | hicinest 27 | hicne 28 | hin 29 | hine 30 | hinn 31 | hique 32 | his 33 | hisce 34 | hisdem 35 | hisne 36 | hisque 37 | hoc 38 | hocin 39 | hocine 40 | hocinest 41 | hocne 42 | hocque 43 | hon 44 | horum 45 | horumque 46 | horunc 47 | hos 48 | hosce 49 | hosne 50 | hosque 51 | host 52 | huic 53 | huius 54 | huiusce 55 | huiusne 56 | huiusque 57 | huiusve 58 | hum 59 | hunc 60 | huncne 61 | -------------------------------------------------------------------------------- /data/abbreviations/abbreviations_loci.txt: -------------------------------------------------------------------------------- 1 | ant 2 | antec 3 | anteced 4 | antecedent 5 | arg 6 | argum 7 | argument 8 | art 9 | artic 10 | cap 11 | capit 12 | capitul 13 | cet 14 | cit 15 | corp 16 | dist 17 | distin 18 | distinc 19 | distinct 20 | ead 21 | eadem 22 | eiusd 23 | ejusd 24 | eod 25 | etc 26 | fin 27 | ib 28 | ibid 29 | ill 30 | inf 31 | infr 32 | lect 33 | loc 34 | penul 35 | penult 36 | praec 37 | praeced 38 | prolog 39 | prooem 40 | prop 41 | propos 42 | qq 43 | qu 44 | quaest 45 | quaestiunc 46 | quaestiuncul 47 | respons 48 | sc 49 | scil 50 | seq 51 | seqq 52 | solut 53 | sq 54 | sqq 55 | ss 56 | text 57 | ult 58 | ultim 59 | vers 60 | versic 61 | vv 62 | uers 63 | uersic 64 | uu 65 | -------------------------------------------------------------------------------- /data/latin_paradigms/alius.txt: -------------------------------------------------------------------------------- 1 | alia 2 | aliae 3 | aliaeque 4 | aliaest 5 | aliaeue 6 | aliaeve 7 | aliam 8 | aliamne 9 | aliamque 10 | aliamue 11 | aliamve 12 | alian 13 | aliaque 14 | aliarum 15 | aliarumque 16 | aliarumue 17 | alias 18 | aliasque 19 | aliast 20 | aliaue 21 | aliave 22 | alii 23 | aliique 24 | aliis 25 | aliisne 26 | aliisque 27 | aliisue 28 | aliisve 29 | aliiue 30 | alio 31 | alione 32 | alioque 33 | aliorum 34 | aliorumque 35 | aliorumue 36 | aliorumve 37 | alios 38 | aliosque 39 | aliost 40 | aliosve 41 | alioue 42 | aliove 43 | aliud 44 | aliudque 45 | aliudue 46 | aliudve 47 | alium 48 | aliumque 49 | aliumue 50 | aliumve 51 | alius 52 | aliusne 53 | aliusque 54 | aliusue 55 | aliusve 56 | -------------------------------------------------------------------------------- /data/latin_paradigms/plus_plures.txt: -------------------------------------------------------------------------------- 1 | plura 2 | pluraque 3 | pluraue 4 | plurave 5 | plure 6 | plures 7 | pluresne 8 | pluresque 9 | pluresue 10 | pluresve 11 | pluribus 12 | pluribusne 13 | pluribusque 14 | pluribusue 15 | pluribusve 16 | plurima 17 | plurimae 18 | plurimaeque 19 | plurimam 20 | plurimaque 21 | plurimarum 22 | plurimas 23 | plurimasque 24 | plurime 25 | plurimi 26 | plurimique 27 | plurimis 28 | plurimisque 29 | plurimo 30 | plurimoque 31 | plurimorum 32 | plurimos 33 | plurimosque 34 | plurimum 35 | plurimumque 36 | plurimumst 37 | plurimus 38 | plurimusque 39 | pluris 40 | plurisne 41 | plurisque 42 | plurisue 43 | plurium 44 | pluriumue 45 | pluriumve 46 | plus 47 | plusne 48 | plusque 49 | plusve 50 | -------------------------------------------------------------------------------- /data/greek_paradigms/amphoteros.txt: -------------------------------------------------------------------------------- 1 | ἀμφότερ' 2 | ἀμφότεροι 3 | ἀμφότερον 4 | ἀμφότερος 5 | ἀμφοτέροιιν 6 | ἀμφοτέροιν 7 | ἀμφοτέροιο 8 | ἀμφοτέροις 9 | ἀμφοτέροισ' 10 | ἀμφοτέροισι 11 | ἀμφοτέροισιν 12 | ἀμφοτέρου 13 | ἀμφοτέρους 14 | ἀμφοτέρω 15 | ἀμφοτέρωι 16 | ἀμφοτέρων 17 | ἀμφοτέρως 18 | ἀμφοτέρῳ 19 | ἁμφότερα 20 | ἁμφοτέροις 21 | ἁμφοτέρων 22 | ἀμφότερα 23 | ἀμφότεραι 24 | ἀμφότερᾳ 25 | ἀμφοτέρα 26 | ἀμφοτέραι 27 | ἀμφοτέραιν 28 | ἀμφοτέραις 29 | ἀμφοτέραισι 30 | ἀμφοτέραισιν 31 | ἀμφοτέραν 32 | ἀμφοτέρας 33 | ἀμφοτέρᾳ 34 | ἀμφοτέρη 35 | ἀμφοτέρηι 36 | ἀμφοτέρην 37 | ἀμφοτέρης 38 | ἀμφοτέρῃ 39 | ἀμφοτέρῃς 40 | ἀμφοτέρῃσ' 41 | ἀμφοτέρῃσι 42 | ἀμφοτέρῃσιν 43 | ἀμφοτεράων 44 | ἀμφοτερᾶν 45 | ἀμφοτερέων 46 | κἀμφότερον 47 | τἀμφότερα 48 | -------------------------------------------------------------------------------- /data/greek_paradigms/ego.txt: -------------------------------------------------------------------------------- 1 | 'γώ 2 | 'γών 3 | 'γωγ' 4 | 'γωγε 5 | 'μ' 6 | 'μέ 7 | 'μοί 8 | 'μοιγ' 9 | 'μοιγε 10 | 'μοῦ 11 | ἅγωγ' 12 | ἁγώ 13 | ἁγών 14 | ἔγωγ' 15 | ἔγωγε 16 | ἔμ' 17 | ἔμεγ' 18 | ἔμεγε 19 | ἔμοιγ' 20 | ἔμοιγε 21 | ἐγώ 22 | ἐγών 23 | ἐγώπερ 24 | ἐμ' 25 | ἐμέ 26 | ἐμέο 27 | ἐμέθεν 28 | ἐμεῖ' 29 | ἐμεῖο 30 | ἐμεῦ 31 | ἐμίν 32 | ἐμοί 33 | ἐμοῦ 34 | κἄγωγ' 35 | κἄγωγε 36 | κἄμ' 37 | κἄμοιγ' 38 | κἄμοιγε 39 | κἀγώ 40 | κἀγών 41 | κἀμ' 42 | κἀμέ 43 | κἀμοί 44 | κἀμοῦ 45 | κἤμ' 46 | κἠγώ 47 | κἠγών 48 | κἠμέ 49 | κἠμοί 50 | μ' 51 | με 52 | με' 53 | μέ 54 | μέο 55 | μεο 56 | μεό 57 | μευ 58 | μεύ 59 | μεῦ 60 | μοι 61 | μοί 62 | μοῖ 63 | μου 64 | μού 65 | μοῦ 66 | οὕμ' 67 | οὑγώ 68 | οὑμοί 69 | σοὐγώ 70 | τἄμ' 71 | τἀμοῦ 72 | τοὐμέ 73 | τοὐμοί 74 | τοὐμοῦ 75 | -------------------------------------------------------------------------------- /data/latin_paradigms/is.txt: -------------------------------------------------------------------------------- 1 | ea 2 | eae 3 | eaeque 4 | eam 5 | eamdem 6 | eamne 7 | eamque 8 | eamue 9 | ean 10 | eane 11 | eanest 12 | eaque 13 | earum 14 | earumne 15 | earumque 16 | earumue 17 | earumve 18 | eas 19 | easque 20 | east 21 | easue 22 | eaue 23 | eave 24 | ei 25 | ein 26 | eine 27 | eique 28 | eis 29 | eisne 30 | eisque 31 | eiue 32 | eius 33 | eiusque 34 | eiust 35 | eiusue 36 | eive 37 | eo 38 | eoque 39 | eorum 40 | eorumdem 41 | eorumne 42 | eorumque 43 | eorumue 44 | eorumve 45 | eos 46 | eosne 47 | eosque 48 | eost 49 | eosue 50 | eoue 51 | eum 52 | eumdem 53 | eumne 54 | eumque 55 | eumue 56 | eumve 57 | id 58 | idne 59 | idnest 60 | idque 61 | idue 62 | ii 63 | iidem 64 | iidemque 65 | iique 66 | iis 67 | iisne 68 | iisque 69 | iisue 70 | is 71 | isne 72 | isque 73 | -------------------------------------------------------------------------------- /data/abbreviations/index_thomisticus_abbreviations_loci.txt: -------------------------------------------------------------------------------- 1 | ant. 2 | antec. 3 | anteced. 4 | antecedent. 5 | arg. 6 | argum. 7 | argument. 8 | art. 9 | artic. 10 | b. 11 | c. 12 | cap. 13 | capit. 14 | capitul. 15 | cet. 16 | cit. 17 | corp. 18 | dist. 19 | distin. 20 | distinc. 21 | distinct. 22 | e. 23 | ead. 24 | eadem. 25 | ejusd. 26 | eod. 27 | etc. 28 | fin. 29 | i. 30 | ib. 31 | ibid. 32 | ill. 33 | in. 34 | inf. 35 | infr. 36 | l. 37 | lect. 38 | loc. 39 | n. 40 | penul. 41 | penult. 42 | praec. 43 | praeced. 44 | prolog. 45 | prooem. 46 | prop. 47 | propos. 48 | q. 49 | qq. 50 | qu. 51 | quaest. 52 | quaestiunc. 53 | quaestiuncul. 54 | respons. 55 | s. 56 | sc. 57 | scil. 58 | seq. 59 | seqq. 60 | solut. 61 | sq. 62 | sqq. 63 | ss. 64 | text. 65 | ult. 66 | ultim. 67 | v. 68 | vers. 69 | versic. 70 | vv. 71 | -------------------------------------------------------------------------------- /data/abbreviations/abbreviations_critical_apparatus.txt: -------------------------------------------------------------------------------- 1 | abiud 2 | add 3 | al 4 | ca 5 | cett 6 | cf 7 | ci 8 | cj 9 | cl 10 | cod 11 | codd 12 | coll 13 | coni 14 | conj 15 | cont 16 | corr 17 | damn 18 | def 19 | del 20 | dett 21 | dist 22 | dub 23 | ed 24 | edd 25 | em 26 | exp 27 | fin 28 | fort 29 | fr 30 | gl 31 | gr 32 | indic 33 | inf 34 | init 35 | inscr 36 | interl 37 | lect 38 | lit 39 | ll 40 | loc 41 | marg 42 | mg 43 | ms 44 | mss 45 | mut 46 | om 47 | pap 48 | papp 49 | pler 50 | plur 51 | pot 52 | pr 53 | prob 54 | qu 55 | ras 56 | recc 57 | rell 58 | sc 59 | schol 60 | scholl 61 | secl 62 | sim 63 | sq 64 | subscr 65 | sup 66 | suppl 67 | susp 68 | tent 69 | trai 70 | transp 71 | transt 72 | trib 73 | ud 74 | uett 75 | uid 76 | uit 77 | uu 78 | uulg 79 | vd 80 | vett 81 | vid 82 | vit 83 | vulg 84 | vv 85 | γρ 86 | -------------------------------------------------------------------------------- /data/greek_paradigms/polus.txt: -------------------------------------------------------------------------------- 1 | πόλεας 2 | πόλεες 3 | πόλεις 4 | πόλεσι 5 | πόλεσιν 6 | πόλεσσι 7 | πόλεσσιν 8 | πόλεων 9 | πόλλ' 10 | πολέα 11 | πολέας 12 | πολέες 13 | πολέεσσ' 14 | πολέεσσι 15 | πολέεσσιν 16 | πολέος 17 | πολέσι 18 | πολέσιν 19 | πολέσσ' 20 | πολέσσιν 21 | πολέων 22 | πολλ' 23 | πολλά 24 | πολλάν 25 | πολλάς 26 | πολλάων 27 | πολλᾶι 28 | πολλᾶν 29 | πολλᾶς 30 | πολλᾷ 31 | πολλαί 32 | πολλαῖς 33 | πολλαῖσι 34 | πολλαῖσιν 35 | πολλέ 36 | πολλέων 37 | πολλή 38 | πολλήν 39 | πολλῆι 40 | πολλῆισιν 41 | πολλῆς 42 | πολλῇ 43 | πολλῇς 44 | πολλῇσι 45 | πολλῇσιν 46 | πολλόν 47 | πολλός 48 | πολλότατα 49 | πολλοί 50 | πολλοῖς 51 | πολλοῖσ' 52 | πολλοῖσι 53 | πολλοῖσιν 54 | πολλούς 55 | πολλοῦ 56 | πολλώ 57 | πολλώς 58 | πολλῶ 59 | πολλῶι 60 | πολλῶν 61 | πολλῷ 62 | πολύ 63 | πολύν 64 | πολύς 65 | πουλύ 66 | πουλύν 67 | πουλύς 68 | -------------------------------------------------------------------------------- /data/greek_paradigms/hosos.txt: -------------------------------------------------------------------------------- 1 | ὅσ' 2 | ὅσα 3 | ὅσαι 4 | ὅσαιπερ 5 | ὅσαις 6 | ὅσαισι 7 | ὅσαισιν 8 | ὅσαν 9 | ὅσαπερ 10 | ὅσας 11 | ὅσασπερ 12 | ὅση 13 | ὅσηι 14 | ὅσην 15 | ὅσηνπερ 16 | ὅσηπερ 17 | ὅσης 18 | ὅσησπερ 19 | ὅσῃ 20 | ὅσῃπερ 21 | ὅσῃσι 22 | ὅσῃσιν 23 | ὅσοι 24 | ὅσοιπερ 25 | ὅσοις 26 | ὅσοισι 27 | ὅσοισιν 28 | ὅσοισπερ 29 | ὅσον 30 | ὅσονπερ 31 | ὅσος 32 | ὅσοσπερ 33 | ὅσου 34 | ὅσουπερ 35 | ὅσους 36 | ὅσουσπερ 37 | ὅσσ' 38 | ὅσσα 39 | ὅσσαι 40 | ὅσσαις 41 | ὅσσαν 42 | ὅσσαπερ 43 | ὅσσας 44 | ὅσσᾳ 45 | ὅσσε 46 | ὅσση 47 | ὅσσην 48 | ὅσσης 49 | ὅσσοι 50 | ὅσσοις 51 | ὅσσοισι 52 | ὅσσοισιν 53 | ὅσσον 54 | ὅσσος 55 | ὅσσου 56 | ὅσσους 57 | ὅσσωι 58 | ὅσσων 59 | ὅσσῳ 60 | ὅσω 61 | ὅσωι 62 | ὅσωιπερ 63 | ὅσων 64 | ὅσωνπερ 65 | ὅσωπερ 66 | ὅσως 67 | ὅσῳ 68 | ὅσῳπερ 69 | ὅττ' 70 | ὅτταν 71 | ὁσέων 72 | ὁσονού 73 | χὤσοι 74 | χὤσον 75 | χὤσσους 76 | -------------------------------------------------------------------------------- /data/greek_paradigms/allos.txt: -------------------------------------------------------------------------------- 1 | ἅλλα 2 | ἅλλαι 3 | ἅλλοι 4 | ἅλλος 5 | ἅλλους 6 | ἅλλω 7 | ἅλλων 8 | ἇλλοι 9 | ἄλλ' 10 | ἄλλα 11 | ἄλλαι 12 | ἄλλαιν 13 | ἄλλαις 14 | ἄλλαισι 15 | ἄλλαισιν 16 | ἄλλαν 17 | ἄλλας 18 | ἄλλᾳ 19 | ἄλλε 20 | ἄλλη 21 | ἄλληι 22 | ἄλλην 23 | ἄλλης 24 | ἄλλῃ 25 | ἄλλῃσι 26 | ἄλλῃσιν 27 | ἄλλο 28 | ἄλλοι 29 | ἄλλοιν 30 | ἄλλοις 31 | ἄλλοισ' 32 | ἄλλοισι 33 | ἄλλοισιν 34 | ἄλλον 35 | ἄλλος 36 | ἄλλου 37 | ἄλλους 38 | ἄλλω 39 | ἄλλωι 40 | ἄλλων 41 | ἄλλως 42 | ἄλλῳ 43 | ἀλλάων 44 | ἀλλᾶν 45 | ἀλλέων 46 | δἄλλως 47 | κἄλλ' 48 | κἄλλα 49 | κἄλλαι 50 | κἄλλαν 51 | κἄλλην 52 | κἄλλῃ 53 | κἄλλο 54 | κἄλλοι 55 | κἄλλοις 56 | κἄλλοισιν 57 | κἄλλος 58 | κἄλλους 59 | κἄλλων 60 | κἄλλως 61 | κἄλλῳ 62 | κἆλλ' 63 | κἆλλαι 64 | κἆλλοι 65 | μἄλλην 66 | τἄλλ' 67 | τἄλλα 68 | τἄλλαι 69 | τἄλλο 70 | τἆλλ' 71 | τἆλλα 72 | ὧλλοι 73 | ὤλλοι 74 | ὦλλοι 75 | ὦλλος 76 | -------------------------------------------------------------------------------- /data/greek_paradigms/heautou.txt: -------------------------------------------------------------------------------- 1 | αὕθ' 2 | αὕτ' 3 | αὑτά 4 | αὑτάν 5 | αὑτάς 6 | αὑτᾶς 7 | αὑτᾷ 8 | αὑταῖς 9 | αὑτήν 10 | αὑτῆι 11 | αὑτῆς 12 | αὑτῇ 13 | αὑτό 14 | αὑτόν 15 | αὑτοῖν 16 | αὑτοῖς 17 | αὑτοῖσι 18 | αὑτοῖσιν 19 | αὑτός 20 | αὑτούς 21 | αὑτοῦ 22 | αὑτώς 23 | αὑτῶ 24 | αὑτῶι 25 | αὑτῶν 26 | αὑτῷ 27 | ἑαυτά 28 | ἑαυτάν 29 | ἑαυτάς 30 | ἑαυτᾶς 31 | ἑαυτᾷ 32 | ἑαυταῖς 33 | ἑαυτέων 34 | ἑαυτήν 35 | ἑαυτῆι 36 | ἑαυτῆς 37 | ἑαυτῇ 38 | ἑαυτό 39 | ἑαυτόν 40 | ἑαυτοῖν 41 | ἑαυτοῖς 42 | ἑαυτοῖσι 43 | ἑαυτοῖσιν 44 | ἑαυτούς 45 | ἑαυτοῦ 46 | ἑαυτώ 47 | ἑαυτῶ 48 | ἑαυτῶι 49 | ἑαυτῶν 50 | ἑαυτῷ 51 | ἑωυτά 52 | ἑωυτάς 53 | ἑωυταῖς 54 | ἑωυταῖσι 55 | ἑωυτέων 56 | ἑωυτήν 57 | ἑωυτῆς 58 | ἑωυτῇ 59 | ἑωυτῇσι 60 | ἑωυτῇσιν 61 | ἑωυτό 62 | ἑωυτόν 63 | ἑωυτοῖς 64 | ἑωυτοῖσι 65 | ἑωυτοῖσιν 66 | ἑωυτούς 67 | ἑωυτοῦ 68 | ἑωυτῶι 69 | ἑωυτῶν 70 | ἑωυτῷ 71 | χαὐτόν 72 | χαὐτοῦ 73 | -------------------------------------------------------------------------------- /data/greek_paradigms/hemeteros.txt: -------------------------------------------------------------------------------- 1 | ἁμέτερα 2 | ἁμέτεροι 3 | ἁμέτερον 4 | ἁμέτερος 5 | ἁμετέρα 6 | ἁμετέραι 7 | ἁμετέραις 8 | ἁμετέραισι 9 | ἁμετέραισιν 10 | ἁμετέραν 11 | ἁμετέρας 12 | ἁμετέρᾳ 13 | ἁμετέροις 14 | ἁμετέροισι 15 | ἁμετέροισιν 16 | ἁμετέρου 17 | ἁμετέρων 18 | ἡμέτερ' 19 | ἡμέτερα 20 | ἡμέτεραι 21 | ἡμέτερε 22 | ἡμέτεροι 23 | ἡμέτερον 24 | ἡμέτερονδ' 25 | ἡμέτερονδε 26 | ἡμέτερος 27 | ἡμετέρα 28 | ἡμετέραι 29 | ἡμετέραιν 30 | ἡμετέραις 31 | ἡμετέραισι 32 | ἡμετέραν 33 | ἡμετέρας 34 | ἡμετέρᾳ 35 | ἡμετέρη 36 | ἡμετέρηισι 37 | ἡμετέρηισιν 38 | ἡμετέρην 39 | ἡμετέρης 40 | ἡμετέρῃ 41 | ἡμετέρῃς 42 | ἡμετέρῃσι 43 | ἡμετέρῃσιν 44 | ἡμετέροιν 45 | ἡμετέροιο 46 | ἡμετέροις 47 | ἡμετέροισ' 48 | ἡμετέροισι 49 | ἡμετέροισιν 50 | ἡμετέρου 51 | ἡμετέρους 52 | ἡμετέρω 53 | ἡμετέρωι 54 | ἡμετέρων 55 | ἡμετέρως 56 | ἡμετέρῳ 57 | ἡμετεράων 58 | θἠμέτερον 59 | θἠμετέρου 60 | χἠμετέρης 61 | -------------------------------------------------------------------------------- /data/latin_paradigms/quantus.txt: -------------------------------------------------------------------------------- 1 | quanta 2 | quantacumque 3 | quantacunque 4 | quantae 5 | quantaecumque 6 | quantaelibet 7 | quantaeque 8 | quantaeuis 9 | quantalibet 10 | quantam 11 | quantamcumque 12 | quantamque 13 | quantane 14 | quantaque 15 | quantarum 16 | quantas 17 | quantaslibet 18 | quantasque 19 | quantasve 20 | quantasvis 21 | quantave 22 | quantavis 23 | quanti 24 | quanticumque 25 | quantilibet 26 | quantine 27 | quantique 28 | quantis 29 | quantiscumque 30 | quantislibet 31 | quantisque 32 | quantist 33 | quantivis 34 | quanto 35 | quantocumque 36 | quantolibet 37 | quantoque 38 | quantorum 39 | quantos 40 | quantosne 41 | quantosque 42 | quantoue 43 | quantouis 44 | quantove 45 | quantovis 46 | quantum 47 | quantumcumque 48 | quantumlibet 49 | quantumque 50 | quantumst 51 | quantumue 52 | quantumuis 53 | quantumvis 54 | quantus 55 | quantuscumque 56 | quantusne 57 | quantusque 58 | -------------------------------------------------------------------------------- /data/homer_data/iliad_lem_1000_not_in_tlg_lem_1000_selection.txt: -------------------------------------------------------------------------------- 1 | # Candidates for Iliad stopwords from Iliad lemmatised 2 | ἀτάρ 3 | μιν 4 | ἠδέ 5 | αὖτε 6 | ἦ 7 | ὄφρα 8 | ἑός 9 | σφεῖς 10 | ἐμός 11 | σός 12 | ἄψ 13 | πρόσθεν 14 | τόσος 15 | πω 16 | τῷ 17 | αἶψα 18 | ἠμί 19 | ἐνθάδε 20 | πάρος 21 | ὅθι 22 | τάχα 23 | τοῖος 24 | ἆρα 25 | ὁπότε 26 | ὦκα 27 | ὄπισθεν 28 | αὖθι 29 | αὐτοῦ 30 | ἠέ 31 | ἡμέτερος 32 | ἰθύς 33 | αὔτως 34 | τόφρα 35 | δεῦρο 36 | οὕνεκα 37 | ἀπάνευθε 38 | προπάροιθε 39 | κεῖνος 40 | εἴσω 41 | ἄγχι 42 | ἄλλοτε 43 | ἐγγύθεν 44 | ἠμέν 45 | ἠύτε 46 | νόσφι 47 | ὀπίσω 48 | ἄντα 49 | ἑτέρωθεν 50 | μήν 51 | τῇ 52 | ἀμφίς 53 | ἀντικρύ 54 | πάντῃ 55 | πῶς 56 | οὔτι 57 | πάντοσε 58 | χαμᾶζε 59 | οἴκαδε 60 | πάμπαν 61 | αὐτόθι 62 | εἷος 63 | ὄσσα 64 | χαμαί 65 | ἄφαρ 66 | μετόπισθε 67 | τεός 68 | ἄνευθε 69 | ἔμπας 70 | τῆλε 71 | ὑπόδρα 72 | ἅλις 73 | ἐπήν 74 | εὖτε 75 | ᾗ 76 | ὁμῶς 77 | πάροιθε 78 | πρόσω 79 | ῥίμφα 80 | -------------------------------------------------------------------------------- /test/voyant_test_files/voyant_test_grc_oxia.txt: -------------------------------------------------------------------------------- 1 | Τί τηνικάδε ἀφῖξαι, ὦ Κρίτων; Ἢ οὐ πρῲ ἔτι ἐστίν; Πάνυ μὲν οὖν. Πηνίκα μάλιστα; Ὄρθρος βαθύς. Θαυμάζω ὅπως ἠθέλησέ σοι ὁ τοῦ δεσμωτηρίου φύλαξ ὑπακοῦσαι. Συνήθης ἤδη μοί ἐστιν, ὦ Σώκρατες, διὰ τὸ πολλάκις δεῦρο φοιτᾶν, καί τι καὶ εὐεργέτηται ὑπʼ ἐμοῦ. Ἄρτι δὲ ἥκεις ἢ πάλαι; Ἐπιεικῶς πάλαι. Εἶτα πῶς οὐκ εὐθὺς ἐπήγειράς με, ἀλλὰ σιγῇ παρα κάθησαι; Οὐ μὰ τὸν Δία, ὦ Σώκρατες, οὐδʼ ἂν αὐτὸς ἤθελον ἐν τοσαύτῃ τε ἀγρυπνίᾳ καὶ λύπῃ εἶναι, ἀλλὰ καὶ σοῦ πάλαι θαυμάζω αἰσθανόμενος ὡς ἡδέως καθεύδεις· καὶ ἐπίτηδές σε οὐκ ἤγειρον ἵνα ὡς ἥδιστα διάγῃς. Καὶ πολλάκις μὲν δή σε καὶ πρότερον ἐν παντὶ τῷ βίῳ ηὐδαιμόνισα τοῦ τρόπου, πολὺ δὲ μάλιστα ἐν τῇ νῦν παρεστώσῃ συμφορᾷ, ὡς ῥᾳδίως αὐτὴν καὶ πρᾴως φέρεις. Καὶ γὰρ ἄν, ὦ Κρίτων, πλημμελὲς εἴη ἀγανακτεῖν τηλικοῦτον ὄντα εἰ δεῖ ἤδη τελευτᾶν. ὄρθρος ὄρθρος ὄρθρος ὄρθρος ὄρθρος ὄρθροσ ὄρθροσ ὄρθροσ ὄρθροσ ὄρθροσ ὄρθροϲ ὄρθροϲ ὄρθροϲ ὄρθροϲ ὄρθροϲ ὌΡΘΡΟΣ ὌΡΘΡΟΣ ὌΡΘΡΟΣ ὌΡΘΡΟΣ 2 | -------------------------------------------------------------------------------- /test/voyant_test_files/voyant_test_grc_tonos_nfc.txt: -------------------------------------------------------------------------------- 1 | Τί τηνικάδε ἀφῖξαι, ὦ Κρίτων; Ἢ οὐ πρῲ ἔτι ἐστίν; Πάνυ μὲν οὖν. Πηνίκα μάλιστα; Ὄρθρος βαθύς. Θαυμάζω ὅπως ἠθέλησέ σοι ὁ τοῦ δεσμωτηρίου φύλαξ ὑπακοῦσαι. Συνήθης ἤδη μοί ἐστιν, ὦ Σώκρατες, διὰ τὸ πολλάκις δεῦρο φοιτᾶν, καί τι καὶ εὐεργέτηται ὑπʼ ἐμοῦ. Ἄρτι δὲ ἥκεις ἢ πάλαι; Ἐπιεικῶς πάλαι. Εἶτα πῶς οὐκ εὐθὺς ἐπήγειράς με, ἀλλὰ σιγῇ παρα κάθησαι; Οὐ μὰ τὸν Δία, ὦ Σώκρατες, οὐδʼ ἂν αὐτὸς ἤθελον ἐν τοσαύτῃ τε ἀγρυπνίᾳ καὶ λύπῃ εἶναι, ἀλλὰ καὶ σοῦ πάλαι θαυμάζω αἰσθανόμενος ὡς ἡδέως καθεύδεις· καὶ ἐπίτηδές σε οὐκ ἤγειρον ἵνα ὡς ἥδιστα διάγῃς. Καὶ πολλάκις μὲν δή σε καὶ πρότερον ἐν παντὶ τῷ βίῳ ηὐδαιμόνισα τοῦ τρόπου, πολὺ δὲ μάλιστα ἐν τῇ νῦν παρεστώσῃ συμφορᾷ, ὡς ῥᾳδίως αὐτὴν καὶ πρᾴως φέρεις. Καὶ γὰρ ἄν, ὦ Κρίτων, πλημμελὲς εἴη ἀγανακτεῖν τηλικοῦτον ὄντα εἰ δεῖ ἤδη τελευτᾶν. ὄρθρος ὄρθρος ὄρθρος ὄρθρος ὄρθρος ὄρθροσ ὄρθροσ ὄρθροσ ὄρθροσ ὄρθροσ ὄρθροϲ ὄρθροϲ ὄρθροϲ ὄρθροϲ ὄρθροϲ ὌΡΘΡΟΣ ὌΡΘΡΟΣ ὌΡΘΡΟΣ ὌΡΘΡΟΣ 2 | -------------------------------------------------------------------------------- /test/voyant_test_files/voyant_test_el_split.txt: -------------------------------------------------------------------------------- 1 | Στο 2 | πρώτο 3 | μέρος 4 | του 5 | διαλόγου 6 | αυτού 7 | συζητούν 8 | ο 9 | Σωκράτης 10 | και 11 | ο 12 | Γοργίας 13 | και 14 | επιχειρούν 15 | να 16 | προσδιορίσουν 17 | επακριβώς 18 | τη 19 | φύση 20 | και 21 | τη 22 | σωστή 23 | χρήση 24 | της 25 | ρητορικής 26 | τέχνης. 27 | Αρχικά 28 | ο 29 | Γοργίας 30 | όρισε 31 | την 32 | αρετή 33 | ως 34 | την 35 | κατ' 36 | εξοχήν 37 | τέχνη 38 | του 39 | λόγου 40 | και 41 | στη 42 | συνέχεια 43 | ως 44 | πειθοῦς 45 | δημιουργόν. 46 | Ο 47 | Σωκράτης 48 | παρατήρησε 49 | ότι 50 | ο 51 | ρήτορας 52 | απλώς 53 | πείθει, 54 | δεν 55 | διδάσκει, 56 | και 57 | ότι 58 | για 59 | την 60 | εκλογή 61 | ειδικών 62 | τεχνιτών, 63 | επιστημόνων 64 | ή 65 | στρατηγών 66 | ή 67 | για 68 | τα 69 | πιο 70 | εξειδικευμένα 71 | θέματα, 72 | όπως 73 | η 74 | ιατρική, 75 | η 76 | ναυπηγική 77 | και 78 | ο 79 | πόλεμος, 80 | αρμόδιοι 81 | να 82 | συμβουλεύσουν 83 | δεν 84 | είναι 85 | οι 86 | ρήτορες 87 | αλλά 88 | οι 89 | ειδικοί. 90 | -------------------------------------------------------------------------------- /data/greek_paradigms/heteros.txt: -------------------------------------------------------------------------------- 1 | ἕτερ' 2 | ἕτερα 3 | ἕτεραι 4 | ἕτεροι 5 | ἕτερον 6 | ἕτερος 7 | ἑτέρα 8 | ἑτέραι 9 | ἑτέραις 10 | ἑτέραισι 11 | ἑτέραν 12 | ἑτέρας 13 | ἑτέρᾳ 14 | ἑτέρη 15 | ἑτέρηφι 16 | ἑτέρηι 17 | ἑτέρηισι 18 | ἑτέρηισιν 19 | ἑτέρην 20 | ἑτέρης 21 | ἑτέρῃ 22 | ἑτέρῃφι 23 | ἑτέρῃσι 24 | ἑτέρῃσιν 25 | ἑτέροιν 26 | ἑτέροιο 27 | ἑτέροις 28 | ἑτέροισι 29 | ἑτέροισιν 30 | ἑτέρου 31 | ἑτέρους 32 | ἑτέρω 33 | ἑτέρωι 34 | ἑτέρων 35 | ἑτέρως 36 | ἑτέρῳ 37 | ἑτερέων 38 | οὕτεροι 39 | οὕτερον 40 | οὕτερος 41 | θάτερ' 42 | θάτερα 43 | θάτεραι 44 | θάτεροι 45 | θάτερον 46 | θάτερος 47 | θατέρα 48 | θατέραι 49 | θατέραις 50 | θατέραν 51 | θατέρας 52 | θατέρᾳ 53 | θατέροιν 54 | θατέροιο 55 | θατέροις 56 | θατέρου 57 | θατέρους 58 | θατέρω 59 | θατέρωι 60 | θατέρων 61 | θατέρῳ 62 | θοὔτερον 63 | τοὔτερον 64 | τοὐτέρου 65 | χἄτερ' 66 | χἄτερα 67 | χἄτεραι 68 | χἄτεροι 69 | χἄτερον 70 | χἄτερος 71 | χἀτέραις 72 | χἀτέραν 73 | χἀτέρας 74 | χἀτέρᾳ 75 | χἀτέροις 76 | χἀτέρους 77 | χἀτέρωι 78 | χἀτέρων 79 | χἀτέρῳ 80 | -------------------------------------------------------------------------------- /data/greek_paradigms/houtos.txt: -------------------------------------------------------------------------------- 1 | αὕτη 2 | αὗθ' 3 | αὗται 4 | αὑταιί 5 | αὑτηγί 6 | αὑτηί 7 | κατταύταν 8 | οὗτοι 9 | οὗτος 10 | οὑτοιί 11 | οὑτοσί 12 | οὑτοσίν 13 | ταύθ' 14 | ταύτ' 15 | ταύτα 16 | ταύται 17 | ταύταιν 18 | ταύταις 19 | ταύταισι 20 | ταύταισιν 21 | ταύταν 22 | ταύτας 23 | ταύτᾳ 24 | ταύτηι 25 | ταύτηις 26 | ταύτην 27 | ταύτης 28 | ταύτῃ 29 | ταύτῃσι 30 | ταύτῃσιν 31 | ταῦθ' 32 | ταῦτ' 33 | ταῦτα 34 | ταυτ' 35 | ταυτᾶν 36 | ταυταγί 37 | ταυταί 38 | ταυταισί 39 | ταυτασί 40 | ταυτηνδί 41 | ταυτηνί 42 | ταυτησί 43 | ταυτησίν 44 | ταυτῃί 45 | ταυτί 46 | τούθ' 47 | τούτ' 48 | τούτοιν 49 | τούτοις 50 | τούτοισ' 51 | τούτοισι 52 | τούτοισιν 53 | τούτου 54 | τούτους 55 | τούτω 56 | τούτωι 57 | τούτων 58 | τούτως 59 | τούτῳ 60 | τοῦθ' 61 | τοῦτ' 62 | τοῦτο 63 | τοῦτον 64 | τουθ' 65 | τουτ' 66 | τουτέων 67 | τουτί 68 | τουτογί 69 | τουτοισί 70 | τουτοισίν 71 | τουτονί 72 | τουτουί 73 | τουτουσί 74 | τουτουσίν 75 | τουτωί 76 | τουτωνί 77 | τουτῳί 78 | χαὔτη 79 | χαὖται 80 | χαὐτηί 81 | χοὖτοι 82 | χοὖτος 83 | χοὐτοσί 84 | -------------------------------------------------------------------------------- /data/greek_paradigms/enantios.txt: -------------------------------------------------------------------------------- 1 | ἐναντί' 2 | ἐναντία 3 | ἐναντίαι 4 | ἐναντίαιν 5 | ἐναντίαις 6 | ἐναντίαν 7 | ἐναντίας 8 | ἐναντίᾳ 9 | ἐναντίη 10 | ἐναντίην 11 | ἐναντίης 12 | ἐναντίῃ 13 | ἐναντίῃσι 14 | ἐναντίῃσιν 15 | ἐναντίοι 16 | ἐναντίοιν 17 | ἐναντίοις 18 | ἐναντίοισι 19 | ἐναντίοισιν 20 | ἐναντίον 21 | ἐναντίος 22 | ἐναντίου 23 | ἐναντίους 24 | ἐναντίω 25 | ἐναντίωι 26 | ἐναντίων 27 | ἐναντίως 28 | ἐναντίῳ 29 | ἐναντιώτατα 30 | ἐναντιώταται 31 | ἐναντιώτατοι 32 | ἐναντιώτατον 33 | ἐναντιώτατος 34 | ἐναντιώτερα 35 | ἐναντιώτεραι 36 | ἐναντιώτερον 37 | ἐναντιώτερος 38 | ἐναντιωτάταις 39 | ἐναντιωτάτας 40 | ἐναντιωτάτη 41 | ἐναντιωτάτηι 42 | ἐναντιωτάτην 43 | ἐναντιωτάτης 44 | ἐναντιωτάτῃ 45 | ἐναντιωτάτοιν 46 | ἐναντιωτάτοις 47 | ἐναντιωτάτοισι 48 | ἐναντιωτάτου 49 | ἐναντιωτάτους 50 | ἐναντιωτάτω 51 | ἐναντιωτάτων 52 | ἐναντιωτάτῳ 53 | ἐναντιωτέρα 54 | ἐναντιωτέραν 55 | ἐναντιωτέρῳ 56 | οὑναντίος 57 | τἀναντί' 58 | τἀναντία 59 | τἀναντίᾳ 60 | τἀναντιώταθ' 61 | τἀναντιώτατα 62 | τοὐναντία 63 | τοὐναντίον 64 | τοὐναντίου 65 | -------------------------------------------------------------------------------- /data/tlg_data/tlg_top_100.txt: -------------------------------------------------------------------------------- 1 | καὶ 2 | δὲ 3 | τὸ 4 | τοῦ 5 | τῶν 6 | τὴν 7 | τῆς 8 | ὁ 9 | ἐν 10 | γὰρ 11 | τὸν 12 | τὰ 13 | μὲν 14 | ἡ 15 | τῷ 16 | ὡς 17 | εἰς 18 | πρὸς 19 | τοῖς 20 | ἢ 21 | τε 22 | ὅτι 23 | ἐπὶ 24 | διὰ 25 | κατὰ 26 | μὴ 27 | τοὺς 28 | οἱ 29 | οὐ 30 | τῇ 31 | δ 32 | οὐκ 33 | περὶ 34 | εἰ 35 | ἐκ 36 | τὰς 37 | τοῦτο 38 | αὐτοῦ 39 | ἀπὸ 40 | ἀλλὰ 41 | οὖν 42 | ἀλλ 43 | εἶναι 44 | ἂν 45 | παρὰ 46 | ταῦτα 47 | μετὰ 48 | αὐτῶν 49 | ὑπὸ 50 | αὐτὸν 51 | αὐτῷ 52 | τι 53 | ἦν 54 | ἐστιν 55 | ἐξ 56 | τις 57 | ἐστι 58 | οὕτως 59 | δέ 60 | τί 61 | οὐδὲ 62 | ταῖς 63 | αἱ 64 | δὴ 65 | θεοῦ 66 | πάντα 67 | τούτων 68 | οὕτω 69 | δι 70 | ἵνα 71 | ὥσπερ 72 | αὐτοῖς 73 | πάλιν 74 | νῦν 75 | γε 76 | οὔτε 77 | ὧν 78 | καθ 79 | ἔχει 80 | μόνον 81 | αὐτὸς 82 | οἷον 83 | μᾶλλον 84 | ἡμῖν 85 | οὐχ 86 | γάρ 87 | κατ 88 | πῶς 89 | οὐδὲν 90 | α 91 | ἡμῶν 92 | ὥστε 93 | ἔστι 94 | ἔτι 95 | ὃ 96 | παρ 97 | σου 98 | λέγει 99 | δύο 100 | μοι 101 | -------------------------------------------------------------------------------- /data/phi_data/phi_top_100.txt: -------------------------------------------------------------------------------- 1 | et 2 | in 3 | est 4 | non 5 | ut 6 | cum 7 | si 8 | ad 9 | quod 10 | qui 11 | sed 12 | quae 13 | ex 14 | a 15 | quam 16 | de 17 | esse 18 | aut 19 | hoc 20 | nec 21 | se 22 | sunt 23 | etiam 24 | enim 25 | quid 26 | per 27 | ab 28 | sit 29 | atque 30 | id 31 | autem 32 | quo 33 | me 34 | ne 35 | te 36 | ac 37 | nam 38 | tamen 39 | eius 40 | haec 41 | mihi 42 | ita 43 | iam 44 | neque 45 | eo 46 | quidem 47 | pro 48 | ea 49 | quoque 50 | tibi 51 | uel 52 | e 53 | quia 54 | ego 55 | nihil 56 | eum 57 | modo 58 | an 59 | libro 60 | sic 61 | nunc 62 | qua 63 | quem 64 | inter 65 | quibus 66 | esset 67 | erat 68 | causa 69 | m 70 | nisi 71 | hic 72 | potest 73 | tu 74 | tum 75 | ipse 76 | quis 77 | fuit 78 | ille 79 | ante 80 | sine 81 | res 82 | omnia 83 | his 84 | i 85 | idem 86 | sibi 87 | ubi 88 | illa 89 | post 90 | rem 91 | ei 92 | tam 93 | re 94 | c 95 | s 96 | apud 97 | is 98 | vel 99 | magis 100 | tantum 101 | -------------------------------------------------------------------------------- /data/greek_paradigms/autos.txt: -------------------------------------------------------------------------------- 1 | αὑταί 2 | αὑτή 3 | αὑτός 4 | αὑτοί 5 | αὔθ' 6 | αὔτ' 7 | αὐτ' 8 | αὐτά 9 | αὐτάν 10 | αὐτάς 11 | αὐτάων 12 | αὐτᾶι 13 | αὐτᾶν 14 | αὐτᾶς 15 | αὐτᾷ 16 | αὐταί 17 | αὐταῖν 18 | αὐταῖς 19 | αὐταῖσι 20 | αὐταῖσιν 21 | αὐτέ 22 | αὐτέων 23 | αὐτή 24 | αὐτήν 25 | αὐτῆι 26 | αὐτῆισι 27 | αὐτῆισιν 28 | αὐτῆς 29 | αὐτῇ 30 | αὐτῇς 31 | αὐτῇσι 32 | αὐτῇσιν 33 | αὐτό 34 | αὐτόφι 35 | αὐτόν 36 | αὐτός 37 | αὐτοί 38 | αὐτοῖν 39 | αὐτοῖο 40 | αὐτοῖς 41 | αὐτοῖσ' 42 | αὐτοῖσι 43 | αὐτοῖσιν 44 | αὐτούς 45 | αὐτοῦ 46 | αὐτώ 47 | αὐτώς 48 | αὐτῶ 49 | αὐτῶι 50 | αὐτῶν 51 | αὐτῷ 52 | καὐτά 53 | καὐτάν 54 | καὐτάς 55 | καὐταί 56 | καὐταῖς 57 | καὐτή 58 | καὐτήν 59 | καὐτῆς 60 | καὐτό 61 | καὐτόν 62 | καὐτός 63 | καὐτοί 64 | καὐτοῖς 65 | καὐτούς 66 | καὐτοῦ 67 | καὐτῶι 68 | καὐτῶν 69 | καὐτῷ 70 | ταὐτό 71 | τὠυτό 72 | τὠυτόν 73 | τὠυτοῦ 74 | τὠυτῷ 75 | τωὔτ' 76 | τωὐτά 77 | τωὐτό 78 | τωὐτόν 79 | τωὐτοῦ 80 | τωὐτῷ 81 | ὡυτή 82 | ὡυτός 83 | ὡυτοί 84 | ωὐτά 85 | ωὐτέων 86 | ωὐτή 87 | ωὐτήν 88 | ωὐτῆς 89 | ωὐτό 90 | ωὐτόν 91 | ωὐτός 92 | ωὐτοί 93 | ωὐτῶν 94 | -------------------------------------------------------------------------------- /data/latin_paradigms/qui.txt: -------------------------------------------------------------------------------- 1 | cui 2 | cuilibet 3 | cuine 4 | cuipiam 5 | cuiue 6 | cuius 7 | cuiuslibet 8 | cuiuspiam 9 | cuiust 10 | cuiusue 11 | cuiusve 12 | cuive 13 | qua 14 | quae 15 | quaedem 16 | quaelibet 17 | quaen 18 | quaene 19 | quaepiam 20 | quaepiamst 21 | quaest 22 | quaestuis 23 | quaestuist 24 | quaeue 25 | quaeve 26 | quam 27 | quamne 28 | quampiam 29 | quamue 30 | quamve 31 | quan 32 | quapiam 33 | quarum 34 | quarumlibet 35 | quas 36 | quaslibet 37 | quast 38 | quasue 39 | quasve 40 | quaue 41 | quave 42 | quei 43 | quein 44 | queique 45 | quem 46 | quemlibet 47 | quemne 48 | quempiam 49 | quemue 50 | quemve 51 | qui 52 | quibus 53 | quibuscum 54 | quibuslibet 55 | quibusue 56 | quibusve 57 | quicum 58 | quicumvis 59 | quilibet 60 | quiue 61 | quive 62 | quod 63 | quodlibet 64 | quodne 65 | quodpiam 66 | quodue 67 | quodve 68 | quoi 69 | quoicumque 70 | quoin 71 | quoique 72 | quoiuis 73 | quoivis 74 | quon 75 | quorum 76 | quorumlibet 77 | quorumst 78 | quos 79 | quoslibet 80 | quosne 81 | quospiam 82 | quost 83 | quosue 84 | quosve 85 | quum 86 | -------------------------------------------------------------------------------- /data/latin_paradigms/vester.txt: -------------------------------------------------------------------------------- 1 | uester 2 | uestra 3 | uestrae 4 | uestraene 5 | uestraeque 6 | uestram 7 | uestramque 8 | uestraque 9 | uestrarum 10 | uestras 11 | uestri 12 | uestrique 13 | uestris 14 | uestrisne 15 | uestrisque 16 | uestro 17 | uestroque 18 | uestrorum 19 | uestros 20 | uestrosque 21 | uestrum 22 | uestrumque 23 | uostra 24 | uostram 25 | uostraque 26 | uostrarum 27 | uostri 28 | uostris 29 | uostrorum 30 | uostrum 31 | vester 32 | vesterque 33 | vestra 34 | vestrae 35 | vestraeque 36 | vestram 37 | vestramne 38 | vestramque 39 | vestrane 40 | vestraque 41 | vestrarum 42 | vestras 43 | vestrasque 44 | vestri 45 | vestrique 46 | vestris 47 | vestrisque 48 | vestrius 49 | vestro 50 | vestrone 51 | vestroque 52 | vestrorum 53 | vestrorumque 54 | vestros 55 | vestrosque 56 | vestrum 57 | vestrumque 58 | vestrumst 59 | voster 60 | vostra 61 | vostrae 62 | vostraeque 63 | vostram 64 | vostraque 65 | vostrarum 66 | vostras 67 | vostrast 68 | vostri 69 | vostris 70 | vostrist 71 | vostro 72 | vostrorum 73 | vostros 74 | vostrosque 75 | vostrost 76 | vostrum 77 | vostrumque 78 | vostrumst 79 | -------------------------------------------------------------------------------- /stopwords_greek_odyssey.txt: -------------------------------------------------------------------------------- 1 | ἄγε 2 | ἄγχι 3 | αἴ 4 | αἲ 5 | αἰὲν 6 | αἶψ 7 | αἶψα 8 | ἅλις 9 | ἄλλοθεν 10 | ἄλλοτε 11 | ἀμφίς 12 | ἀμφὶς 13 | ἄντα 14 | ἀντίον 15 | ἀπάνευθε 16 | ἄπο 17 | ἆσσον 18 | αὖθι 19 | αὐτίκ 20 | αὐτόθι 21 | αὔτως 22 | ἄφαρ 23 | ἄψ 24 | δηθά 25 | δήν 26 | δὴν 27 | διέκ 28 | διὲκ 29 | ἑ 30 | ἐγγύθεν 31 | ἐγγύς 32 | ἐγγὺς 33 | εἰν 34 | εἷος 35 | ἑκάς 36 | ἐκεῖθι 37 | ἔμπης 38 | ἔνθεν 39 | ἔνι 40 | ἔντοσθε 41 | ἑὸν 42 | ἑός 43 | ἐῢ 44 | εὖτε 45 | ἠδέ 46 | ἠέ 47 | ἦε 48 | ἦέ 49 | ἠμέν 50 | ἠμὲν 51 | ἠμί 52 | ἦμος 53 | θᾶσσον 54 | θύραζε 55 | ἰθύς 56 | κὰδ 57 | καρπαλίμως 58 | κάτα 59 | κέ 60 | κέν 61 | νόσφι 62 | νῶϊ 63 | ὅθι 64 | οἷά 65 | οἴη 66 | οἴκαδ 67 | οἴκαδε 68 | οἶκόνδε 69 | οἶον 70 | οἶος 71 | ὁμῶς 72 | ὄπισθεν 73 | ὀπίσσω 74 | ὁππότε 75 | ὄσσα 76 | ὅττι 77 | πάγχυ 78 | πάμπαν 79 | πάρα 80 | παρέξ 81 | πάρος 82 | ποθι 83 | ποτὶ 84 | πρόσθεν 85 | προτέρω 86 | προτὶ 87 | πώ 88 | τάχιστα 89 | τεός 90 | τοιγάρ 91 | τοιγὰρ 92 | τοῖον 93 | τοῖος 94 | τόσος 95 | τόσσον 96 | τόφρα 97 | τῶ 98 | ὕπο 99 | ὦκα 100 | ὧς 101 | -------------------------------------------------------------------------------- /data/homer_data/odyssey_candidates_not_in_current_greek.txt: -------------------------------------------------------------------------------- 1 | ἄγε 2 | ἄγχι 3 | αἴ 4 | αἲ 5 | αἰὲν 6 | αἶψ 7 | αἶψα 8 | ἅλις 9 | ἄλλοθεν 10 | ἄλλοτε 11 | ἀμφίς 12 | ἀμφὶς 13 | ἄντα 14 | ἀντίον 15 | ἀπάνευθε 16 | ἄπο 17 | ἆσσον 18 | αὖθι 19 | αὐτίκ 20 | αὐτόθι 21 | αὔτως 22 | ἄφαρ 23 | ἄψ 24 | δηθά 25 | δήν 26 | δὴν 27 | διέκ 28 | διὲκ 29 | ἑ 30 | ἐγγύθεν 31 | ἐγγύς 32 | ἐγγὺς 33 | εἰν 34 | εἷος 35 | ἑκάς 36 | ἐκεῖθι 37 | ἔμπης 38 | ἔνθεν 39 | ἔνι 40 | ἔντοσθε 41 | ἑὸν 42 | ἑός 43 | ἐῢ 44 | εὖτε 45 | ἠδέ 46 | ἠέ 47 | ἦε 48 | ἦέ 49 | ἠμέν 50 | ἠμὲν 51 | ἠμί 52 | ἦμος 53 | θᾶσσον 54 | θύραζε 55 | ἰθύς 56 | κὰδ 57 | καρπαλίμως 58 | κάτα 59 | κέ 60 | κέν 61 | νόσφι 62 | νῶϊ 63 | ὅθι 64 | οἷά 65 | οἴη 66 | οἴκαδ 67 | οἴκαδε 68 | οἶκόνδε 69 | οἶον 70 | οἶος 71 | ὁμῶς 72 | ὄπισθεν 73 | ὀπίσσω 74 | ὁππότε 75 | ὄσσα 76 | ὅττι 77 | πάγχυ 78 | πάμπαν 79 | πάρα 80 | παρέξ 81 | πάρος 82 | ποθι 83 | ποτὶ 84 | πρόσθεν 85 | προτέρω 86 | προτὶ 87 | πώ 88 | τάχιστα 89 | τεός 90 | τοιγάρ 91 | τοιγὰρ 92 | τοῖον 93 | τοῖος 94 | τόσος 95 | τόσσον 96 | τόφρα 97 | τῶ 98 | ὕπο 99 | ὦκα 100 | ὧς 101 | -------------------------------------------------------------------------------- /stopwords_greek_iliad.txt: -------------------------------------------------------------------------------- 1 | ἄγε 2 | ἄγχι 3 | ἀγχοῦ 4 | αἴ 5 | αἰὲν 6 | αἶψα 7 | ἅλις 8 | ἄλλοτε 9 | ἀμφίς 10 | ἀμφὶς 11 | ἄνευθε 12 | ἄντα 13 | ἀντικρύ 14 | ἀντικρὺ 15 | ἀντίον 16 | ἀπάνευθε 17 | ἄπο 18 | αὖθ 19 | αὖθι 20 | αὐτίκ 21 | αὐτόθι 22 | αὔτως 23 | ἄφαρ 24 | ἄψ 25 | ἑ 26 | ἐγγύθεν 27 | ἐγγὺς 28 | εἶμι 29 | εἰν 30 | εἷος 31 | ἔμπας 32 | ἔνθά 33 | ἔνι 34 | ἑός 35 | ἐπήν 36 | ἑτέρωθεν 37 | ἐῢ 38 | εὖτε 39 | ἠδέ 40 | ἠέ 41 | ἠμέν 42 | ἠμὲν 43 | ἠμί 44 | ἠύτε 45 | ἠΰτε 46 | ἰθύς 47 | ἰθὺς 48 | ἴμεν 49 | κὰδ 50 | καρπαλίμως 51 | κέ 52 | κέν 53 | μὰν 54 | μετόπισθε 55 | νόσφι 56 | νόσφιν 57 | νῶϊ 58 | ὅθι 59 | οἴκαδε 60 | οἶον 61 | οἶος 62 | ὁμῶς 63 | ὄπισθε 64 | ὄπισθεν 65 | ὀπίσσω 66 | ὁππότε 67 | ὄσσα 68 | ὅττι 69 | ὅττί 70 | οὔτέ 71 | οὔτι 72 | ὄφρά 73 | πάμπαν 74 | πάντῃ 75 | πάντος 76 | πάντοσε 77 | πάρα 78 | πάροιθε 79 | πάρος 80 | ποτὶ 81 | προπάροιθε 82 | πρόσθ 83 | πρόσθε 84 | πρόσθεν 85 | πρόσω 86 | προτὶ 87 | πώ 88 | ῥίμφα 89 | τάχιστα 90 | τεός 91 | τῆλε 92 | τοῖο 93 | τοῖος 94 | τόσος 95 | τόσσον 96 | τόφρα 97 | ὕπο 98 | ὑπόδρα 99 | χαμᾶζε 100 | χαμαί 101 | χαμαὶ 102 | ὦκα 103 | ὧς 104 | -------------------------------------------------------------------------------- /data/homer_data/iliad_candidates_not_in_current_greek.txt: -------------------------------------------------------------------------------- 1 | ἄγε 2 | ἄγχι 3 | ἀγχοῦ 4 | αἴ 5 | αἰὲν 6 | αἶψα 7 | ἅλις 8 | ἄλλοτε 9 | ἀμφίς 10 | ἀμφὶς 11 | ἄνευθε 12 | ἄντα 13 | ἀντικρύ 14 | ἀντικρὺ 15 | ἀντίον 16 | ἀπάνευθε 17 | ἄπο 18 | αὖθ 19 | αὖθι 20 | αὐτίκ 21 | αὐτόθι 22 | αὔτως 23 | ἄφαρ 24 | ἄψ 25 | ἑ 26 | ἐγγύθεν 27 | ἐγγὺς 28 | εἶμι 29 | εἰν 30 | εἷος 31 | ἔμπας 32 | ἔνθά 33 | ἔνι 34 | ἑός 35 | ἐπήν 36 | ἑτέρωθεν 37 | ἐῢ 38 | εὖτε 39 | ἠδέ 40 | ἠέ 41 | ἠμέν 42 | ἠμὲν 43 | ἠμί 44 | ἠύτε 45 | ἠΰτε 46 | ἰθύς 47 | ἰθὺς 48 | ἴμεν 49 | κὰδ 50 | καρπαλίμως 51 | κέ 52 | κέν 53 | μὰν 54 | μετόπισθε 55 | νόσφι 56 | νόσφιν 57 | νῶϊ 58 | ὅθι 59 | οἴκαδε 60 | οἶον 61 | οἶος 62 | ὁμῶς 63 | ὄπισθε 64 | ὄπισθεν 65 | ὀπίσσω 66 | ὁππότε 67 | ὄσσα 68 | ὅττι 69 | ὅττί 70 | οὔτέ 71 | οὔτι 72 | ὄφρά 73 | πάμπαν 74 | πάντῃ 75 | πάντος 76 | πάντοσε 77 | πάρα 78 | πάροιθε 79 | πάρος 80 | ποτὶ 81 | προπάροιθε 82 | πρόσθ 83 | πρόσθε 84 | πρόσθεν 85 | πρόσω 86 | προτὶ 87 | πώ 88 | ῥίμφα 89 | τάχιστα 90 | τεός 91 | τῆλε 92 | τοῖο 93 | τοῖος 94 | τόσος 95 | τόσσον 96 | τόφρα 97 | ὕπο 98 | ὑπόδρα 99 | χαμᾶζε 100 | χαμαί 101 | χαμαὶ 102 | ὦκα 103 | ὧς 104 | -------------------------------------------------------------------------------- /data/greek_paradigms/hode.txt: -------------------------------------------------------------------------------- 1 | ἅδ' 2 | ἅδε 3 | αἵδ' 4 | αἵδε 5 | ἥδ' 6 | ἥδε 7 | ἧδ' 8 | ἡδ' 9 | ἡδί 10 | καττάδε 11 | ὅδ' 12 | ὅδε 13 | ὁδ' 14 | ὁδί 15 | οἵδ' 16 | οἵδε 17 | οἷδ' 18 | οἱδ' 19 | οἱδί 20 | τάδ' 21 | τάδε 22 | τάνδ' 23 | τάνδε 24 | τάσδ' 25 | τάσδε 26 | τᾶδ' 27 | τᾶιδ' 28 | τᾶιδε 29 | τᾶνδ' 30 | τᾶνδε 31 | τᾶσδ' 32 | τᾶσδε 33 | τᾷδ' 34 | τᾷδε 35 | ταδ' 36 | ταδί 37 | ταῖνδ' 38 | ταῖνδε 39 | ταῖσδ' 40 | ταῖσδε 41 | ταισίδ' 42 | τασδί 43 | τήνδ' 44 | τήνδε 45 | τῆιδ' 46 | τῆιδε 47 | τῆισδε 48 | τῆσδ' 49 | τῆσδε 50 | τῇδ' 51 | τῇδε 52 | τηνδεδί 53 | τῃσίδε 54 | τόδ' 55 | τόδε 56 | τόνδ' 57 | τόνδε 58 | τοδ' 59 | τοδί 60 | τοίδ' 61 | τοίδε 62 | τοίσδεσι 63 | τοίσδεσιν 64 | τοίσδεσσι 65 | τοίσδεσσιν 66 | τοῖνδ' 67 | τοῖνδε 68 | τοῖσδ' 69 | τοῖσδε 70 | τοῖσδεσι 71 | τοῖσδεσιν 72 | τοῖσδεσσι 73 | τοῖσδεσσιν 74 | τοῖσιδ' 75 | τοῖσιδε 76 | τοῖσινδ' 77 | τοισδί 78 | τοισίδ' 79 | τοισίδε 80 | τονδ' 81 | τονδί 82 | τούσδ' 83 | τούσδε 84 | τοῦδ' 85 | τοῦδε 86 | τοῦσδ' 87 | τουδ' 88 | τουδί 89 | τουσδί 90 | τώδ' 91 | τώδε 92 | τώσδε 93 | τῶδ' 94 | τῶδε 95 | τῶιδ' 96 | τῶιδε 97 | τῶνδ' 98 | τῶνδε 99 | τῷδ' 100 | τῷδε 101 | τωιδί 102 | τωνδ' 103 | τωνδί 104 | τῳδεδί 105 | τῳδί 106 | χἥδ' 107 | χἤδ' 108 | χἤδε 109 | -------------------------------------------------------------------------------- /data/greek_paradigms/hostis.txt: -------------------------------------------------------------------------------- 1 | ἅντιν' 2 | ἅντινα 3 | ἅσσ' 4 | ἅσσα 5 | ἅστινας 6 | ἅτιν' 7 | ἅτινα 8 | ἅτις 9 | ἅτθ' 10 | ἅττ' 11 | ἅττα 12 | ἁστινασοῦν 13 | αἵτινες 14 | αἷστισι 15 | αἷστισιν 16 | αἱστισινοῦν 17 | ἥντιν' 18 | ἥντινα 19 | ἥτις 20 | ἧιτινι 21 | ἧστινος 22 | ᾗτινι 23 | ἡντιναδήποτ' 24 | ἡντιναδήποτε 25 | ἡντινοῦν 26 | ἡστινοσοῦν 27 | ἡτισοῦν 28 | ᾑτινιδή 29 | ᾑτινιδήποτ' 30 | ᾑτινιοῦν 31 | ὅ,τι 32 | ὅ,του 33 | ὅ, τι 34 | ὅ, του 35 | ὅντιν' 36 | ὅντινα 37 | ὅθ' 38 | ὅστις 39 | ὅστισπερ 40 | ὅτ' 41 | ὅτεο 42 | ὅτευ 43 | ὅτεωι 44 | ὅτεων 45 | ὅτεῳ 46 | ὅτι 47 | ὅτιν' 48 | ὅτινα 49 | ὅτινας 50 | ὅτις 51 | ὅτοις 52 | ὅτοισι 53 | ὅτοισιν 54 | ὅτου 55 | ὅτουπερ 56 | ὅττεο 57 | ὅττευ 58 | ὅτωι 59 | ὅτων 60 | ὅτῳ 61 | ὅτῳπερ 62 | ὁντιναοῦν 63 | ὁντινοῦν 64 | ὁστισδηποτοῦν 65 | ὁστισοῦν 66 | ὁτέοισι 67 | ὁτέοισιν 68 | ὁτιδήποθ' 69 | ὁτιδήποτ' 70 | ὁτιδήποτε 71 | ὁτουδήποτ' 72 | ὁτουδήποτε 73 | ὁτουοῦν 74 | ὁτωιοῦν 75 | ὁτῳδήποτε 76 | ὁτῳοῦν 77 | οἵτινες 78 | οἷστισι 79 | οἷστισιν 80 | οἱστισινοῦν 81 | οὕστινας 82 | οὗτινος 83 | οὑστινασοῦν 84 | οὑτινοσοῦν 85 | ὧιτινι 86 | ὧντινων 87 | ᾧτινι 88 | ὡντινωνοῦν 89 | ᾡτινιοῦν 90 | χἄτις 91 | χἤτις 92 | χὥστις 93 | χὥτι 94 | χὥτις 95 | χὥτῳ 96 | χὤστις 97 | χὤτ' 98 | χὤτι 99 | χὤτου 100 | -------------------------------------------------------------------------------- /README.md: -------------------------------------------------------------------------------- 1 | [![License: CC BY-NC-SA 4.0](https://img.shields.io/badge/License-CC%20BY--NC--SA%204.0-blue.svg)](https://creativecommons.org/licenses/by-nc-sa/4.0/) 2 | [![DOI](https://zenodo.org/badge/DOI/10.5281/zenodo.1165205.svg)](https://doi.org/10.5281/zenodo.1165205) 3 | 4 | # Project status 5 | 6 | This repository contains Ancient Greek and Latin [stopwords](https://github.com/aurelberra/stopwords/blob/master/rationale.md#about-stopwords) for textual analysis. 7 | 8 | The lists were first designed to be used in the [Voyant Tools](https://voyant-tools.org/) environment, where they are implemented. They are also integrated into the [*Quanteda Stopwords*](https://github.com/quanteda/stopwords/) R package. 9 | 10 | The creation of these data sets is documented in the [project rationale and history](rationale.md) and the [revision notes](revision_notes.md). 11 | 12 | # Current lists 13 | 14 | * Ancient Latin stopwords: [TXT](stopwords_latin.txt) | [JSON](stopwords_latin.json) 15 | * Ancient Greek stopwords: [TXT](stopwords_greek.txt) | [JSON](stopwords_greek.json) 16 | 17 | Questions, comments and advice are most welcome. 18 | 19 | [![CC BY-NC-SA 4.0][cc-by-nc-sa-image]][cc-by-nc-sa] 20 | 21 | [cc-by-nc-sa]: http://creativecommons.org/licenses/by-nc-sa/4.0/ 22 | [cc-by-nc-sa-image]: https://licensebuttons.net/l/by-nc-sa/4.0/88x31.png 23 | -------------------------------------------------------------------------------- /data/phi_data/phi_top_1000_selection.txt: -------------------------------------------------------------------------------- 1 | # invariable 2 | quoque 3 | nihil 4 | nil 5 | nunc 6 | quasi 7 | itaque 8 | item 9 | satis 10 | semper 11 | propter 12 | inde 13 | unde 14 | saepe 15 | simul 16 | postea 17 | tunc 18 | ideo 19 | numquam 20 | ibi 21 | supra 22 | hinc 23 | quin 24 | vero 25 | usque 26 | circa 27 | praeter 28 | tamquam 29 | denique 30 | tot 31 | diu 32 | praeterea 33 | postquam 34 | statim 35 | adeo 36 | intra 37 | fere 38 | scilicet 39 | umquam 40 | quando 41 | prope 42 | nondum 43 | procul 44 | rursus 45 | huc 46 | omnino 47 | donec 48 | quemadmodum 49 | quippe 50 | aliquando 51 | velut 52 | interdum 53 | utique 54 | paene 55 | extra 56 | quotiens 57 | num 58 | iterum 59 | vix 60 | semel 61 | immo 62 | ni 63 | illic 64 | quamvis 65 | protinus 66 | hodie 67 | undique 68 | quondam 69 | equidem 70 | pariter 71 | olim 72 | fortasse 73 | profecto 74 | demum 75 | quodam 76 | ecce 77 | antea 78 | nimis 79 | etiamsi 80 | juxta 81 | antequam 82 | repente 83 | etenim 84 | frustra 85 | sponte 86 | praesertim 87 | 88 | # variable 89 | omnis 90 | quidam 91 | tantus 92 | quantus 93 | multus 94 | solus 95 | nullus 96 | nemo 97 | iste 98 | uter 99 | quivis 100 | ullus 101 | talis 102 | qualis 103 | meus 104 | tuus 105 | suus 106 | noster 107 | voster 108 | is 109 | -------------------------------------------------------------------------------- /stopwords_greek_homer.txt: -------------------------------------------------------------------------------- 1 | ἄγε 2 | ἄγχι 3 | ἀγχοῦ 4 | αἴ 5 | αἲ 6 | αἰὲν 7 | αἶψ 8 | αἶψα 9 | ἅλις 10 | ἄλλοθεν 11 | ἄλλοτε 12 | ἀμφίς 13 | ἀμφὶς 14 | ἄνευθε 15 | ἄντα 16 | ἀντικρύ 17 | ἀντικρὺ 18 | ἀντίον 19 | ἀπάνευθε 20 | ἄπο 21 | ἆσσον 22 | αὖθ 23 | αὖθι 24 | αὐτίκ 25 | αὐτόθι 26 | αὔτως 27 | ἄφαρ 28 | ἄψ 29 | δηθά 30 | δήν 31 | δὴν 32 | διέκ 33 | διὲκ 34 | ἑ 35 | ἐγγύθεν 36 | ἐγγύς 37 | ἐγγὺς 38 | εἶμι 39 | εἰν 40 | εἷος 41 | ἑκάς 42 | ἐκεῖθι 43 | ἔμπας 44 | ἔμπης 45 | ἔνθά 46 | ἔνθεν 47 | ἔνι 48 | ἔντοσθε 49 | ἑὸν 50 | ἑός 51 | ἐπήν 52 | ἑτέρωθεν 53 | ἐῢ 54 | εὖτε 55 | ἠδέ 56 | ἠέ 57 | ἦε 58 | ἦέ 59 | ἠμέν 60 | ἠμὲν 61 | ἠμί 62 | ἦμος 63 | ἠύτε 64 | ἠΰτε 65 | θᾶσσον 66 | θύραζε 67 | ἰθύς 68 | ἰθὺς 69 | ἴμεν 70 | κὰδ 71 | καρπαλίμως 72 | κάτα 73 | κέ 74 | κέν 75 | μὰν 76 | μετόπισθε 77 | νόσφι 78 | νόσφιν 79 | νῶϊ 80 | ὅθι 81 | οἷά 82 | οἴη 83 | οἴκαδ 84 | οἴκαδε 85 | οἶκόνδε 86 | οἶον 87 | οἶος 88 | ὁμῶς 89 | ὄπισθε 90 | ὄπισθεν 91 | ὀπίσσω 92 | ὁππότε 93 | ὄσσα 94 | ὅττι 95 | ὅττί 96 | οὔτέ 97 | οὔτι 98 | ὄφρά 99 | πάγχυ 100 | πάμπαν 101 | πάντῃ 102 | πάντος 103 | πάντοσε 104 | πάρα 105 | παρέξ 106 | πάροιθε 107 | πάρος 108 | ποθι 109 | ποτὶ 110 | προπάροιθε 111 | πρόσθ 112 | πρόσθε 113 | πρόσθεν 114 | πρόσω 115 | προτέρω 116 | προτὶ 117 | πώ 118 | ῥίμφα 119 | τάχιστα 120 | τεός 121 | τῆλε 122 | τοιγάρ 123 | τοιγὰρ 124 | τοῖο 125 | τοῖον 126 | τοῖος 127 | τόσος 128 | τόσσον 129 | τόφρα 130 | τῶ 131 | ὕπο 132 | ὑπόδρα 133 | χαμᾶζε 134 | χαμαί 135 | χαμαὶ 136 | ὦκα 137 | ὧς 138 | -------------------------------------------------------------------------------- /stopwords_for_quanteda/stopwords_quanteda.R: -------------------------------------------------------------------------------- 1 | # Test Quanteda stopwords ------------------------------------------------- 2 | # https://github.com/quanteda/stopwords 3 | 4 | library("pacman") 5 | p_load("quanteda") 6 | p_load("readtext") 7 | p_load("tidyverse") 8 | p_load("stopwords") 9 | # remotes::install_github("quanteda/stopwords", ref = "add-voyant", force = T) 10 | 11 | stopwords::stopwords("grc", source = "ancient") 12 | stopwords::stopwords("latin", source = "ancient") 13 | stopwords::stopwords("grc", source = "perseus") 14 | stopwords::stopwords("latin", source = "perseus") 15 | stopwords::stopwords("latin", source = "stopwords-iso") 16 | 17 | # Frequency plots with stopwords ---- 18 | 19 | cp_dem <- 20 | readtext( 21 | "/Users/aurel/Documents/github/hn3-dev/data/demosthenes/demosthenes_works/", 22 | cache = FALSE 23 | ) 24 | cp_dem$doc_id <- cp_dem$doc_id %>% str_replace_all("\\D", "") 25 | cp_dem <- corpus(cp_dem) 26 | 27 | dfm_cp_dem <- cp_dem %>% 28 | dfm(remove = stopwords::stopwords("grc", source = "ancient"), 29 | remove_punct = TRUE) %>% 30 | # dfm(remove = stopwords::stopwords("grc", source = "perseus"), remove_punct = TRUE) %>% 31 | dfm_trim(min_termfreq = 10, verbose = FALSE) 32 | 33 | features_dfm_cp_dem <- textstat_frequency(dfm_cp_dem, n = 100) 34 | 35 | features_dfm_cp_dem$feature <- 36 | with(features_dfm_cp_dem, reorder(feature, -frequency)) 37 | 38 | ggplot(features_dfm_cp_dem, aes(x = feature, y = frequency)) + 39 | geom_point() + 40 | theme(axis.text.x = element_text(angle = 90, hjust = 1)) 41 | -------------------------------------------------------------------------------- /data/homer_data/homer_all_candidates.txt: -------------------------------------------------------------------------------- 1 | ἄγε 2 | ἄγχι 3 | ἀγχοῦ 4 | αἴ 5 | αἲ 6 | αἰὲν 7 | αἶψ 8 | αἶψα 9 | ἅλις 10 | ἄλλοθεν 11 | ἄλλοτε 12 | ἀμφίς 13 | ἀμφὶς 14 | ἄνευθε 15 | ἄντα 16 | ἀντικρύ 17 | ἀντικρὺ 18 | ἀντίον 19 | ἀπάνευθε 20 | ἄπο 21 | ἆσσον 22 | αὖθ 23 | αὖθι 24 | αὐτίκ 25 | αὐτόθι 26 | αὔτως 27 | ἄφαρ 28 | ἄψ 29 | δηθά 30 | δήν 31 | δὴν 32 | διέκ 33 | διὲκ 34 | ἑ 35 | ἐγγύθεν 36 | ἐγγύς 37 | ἐγγὺς 38 | εἶμι 39 | εἰν 40 | εἷος 41 | ἑκάς 42 | ἐκεῖθι 43 | ἔμπας 44 | ἔμπης 45 | ἔνθά 46 | ἔνθεν 47 | ἔνι 48 | ἔντοσθε 49 | ἑὸν 50 | ἑός 51 | ἐπήν 52 | ἑτέρωθεν 53 | ἐῢ 54 | εὖτε 55 | ἠδέ 56 | ἠέ 57 | ἦε 58 | ἦέ 59 | ἠμέν 60 | ἠμὲν 61 | ἠμί 62 | ἦμος 63 | ἠύτε 64 | ἠΰτε 65 | θᾶσσον 66 | θύραζε 67 | ἰθύς 68 | ἰθὺς 69 | ἴμεν 70 | κὰδ 71 | καρπαλίμως 72 | κάτα 73 | κέ 74 | κέν 75 | μὰν 76 | μετόπισθε 77 | νόσφι 78 | νόσφιν 79 | νῶϊ 80 | ὅθι 81 | οἷά 82 | οἴη 83 | οἴκαδ 84 | οἴκαδε 85 | οἶκόνδε 86 | οἶον 87 | οἶος 88 | ὁμῶς 89 | ὄπισθε 90 | ὄπισθεν 91 | ὀπίσσω 92 | ὁππότε 93 | ὄσσα 94 | ὅττι 95 | ὅττί 96 | οὔτέ 97 | οὔτι 98 | ὄφρά 99 | πάγχυ 100 | πάμπαν 101 | πάντῃ 102 | πάντος 103 | πάντοσε 104 | πάρα 105 | παρέξ 106 | πάροιθε 107 | πάρος 108 | ποθι 109 | ποτὶ 110 | προπάροιθε 111 | πρόσθ 112 | πρόσθε 113 | πρόσθεν 114 | πρόσω 115 | προτέρω 116 | προτὶ 117 | πώ 118 | ῥίμφα 119 | τάχιστα 120 | τεός 121 | τῆλε 122 | τοιγάρ 123 | τοιγὰρ 124 | τοῖο 125 | τοῖον 126 | τοῖος 127 | τόσος 128 | τόσσον 129 | τόφρα 130 | τῶ 131 | ὕπο 132 | ὑπόδρα 133 | χαμᾶζε 134 | χαμαί 135 | χαμαὶ 136 | ὦκα 137 | ὧς 138 | -------------------------------------------------------------------------------- /data/praenomina.txt: -------------------------------------------------------------------------------- 1 | # Most common [Praenomina](https://en.wikipedia.org/wiki/Praenomen#Latin_praenomina) 2 | 3 | Agrippa (Agr.) 4 | Appius (Ap.) 5 | Aulus (A.) 6 | Caeso (K.) 7 | Decimus (D.) 8 | Faustus (F.) 9 | Gaius (C.) 10 | Gnaeus (Cn.) 11 | Hostus 12 | Lucius (L.) 13 | Mamercus (Mam.) 14 | Manius (M'.) 15 | Marcus (M.) 16 | Mettius 17 | Nonus 18 | Numerius (N.) 19 | Octavius (Oct.) 20 | Opiter (Opet.) 21 | Paullus 22 | Postumus (Post.) 23 | Proculus (Pro.) 24 | Publius (P.) 25 | Quintus (Q.) 26 | Septimus 27 | Sertor (Sert.) 28 | Servius (Ser.) 29 | Sextus (Sex.) 30 | Spurius (S.) 31 | Statius (St.) 32 | Tiberius (Ti.) 33 | Titus (T.) 34 | Tullus 35 | Vibius (V.) 36 | Volesus (Vol.) 37 | Vopiscus (Vop.) 38 | 39 | # Abbreviations 40 | 41 | * single letters: A., K., D., F., C., L., M., M'., N., P., Q., S., T., V. 42 | * more than one letter: Agr., Ap., Cn., Mam., Oct., Opet., Pro., Sert., Ser., Sex., St., Ti., Vol., Vop. 43 | * relevant forms for stopwords: agr, ap, cn, mam, oct, opet, pro, sert, ser, sex, st, ti, vol, vop 44 | 45 | # As lists 46 | 47 | c("A.", "K.", "D.", "F.", "C.", "L.", "M.", "M'.", "N.", "P.", "Q.", "S.", "T.", "V." ,"Agr.", "Ap.", "Cn.", "Mam.", "Oct.", "Opet.", "Pro.", "Sert.", "Ser.", "Sex.", "St.", "Ti.", "Vol.", "Vop.", "a.", "k.", "d.", "f.", "c.", "l.", "m.", "m'.", "n.", "p.", "q.", "s.", "t.", "v." ,"agr.", "ap.", "cn.", "mam.", "oct.", "opet.", "pro.", "sert.", "ser.", "sex.", "st.", "ti.", "vol.", "vop.") 48 | 49 | [A|K|D|F|C|L|M|M'|N|P|Q|S|T|V|Agr|Ap|Cn|Mam|Oct|Opet|Pro|Sert|Ser|Sex|St|Ti|Vol|Vop|a|k|d|f|c|l|m|m'|n|p|q|s|t|v|agr|ap|cn|mam|oct|opet|pro|sert|ser|sex|st|ti|vol|vop] 50 | -------------------------------------------------------------------------------- /CITATION.cff: -------------------------------------------------------------------------------- 1 | # This CITATION.cff file was generated with cffinit. 2 | # Visit https://bit.ly/cffinit to generate yours today! 3 | 4 | cff-version: 1.2.0 5 | title: Ancient Greek and Latin Stopwords 6 | message: >- 7 | If you use this dataset, please cite it using the metadata 8 | from this file. 9 | type: dataset 10 | authors: 11 | - given-names: Aurélien 12 | family-names: Berra 13 | email: aurelien.berra@parisnanterre.fr 14 | affiliation: Université Paris-Nanterre 15 | orcid: 'https://orcid.org/0000-0002-1695-8497' 16 | identifiers: 17 | - type: doi 18 | value: 10.5281/zenodo.1165206 19 | repository-code: 'https://github.com/aurelberra/stopwords' 20 | url: >- 21 | https://github.com/aurelberra/stopwords/blob/master/rationale.md 22 | abstract: >- 23 | These Ancient Greek and Latin stoplists are static, 24 | “general-use” lists, which users can adapt to their 25 | purposes. After an initial comparison of existing lists of 26 | stopwords, the lists were designed through statistical 27 | corpus analysis, i.e. most frequent words in TLG E and PHI 28 | 5. They were tested on various corpora, and include 29 | variant forms, several full paradigms and other elements 30 | common in stoplists like typographical symbols, single 31 | letters, numerals, critical abbreviations, as well as — 32 | for the Greek — words specific to the Homeric poems. For 33 | more information, see 34 | . 35 | keywords: 36 | - stopwords 37 | - ancient greek 38 | - latin 39 | - textual analysis 40 | - philology 41 | license: CC-BY-NC-SA-4.0 42 | -------------------------------------------------------------------------------- /versions/stopwords_latin_v1_0.txt: -------------------------------------------------------------------------------- 1 | # Ancient Latin stopwords 2 | # 2017-10-16 version 1.0 3 | # Aurélien Berra 4 | # https://github.com/aurelberra/stopwords 5 | # Total number of items (tokens or symbols): 144 6 | 7 | a 8 | ab 9 | ac 10 | ad 11 | adhuc 12 | aliqui 13 | aliquis 14 | an 15 | ante 16 | apud 17 | at 18 | atque 19 | aut 20 | autem 21 | contra 22 | cui 23 | cuius 24 | cujus 25 | cum 26 | cur 27 | de 28 | deinde 29 | dum 30 | e 31 | ea 32 | ego 33 | ei 34 | eius 35 | ejus 36 | enim 37 | eo 38 | eorum 39 | erant 40 | erat 41 | ergo 42 | es 43 | esse 44 | esset 45 | est 46 | et 47 | etiam 48 | etsi 49 | eum 50 | ex 51 | fio 52 | fuit 53 | haec 54 | haud 55 | hic 56 | his 57 | hoc 58 | iam 59 | id 60 | idem 61 | igitur 62 | illa 63 | ille 64 | in 65 | infra 66 | inter 67 | interim 68 | ipse 69 | is 70 | ita 71 | jam 72 | magis 73 | me 74 | mihi 75 | modo 76 | mox 77 | nam 78 | ne 79 | nec 80 | necque 81 | neque 82 | nisi 83 | nobis 84 | non 85 | nos 86 | o 87 | ob 88 | per 89 | possum 90 | post 91 | pro 92 | qua 93 | quae 94 | quam 95 | quare 96 | quem 97 | qui 98 | quia 99 | quibus 100 | quicumque 101 | quid 102 | quidem 103 | quilibet 104 | quis 105 | quisnam 106 | quisquam 107 | quisque 108 | quisquis 109 | quo 110 | quod 111 | quoniam 112 | quos 113 | re 114 | rebus 115 | rem 116 | res 117 | se 118 | secundum 119 | sed 120 | si 121 | sibi 122 | sic 123 | sicut 124 | sine 125 | sit 126 | siue 127 | sive 128 | sua 129 | sub 130 | sui 131 | sum 132 | sunt 133 | super 134 | suus 135 | tam 136 | tamen 137 | tandem 138 | te 139 | tibi 140 | trans 141 | tu 142 | tum 143 | ubi 144 | uel 145 | uero 146 | uos 147 | ut 148 | vel 149 | vero 150 | vos 151 | -------------------------------------------------------------------------------- /data/abbreviations/abbreviations.txt: -------------------------------------------------------------------------------- 1 | # CRITICAL ABBREVIATIONS 2 | abiud 3 | add 4 | adesp 5 | al 6 | ant 7 | antec 8 | anteced 9 | antecedent 10 | anth 11 | app 12 | arg 13 | argum 14 | argument 15 | art 16 | artic 17 | ca 18 | cap 19 | capit 20 | capitul 21 | cert 22 | cet 23 | cett 24 | cf 25 | ci 26 | cit 27 | cj 28 | cl 29 | cod 30 | codd 31 | col 32 | coll 33 | coni 34 | conj 35 | cont 36 | corp 37 | corr 38 | damn 39 | def 40 | del 41 | dett 42 | dist 43 | dist 44 | distin 45 | distinc 46 | distinct 47 | dub 48 | ead 49 | eadem 50 | ed 51 | edd 52 | eiusd 53 | ejusd 54 | em 55 | eod 56 | epist 57 | etc 58 | exp 59 | fg 60 | fgs 61 | fin 62 | fin 63 | fort 64 | fr 65 | frg 66 | gl 67 | gr 68 | ib 69 | ibid 70 | il 71 | ill 72 | indic 73 | inf 74 | inf 75 | infr 76 | init 77 | inscr 78 | interl 79 | lect 80 | lect 81 | lit 82 | litt 83 | ll 84 | loc 85 | loc 86 | marg 87 | mg 88 | ms 89 | mss 90 | mut 91 | od 92 | om 93 | pag 94 | pal 95 | pap 96 | papp 97 | penul 98 | penult 99 | pler 100 | plur 101 | pot 102 | pp 103 | pr 104 | praec 105 | praeced 106 | prob 107 | prolog 108 | prooem 109 | prop 110 | propos 111 | qq 112 | qu 113 | qu 114 | quaest 115 | quaestiunc 116 | quaestiuncul 117 | ras 118 | recc 119 | rell 120 | respons 121 | sc 122 | sc 123 | schol 124 | scholl 125 | scil 126 | secl 127 | seq 128 | seqq 129 | sim 130 | solut 131 | sq 132 | sq 133 | sqq 134 | ss 135 | subscr 136 | sup 137 | suppl 138 | susp 139 | tent 140 | text 141 | trai 142 | transp 143 | transt 144 | trib 145 | ud 146 | uers 147 | uersic 148 | uett 149 | uid 150 | uit 151 | ult 152 | ultim 153 | uu 154 | uu 155 | uulg 156 | vd 157 | vers 158 | versic 159 | vett 160 | vid 161 | vit 162 | vulg 163 | vv 164 | vv 165 | γρ 166 | -------------------------------------------------------------------------------- /data/latin_paradigms/possum.txt: -------------------------------------------------------------------------------- 1 | posse 2 | possem 3 | possemne 4 | possemque 5 | possemus 6 | possent 7 | possentne 8 | posseque 9 | posses 10 | possesne 11 | posset 12 | possetis 13 | possetisne 14 | possetne 15 | possetque 16 | possim 17 | possimne 18 | possimus 19 | possimusne 20 | possin 21 | possint 22 | possintne 23 | possintque 24 | possis 25 | possisne 26 | possisque 27 | possit 28 | possitis 29 | possitne 30 | possitque 31 | possum 32 | possumne 33 | possumus 34 | possumusne 35 | possunt 36 | possuntne 37 | possuntque 38 | potens 39 | potensque 40 | potentem 41 | potentemque 42 | potentes 43 | potentesque 44 | potenti 45 | potentia 46 | potentibus 47 | potentis 48 | potentisque 49 | potentium 50 | poteram 51 | poteramus 52 | poteramusne 53 | poterant 54 | poterantque 55 | poteras 56 | poterat 57 | poteratis 58 | poteratne 59 | poteratque 60 | poterimus 61 | poterin 62 | poteris 63 | poterisne 64 | poterisque 65 | poterit 66 | poteritis 67 | poteritisne 68 | poteritne 69 | poteritque 70 | potero 71 | poteron 72 | poterone 73 | poterunt 74 | poteruntque 75 | potes 76 | potesne 77 | potesque 78 | potest 79 | potestis 80 | potestisne 81 | potestne 82 | potestque 83 | potueram 84 | potueramus 85 | potuerant 86 | potueras 87 | potuerat 88 | potueratis 89 | potuere 90 | potuerim 91 | potuerimus 92 | potuerint 93 | potueris 94 | potuerit 95 | potueritis 96 | potueritne 97 | potueritque 98 | potuero 99 | potuerunt 100 | potueruntne 101 | potueruntque 102 | potui 103 | potuimus 104 | potuine 105 | potuique 106 | potuisse 107 | potuissem 108 | potuissemus 109 | potuissent 110 | potuisses 111 | potuisset 112 | potuissetis 113 | potuisti 114 | potuistine 115 | potuistis 116 | potuit 117 | potuitne 118 | potuitque 119 | potuitue 120 | -------------------------------------------------------------------------------- /test/voyant_test_files/voyant_test_grc_oxia_split.txt: -------------------------------------------------------------------------------- 1 | τί 2 | τηνικάδε 3 | ἀφῖξαι, 4 | ὦ 5 | κρίτων; 6 | ἢ 7 | οὐ 8 | πρῲ 9 | ἔτι 10 | ἐστίν; 11 | πάνυ 12 | μὲν 13 | οὖν. 14 | πηνίκα 15 | μάλιστα; 16 | ὄρθρος 17 | βαθύς. 18 | θαυμάζω 19 | ὅπως 20 | ἠθέλησέ 21 | σοι 22 | ὁ 23 | τοῦ 24 | δεσμωτηρίου 25 | φύλαξ 26 | ὑπακοῦσαι. 27 | συνήθης 28 | ἤδη 29 | μοί 30 | ἐστιν, 31 | ὦ 32 | σώκρατες, 33 | διὰ 34 | τὸ 35 | πολλάκις 36 | δεῦρο 37 | φοιτᾶν, 38 | καί 39 | τι 40 | καὶ 41 | εὐεργέτηται 42 | ὑπʼ 43 | ἐμοῦ. 44 | ἄρτι 45 | δὲ 46 | ἥκεις 47 | ἢ 48 | πάλαι; 49 | ἐπιεικῶς 50 | πάλαι. 51 | εἶτα 52 | πῶς 53 | οὐκ 54 | εὐθὺς 55 | ἐπήγειράς 56 | με, 57 | ἀλλὰ 58 | σιγῇ 59 | παρα 60 | κάθησαι; 61 | οὐ 62 | μὰ 63 | τὸν 64 | δία, 65 | ὦ 66 | σώκρατες, 67 | οὐδʼ 68 | ἂν 69 | αὐτὸς 70 | ἤθελον 71 | ἐν 72 | τοσαύτῃ 73 | τε 74 | ἀγρυπνίᾳ 75 | καὶ 76 | λύπῃ 77 | εἶναι, 78 | ἀλλὰ 79 | καὶ 80 | σοῦ 81 | πάλαι 82 | θαυμάζω 83 | αἰσθανόμενος 84 | ὡς 85 | ἡδέως 86 | καθεύδεις· 87 | καὶ 88 | ἐπίτηδές 89 | σε 90 | οὐκ 91 | ἤγειρον 92 | ἵνα 93 | ὡς 94 | ἥδιστα 95 | διάγῃς. 96 | καὶ 97 | πολλάκις 98 | μὲν 99 | δή 100 | σε 101 | καὶ 102 | πρότερον 103 | ἐν 104 | παντὶ 105 | τῷ 106 | βίῳ 107 | ηὐδαιμόνισα 108 | τοῦ 109 | τρόπου, 110 | πολὺ 111 | δὲ 112 | μάλιστα 113 | ἐν 114 | τῇ 115 | νῦν 116 | παρεστώσῃ 117 | συμφορᾷ, 118 | ὡς 119 | ῥᾳδίως 120 | αὐτὴν 121 | καὶ 122 | πρᾴως 123 | φέρεις. 124 | καὶ 125 | γὰρ 126 | ἄν, 127 | ὦ 128 | κρίτων, 129 | πλημμελὲς 130 | εἴη 131 | ἀγανακτεῖν 132 | τηλικοῦτον 133 | ὄντα 134 | εἰ 135 | δεῖ 136 | ἤδη 137 | τελευτᾶν. 138 | ὄρθρος 139 | ὄρθρος 140 | ὄρθρος 141 | ὄρθρος 142 | ὄρθρος 143 | ὄρθροσ 144 | ὄρθροσ 145 | ὄρθροσ 146 | ὄρθροσ 147 | ὄρθροσ 148 | ὄρθροϲ 149 | ὄρθροϲ 150 | ὄρθροϲ 151 | ὄρθροϲ 152 | ὄρθροϲ 153 | ὄρθροσ 154 | ὄρθροσ 155 | ὄρθροσ 156 | ὄρθροσ 157 | -------------------------------------------------------------------------------- /test/voyant_test_files/voyant_test_grc_oxia_split_nfc.txt: -------------------------------------------------------------------------------- 1 | τί 2 | τηνικάδε 3 | ἀφῖξαι, 4 | ὦ 5 | κρίτων; 6 | ἢ 7 | οὐ 8 | πρῲ 9 | ἔτι 10 | ἐστίν; 11 | πάνυ 12 | μὲν 13 | οὖν. 14 | πηνίκα 15 | μάλιστα; 16 | ὄρθρος 17 | βαθύς. 18 | θαυμάζω 19 | ὅπως 20 | ἠθέλησέ 21 | σοι 22 | ὁ 23 | τοῦ 24 | δεσμωτηρίου 25 | φύλαξ 26 | ὑπακοῦσαι. 27 | συνήθης 28 | ἤδη 29 | μοί 30 | ἐστιν, 31 | ὦ 32 | σώκρατες, 33 | διὰ 34 | τὸ 35 | πολλάκις 36 | δεῦρο 37 | φοιτᾶν, 38 | καί 39 | τι 40 | καὶ 41 | εὐεργέτηται 42 | ὑπʼ 43 | ἐμοῦ. 44 | ἄρτι 45 | δὲ 46 | ἥκεις 47 | ἢ 48 | πάλαι; 49 | ἐπιεικῶς 50 | πάλαι. 51 | εἶτα 52 | πῶς 53 | οὐκ 54 | εὐθὺς 55 | ἐπήγειράς 56 | με, 57 | ἀλλὰ 58 | σιγῇ 59 | παρα 60 | κάθησαι; 61 | οὐ 62 | μὰ 63 | τὸν 64 | δία, 65 | ὦ 66 | σώκρατες, 67 | οὐδʼ 68 | ἂν 69 | αὐτὸς 70 | ἤθελον 71 | ἐν 72 | τοσαύτῃ 73 | τε 74 | ἀγρυπνίᾳ 75 | καὶ 76 | λύπῃ 77 | εἶναι, 78 | ἀλλὰ 79 | καὶ 80 | σοῦ 81 | πάλαι 82 | θαυμάζω 83 | αἰσθανόμενος 84 | ὡς 85 | ἡδέως 86 | καθεύδεις· 87 | καὶ 88 | ἐπίτηδές 89 | σε 90 | οὐκ 91 | ἤγειρον 92 | ἵνα 93 | ὡς 94 | ἥδιστα 95 | διάγῃς. 96 | καὶ 97 | πολλάκις 98 | μὲν 99 | δή 100 | σε 101 | καὶ 102 | πρότερον 103 | ἐν 104 | παντὶ 105 | τῷ 106 | βίῳ 107 | ηὐδαιμόνισα 108 | τοῦ 109 | τρόπου, 110 | πολὺ 111 | δὲ 112 | μάλιστα 113 | ἐν 114 | τῇ 115 | νῦν 116 | παρεστώσῃ 117 | συμφορᾷ, 118 | ὡς 119 | ῥᾳδίως 120 | αὐτὴν 121 | καὶ 122 | πρᾴως 123 | φέρεις. 124 | καὶ 125 | γὰρ 126 | ἄν, 127 | ὦ 128 | κρίτων, 129 | πλημμελὲς 130 | εἴη 131 | ἀγανακτεῖν 132 | τηλικοῦτον 133 | ὄντα 134 | εἰ 135 | δεῖ 136 | ἤδη 137 | τελευτᾶν. 138 | ὄρθρος 139 | ὄρθρος 140 | ὄρθρος 141 | ὄρθρος 142 | ὄρθρος 143 | ὄρθροσ 144 | ὄρθροσ 145 | ὄρθροσ 146 | ὄρθροσ 147 | ὄρθροσ 148 | ὄρθροϲ 149 | ὄρθροϲ 150 | ὄρθροϲ 151 | ὄρθροϲ 152 | ὄρθροϲ 153 | ὄρθροσ 154 | ὄρθροσ 155 | ὄρθροσ 156 | ὄρθροσ 157 | -------------------------------------------------------------------------------- /test/voyant_test_files/voyant_test_grc_tonos_nfc_split.txt: -------------------------------------------------------------------------------- 1 | τί 2 | τηνικάδε 3 | ἀφῖξαι, 4 | ὦ 5 | κρίτων; 6 | ἢ 7 | οὐ 8 | πρῲ 9 | ἔτι 10 | ἐστίν; 11 | πάνυ 12 | μὲν 13 | οὖν. 14 | πηνίκα 15 | μάλιστα; 16 | ὄρθρος 17 | βαθύς. 18 | θαυμάζω 19 | ὅπως 20 | ἠθέλησέ 21 | σοι 22 | ὁ 23 | τοῦ 24 | δεσμωτηρίου 25 | φύλαξ 26 | ὑπακοῦσαι. 27 | συνήθης 28 | ἤδη 29 | μοί 30 | ἐστιν, 31 | ὦ 32 | σώκρατες, 33 | διὰ 34 | τὸ 35 | πολλάκις 36 | δεῦρο 37 | φοιτᾶν, 38 | καί 39 | τι 40 | καὶ 41 | εὐεργέτηται 42 | ὑπʼ 43 | ἐμοῦ. 44 | ἄρτι 45 | δὲ 46 | ἥκεις 47 | ἢ 48 | πάλαι; 49 | ἐπιεικῶς 50 | πάλαι. 51 | εἶτα 52 | πῶς 53 | οὐκ 54 | εὐθὺς 55 | ἐπήγειράς 56 | με, 57 | ἀλλὰ 58 | σιγῇ 59 | παρα 60 | κάθησαι; 61 | οὐ 62 | μὰ 63 | τὸν 64 | δία, 65 | ὦ 66 | σώκρατες, 67 | οὐδʼ 68 | ἂν 69 | αὐτὸς 70 | ἤθελον 71 | ἐν 72 | τοσαύτῃ 73 | τε 74 | ἀγρυπνίᾳ 75 | καὶ 76 | λύπῃ 77 | εἶναι, 78 | ἀλλὰ 79 | καὶ 80 | σοῦ 81 | πάλαι 82 | θαυμάζω 83 | αἰσθανόμενος 84 | ὡς 85 | ἡδέως 86 | καθεύδεις· 87 | καὶ 88 | ἐπίτηδές 89 | σε 90 | οὐκ 91 | ἤγειρον 92 | ἵνα 93 | ὡς 94 | ἥδιστα 95 | διάγῃς. 96 | καὶ 97 | πολλάκις 98 | μὲν 99 | δή 100 | σε 101 | καὶ 102 | πρότερον 103 | ἐν 104 | παντὶ 105 | τῷ 106 | βίῳ 107 | ηὐδαιμόνισα 108 | τοῦ 109 | τρόπου, 110 | πολὺ 111 | δὲ 112 | μάλιστα 113 | ἐν 114 | τῇ 115 | νῦν 116 | παρεστώσῃ 117 | συμφορᾷ, 118 | ὡς 119 | ῥᾳδίως 120 | αὐτὴν 121 | καὶ 122 | πρᾴως 123 | φέρεις. 124 | καὶ 125 | γὰρ 126 | ἄν, 127 | ὦ 128 | κρίτων, 129 | πλημμελὲς 130 | εἴη 131 | ἀγανακτεῖν 132 | τηλικοῦτον 133 | ὄντα 134 | εἰ 135 | δεῖ 136 | ἤδη 137 | τελευτᾶν. 138 | ὄρθρος 139 | ὄρθρος 140 | ὄρθρος 141 | ὄρθρος 142 | ὄρθρος 143 | ὄρθροσ 144 | ὄρθροσ 145 | ὄρθροσ 146 | ὄρθροσ 147 | ὄρθροσ 148 | ὄρθροϲ 149 | ὄρθροϲ 150 | ὄρθροϲ 151 | ὄρθροϲ 152 | ὄρθροϲ 153 | ὄρθροσ 154 | ὄρθροσ 155 | ὄρθροσ 156 | ὄρθροσ 157 | -------------------------------------------------------------------------------- /data/tlg_data/tlg_top_1000_selection.txt: -------------------------------------------------------------------------------- 1 | # invariable 2 | ἐν 3 | ὡς 4 | εἰς 5 | ἐς 6 | ἤ 7 | ἢ 8 | τε 9 | ὅτι 10 | οὐ 11 | εἰ 12 | ἐκ 13 | ἂν 14 | οὕτως 15 | ἵνα 16 | ὥσπερ 17 | γε 18 | μᾶλλον 19 | ὥστε 20 | ἔτι 21 | ὅταν 22 | ἄρα 23 | ἤδη 24 | ἅμα 25 | εἶτα 26 | κἂν 27 | ὅπως 28 | ἕως 29 | ἤτοι 30 | γοῦν 31 | ὅθεν 32 | εἴτε 33 | ἑξῆς 34 | ἤγουν 35 | ἄνω 36 | ἔξω 37 | ὅμως 38 | ἴσως 39 | ἔνθα 40 | τοι 41 | εἴπερ 42 | ἔπειτα 43 | ὥς 44 | οὐκοῦν 45 | ἄνευ 46 | πως 47 | ὁμοῦ 48 | ὅπου 49 | ἕνεκα 50 | ἔξωθεν 51 | ποῦ 52 | ἄνωθεν 53 | ἔμπροσθεν 54 | ἐφεξῆς 55 | πανταχοῦ 56 | ὧδε 57 | ἅτε 58 | ἄχρι 59 | ἔνδον 60 | ἅπαξ 61 | ἄρτι 62 | καί 63 | δέ 64 | γάρ 65 | μέν 66 | πρός 67 | ἐπί 68 | διά 69 | κατά 70 | μή 71 | οὐ 72 | περί 73 | ἀπό 74 | ἀλλά 75 | οὖν 76 | παρά 77 | μετά 78 | ὑπό 79 | οὐδέ 80 | δή 81 | πάλιν 82 | νῦν 83 | οὔτε 84 | ὑπέρ 85 | ἐπεί 86 | ἀντί 87 | ἐπειδή 88 | ἐάν 89 | τότε 90 | πρό 91 | τοίνυν 92 | μάλιστα 93 | ἐνταῦθα 94 | ἀεί 95 | σύν 96 | διό 97 | μήτε 98 | ἀνά 99 | καθά 100 | μέντοι 101 | πολλάκις 102 | μέχρι 103 | ἐκεῖ 104 | ποτέ 105 | πλήν 106 | εὖ 107 | πού 108 | πάνυ 109 | εὐθύς 110 | καίτοι 111 | καθόλου 112 | τουτέστιν 113 | τουτέστι 114 | οὐκέτι 115 | χωρίς 116 | διότι 117 | ἐντεῦθεν 118 | κάτω 119 | αὖθις 120 | πρίν 121 | μεταξύ 122 | αὖ 123 | σφόδρα 124 | δηλονότι 125 | πάλαι 126 | οὔτε 127 | καθώς 128 | ἐκεῖθεν 129 | ὡσαύτως 130 | μάλα 131 | λίαν 132 | πόθεν 133 | οὔπω 134 | ἐντός 135 | αὐτίκα 136 | ἐκτός 137 | ἄν 138 | σχεδόν 139 | πέρ 140 | ἡνίκα 141 | μηκέτι 142 | ἐκεῖσε 143 | ἀμφί 144 | ἐπειδάν 145 | οὐδέποτε 146 | 147 | # variable 148 | ὁ 149 | τις 150 | ὃ 151 | οὗτος 152 | ὦ 153 | ἣν 154 | ὃν 155 | ἃ 156 | ὅτε 157 | ὃς 158 | ἓν 159 | οὓς 160 | οἳ 161 | εἷς 162 | τοῦτο 163 | ὅστις 164 | ὅς 165 | αὐτός 166 | τίς 167 | οἷος 168 | ἐγώ 169 | οὐδείς 170 | σύ 171 | ὅσπερ 172 | ἑαυτοῦ 173 | ὅσος 174 | μηδέ 175 | μηδείς 176 | τοιοῦτος 177 | ἐκεῖνος 178 | τοσοῦτος 179 | ὅδε 180 | -------------------------------------------------------------------------------- /data/greek_paradigms/ekeinos.txt: -------------------------------------------------------------------------------- 1 | 'κείνας 2 | 'κείνη 3 | 'κείνην 4 | 'κείνης 5 | 'κείνῃ 6 | 'κείνοις 7 | 'κείνου 8 | 'κείνους 9 | 'κείνων 10 | 'κείνως 11 | 'κείνῳ 12 | 'κεῖν' 13 | 'κεῖνα 14 | 'κεῖναι 15 | 'κεῖνο 16 | 'κεῖνοι 17 | 'κεῖνον 18 | 'κεῖνος 19 | ἁκείνοις 20 | ἁκεῖνοι 21 | ἁκεῖνος 22 | ἐκείν' 23 | ἐκείνα 24 | ἐκείναιν 25 | ἐκείναις 26 | ἐκείναν 27 | ἐκείνας 28 | ἐκείνᾳ 29 | ἐκείνη 30 | ἐκείνηι 31 | ἐκείνην 32 | ἐκείνης 33 | ἐκείνῃ 34 | ἐκείνῃσι 35 | ἐκείνοιν 36 | ἐκείνοις 37 | ἐκείνοισι 38 | ἐκείνοισιν 39 | ἐκείνου 40 | ἐκείνους 41 | ἐκείνω 42 | ἐκείνωι 43 | ἐκείνων 44 | ἐκείνως 45 | ἐκείνῳ 46 | ἐκεῖν' 47 | ἐκεῖνα 48 | ἐκεῖναι 49 | ἐκεῖνε 50 | ἐκεῖνο 51 | ἐκεῖνοι 52 | ἐκεῖνον 53 | ἐκεῖνος 54 | ἐκεινέων 55 | ἐκεινηί 56 | ἐκεινοιί 57 | ἐκεινοσί 58 | ἐκεινοσίν 59 | κἀκείναις 60 | κἀκείνας 61 | κἀκείνη 62 | κἀκείνηι 63 | κἀκείνην 64 | κἀκείνης 65 | κἀκείνῃ 66 | κἀκείνῃσι 67 | κἀκείνοις 68 | κἀκείνοισι 69 | κἀκείνοισιν 70 | κἀκείνου 71 | κἀκείνους 72 | κἀκείνω 73 | κἀκείνωι 74 | κἀκείνων 75 | κἀκείνως 76 | κἀκείνῳ 77 | κἀκεῖν' 78 | κἀκεῖνα 79 | κἀκεῖναι 80 | κἀκεῖνο 81 | κἀκεῖνοι 82 | κἀκεῖνον 83 | κἀκεῖνος 84 | κείν' 85 | κείνα 86 | κείναις 87 | κείναισιν 88 | κείναν 89 | κείνας 90 | κείνᾳ 91 | κείνη 92 | κείνηι 93 | κείνην 94 | κείνης 95 | κείνῃ 96 | κείνῃς 97 | κείνῃσι 98 | κείνῃσιν 99 | κείνοιν 100 | κείνοιο 101 | κείνοις 102 | κείνοισ' 103 | κείνοισι 104 | κείνοισιν 105 | κείνου 106 | κείνους 107 | κείνω 108 | κείνωι 109 | κείνων 110 | κείνως 111 | κείνῳ 112 | κεῖν' 113 | κεῖνα 114 | κεῖναι 115 | κεῖνο 116 | κεῖνοι 117 | κεῖνον 118 | κεῖνος 119 | κήνα 120 | κήνας 121 | κήνω 122 | κήνων 123 | κῆν' 124 | κῆνο 125 | κῆνοι 126 | κῆνον 127 | κῆνος 128 | κηνᾶν 129 | οὑκείνου 130 | οὑκεῖνοι 131 | τἀκείνης 132 | τἀκείνῃ 133 | τἀκείνοις 134 | τἀκείνου 135 | τἀκείνων 136 | τἀκείνῳ 137 | τἀκεῖν' 138 | τἀκεῖνα 139 | τήνα 140 | τήναις 141 | τήναν 142 | τήνας 143 | τήνᾳ 144 | τήνη 145 | τήνης 146 | τήνοιο 147 | τήνοις 148 | τήνοισι 149 | τήνου 150 | τήνω 151 | τήνωι 152 | τήνων 153 | τήνῳ 154 | τῆν' 155 | τῆνα 156 | τῆναι 157 | τῆνε 158 | τῆνο 159 | τῆνοι 160 | τῆνον 161 | τῆνος 162 | τοὐκείνης 163 | τοὐκείνου 164 | -------------------------------------------------------------------------------- /data/homer_data/odyssey_1000_not_in_tlg_1000_selection.txt: -------------------------------------------------------------------------------- 1 | # Candidates for Odyssey stopwords 2 | ὣς 3 | αὐτὰρ 4 | ἐνὶ 5 | μιν 6 | ἄρ 7 | κεν 8 | ἠδὲ 9 | οὐδέ 10 | ῥ 11 | κε 12 | ὄφρα 13 | αὖτε 14 | ἄγε 15 | ἔφατ 16 | ἠδ 17 | ἐγὼν 18 | ἔνθ 19 | μάλ 20 | φάτο 21 | ἠὲ 22 | ὄφρ 23 | ἀλλά 24 | κέ 25 | τοῖσιν 26 | ἀντίον 27 | ἐπεί 28 | ῥα 29 | τοὶ 30 | τοῖσι 31 | τῶ 32 | ἅμ 33 | τότ 34 | αἰεὶ 35 | αὖτ 36 | κέν 37 | σφιν 38 | νύ 39 | ἀτὰρ 40 | αἶψα 41 | ἔπειτ 42 | ὅθι 43 | πάρος 44 | αὐτίκ 45 | ποτ 46 | ἐνθάδ 47 | ἦεν 48 | ἐόντα 49 | ἐῢ 50 | αὖτις 51 | ἔτ 52 | πὰρ 53 | κεῖνος 54 | σύ 55 | αἴ 56 | ἀμφ 57 | ἔμμεναι 58 | ἐμὸν 59 | ἐρέω 60 | πόλλ 61 | πω 62 | ἂψ 63 | μευ 64 | τιν 65 | αἰὲν 66 | ἔην 67 | ἰὼν 68 | ποτὶ 69 | τὼ 70 | ὅττι 71 | ἔνθεν 72 | ἐὼν 73 | ἕκαστα 74 | ἔνι 75 | ὅτ 76 | ὦκα 77 | ἔσαν 78 | ἦμος 79 | ὅν 80 | ἐμοί 81 | οἴκαδ 82 | ἄγχι 83 | εἴπω 84 | τόφρα 85 | ἠμὲν 86 | θύραζε 87 | ῥά 88 | δὴν 89 | τόδ 90 | τοί 91 | ἔειπε 92 | εἰπὲ 93 | ἔσσεται 94 | αἶψ 95 | εἵνεκα 96 | εἴσω 97 | ἐσσι 98 | ὀπίσσω 99 | ὁππότε 100 | πού 101 | πώ 102 | ἄπο 103 | ἑ 104 | ἐνθάδε 105 | κὰδ 106 | οἶος 107 | ὢ 108 | αἲ 109 | αὔτως 110 | δεῦρο 111 | ἔμπης 112 | κάτα 113 | πολλὸν 114 | τοῖος 115 | ἔειπεν 116 | εἷος 117 | καρπαλίμως 118 | κεῖνον 119 | ὅδ 120 | ὅσσα 121 | πρίν 122 | σέ 123 | σὴν 124 | τάχιστα 125 | αἵ 126 | δεῦρ 127 | οἷ 128 | οἴκαδε 129 | ὅσσοι 130 | πάντ 131 | τοιγὰρ 132 | τοῖον 133 | ὧς 134 | ἔειπες 135 | ἔπι 136 | ἔχε 137 | μηδέ 138 | οἶκόνδε 139 | πολλά 140 | τόσσον 141 | αἰεί 142 | ἄλλοθεν 143 | ἂρ 144 | αὖθι 145 | εἰν 146 | ἐών 147 | ἥν 148 | οἷος 149 | ὅσσον 150 | πάμπαν 151 | πέρ 152 | ὧδ 153 | ἅ 154 | ἄφαρ 155 | ἠέ 156 | οἶον 157 | πάντεσσι 158 | προτὶ 159 | σὸν 160 | αἳ 161 | ἐμόν 162 | ἐμὸς 163 | ἑὸν 164 | ἦε 165 | κείνου 166 | νῶϊ 167 | ὅδε 168 | οἴη 169 | πάρα 170 | πᾶσαι 171 | σοί 172 | σφ 173 | σφεας 174 | χ 175 | ἄλλ 176 | ἄλλαι 177 | ἀνά 178 | ἐγγὺς 179 | ἥδε 180 | οἷά 181 | οὐκέτ 182 | ποτέ 183 | ὕπο 184 | ἅλις 185 | ἀμφὶς 186 | ἀν 187 | ἅπαντες 188 | αὐτή 189 | ἐγγύθεν 190 | ἔμ 191 | ἐμεῖο 192 | ἔπειθ 193 | ἔστ 194 | ἡμέας 195 | προτέρω 196 | σῷ 197 | ὕμιν 198 | ἄλλῃ 199 | αὐτοί 200 | διὲκ 201 | ἐμὴν 202 | ἐμῆς 203 | ἐόντες 204 | ἦέ 205 | ἥμιν 206 | θᾶσσον 207 | -------------------------------------------------------------------------------- /data/abbreviations/abbreviations.json: -------------------------------------------------------------------------------- 1 | "CRITICAL ABBREVIATIONS": [ 2 | "abiud", 3 | "add", 4 | "adesp", 5 | "al", 6 | "ant", 7 | "antec", 8 | "anteced", 9 | "antecedent", 10 | "anth", 11 | "app", 12 | "arg", 13 | "argum", 14 | "argument", 15 | "art", 16 | "artic", 17 | "ca", 18 | "cap", 19 | "capit", 20 | "capitul", 21 | "cert", 22 | "cet", 23 | "cett", 24 | "cf", 25 | "ci", 26 | "cit", 27 | "cj", 28 | "cl", 29 | "cod", 30 | "codd", 31 | "col", 32 | "coll", 33 | "coni", 34 | "conj", 35 | "cont", 36 | "corp", 37 | "corr", 38 | "damn", 39 | "def", 40 | "del", 41 | "dett", 42 | "dist", 43 | "dist", 44 | "distin", 45 | "distinc", 46 | "distinct", 47 | "dub", 48 | "ead", 49 | "eadem", 50 | "ed", 51 | "edd", 52 | "eiusd", 53 | "ejusd", 54 | "em", 55 | "eod", 56 | "epist", 57 | "etc", 58 | "exp", 59 | "fg", 60 | "fgs", 61 | "fin", 62 | "fin", 63 | "fort", 64 | "fr", 65 | "frg", 66 | "gl", 67 | "gr", 68 | "ib", 69 | "ibid", 70 | "il", 71 | "ill", 72 | "indic", 73 | "inf", 74 | "inf", 75 | "infr", 76 | "init", 77 | "inscr", 78 | "interl", 79 | "lect", 80 | "lect", 81 | "lit", 82 | "litt", 83 | "ll", 84 | "loc", 85 | "loc", 86 | "marg", 87 | "mg", 88 | "ms", 89 | "mss", 90 | "mut", 91 | "od", 92 | "om", 93 | "pag", 94 | "pal", 95 | "pap", 96 | "papp", 97 | "penul", 98 | "penult", 99 | "pler", 100 | "plur", 101 | "pot", 102 | "pp", 103 | "pr", 104 | "praec", 105 | "praeced", 106 | "prob", 107 | "prolog", 108 | "prooem", 109 | "prop", 110 | "propos", 111 | "qq", 112 | "qu", 113 | "qu", 114 | "quaest", 115 | "quaestiunc", 116 | "quaestiuncul", 117 | "ras", 118 | "recc", 119 | "rell", 120 | "respons", 121 | "sc", 122 | "sc", 123 | "schol", 124 | "scholl", 125 | "scil", 126 | "secl", 127 | "seq", 128 | "seqq", 129 | "sim", 130 | "solut", 131 | "sq", 132 | "sq", 133 | "sqq", 134 | "ss", 135 | "subscr", 136 | "sup", 137 | "suppl", 138 | "susp", 139 | "tent", 140 | "text", 141 | "trai", 142 | "transp", 143 | "transt", 144 | "trib", 145 | "ud", 146 | "uers", 147 | "uersic", 148 | "uett", 149 | "uid", 150 | "uit", 151 | "ult", 152 | "ultim", 153 | "uu", 154 | "uu", 155 | "uulg", 156 | "vd", 157 | "vers", 158 | "versic", 159 | "vett", 160 | "vid", 161 | "vit", 162 | "vulg", 163 | "vv", 164 | "vv", 165 | "γρ" 166 | ], 167 | -------------------------------------------------------------------------------- /data/homer_data/iliad_1000_not_in_tlg_1000_selection.txt: -------------------------------------------------------------------------------- 1 | # Candidates for Iliad stopwords 2 | ὣς 3 | τ 4 | οἳ 5 | αὐτὰρ 6 | ἄρ 7 | μιν 8 | τοι 9 | ἄρα 10 | οὐδ 11 | περ 12 | ἐπεὶ 13 | ἦ 14 | ἐς 15 | οὔ 16 | καί 17 | ὅ 18 | ὅτε 19 | ἐνὶ 20 | κεν 21 | ὅς 22 | ἐπ 23 | γ 24 | ἐγὼ 25 | οὐδέ 26 | ἔπειτα 27 | ῥ 28 | κε 29 | μάλα 30 | σὺ 31 | ἀμφὶ 32 | ὃς 33 | εἴ 34 | ῥα 35 | με 36 | ἣ 37 | μή 38 | οἵ 39 | ἠδὲ 40 | κ 41 | μέν 42 | ὥς 43 | σε 44 | τὼ 45 | θ 46 | ἠδ 47 | αὖτε 48 | μάλ 49 | ὄφρα 50 | ἔνθ 51 | αὖτις 52 | αἴ 53 | ἠὲ 54 | φάτο 55 | τοῖσι 56 | ἄγε 57 | αὖτ 58 | ἀτὰρ 59 | ἂψ 60 | ἐπεί 61 | ῥά 62 | ὅτ 63 | νύ 64 | ὄφρ 65 | αἰεὶ 66 | ἔπι 67 | τοὶ 68 | ἀμφ 69 | πὰρ 70 | τώ 71 | ἀλλά 72 | ἅμ 73 | αἳ 74 | ὅν 75 | ποτ 76 | ἐόντα 77 | ἔπειτ 78 | ἔτ 79 | προτὶ 80 | σφιν 81 | ἐγὼν 82 | ἦεν 83 | κέ 84 | κέν 85 | αἶψα 86 | τότ 87 | ἑ 88 | οἶος 89 | ἐμὸν 90 | ἐὼν 91 | σύ 92 | ὅθι 93 | ἔμμεναι 94 | ἔνθά 95 | πω 96 | αὖθι 97 | ἐμεῖο 98 | ἔνι 99 | ἔχε 100 | πρίν 101 | αἰὲν 102 | ἔην 103 | ἔσσεται 104 | αὔτως 105 | ἔσαν 106 | νῶϊ 107 | σφι 108 | ἰθὺς 109 | κὰδ 110 | ἀντίον 111 | αὐτίκ 112 | ἔγωγε 113 | πρόσθεν 114 | τιν 115 | οὔτέ 116 | εἴσω 117 | ὀπίσσω 118 | ποτὶ 119 | αἵ 120 | ἄπο 121 | αὖθ 122 | ἐγγύθεν 123 | ἐγγὺς 124 | ἔειπεν 125 | ἐμῷ 126 | ἠμὲν 127 | τάχιστα 128 | ἐνθάδ 129 | ἑτέρωθεν 130 | ἰὼν 131 | ὧς 132 | ἀπάνευθε 133 | ἐσσι 134 | ἠΰτε 135 | ὢ 136 | ἄγχι 137 | ἔπειθ 138 | νυ 139 | ὅσσον 140 | ἀλλήλοισιν 141 | ἐνθάδε 142 | ἐρέω 143 | μευ 144 | ὄφρά 145 | πέρ 146 | τοῖσιν 147 | ὕπο 148 | ἀμφὶς 149 | ἀντικρὺ 150 | γένετ 151 | εἵνεκα 152 | μοί 153 | πάντῃ 154 | πώ 155 | σοί 156 | τόδ 157 | τόφρα 158 | φημι 159 | χαμᾶζε 160 | ἄντα 161 | ἐῢ 162 | ἴμεν 163 | ἄλλοτε 164 | καρπαλίμως 165 | ποτέ 166 | αἰεί 167 | ἀν 168 | ἰόντες 169 | ὁππότε 170 | ὅσσοι 171 | πόλλ 172 | πρόσθε 173 | εἰν 174 | εἴπω 175 | ἠέ 176 | μὰν 177 | οἷ 178 | οὕνεκ 179 | τοί 180 | ἀγχοῦ 181 | ἀλλήλοισι 182 | δεῦρο 183 | ὅττί 184 | πᾶσαι 185 | πολλά 186 | πρόσθ 187 | τοῖο 188 | χαμαὶ 189 | ἄφαρ 190 | ἔα 191 | ἥν 192 | κεῖνος 193 | ὅττι 194 | πάντ 195 | σεῖο 196 | σέο 197 | σεῦ 198 | τόσσον 199 | ἔμ 200 | νόσφιν 201 | ὄπισθε 202 | πάντος 203 | πού 204 | σέ 205 | τινά 206 | ὑπόδρα 207 | ὤ 208 | ὧδ 209 | εἷος 210 | ἐμεῦ 211 | ἐόντες 212 | ἔχεν 213 | ὅθ 214 | οἶον 215 | ὁμῶς 216 | πάρα 217 | ἅ 218 | ἂρ 219 | αὐτοί 220 | εἶμι 221 | -------------------------------------------------------------------------------- /data/phi_data/phi_500_not_in_latin_v_1.txt: -------------------------------------------------------------------------------- 1 | quoque 2 | nihil 3 | nunc 4 | causa 5 | m 6 | potest 7 | omnia 8 | i 9 | c 10 | s 11 | tantum 12 | erit 13 | omnes 14 | p 15 | omnibus 16 | quasi 17 | minus 18 | rei 19 | eam 20 | posse 21 | t 22 | inquit 23 | itaque 24 | illi 25 | habet 26 | ipsa 27 | sint 28 | primum 29 | illud 30 | item 31 | eos 32 | satis 33 | ait 34 | hanc 35 | rerum 36 | semper 37 | propter 38 | suo 39 | l 40 | possit 41 | inde 42 | omnis 43 | fuerit 44 | omnium 45 | unde 46 | alia 47 | fieri 48 | alii 49 | eadem 50 | hunc 51 | hac 52 | facere 53 | quas 54 | saepe 55 | aliquid 56 | suis 57 | mea 58 | ipsum 59 | multa 60 | solum 61 | illum 62 | fuisse 63 | nulla 64 | simul 65 | postea 66 | quidam 67 | habere 68 | factum 69 | dixit 70 | tunc 71 | licet 72 | dicere 73 | tua 74 | quantum 75 | dicitur 76 | uti 77 | ideo 78 | numquam 79 | ibi 80 | iis 81 | aliud 82 | eodem 83 | huius 84 | quorum 85 | nemo 86 | suum 87 | supra 88 | dicit 89 | hinc 90 | quin 91 | fecit 92 | illo 93 | d 94 | plus 95 | ista 96 | ipsi 97 | fit 98 | illis 99 | n 100 | suam 101 | huic 102 | facit 103 | essent 104 | facta 105 | omni 106 | usque 107 | potius 108 | ipso 109 | dedit 110 | quaedam 111 | forte 112 | aliis 113 | prius 114 | certe 115 | posset 116 | nostra 117 | tamquam 118 | q 119 | meo 120 | circa 121 | praeter 122 | u 123 | denique 124 | illam 125 | sane 126 | possunt 127 | quamquam 128 | tot 129 | aliter 130 | suae 131 | r 132 | aduersus 133 | habent 134 | meum 135 | suos 136 | diu 137 | multis 138 | hi 139 | dare 140 | omne 141 | dictum 142 | praeterea 143 | postquam 144 | alio 145 | statim 146 | adeo 147 | intra 148 | alter 149 | tanta 150 | fere 151 | utrum 152 | alterum 153 | scilicet 154 | multo 155 | umquam 156 | videtur 157 | quando 158 | uidetur 159 | cetera 160 | mi 161 | eas 162 | ii 163 | potuit 164 | dici 165 | nostri 166 | fore 167 | quicquam 168 | tuo 169 | namque 170 | prope 171 | habeat 172 | altera 173 | sese 174 | ceteris 175 | nullum 176 | omnem 177 | multum 178 | aliqua 179 | dicunt 180 | dicta 181 | fuerat 182 | nullo 183 | diximus 184 | illius 185 | alias 186 | v 187 | nostris 188 | quamuis 189 | hos 190 | dari 191 | h 192 | ipsis 193 | habuit 194 | ceterum 195 | ulla 196 | nondum 197 | ipsius 198 | vobis 199 | procul 200 | alios 201 | rursus 202 | quidquid 203 | huc 204 | dicam 205 | omnino 206 | tuis 207 | donec 208 | alius 209 | -------------------------------------------------------------------------------- /data/latin_paradigms/sum.txt: -------------------------------------------------------------------------------- 1 | eram 2 | eramque 3 | eramus 4 | erant 5 | erantque 6 | eras 7 | erat 8 | eratis 9 | eratne 10 | eratque 11 | erimus 12 | erimusque 13 | erin 14 | eris 15 | erisque 16 | erit 17 | eritis 18 | eritisque 19 | eritne 20 | eritque 21 | eritue 22 | ero 23 | eroque 24 | erunt 25 | eruntque 26 | eruntue 27 | eruntve 28 | es 29 | esne 30 | esque 31 | esse 32 | essem 33 | essemque 34 | essemus 35 | essemusne 36 | essemusque 37 | essemusve 38 | essene 39 | essent 40 | essentne 41 | essentque 42 | essentve 43 | esseque 44 | esses 45 | essesne 46 | essesque 47 | essesve 48 | esset 49 | essetis 50 | essetisne 51 | essetisque 52 | essetisve 53 | essetne 54 | essetque 55 | essetve 56 | esseve 57 | est 58 | este 59 | estene 60 | esteque 61 | esteve 62 | estis 63 | estisne 64 | estisque 65 | estisve 66 | estne 67 | esto 68 | eston 69 | estote 70 | estque 71 | estve 72 | esve 73 | fore 74 | forem 75 | forent 76 | fores 77 | foresque 78 | foret 79 | fuam 80 | fuant 81 | fuas 82 | fuat 83 | fueram 84 | fueramque 85 | fueramus 86 | fuerant 87 | fueras 88 | fuerat 89 | fueratis 90 | fueratque 91 | fuere 92 | fuerim 93 | fuerimque 94 | fuerimus 95 | fuerint 96 | fuerintne 97 | fuerintque 98 | fueris 99 | fuerisne 100 | fuerit 101 | fueritis 102 | fueritne 103 | fueritque 104 | fueritue 105 | fueritve 106 | fuero 107 | fuerunt 108 | fueruntne 109 | fueruntque 110 | fui 111 | fuimus 112 | fuimusque 113 | fuimusve 114 | fuisse 115 | fuissem 116 | fuissemus 117 | fuissent 118 | fuisseque 119 | fuisses 120 | fuisset 121 | fuissetis 122 | fuissetque 123 | fuisti 124 | fuistin 125 | fuistique 126 | fuistis 127 | fuistisne 128 | fuit 129 | fuitne 130 | fuitque 131 | futura 132 | futurae 133 | futuraeque 134 | futuram 135 | futuramque 136 | futuraque 137 | futurarum 138 | futuras 139 | futurast 140 | futurave 141 | future 142 | futuri 143 | futurique 144 | futuris 145 | futurisque 146 | futuro 147 | futurorum 148 | futurorumque 149 | futuros 150 | futurosque 151 | futurove 152 | futurum 153 | futurumque 154 | futurumst 155 | futurumve 156 | futurus 157 | futurusne 158 | futurusque 159 | futurusve 160 | siem 161 | sient 162 | sies 163 | siet 164 | sim 165 | simne 166 | simque 167 | simus 168 | sint 169 | sintne 170 | sintque 171 | sis 172 | sisne 173 | sisque 174 | sist 175 | sit 176 | sitis 177 | sitisque 178 | sitne 179 | sitque 180 | sitve 181 | sum 182 | sumne 183 | sumque 184 | sumus 185 | sumusque 186 | sumusve 187 | sunt 188 | suntne 189 | sunto 190 | suntoque 191 | suntque 192 | -------------------------------------------------------------------------------- /data/homer_data/odyssey_candidates_union_100_1000.txt: -------------------------------------------------------------------------------- 1 | # Candidates for Odyssey stopwords 2 | ὣς 3 | αὐτὰρ 4 | ἐνὶ 5 | μιν 6 | ἄρ 7 | κεν 8 | ἠδὲ 9 | οὐδέ 10 | ῥ 11 | κε 12 | ὄφρα 13 | αὖτε 14 | ἄγε 15 | ἔφατ 16 | ἠδ 17 | ἐγὼν 18 | ἔνθ 19 | μάλ 20 | φάτο 21 | ἠὲ 22 | ὄφρ 23 | ἀλλά 24 | κέ 25 | τοῖσιν 26 | ἀντίον 27 | ἐπεί 28 | ῥα 29 | τοὶ 30 | τοῖσι 31 | τῶ 32 | ἅμ 33 | τότ 34 | αἰεὶ 35 | αὖτ 36 | κέν 37 | σφιν 38 | νύ 39 | ἀτὰρ 40 | αἶψα 41 | ἔπειτ 42 | ὅθι 43 | πάρος 44 | αὐτίκ 45 | ποτ 46 | ἐνθάδ 47 | ἦεν 48 | ἐόντα 49 | ἐῢ 50 | αὖτις 51 | ἔτ 52 | πὰρ 53 | κεῖνος 54 | σύ 55 | αἴ 56 | ἀμφ 57 | ἔμμεναι 58 | ἐμὸν 59 | ἐρέω 60 | πόλλ 61 | πω 62 | ἂψ 63 | μευ 64 | τιν 65 | αἰὲν 66 | ἔην 67 | ἰὼν 68 | ποτὶ 69 | τὼ 70 | ὅττι 71 | ἔνθεν 72 | ἐὼν 73 | ἕκαστα 74 | ἔνι 75 | ὅτ 76 | ὦκα 77 | ἔσαν 78 | ἦμος 79 | ὅν 80 | ἐμοί 81 | οἴκαδ 82 | ἄγχι 83 | εἴπω 84 | τόφρα 85 | ἠμὲν 86 | θύραζε 87 | ῥά 88 | δὴν 89 | τόδ 90 | τοί 91 | ἔειπε 92 | εἰπὲ 93 | ἔσσεται 94 | αἶψ 95 | εἵνεκα 96 | εἴσω 97 | ἐσσι 98 | ὀπίσσω 99 | ὁππότε 100 | πού 101 | πώ 102 | ἄπο 103 | ἑ 104 | ἐνθάδε 105 | κὰδ 106 | οἶος 107 | ὢ 108 | αἲ 109 | αὔτως 110 | δεῦρο 111 | ἔμπης 112 | κάτα 113 | πολλὸν 114 | τοῖος 115 | ἔειπεν 116 | εἷος 117 | καρπαλίμως 118 | κεῖνον 119 | ὅδ 120 | ὅσσα 121 | πρίν 122 | σέ 123 | σὴν 124 | τάχιστα 125 | αἵ 126 | δεῦρ 127 | οἷ 128 | οἴκαδε 129 | ὅσσοι 130 | πάντ 131 | τοιγὰρ 132 | τοῖον 133 | ὧς 134 | ἔειπες 135 | ἔπι 136 | ἔχε 137 | μηδέ 138 | οἶκόνδε 139 | πολλά 140 | τόσσον 141 | αἰεί 142 | ἄλλοθεν 143 | ἂρ 144 | αὖθι 145 | εἰν 146 | ἐών 147 | ἥν 148 | οἷος 149 | ὅσσον 150 | πάμπαν 151 | πέρ 152 | ὧδ 153 | ἅ 154 | ἄφαρ 155 | ἠέ 156 | οἶον 157 | πάντεσσι 158 | προτὶ 159 | σὸν 160 | αἳ 161 | ἐμόν 162 | ἐμὸς 163 | ἑὸν 164 | ἦε 165 | κείνου 166 | νῶϊ 167 | ὅδε 168 | οἴη 169 | πάρα 170 | πᾶσαι 171 | σοί 172 | σφ 173 | σφεας 174 | χ 175 | ἄλλ 176 | ἄλλαι 177 | ἀνά 178 | ἐγγὺς 179 | ἥδε 180 | οἷά 181 | οὐκέτ 182 | ποτέ 183 | ὕπο 184 | ἅλις 185 | ἀμφὶς 186 | ἀν 187 | ἅπαντες 188 | αὐτή 189 | ἐγγύθεν 190 | ἔμ 191 | ἐμεῖο 192 | ἔπειθ 193 | ἔστ 194 | ἡμέας 195 | προτέρω 196 | σῷ 197 | ὕμιν 198 | ἄλλῃ 199 | αὐτοί 200 | διὲκ 201 | ἐμὴν 202 | ἐμῆς 203 | ἐόντες 204 | ἦέ 205 | ἥμιν 206 | θᾶσσον 207 | τ 208 | τοι 209 | ἦ 210 | ἐπεὶ 211 | ἐς 212 | ἄρα 213 | καί 214 | οὔ 215 | ἐγὼ 216 | περ 217 | γ 218 | ἔνθα 219 | ἐπ 220 | οὐδ 221 | μ 222 | ἔπειτα 223 | ὅτε 224 | σε 225 | μάλα 226 | με 227 | ὅς 228 | μή 229 | ὅ 230 | πολλὰ 231 | εἴ 232 | σὺ 233 | δή 234 | μέν 235 | τίς 236 | κ 237 | οἵ 238 | πάντες 239 | ὦ 240 | ἐγώ 241 | ἥ 242 | θ 243 | ἤδη 244 | -------------------------------------------------------------------------------- /data/abbreviations/athenaeus_ascii.txt: -------------------------------------------------------------------------------- 1 | k 2 | fr 3 | ii 4 | i 5 | fhg 6 | p 7 | b 8 | iv 9 | ib 10 | n 11 | m 12 | iii 13 | r 14 | c 15 | l 16 | a 17 | b 18 | w 19 | h 20 | schn 21 | pr 22 | v 23 | cf 24 | ibid 25 | bo 26 | eur 27 | pl 28 | v 29 | tur 30 | d 31 | e 32 | s 33 | ki 34 | f 35 | l 36 | sch 37 | bl 38 | koepke 39 | litt 40 | al 41 | gaede 42 | h 43 | scr 44 | wil 45 | ad 46 | birt 47 | om 48 | schm 49 | bach 50 | hi 51 | a 52 | arist 53 | hu 54 | ri 55 | rz 56 | symp 57 | an 58 | anth 59 | bergk 60 | op 61 | pl 62 | pop 63 | ar 64 | strecker 65 | bacch 66 | com 67 | ep 68 | fgh 69 | ix 70 | med 71 | pind 72 | plat 73 | ps 74 | rose 75 | vi 76 | hipp 77 | opp 78 | p 79 | phaedr 80 | soph 81 | st 82 | supra 83 | us 84 | ach 85 | apol 86 | arch 87 | bgk 88 | brandt 89 | cap 90 | choliamb 91 | ed 92 | hes 93 | inc 94 | iph 95 | ol 96 | pag 97 | tro 98 | vii 99 | xi 100 | z 101 | adesp 102 | adn 103 | alex 104 | andr 105 | ap 106 | av 107 | br 108 | byw 109 | carm 110 | cd 111 | chol 112 | de 113 | dem 114 | e 115 | el 116 | eratosth 117 | fol 118 | herc 119 | herm 120 | herod 121 | hill 122 | hom 123 | i 124 | kinkel 125 | koep 126 | mein 127 | mich 128 | nauck 129 | nub 130 | ol 131 | phaed 132 | philox 133 | pke 134 | ribb 135 | simon 136 | sophr 137 | stesich 138 | streck 139 | theogn 140 | tim 141 | trag 142 | vels 143 | viii 144 | xen 145 | aeoli 146 | aesch 147 | ages 148 | al 149 | alcaei 150 | amipsiae 151 | anal 152 | anan 153 | andoc 154 | androm 155 | ant 156 | ante 157 | anth 158 | antig 159 | ap 160 | apoll 161 | aristias 162 | augae 163 | av 164 | baum 165 | bc 166 | behr 167 | bernh 168 | bue 169 | burckh 170 | castorionis 171 | chamael 172 | cia 173 | conv 174 | cor 175 | critiae 176 | cycl 177 | cyr 178 | del 179 | diogenian 180 | duening 181 | epic 182 | epic 183 | epich 184 | eq 185 | eq 186 | et 187 | extr 188 | g 189 | gen 190 | gorg 191 | hec 192 | hell 193 | hist 194 | hymn 195 | inde 196 | init 197 | kock 198 | lach 199 | li 200 | lib 201 | littr 202 | lyc 203 | melan 204 | mem 205 | meteor 206 | min 207 | muell 208 | myrmid 209 | nem 210 | nic 211 | nub 212 | o 213 | odor 214 | oenom 215 | olynth 216 | omis 217 | or 218 | or 219 | orac 220 | ot 221 | pac 222 | parm 223 | pet 224 | philem 225 | phoen 226 | pl 227 | plin 228 | plut 229 | polit 230 | polyb 231 | pyth 232 | pyth 233 | qu 234 | r 235 | ran 236 | ran 237 | reip 238 | rep 239 | rhet 240 | sc 241 | schaubach 242 | scol 243 | sic 244 | sq 245 | sqq 246 | str 247 | theaet 248 | theocr 249 | thuc 250 | timon 251 | wachsm 252 | wi 253 | wimm 254 | xiii 255 | xiv 256 | zenob 257 | ziegl 258 | -------------------------------------------------------------------------------- /data/tlg_data/tlg_500_not_in_greek_v_1.txt: -------------------------------------------------------------------------------- 1 | τοῦτο 2 | αὐτοῦ 3 | εἶναι 4 | ταῦτα 5 | αὐτῶν 6 | αὐτὸν 7 | αὐτῷ 8 | ἦν 9 | ἐστιν 10 | πάντα 11 | τούτων 12 | δι 13 | ὥσπερ 14 | αὐτοῖς 15 | πάλιν 16 | νῦν 17 | ὧν 18 | ἔχει 19 | μόνον 20 | οἷον 21 | μᾶλλον 22 | ἡμῖν 23 | πῶς 24 | α 25 | ἡμῶν 26 | ἔστι 27 | σου 28 | λέγει 29 | μοι 30 | αὐτῆς 31 | μου 32 | τούτου 33 | ὅταν 34 | αὐτοὺς 35 | αὐτὸ 36 | ἐς 37 | ἐπ 38 | ἀντὶ 39 | αὐτὴν 40 | πάντων 41 | γίνεται 42 | ἐπειδὴ 43 | ἡμᾶς 44 | γ 45 | ἔστιν 46 | ἐστὶν 47 | με 48 | τούτοις 49 | ἤδη 50 | ἐστὶ 51 | τοίνυν 52 | πρῶτον 53 | ἔσται 54 | β 55 | τ 56 | ἔχειν 57 | σοι 58 | μάλιστα 59 | ἣν 60 | ταύτην 61 | εἰπεῖν 62 | τοῦτον 63 | εἶπεν 64 | ἄλλων 65 | λέγων 66 | ε 67 | ἐνταῦθα 68 | ἀεὶ 69 | λέγεται 70 | εἴη 71 | σε 72 | εἶτα 73 | λέγειν 74 | πολλὰ 75 | φησιν 76 | τούτῳ 77 | διὸ 78 | ν 79 | πρότερον 80 | ἄλλο 81 | ι 82 | πᾶν 83 | γενέσθαι 84 | φησὶν 85 | ὅσα 86 | μηδὲ 87 | ὑμῶν 88 | ἔφη 89 | αὐτῇ 90 | ὅπως 91 | αὐτὰ 92 | φησὶ 93 | καθάπερ 94 | ἔχων 95 | ὑμῖν 96 | μέντοι 97 | πάντες 98 | ταύτης 99 | ἕως 100 | μηδὲν 101 | ὄντα 102 | αὕτη 103 | ἕτερον 104 | ἤτοι 105 | ἡμεῖς 106 | αὐτόν 107 | τοιαῦτα 108 | εἴρηται 109 | ποιεῖ 110 | πολλάκις 111 | η 112 | ὢν 113 | μέχρι 114 | ἄλλως 115 | κ 116 | ἄλλα 117 | ἑαυτὸν 118 | φησίν 119 | ᾖ 120 | ο 121 | ἐκεῖ 122 | ὑμᾶς 123 | πᾶσαν 124 | ἐκείνου 125 | φησι 126 | λέγω 127 | ἐγένετο 128 | τοιοῦτον 129 | παντὸς 130 | πολὺ 131 | ὅσον 132 | πάντας 133 | τινος 134 | θ 135 | μ 136 | τινὰ 137 | ἑξῆς 138 | ποιεῖν 139 | πολλῶν 140 | ἁπλῶς 141 | οὗτοι 142 | πάντως 143 | ἤγουν 144 | εἰσιν 145 | ἐκείνων 146 | ᾗ 147 | ἕκαστον 148 | τινες 149 | πλὴν 150 | ἦσαν 151 | ὄντων 152 | ποτὲ 153 | αὐτοὶ 154 | ὄντος 155 | ἐστίν 156 | εὖ 157 | πλέον 158 | ἄνω 159 | ἐκεῖνος 160 | εἶπε 161 | ἄλλοις 162 | ὂν 163 | πάνυ 164 | ς 165 | ταύτῃ 166 | εὐθὺς 167 | λ 168 | φησί 169 | ἔξω 170 | τούτους 171 | πάσης 172 | ὅμως 173 | γίνεσθαι 174 | καθόλου 175 | τουτέστιν 176 | ζ 177 | τουτέστι 178 | ἑαυτῷ 179 | ἐμοῦ 180 | πᾶσι 181 | πᾶσα 182 | ἐμοὶ 183 | τοσοῦτον 184 | οὐκέτι 185 | ἔχοντα 186 | ἐκεῖνο 187 | εἰπὼν 188 | χωρὶς 189 | διότι 190 | ἑαυτῶν 191 | ἐντεῦθεν 192 | κάτω 193 | αὖθις 194 | γέγονεν 195 | ἴσως 196 | εἰσι 197 | πολλοὶ 198 | ἁπάντων 199 | ἔνθα 200 | τοιούτων 201 | εἰσὶ 202 | εἴπερ 203 | πρὶν 204 | ἔπειτα 205 | παντὶ 206 | ἄλλοι 207 | πολλοὺς 208 | ἔστω 209 | πᾶσιν 210 | τοῦτ 211 | γίνονται 212 | οὐκοῦν 213 | π 214 | μεταξὺ 215 | ἄνευ 216 | τινὲς 217 | ὑμεῖς 218 | ἐκεῖνον 219 | ὁμοῦ 220 | ϛ 221 | ἀλλήλων 222 | ἔχοντες 223 | ὅπου 224 | γένηται 225 | πολλῷ 226 | σοῦ 227 | τινὸς 228 | αὐτὴ 229 | σφόδρα 230 | ἅπαντα 231 | αὐτούς 232 | ὑφ 233 | πᾶς 234 | γέγονε 235 | ἕνεκα 236 | ἔχον 237 | τοῦτό 238 | ἔχουσι 239 | δηλονότι 240 | -------------------------------------------------------------------------------- /data/latin_paradigms/do.txt: -------------------------------------------------------------------------------- 1 | da 2 | dabam 3 | dabamus 4 | dabant 5 | dabantque 6 | dabantur 7 | dabanturque 8 | dabar 9 | dabas 10 | dabat 11 | dabatque 12 | dabatur 13 | dabaturque 14 | daberis 15 | dabimus 16 | dabimusque 17 | dabin 18 | dabis 19 | dabisne 20 | dabisque 21 | dabit 22 | dabitis 23 | dabitque 24 | dabitur 25 | dabiturne 26 | dabiturque 27 | dabo 28 | daboque 29 | dabor 30 | dabunt 31 | dabuntque 32 | dabuntur 33 | damur 34 | damus 35 | damusque 36 | dan 37 | danda 38 | dandae 39 | dandam 40 | dandamque 41 | dandaque 42 | dandarum 43 | dandas 44 | dandi 45 | dandique 46 | dandis 47 | dando 48 | dandoque 49 | dandorum 50 | dandos 51 | dandosne 52 | dandosque 53 | dandum 54 | dandumque 55 | dandumst 56 | dandus 57 | dandusque 58 | dans 59 | dant 60 | dante 61 | dantem 62 | dantes 63 | danti 64 | dantia 65 | dantibus 66 | dantis 67 | danto 68 | dantque 69 | dantur 70 | daque 71 | dare 72 | darem 73 | daremus 74 | daren 75 | darent 76 | darentque 77 | darentur 78 | dareque 79 | darer 80 | dareris 81 | dares 82 | daret 83 | daretis 84 | daretque 85 | daretur 86 | dari 87 | darier 88 | darique 89 | daris 90 | dariue 91 | das 92 | dasne 93 | dasque 94 | dat 95 | data 96 | datae 97 | datam 98 | datamque 99 | dataque 100 | datarum 101 | datas 102 | datasque 103 | datast 104 | date 105 | dati 106 | datin 107 | datiores 108 | datique 109 | datis 110 | datisne 111 | datisque 112 | datne 113 | dato 114 | datoque 115 | datorum 116 | datos 117 | datosque 118 | datque 119 | datu 120 | datum 121 | datumque 122 | datumst 123 | datur 124 | datura 125 | daturae 126 | daturam 127 | daturas 128 | dature 129 | daturi 130 | daturin 131 | daturique 132 | daturis 133 | daturo 134 | daturos 135 | daturque 136 | daturum 137 | daturumque 138 | daturus 139 | daturust 140 | datus 141 | datusque 142 | datust 143 | daue 144 | dave 145 | dederam 146 | dederamque 147 | dederamus 148 | dederant 149 | dederas 150 | dederat 151 | dederatque 152 | dedere 153 | dederim 154 | dederimus 155 | dederint 156 | dederis 157 | dederisque 158 | dederit 159 | dederitis 160 | dederitque 161 | dedero 162 | dederunt 163 | dederuntque 164 | dedi 165 | dedimus 166 | dedin 167 | dedique 168 | dedisse 169 | dedissem 170 | dedissemus 171 | dedissent 172 | dedisses 173 | dedisset 174 | dedissetis 175 | dedissetue 176 | dedisti 177 | dedistin 178 | dedistique 179 | dedistis 180 | dedit 181 | deditque 182 | dem 183 | demque 184 | demus 185 | demusque 186 | den 187 | dent 188 | dentque 189 | dentur 190 | der 191 | dere 192 | deris 193 | des 194 | desque 195 | det 196 | detis 197 | detisque 198 | detque 199 | detur 200 | deturque 201 | do 202 | don 203 | doque 204 | dor 205 | duim 206 | duint 207 | duis 208 | duisque 209 | duit 210 | -------------------------------------------------------------------------------- /versions/stopwords_greek_v1_0.txt: -------------------------------------------------------------------------------- 1 | # Ancient Greek stopwords 2 | # 2017-10-16 version 1.0 3 | # Aurélien Berra 4 | # https://github.com/aurelberra/stopwords 5 | # Total number of items (tokens or symbols): 262 6 | 7 | αἱ 8 | αἳ 9 | αἵ 10 | αὐτὸς 11 | αὐτὸσ 12 | αὐτὸϲ 13 | αὐτός 14 | αὐτόσ 15 | αὐτόϲ 16 | αὖ 17 | γα 18 | γε 19 | γοῦν 20 | γὰρ 21 | γάρ 22 | γᾶ 23 | δ 24 | δ' 25 | δαὶ 26 | δαί 27 | διὰ 28 | διά 29 | δὲ 30 | δέ 31 | δὴ 32 | δή 33 | δ’ 34 | εἰ 35 | εἰμὶ 36 | εἰμί 37 | εἰς 38 | εἰσ 39 | εἰϲ 40 | εἴ 41 | εἴμι 42 | εἴτε 43 | καίτοι 44 | καθ 45 | κατ 46 | κατὰ 47 | κατά 48 | καὶ 49 | καί 50 | κἀν 51 | κἂν 52 | μήτε 53 | μεθ 54 | μετ 55 | μετὰ 56 | μετά 57 | μἐν 58 | μὲν 59 | μέν 60 | μὴ 61 | μὴν 62 | μή 63 | ξύν 64 | ξὺν 65 | οἱ 66 | οἳ 67 | οἷς 68 | οἷϲ 69 | οὐ 70 | οὐδ 71 | οὐδεὶς 72 | οὐδεὶσ 73 | οὐδεὶϲ 74 | οὐδείς 75 | οὐδείσ 76 | οὐδείϲ 77 | οὐδὲ 78 | οὐδὲν 79 | οὐδέ 80 | οὐκ 81 | οὐχ 82 | οὐχὶ 83 | οὓς 84 | οὓϲ 85 | οὔκ 86 | οὔτε 87 | οὕτω 88 | οὕτως 89 | οὕτωσ 90 | οὕτωϲ 91 | οὖν 92 | οὗ 93 | οὗτος 94 | οὗτοσ 95 | οὗτοϲ 96 | παρ 97 | παρὰ 98 | παρά 99 | περὶ 100 | περί 101 | ποτε 102 | που 103 | ποῦ 104 | προ 105 | πρὸ 106 | πρὸς 107 | πρὸσ 108 | πρὸϲ 109 | πρός 110 | πρόσ 111 | πρόϲ 112 | πως 113 | πωϲ 114 | σὸς 115 | σὸσ 116 | σός 117 | σόσ 118 | σὺ 119 | σὺν 120 | σύ 121 | σύν 122 | ταῖς 123 | ταῖσ 124 | ταῖϲ 125 | τε 126 | τι 127 | τινα 128 | τις 129 | τισ 130 | τιϲ 131 | τοι 132 | τοιοῦτος 133 | τοιοῦτοσ 134 | τοιοῦτοϲ 135 | τοὶ 136 | τοί 137 | τοὺς 138 | τοὺσ 139 | τοὺϲ 140 | τούς 141 | τούσ 142 | τούϲ 143 | τοῖς 144 | τοῖσ 145 | τοῖϲ 146 | τοῦ 147 | τότε 148 | τὰ 149 | τὰς 150 | τὰσ 151 | τὰϲ 152 | τά 153 | τάς 154 | τάσ 155 | τάϲ 156 | τὴν 157 | τήν 158 | τὶ 159 | τὶς 160 | τὶϲ 161 | τί 162 | τίς 163 | τίσ 164 | τίϲ 165 | τὸ 166 | τὸν 167 | τό 168 | τόν 169 | τᾶς 170 | τᾶϲ 171 | τῆς 172 | τῆσ 173 | τῆϲ 174 | τῇ 175 | τῶν 176 | τῷ 177 | ϲὸϲ 178 | ϲόϲ 179 | ϲὺ 180 | ϲὺν 181 | ϲύ 182 | ϲύν 183 | ἀλλ 184 | ἀλλ' 185 | ἀλλὰ 186 | ἀλλά 187 | ἀλλ’ 188 | ἀπ 189 | ἀπὸ 190 | ἀπό 191 | ἀφ 192 | ἂν 193 | ἃ 194 | ἄλλος 195 | ἄλλοσ 196 | ἄλλοϲ 197 | ἄν 198 | ἄρα 199 | ἅμα 200 | ἐγὼ 201 | ἐγώ 202 | ἐκ 203 | ἐμὸς 204 | ἐμὸσ 205 | ἐμὸϲ 206 | ἐμός 207 | ἐμόσ 208 | ἐμόϲ 209 | ἐν 210 | ἐξ 211 | ἐπεὶ 212 | ἐπὶ 213 | ἐπί 214 | ἐστι 215 | ἐφ 216 | ἐϲτι 217 | ἐὰν 218 | ἐάν 219 | ἑαυτοῦ 220 | ἔτι 221 | ἡ 222 | ἢ 223 | ἣ 224 | ἤ 225 | ἥ 226 | ἧς 227 | ἧϲ 228 | ἵνα 229 | ὁ 230 | ὃ 231 | ὃδε 232 | ὃν 233 | ὃς 234 | ὃσ 235 | ὃϲ 236 | ὅ 237 | ὅδε 238 | ὅθεν 239 | ὅπερ 240 | ὅς 241 | ὅσ 242 | ὅστις 243 | ὅστισ 244 | ὅτε 245 | ὅτι 246 | ὅϲ 247 | ὅϲτιϲ 248 | ὑμὸς 249 | ὑμὸσ 250 | ὑμὸϲ 251 | ὑμός 252 | ὑμόσ 253 | ὑμόϲ 254 | ὑπ 255 | ὑπὲρ 256 | ὑπέρ 257 | ὑπὸ 258 | ὑπό 259 | ὡς 260 | ὡσ 261 | ὡϲ 262 | ὥς 263 | ὥσ 264 | ὥστε 265 | ὥϲ 266 | ὥϲτε 267 | ὦ 268 | ᾧ 269 | -------------------------------------------------------------------------------- /data/greek_paradigms/phemi.txt: -------------------------------------------------------------------------------- 1 | ἔφα 2 | ἔφαμεν 3 | ἔφαν 4 | ἔφαντ' 5 | ἔφαντο 6 | ἔφαθ' 7 | ἔφασαν 8 | ἔφασο 9 | ἔφατ' 10 | ἔφατε 11 | ἔφατο 12 | ἔφατον 13 | ἔφη 14 | ἔφημεν 15 | ἔφην 16 | ἔφης 17 | ἔφησα 18 | ἔφησαν 19 | ἔφησας 20 | ἔφησε 21 | ἔφησεν 22 | ἔφησθ' 23 | ἔφησθα 24 | ἐφάμην 25 | ἐφάθημεν 26 | ἐφάθην 27 | ἐφάθησαν 28 | ἐφάτην 29 | ἐφήσαμεν 30 | ἐφήσατε 31 | φάμ' 32 | φάμεν 33 | φάμεναι 34 | φάμενοι 35 | φάμενον 36 | φάμενος 37 | φάμην 38 | φάν 39 | φάναι 40 | φάντα 41 | φάντας 42 | φάντες 43 | φάντι 44 | φάντο 45 | φάντος 46 | φάντων 47 | φάο 48 | φάθ' 49 | φάθι 50 | φάς 51 | φάσ' 52 | φάσαι 53 | φάσαν 54 | φάσας 55 | φάσει 56 | φάσεις 57 | φάσηις 58 | φάσῃς 59 | φάσι 60 | φάσιν 61 | φάσο 62 | φάσομαι 63 | φάσουσιν 64 | φάσθ' 65 | φάσθαι 66 | φάσθε 67 | φάσθω 68 | φάσω 69 | φάτ' 70 | φάτε 71 | φάτην 72 | φάτι 73 | φάτο 74 | φάτω 75 | φᾶ 76 | φᾶν 77 | φᾶσ' 78 | φᾶσα 79 | φᾶσαι 80 | φᾶσι 81 | φᾶσιν 82 | φαίη 83 | φαίημεν 84 | φαίην 85 | φαίης 86 | φαίησαν 87 | φαίητ' 88 | φαίητε 89 | φαῖεν 90 | φαῖμ' 91 | φαῖμεν 92 | φαῖσ' 93 | φαῖσι 94 | φαμ' 95 | φαμέν 96 | φαμένα 97 | φαμένας 98 | φαμένη 99 | φαμένην 100 | φαμένης 101 | φαμένοιο 102 | φαμένοις 103 | φαμένου 104 | φαμένους 105 | φαμένων 106 | φαμένῳ 107 | φαμεν 108 | φαμι 109 | φαμί 110 | φαντι 111 | φαντί 112 | φαθ' 113 | φαθί 114 | φασ' 115 | φασεῖς 116 | φασι 117 | φασί 118 | φασίν 119 | φασιν 120 | φασοῦμες 121 | φασῶ 122 | φατ' 123 | φατε 124 | φατέ 125 | φατι 126 | φατί 127 | φατόν 128 | φατον 129 | φήῃ 130 | φήμ' 131 | φής 132 | φήσ' 133 | φήσαι 134 | φήσαιεν 135 | φήσαιμ' 136 | φήσαιμεν 137 | φήσαιμι 138 | φήσαις 139 | φήσαιτ' 140 | φήσαιτε 141 | φήσαιτο 142 | φήσαντα 143 | φήσαντας 144 | φήσαντες 145 | φήσαντι 146 | φήσαντος 147 | φήσας 148 | φήσασα 149 | φήσασαν 150 | φήσασι 151 | φήσασιν 152 | φήσασκε 153 | φήσασκεν 154 | φήσει 155 | φήσειαν 156 | φήσειας 157 | φήσειε 158 | φήσειεν 159 | φήσειν 160 | φήσεις 161 | φήσετ' 162 | φήσεται 163 | φήσετε 164 | φήσητε 165 | φήσῃ 166 | φήσῃς 167 | φήσι 168 | φήσοι 169 | φήσοιεν 170 | φήσοιτε 171 | φήσομαι 172 | φήσομεν 173 | φήσοντας 174 | φήσοντες 175 | φήσοντι 176 | φήσοντος 177 | φήσουσ' 178 | φήσουσι 179 | φήσουσιν 180 | φήσω 181 | φήσωμεν 182 | φήσων 183 | φήσωσι 184 | φήσωσιν 185 | φῄς 186 | φῆ 187 | φῆι 188 | φῆις 189 | φῆν 190 | φῆς 191 | φῆσ' 192 | φῆσαι 193 | φῆσαν 194 | φῆσε 195 | φῆσι 196 | φῆσθα 197 | φῆτε 198 | φῇ 199 | φῇς 200 | φῇσι 201 | φῇσιν 202 | φῇσθα 203 | φημ' 204 | φημι 205 | φημί 206 | φης 207 | φησ' 208 | φησάντων 209 | φησάσης 210 | φησάσῃ 211 | φησάτω 212 | φησι 213 | φησί 214 | φησίν 215 | φησιν 216 | φησόντων 217 | φῶ 218 | φῶμεν 219 | φῶσ' 220 | φῶσι 221 | φῶσιν 222 | κἄφησε 223 | κἤφα 224 | πεφάσθω 225 | πεφασμένα 226 | πεφασμένην 227 | πεφασμένης 228 | πεφασμένοις 229 | πεφασμένον 230 | πεφασμένος 231 | πεφασμένου 232 | πεφασμένων 233 | πεφασμένως 234 | -------------------------------------------------------------------------------- /data/latin_paradigms/habeo.txt: -------------------------------------------------------------------------------- 1 | habe 2 | habeam 3 | habeamini 4 | habeamus 5 | habeant 6 | habeantne 7 | habeantque 8 | habeantur 9 | habear 10 | habeare 11 | habearis 12 | habeas 13 | habeasne 14 | habeasque 15 | habeat 16 | habeatis 17 | habeatque 18 | habeatur 19 | habeaturque 20 | habebam 21 | habebamus 22 | habebant 23 | habebantque 24 | habebantur 25 | habebas 26 | habebat 27 | habebatis 28 | habebatque 29 | habebatur 30 | habebaturque 31 | habebere 32 | habeberis 33 | habebimur 34 | habebimus 35 | habebis 36 | habebit 37 | habebitis 38 | habebitque 39 | habebitur 40 | habebo 41 | habebor 42 | habebunt 43 | habebuntque 44 | habebuntur 45 | habemur 46 | habemus 47 | haben 48 | habenda 49 | habendae 50 | habendaeque 51 | habendam 52 | habendamque 53 | habendarum 54 | habendas 55 | habendast 56 | habendi 57 | habendique 58 | habendis 59 | habendo 60 | habendoque 61 | habendorum 62 | habendos 63 | habendum 64 | habendumque 65 | habendumst 66 | habendus 67 | habendusve 68 | habens 69 | habensque 70 | habent 71 | habente 72 | habentem 73 | habentes 74 | habenti 75 | habentia 76 | habentibus 77 | habentis 78 | habentium 79 | habentne 80 | habento 81 | habentque 82 | habentur 83 | habeo 84 | habeon 85 | habeoque 86 | habeor 87 | habere 88 | haberem 89 | haberemque 90 | haberemus 91 | haberent 92 | haberentque 93 | haberentue 94 | haberentur 95 | habereque 96 | haberes 97 | haberet 98 | haberetis 99 | haberetne 100 | haberetque 101 | haberetur 102 | habereturque 103 | haberi 104 | haberier 105 | haberique 106 | haberis 107 | habes 108 | habesne 109 | habet 110 | habete 111 | habetin 112 | habetis 113 | habetisque 114 | habeto 115 | habetote 116 | habetque 117 | habetur 118 | habeturque 119 | habita 120 | habitae 121 | habitam 122 | habitaque 123 | habitas 124 | habitasque 125 | habitast 126 | habite 127 | habiti 128 | habitior 129 | habitis 130 | habitissimum 131 | habito 132 | habitoque 133 | habitorum 134 | habitos 135 | habitosque 136 | habitu 137 | habitum 138 | habitumque 139 | habitune 140 | habituque 141 | habitura 142 | habiturae 143 | habituram 144 | habituras 145 | habituri 146 | habiturine 147 | habituris 148 | habituro 149 | habituros 150 | habiturum 151 | habiturumue 152 | habiturus 153 | habiturusque 154 | habiturust 155 | habiturusue 156 | habitus 157 | habitusque 158 | habitust 159 | habueram 160 | habueramus 161 | habuerant 162 | habueras 163 | habuerat 164 | habuere 165 | habuerim 166 | habuerimus 167 | habuerint 168 | habueris 169 | habuerisque 170 | habuerit 171 | habueritis 172 | habueritne 173 | habueritque 174 | habuero 175 | habuerunt 176 | habueruntque 177 | habui 178 | habuimus 179 | habuique 180 | habuisse 181 | habuissem 182 | habuissemus 183 | habuissent 184 | habuisseque 185 | habuisses 186 | habuisset 187 | habuissetis 188 | habuissetque 189 | habuisti 190 | habuistis 191 | habuit 192 | habuitne 193 | habuitque 194 | -------------------------------------------------------------------------------- /data/homer_data/iliad_all_candidates_1000.txt: -------------------------------------------------------------------------------- 1 | # Candidates for Iliad stopwords 2 | # Candidates for Iliad stopwords from Iliad lemmatised 3 | ἅ 4 | ἄγε 5 | ἄγχι 6 | ἀγχοῦ 7 | αἴ 8 | αἵ 9 | αἳ 10 | αἰεί 11 | αἰεὶ 12 | αἰὲν 13 | αἶψα 14 | ἅλις 15 | ἀλλά 16 | ἀλλήλοισι 17 | ἀλλήλοισιν 18 | ἄλλοτε 19 | ἅμ 20 | ἀμφ 21 | ἀμφὶ 22 | ἀμφίς 23 | ἀμφὶς 24 | ἀν 25 | ἄνευθε 26 | ἄντα 27 | ἀντικρύ 28 | ἀντικρὺ 29 | ἀντίον 30 | ἀπάνευθε 31 | ἄπο 32 | ἄρ 33 | ἂρ 34 | ἄρα 35 | ἆρα 36 | ἀτάρ 37 | ἀτὰρ 38 | αὖθ 39 | αὖθι 40 | αὖτ 41 | αὐτὰρ 42 | αὖτε 43 | αὐτίκ 44 | αὖτις 45 | αὐτόθι 46 | αὐτοί 47 | αὐτοῦ 48 | αὔτως 49 | ἄφαρ 50 | ἄψ 51 | ἂψ 52 | γ 53 | γένετ 54 | δεῦρο 55 | ἑ 56 | ἔα 57 | ἐγγύθεν 58 | ἐγγὺς 59 | ἐγὼ 60 | ἔγωγε 61 | ἐγὼν 62 | ἔειπεν 63 | ἔην 64 | εἴ 65 | εἶμι 66 | εἰν 67 | εἵνεκα 68 | εἷος 69 | εἴπω 70 | εἴσω 71 | ἔμ 72 | ἐμεῖο 73 | ἐμεῦ 74 | ἔμμεναι 75 | ἐμὸν 76 | ἐμός 77 | ἔμπας 78 | ἐμῷ 79 | ἔνθ 80 | ἔνθά 81 | ἐνθάδ 82 | ἐνθάδε 83 | ἐνὶ 84 | ἔνι 85 | ἐόντα 86 | ἐόντες 87 | ἑός 88 | ἐπ 89 | ἐπεί 90 | ἐπεὶ 91 | ἔπειθ 92 | ἔπειτ 93 | ἔπειτα 94 | ἐπήν 95 | ἔπι 96 | ἐρέω 97 | ἐς 98 | ἔσαν 99 | ἔσσεται 100 | ἐσσι 101 | ἔτ 102 | ἑτέρωθεν 103 | ἐῢ 104 | εὖτε 105 | ἔχε 106 | ἔχεν 107 | ἐὼν 108 | ἦ 109 | ἣ 110 | ᾗ 111 | ἠδ 112 | ἠδέ 113 | ἠδὲ 114 | ἠέ 115 | ἠὲ 116 | ἦεν 117 | ἠμέν 118 | ἠμὲν 119 | ἡμέτερος 120 | ἠμί 121 | ἥν 122 | ἠύτε 123 | ἠΰτε 124 | θ 125 | ἰθύς 126 | ἰθὺς 127 | ἴμεν 128 | ἰόντες 129 | ἰὼν 130 | κ 131 | κὰδ 132 | καί 133 | καρπαλίμως 134 | κε 135 | κέ 136 | κεῖνος 137 | κεν 138 | κέν 139 | μάλ 140 | μάλα 141 | μὰν 142 | με 143 | μέν 144 | μετόπισθε 145 | μευ 146 | μή 147 | μήν 148 | μιν 149 | μοί 150 | νόσφι 151 | νόσφιν 152 | νυ 153 | νύ 154 | νῶϊ 155 | ὅ 156 | ὅθ 157 | ὅθι 158 | οἵ 159 | οἳ 160 | οἷ 161 | οἴκαδε 162 | οἶον 163 | οἶος 164 | ὁμῶς 165 | ὅν 166 | ὄπισθε 167 | ὄπισθεν 168 | ὀπίσσω 169 | ὀπίσω 170 | ὁπότε 171 | ὁππότε 172 | ὅς 173 | ὃς 174 | ὄσσα 175 | ὅσσοι 176 | ὅσσον 177 | ὅτ 178 | ὅτε 179 | ὅττι 180 | ὅττί 181 | οὔ 182 | οὐδ 183 | οὐδέ 184 | οὕνεκ 185 | οὕνεκα 186 | οὔτέ 187 | οὔτι 188 | ὄφρ 189 | ὄφρα 190 | ὄφρά 191 | πάμπαν 192 | πάντ 193 | πάντῃ 194 | πάντος 195 | πάντοσε 196 | πὰρ 197 | πάρα 198 | πάροιθε 199 | πάρος 200 | πᾶσαι 201 | περ 202 | πέρ 203 | πόλλ 204 | πολλά 205 | ποτ 206 | ποτέ 207 | ποτὶ 208 | πού 209 | πρίν 210 | προπάροιθε 211 | πρόσθ 212 | πρόσθε 213 | πρόσθεν 214 | πρόσω 215 | προτὶ 216 | πω 217 | πώ 218 | πῶς 219 | ῥ 220 | ῥα 221 | ῥά 222 | ῥίμφα 223 | σε 224 | σέ 225 | σεῖο 226 | σέο 227 | σεῦ 228 | σοί 229 | σός 230 | σύ 231 | σὺ 232 | σφεῖς 233 | σφι 234 | σφιν 235 | τ 236 | τάχα 237 | τάχιστα 238 | τεός 239 | τῇ 240 | τῆλε 241 | τιν 242 | τινά 243 | τόδ 244 | τοι 245 | τοί 246 | τοὶ 247 | τοῖο 248 | τοῖος 249 | τοῖσι 250 | τοῖσιν 251 | τόσος 252 | τόσσον 253 | τότ 254 | τόφρα 255 | τώ 256 | τὼ 257 | τῷ 258 | ὕπο 259 | ὑπόδρα 260 | φάτο 261 | φημι 262 | χαμᾶζε 263 | χαμαί 264 | χαμαὶ 265 | ὤ 266 | ὢ 267 | ὧδ 268 | ὦκα 269 | ὥς 270 | ὣς 271 | ὧς 272 | -------------------------------------------------------------------------------- /data/latin_paradigms/dico.txt: -------------------------------------------------------------------------------- 1 | dic 2 | dicam 3 | dicamini 4 | dicamne 5 | dicamque 6 | dicamur 7 | dicamus 8 | dicamve 9 | dicant 10 | dicantur 11 | dicar 12 | dicare 13 | dicaris 14 | dicarque 15 | dicas 16 | dicasque 17 | dicasve 18 | dicat 19 | dicatis 20 | dicatque 21 | dicatur 22 | dicaturque 23 | dice 24 | dicebam 25 | dicebamini 26 | dicebamque 27 | dicebamus 28 | dicebant 29 | dicebantque 30 | dicebantur 31 | dicebanturque 32 | dicebar 33 | dicebare 34 | dicebas 35 | dicebat 36 | dicebatis 37 | dicebatque 38 | dicebatur 39 | dicemur 40 | dicemus 41 | dicemusque 42 | dicen 43 | dicenda 44 | dicendae 45 | dicendaeque 46 | dicendaeve 47 | dicendam 48 | dicendamue 49 | dicendane 50 | dicendarum 51 | dicendas 52 | dicendast 53 | dicende 54 | dicendi 55 | dicendique 56 | dicendis 57 | dicendo 58 | dicendoque 59 | dicendos 60 | dicendove 61 | dicendum 62 | dicendumque 63 | dicendumst 64 | dicendus 65 | dicens 66 | dicensque 67 | dicensve 68 | dicent 69 | dicente 70 | dicentem 71 | dicentemque 72 | dicentes 73 | dicenti 74 | dicentia 75 | dicentibus 76 | dicentis 77 | dicentium 78 | dicentque 79 | dicentur 80 | dicere 81 | dicerem 82 | diceremus 83 | dicerent 84 | dicerentque 85 | dicerentur 86 | dicereque 87 | dicerer 88 | dicereris 89 | diceres 90 | diceresne 91 | diceret 92 | diceretis 93 | diceretque 94 | diceretur 95 | dicereturue 96 | diceris 97 | dices 98 | dicesne 99 | dicesque 100 | dicet 101 | dicetis 102 | dicetne 103 | dicetque 104 | dicetur 105 | diceturque 106 | dici 107 | dicier 108 | dicimini 109 | dicimur 110 | dicimus 111 | dicin 112 | dicique 113 | dicis 114 | dicisne 115 | dicisque 116 | dicit 117 | dicite 118 | dicitis 119 | dicito 120 | dicitque 121 | dicitur 122 | diciturne 123 | dicta 124 | dictae 125 | dictaeque 126 | dictam 127 | dictamque 128 | dictaque 129 | dictarum 130 | dictas 131 | dictasque 132 | dictast 133 | dicte 134 | dicti 135 | dictique 136 | dictis 137 | dictisque 138 | dictiue 139 | dicto 140 | dictoque 141 | dictorum 142 | dictorumque 143 | dictos 144 | dictoue 145 | dictove 146 | dictu 147 | dictum 148 | dictumque 149 | dictumst 150 | dictumue 151 | dictumve 152 | dictuque 153 | dictura 154 | dicturam 155 | dicturas 156 | dicturi 157 | dicturis 158 | dicturo 159 | dicturos 160 | dicturosque 161 | dicturum 162 | dicturumque 163 | dicturus 164 | dicturusne 165 | dicturusque 166 | dicturusve 167 | dictus 168 | dictusque 169 | dictust 170 | dicunda 171 | dicundae 172 | dicundi 173 | dicundis 174 | dicundo 175 | dicundum 176 | dicundumst 177 | dicunt 178 | dicunto 179 | dicuntque 180 | dicuntur 181 | dixe 182 | dixeram 183 | dixeramus 184 | dixerant 185 | dixeras 186 | dixerat 187 | dixeratis 188 | dixere 189 | dixerim 190 | dixerimus 191 | dixerin 192 | dixerint 193 | dixeris 194 | dixerisne 195 | dixerit 196 | dixeritis 197 | dixeritne 198 | dixeritque 199 | dixero 200 | dixerunt 201 | dixeruntque 202 | dixi 203 | diximus 204 | dixin 205 | dixique 206 | dixisse 207 | dixissem 208 | dixissemus 209 | dixissent 210 | dixisses 211 | dixisset 212 | dixissetque 213 | dixisti 214 | dixistique 215 | dixistis 216 | dixit 217 | dixitne 218 | dixitque 219 | -------------------------------------------------------------------------------- /data/homer_data/odyssey_all_candidates_1000.txt: -------------------------------------------------------------------------------- 1 | # Candidates for Odyssey stopwords 2 | # Candidates for Odyssey stopwords from Odyssey lemmatised 3 | # first list 4 | # list completed 5 | ἅ 6 | ἄγε 7 | ἄγχι 8 | αἴ 9 | αἲ 10 | αἵ 11 | αἳ 12 | αἰεί 13 | αἰεὶ 14 | αἰὲν 15 | αἶψ 16 | αἶψα 17 | ἅλις 18 | ἄλλ 19 | ἀλλά 20 | ἄλλαι 21 | ἄλλῃ 22 | ἄλλοθεν 23 | ἄλλοτε 24 | ἅμ 25 | ἀμφ 26 | ἀμφίς 27 | ἀμφὶς 28 | ἀν 29 | ἀνά 30 | ἄντα 31 | ἀντίον 32 | ἀπάνευθε 33 | ἅπαντες 34 | ἄπο 35 | ἄρ 36 | ἂρ 37 | ἄρα 38 | ἆρα 39 | ἆσσον 40 | ἀτάρ 41 | ἀτὰρ 42 | αὖθι 43 | αὖτ 44 | αὐτὰρ 45 | αὖτε 46 | αὐτή 47 | αὐτίκ 48 | αὖτις 49 | αὐτόθι 50 | αὐτοί 51 | αὐτοῦ 52 | αὔτως 53 | ἄφαρ 54 | ἄψ 55 | ἂψ 56 | γ 57 | δεῦρ 58 | δεῦρο 59 | δή 60 | δηθά 61 | δήν 62 | δὴν 63 | διέκ 64 | διὲκ 65 | ἑ 66 | ἐγγύθεν 67 | ἐγγύς 68 | ἐγγὺς 69 | ἐγώ 70 | ἐγὼ 71 | ἐγὼν 72 | ἔειπε 73 | ἔειπεν 74 | ἔειπες 75 | ἔην 76 | εἴ 77 | εἰν 78 | εἵνεκα 79 | εἷος 80 | εἰπὲ 81 | εἴπω 82 | εἴσω 83 | ἑκάς 84 | ἕκαστα 85 | ἐκεῖθι 86 | ἔμ 87 | ἐμεῖο 88 | ἐμὴν 89 | ἐμῆς 90 | ἔμμεναι 91 | ἐμοί 92 | ἐμόν 93 | ἐμὸν 94 | ἐμός 95 | ἐμὸς 96 | ἔμπης 97 | ἔνθ 98 | ἔνθα 99 | ἐνθάδ 100 | ἐνθάδε 101 | ἔνθεν 102 | ἐνὶ 103 | ἔνι 104 | ἔντοσθε 105 | ἑὸν 106 | ἐόντα 107 | ἐόντες 108 | ἑός 109 | ἐπ 110 | ἐπεί 111 | ἐπεὶ 112 | ἔπειθ 113 | ἔπειτ 114 | ἔπειτα 115 | ἔπι 116 | ἐρέω 117 | ἐς 118 | ἔσαν 119 | ἔσσεται 120 | ἐσσι 121 | ἔστ 122 | ἔτ 123 | ἐῢ 124 | εὖτε 125 | ἔφατ 126 | ἔχε 127 | ἐών 128 | ἐὼν 129 | ἦ 130 | ἥ 131 | ἠδ 132 | ἠδέ 133 | ἠδὲ 134 | ἥδε 135 | ἤδη 136 | ἠέ 137 | ἠὲ 138 | ἦε 139 | ἦέ 140 | ἦεν 141 | ἡμέας 142 | ἠμέν 143 | ἠμὲν 144 | ἠμί 145 | ἥμιν 146 | ἦμος 147 | ἥν 148 | θ 149 | θᾶσσον 150 | θύραζε 151 | ἰθύς 152 | ἰὼν 153 | κ 154 | κὰδ 155 | καί 156 | καρπαλίμως 157 | κάτα 158 | κε 159 | κέ 160 | κεῖνον 161 | κεῖνος 162 | κείνου 163 | κεν 164 | κέν 165 | μ 166 | μάλ 167 | μάλα 168 | με 169 | μέν 170 | μευ 171 | μή 172 | μηδέ 173 | μιν 174 | νόσφι 175 | νύ 176 | νῶϊ 177 | ὅ 178 | ὅδ 179 | ὅδε 180 | ὅθι 181 | οἵ 182 | οἷ 183 | οἷά 184 | οἴη 185 | οἴκαδ 186 | οἴκαδε 187 | οἶκόνδε 188 | οἶον 189 | οἶος 190 | οἷος 191 | ὁμῶς 192 | ὅν 193 | ὄπισθεν 194 | ὀπίσσω 195 | ὀπίσω 196 | ὁπότε 197 | ὁππότε 198 | ὅς 199 | ὄσσα 200 | ὅσσα 201 | ὅσσοι 202 | ὅσσον 203 | ὅτ 204 | ὅτε 205 | ὅττι 206 | οὔ 207 | οὐδ 208 | οὐδέ 209 | οὐκέτ 210 | ὄφρ 211 | ὄφρα 212 | πάγχυ 213 | πάμπαν 214 | πάντ 215 | πάντες 216 | πάντεσσι 217 | πὰρ 218 | πάρα 219 | παρέξ 220 | πάρος 221 | πᾶσαι 222 | περ 223 | πέρ 224 | ποθι 225 | πόλλ 226 | πολλά 227 | πολλὰ 228 | πολλὸν 229 | ποτ 230 | ποτέ 231 | ποτὶ 232 | πού 233 | πρίν 234 | πρόσθεν 235 | προτέρω 236 | προτὶ 237 | πω 238 | πώ 239 | πῶς 240 | ῥ 241 | ῥα 242 | ῥά 243 | σε 244 | σέ 245 | σὴν 246 | σοί 247 | σὸν 248 | σός 249 | σύ 250 | σὺ 251 | σφ 252 | σφεας 253 | σφεῖς 254 | σφιν 255 | σῷ 256 | τ 257 | τάχα 258 | τάχιστα 259 | τεός 260 | τί 261 | τιν 262 | τίς 263 | τόδ 264 | τοι 265 | τοί 266 | τοὶ 267 | τοιγάρ 268 | τοιγὰρ 269 | τοῖον 270 | τοῖος 271 | τοῖσι 272 | τοῖσιν 273 | τόσος 274 | τόσσον 275 | τότ 276 | τόφρα 277 | τὼ 278 | τῶ 279 | τῷ 280 | ὕμιν 281 | ὕπο 282 | φάτο 283 | χ 284 | ὢ 285 | ὦ 286 | ὧδ 287 | ὦκα 288 | ὣς 289 | ὧς 290 | -------------------------------------------------------------------------------- /data/latin_paradigms/facio.txt: -------------------------------------------------------------------------------- 1 | fac 2 | face 3 | facere 4 | facerem 5 | faceremque 6 | faceremus 7 | faceren 8 | facerent 9 | facerentque 10 | faceres 11 | facerest 12 | faceret 13 | faceretis 14 | faceretne 15 | faceretque 16 | facereve 17 | faci 18 | faciam 19 | faciamque 20 | faciamus 21 | faciant 22 | faciantque 23 | faciantur 24 | facias 25 | faciasne 26 | faciasque 27 | faciat 28 | faciatis 29 | faciatque 30 | faciatur 31 | faciebam 32 | faciebamus 33 | faciebant 34 | faciebantque 35 | faciebas 36 | faciebat 37 | faciebatis 38 | faciebatque 39 | faciemus 40 | faciemusque 41 | facienda 42 | faciendae 43 | faciendai 44 | faciendam 45 | faciendarum 46 | faciendas 47 | faciendi 48 | faciendique 49 | faciendis 50 | faciendiue 51 | faciendive 52 | faciendo 53 | faciendoque 54 | faciendorum 55 | faciendos 56 | faciendosque 57 | faciendum 58 | faciendumne 59 | faciendumque 60 | faciendumst 61 | faciendumve 62 | faciendus 63 | faciens 64 | facient 65 | faciente 66 | facientem 67 | facientes 68 | facienti 69 | facientia 70 | facientibus 71 | facientibusque 72 | facientis 73 | facientium 74 | facientque 75 | facientur 76 | facies 77 | faciesque 78 | faciesve 79 | faciet 80 | facietis 81 | facietisque 82 | facietque 83 | facimus 84 | facio 85 | facioque 86 | facis 87 | facisne 88 | facisque 89 | facit 90 | facite 91 | facitis 92 | facitne 93 | facito 94 | facitoque 95 | facitote 96 | facitque 97 | facitur 98 | faciunda 99 | faciundae 100 | faciundam 101 | faciundas 102 | faciundi 103 | faciundis 104 | faciundisque 105 | faciundo 106 | faciundorum 107 | faciundos 108 | faciundum 109 | faciundumst 110 | faciundus 111 | faciunt 112 | faciuntne 113 | faciunto 114 | faciuntque 115 | facque 116 | facta 117 | factae 118 | factaeque 119 | factam 120 | factamque 121 | factaque 122 | factarum 123 | factas 124 | factast 125 | factaue 126 | facte 127 | facti 128 | factique 129 | factis 130 | factisque 131 | factius 132 | facto 133 | factoque 134 | factorum 135 | factorumque 136 | factos 137 | factost 138 | factoue 139 | factu 140 | factum 141 | factumne 142 | factumque 143 | factumst 144 | factumue 145 | factumve 146 | factuque 147 | factura 148 | facturae 149 | facturam 150 | facturas 151 | facturave 152 | facturi 153 | facturis 154 | facturo 155 | facturos 156 | facturosque 157 | facturum 158 | facturumque 159 | facturumue 160 | facturus 161 | facturusne 162 | facturusque 163 | facturust 164 | facturusue 165 | factus 166 | factusne 167 | factusque 168 | factust 169 | faxim 170 | faxint 171 | faxis 172 | faxit 173 | faxo 174 | feceram 175 | feceramus 176 | fecerant 177 | fecerantque 178 | feceras 179 | fecerat 180 | feceratis 181 | feceratque 182 | fecere 183 | fecerim 184 | fecerimque 185 | fecerimus 186 | fecerint 187 | feceris 188 | fecerisne 189 | fecerit 190 | feceritis 191 | feceritque 192 | feceritue 193 | fecero 194 | fecerunt 195 | feceruntque 196 | feci 197 | fecimus 198 | fecique 199 | fecisse 200 | fecissem 201 | fecissemus 202 | fecissent 203 | fecissentque 204 | fecisseque 205 | fecisses 206 | fecisset 207 | fecissetis 208 | fecissetue 209 | fecisti 210 | fecistique 211 | fecistis 212 | fecit 213 | fecitne 214 | fecitque 215 | -------------------------------------------------------------------------------- /data/latin_paradigms/fero.txt: -------------------------------------------------------------------------------- 1 | fer 2 | feram 3 | feramque 4 | feramur 5 | feramus 6 | ferant 7 | ferantur 8 | feranturque 9 | ferar 10 | ferare 11 | feraris 12 | feras 13 | ferasque 14 | ferasue 15 | ferat 16 | feratis 17 | feratque 18 | feratur 19 | feraturque 20 | ferebam 21 | ferebamur 22 | ferebamus 23 | ferebant 24 | ferebantque 25 | ferebantur 26 | ferebanturque 27 | ferebar 28 | ferebare 29 | ferebaris 30 | ferebas 31 | ferebat 32 | ferebatis 33 | ferebatque 34 | ferebatur 35 | ferebaturque 36 | feremur 37 | feremus 38 | feren 39 | ferenda 40 | ferendae 41 | ferendam 42 | ferendaque 43 | ferendarum 44 | ferendas 45 | ferendi 46 | ferendine 47 | ferendis 48 | ferendo 49 | ferendos 50 | ferendum 51 | ferendus 52 | ferens 53 | ferent 54 | ferente 55 | ferentem 56 | ferentes 57 | ferenti 58 | ferentia 59 | ferentibus 60 | ferentis 61 | ferentium 62 | ferentur 63 | ferere 64 | fereris 65 | feres 66 | feresne 67 | feret 68 | feretis 69 | feretque 70 | feretur 71 | fero 72 | feroque 73 | feror 74 | ferorque 75 | ferque 76 | ferre 77 | ferrem 78 | ferremus 79 | ferrent 80 | ferrentur 81 | ferreque 82 | ferres 83 | ferret 84 | ferretis 85 | ferretne 86 | ferretque 87 | ferretur 88 | ferri 89 | ferrique 90 | ferrist 91 | ferriue 92 | ferrive 93 | fers 94 | fersne 95 | fersque 96 | fert 97 | ferte 98 | fertis 99 | fertne 100 | ferto 101 | fertor 102 | fertque 103 | fertur 104 | ferturque 105 | ferue 106 | ferundae 107 | ferundam 108 | ferundast 109 | ferundi 110 | ferundis 111 | ferundo 112 | ferundum 113 | ferunt 114 | ferunto 115 | feruntque 116 | feruntur 117 | lata 118 | latae 119 | latam 120 | latamque 121 | lataque 122 | latarum 123 | latarumque 124 | latas 125 | late 126 | lateque 127 | latest 128 | lati 129 | latin 130 | latine 131 | latineque 132 | latior 133 | latiora 134 | latiore 135 | latiorem 136 | latioremque 137 | latiores 138 | latioribus 139 | latioribusque 140 | latioris 141 | latiorque 142 | latiorum 143 | latique 144 | latis 145 | latisque 146 | latissima 147 | latissimae 148 | latissimam 149 | latissimarum 150 | latissimas 151 | latissime 152 | latissimeque 153 | latissimi 154 | latissimis 155 | latissimo 156 | latissimos 157 | latissimum 158 | latissimus 159 | latius 160 | latiusque 161 | lato 162 | laton 163 | latone 164 | latoque 165 | latorum 166 | latorumque 167 | latos 168 | latosque 169 | latu 170 | latum 171 | latumque 172 | latumst 173 | latura 174 | laturam 175 | laturas 176 | laturi 177 | laturique 178 | laturis 179 | laturo 180 | laturos 181 | laturum 182 | laturumque 183 | laturus 184 | latus 185 | latusque 186 | tetulere 187 | tetulerit 188 | tetulero 189 | tetulerunt 190 | tetuli 191 | tetulisse 192 | tetulissem 193 | tetulissent 194 | tetulisset 195 | tetulisti 196 | tetulit 197 | tuleram 198 | tuleramus 199 | tulerant 200 | tuleras 201 | tulerat 202 | tulere 203 | tulerim 204 | tulerimus 205 | tulerint 206 | tulerintque 207 | tuleris 208 | tulerit 209 | tuleritis 210 | tulero 211 | tulerunt 212 | tuleruntque 213 | tuli 214 | tulimus 215 | tulimusque 216 | tulique 217 | tulisse 218 | tulissem 219 | tulissemus 220 | tulissent 221 | tulisses 222 | tulisset 223 | tulissetis 224 | tulisti 225 | tulistis 226 | tulit 227 | tulitque 228 | -------------------------------------------------------------------------------- /test/test_json_txt/convert_json_to_txt.R: -------------------------------------------------------------------------------- 1 | # -------------------------- # 2 | # Stopwords: Latin and Greek # 3 | # Make TXT from JSON # 4 | # -------------------------- # 5 | 6 | source("~/Documents/github/r-dev/helpers.R") 7 | 8 | 9 | # Initial conversion to JSON 10 | # -------------------------- 11 | 12 | # Test RJSON package 13 | # R to/from JSON with flattened output: not what I need 14 | # install.packages("rjson") 15 | library(rjson) 16 | 17 | # memo: needed R structure to reproduce my levels/headings with rjson 18 | test_from_r <- list( 19 | "TYPOGRAPHICAL SYMBOLS" = c("!", "$"), 20 | "PRONOUNS" = list( 21 | "ego" = c("ego", "egon"), 22 | "meus" = c("mea", "meae") 23 | ) 24 | ) 25 | test_from_r <- unlist(test_from_r, use.names = TRUE) 26 | test_r_to_json <- toJSON(test_from_r) 27 | write_lines(test_r_to_json, "./test/test_json_txt/test_r_to_json.json") 28 | 29 | test_r_from_json <- read_file("./versions/stopwords_latin_v2_1.json") 30 | test_r_from_json <- fromJSON(test_r_from_json) 31 | write_lines(test_r_from_json, "./test/test_json_txt/test_r_from_json.txt") 32 | 33 | # TXT/Markdown to JSON 34 | # too complicated: can't close brackets easily 35 | # if used at all, JSON has to be the structured source format 36 | # test_input <- read_file("./test/test_json_txt/test_input.txt") 37 | # test_output <- c("{", test_input, "}") 38 | # test_output <- str_replace_all(test_output, "#\\s(.*)\n(?=\n##)", "\"\\1\": {\n") 39 | # test_output <- str_replace_all(test_output, "#+\\s(.*)\n", "\"\\1\": [\n") 40 | # test_output <- str_replace_all(test_output, "\\{\n\n", "\\{\n") 41 | # test_output <- str_replace_all(test_output, "\n\n", "\n],\n") 42 | # test_output <- str_replace_all(test_output, "\n([^\\]\"].*)", "\n\"\\1\",") 43 | # test_output <- str_replace_all(test_output, ",\n([\\]\\}])", "\n\\1") 44 | # test_output <- str_replace_all(test_output, ",\\n\\n\\}", "\n}") # breaking here 45 | # write_lines(test_output, "./test/test_json_txt/test_output.md") 46 | 47 | # or try Markdown to R list, then toJSON? 48 | 49 | # for now use a CLI Python Markdown to JSON converter 50 | # https://github.com/njvack/markdown-to-json 51 | # result: stopwords_latin_v2_1.json and stopwords_greek_v2_2.json 52 | 53 | 54 | # Test JSON to TXT/Markdown with my headings 55 | # ------------------------------------------ 56 | 57 | test_input_json <- read_file("./test/test_json_txt/test_input.json") 58 | test_input_json %>% 59 | str_replace_all("^\\{\n", "") %>% 60 | str_replace_all("\\}\n\\}\n", "") %>% 61 | str_replace_all("\\s*\"([A-Z]+.*)\": [\\[\\{\\],]+\n", "# \\1\n") %>% 62 | str_replace_all("\\s*\"(.*)\": \\[\n", "## \\1\n") %>% 63 | # str_replace_all("[\":\\{\\}\\[\\],]", "\n") %>% 64 | str_replace_all("\\:(?!\")", "\n") %>% 65 | str_replace_all("\\[(?!\")", "\n") %>% 66 | str_replace_all("\\](?!\")", "\n") %>% 67 | str_replace_all("\\{(?!\")", "\n") %>% 68 | str_replace_all("\\}(?!\")", "\n") %>% 69 | str_replace_all("\\\\(?!\")", "\n") %>% 70 | str_replace_all(",", "\n") %>% 71 | str_replace_all('\\"(?!\")', "\n") %>% 72 | str_replace_all("\\\\", "\n") %>% 73 | str_replace_all("\n\\s+", "\n") %>% 74 | str_replace_all("##", "\n##") %>% 75 | str_replace_all("\n#(.)", "\n\n#\\1") %>% 76 | str_replace_all("\n\n\n", "\n\n") %>% 77 | write_file("./test/test_json_txt/test_output.md") 78 | 79 | # Add metadata 80 | today <- format(Sys.time(), "%Y-%m-%d") 81 | version_latin <- "2.1" 82 | current_latin_count <- count_items_in_txt_list("stopwords_latin.txt") 83 | test_output <- read_file("./test/test_json_txt/test_output.md") 84 | # meta <- read_file("stopwords_latin_metadata.txt") 85 | current_metadata <- paste0( 86 | "# Ancient Latin stopwords", "\n", 87 | "# version ", version_latin, "\n", 88 | "# ", today, "\n", 89 | "# Aurélien Berra", "\n", 90 | "# ", "\n", 91 | "# Ancient Latin stopwords for textual analysis", "\n", 92 | "# language: Latin (la, lat)", "\n", 93 | "# type: dataset", "\n", 94 | "# items count: ", current_latin_count, "\n", 95 | "# https://github.com/aurelberra/stopwords", "\n", 96 | "# rights: CC-BY-NC-SA", "\n", 97 | "\n" 98 | ) 99 | test_stopwords <- paste0(current_metadata, test_output) 100 | write_file(test_stopwords, "./test/test_json_txt/test_stopwords.txt") 101 | -------------------------------------------------------------------------------- /data/phi_data/phi_1000_not_in_latin_v_1.txt: -------------------------------------------------------------------------------- 1 | quoque 2 | nihil 3 | nunc 4 | causa 5 | m 6 | potest 7 | omnia 8 | i 9 | c 10 | s 11 | tantum 12 | erit 13 | omnes 14 | p 15 | omnibus 16 | quasi 17 | minus 18 | rei 19 | eam 20 | posse 21 | t 22 | inquit 23 | itaque 24 | illi 25 | habet 26 | ipsa 27 | sint 28 | primum 29 | illud 30 | item 31 | eos 32 | satis 33 | ait 34 | hanc 35 | rerum 36 | semper 37 | propter 38 | suo 39 | l 40 | possit 41 | inde 42 | omnis 43 | fuerit 44 | omnium 45 | unde 46 | alia 47 | fieri 48 | alii 49 | eadem 50 | hunc 51 | hac 52 | facere 53 | quas 54 | saepe 55 | aliquid 56 | suis 57 | mea 58 | ipsum 59 | multa 60 | solum 61 | illum 62 | fuisse 63 | nulla 64 | simul 65 | postea 66 | quidam 67 | habere 68 | factum 69 | dixit 70 | tunc 71 | licet 72 | dicere 73 | tua 74 | quantum 75 | dicitur 76 | uti 77 | ideo 78 | numquam 79 | ibi 80 | iis 81 | aliud 82 | eodem 83 | huius 84 | quorum 85 | nemo 86 | suum 87 | supra 88 | dicit 89 | hinc 90 | quin 91 | fecit 92 | illo 93 | d 94 | plus 95 | ista 96 | ipsi 97 | fit 98 | illis 99 | n 100 | suam 101 | huic 102 | facit 103 | essent 104 | facta 105 | omni 106 | usque 107 | potius 108 | ipso 109 | dedit 110 | quaedam 111 | forte 112 | aliis 113 | prius 114 | certe 115 | posset 116 | nostra 117 | tamquam 118 | q 119 | meo 120 | circa 121 | praeter 122 | u 123 | denique 124 | illam 125 | sane 126 | possunt 127 | quamquam 128 | tot 129 | aliter 130 | suae 131 | r 132 | aduersus 133 | habent 134 | meum 135 | suos 136 | diu 137 | multis 138 | hi 139 | dare 140 | omne 141 | dictum 142 | praeterea 143 | postquam 144 | alio 145 | statim 146 | adeo 147 | intra 148 | alter 149 | tanta 150 | fere 151 | utrum 152 | alterum 153 | scilicet 154 | multo 155 | umquam 156 | videtur 157 | quando 158 | uidetur 159 | cetera 160 | mi 161 | eas 162 | ii 163 | potuit 164 | dici 165 | nostri 166 | fore 167 | quicquam 168 | tuo 169 | namque 170 | prope 171 | habeat 172 | altera 173 | sese 174 | ceteris 175 | nullum 176 | omnem 177 | multum 178 | aliqua 179 | dicunt 180 | dicta 181 | fuerat 182 | nullo 183 | diximus 184 | illius 185 | alias 186 | v 187 | nostris 188 | quamuis 189 | hos 190 | dari 191 | h 192 | ipsis 193 | habuit 194 | ceterum 195 | ulla 196 | nondum 197 | ipsius 198 | vobis 199 | procul 200 | alios 201 | rursus 202 | quidquid 203 | huc 204 | dicam 205 | omnino 206 | tuis 207 | donec 208 | alius 209 | quemadmodum 210 | dixi 211 | data 212 | tuum 213 | quippe 214 | meis 215 | mei 216 | dicimus 217 | fuisset 218 | eis 219 | aliquando 220 | meus 221 | uelut 222 | multi 223 | plures 224 | interdum 225 | meae 226 | cn 227 | meam 228 | quaeque 229 | utique 230 | paene 231 | earum 232 | poterit 233 | dicendum 234 | fuerunt 235 | tanto 236 | eiusdem 237 | extra 238 | ferre 239 | fiat 240 | quotiens 241 | num 242 | seu 243 | tui 244 | iste 245 | illos 246 | sumus 247 | tuae 248 | iterum 249 | sex 250 | dicuntur 251 | has 252 | nil 253 | vix 254 | idque 255 | quibusdam 256 | semel 257 | tuam 258 | immo 259 | dico 260 | alium 261 | datur 262 | nostrum 263 | suas 264 | plerumque 265 | alterius 266 | ni 267 | ultra 268 | futurum 269 | erunt 270 | plura 271 | nostro 272 | facto 273 | plane 274 | quamvis 275 | secum 276 | iii 277 | datum 278 | utrumque 279 | quanto 280 | illic 281 | protinus 282 | adversus 283 | possint 284 | faciunt 285 | haberet 286 | sin 287 | uideri 288 | mecum 289 | hodie 290 | diceret 291 | factus 292 | undique 293 | horum 294 | plurimum 295 | quondam 296 | fecerit 297 | equidem 298 | fuerint 299 | nullam 300 | ipsam 301 | pluribus 302 | pariter 303 | que 304 | tecum 305 | sis 306 | talis 307 | poterat 308 | fecisse 309 | olim 310 | video 311 | fortasse 312 | ipsos 313 | f 314 | aliquo 315 | qualis 316 | profecto 317 | minime 318 | demum 319 | tulit 320 | quodam 321 | multos 322 | inquam 323 | ecce 324 | suorum 325 | potes 326 | nulli 327 | antea 328 | nimis 329 | etiamsi 330 | dicat 331 | fiunt 332 | dat 333 | videatur 334 | iuxta 335 | habebat 336 | possent 337 | neminem 338 | videri 339 | quarum 340 | eandem 341 | eundem 342 | x 343 | iamque 344 | altero 345 | dein 346 | facies 347 | noster 348 | nihilo 349 | antequam 350 | nostrae 351 | repente 352 | quicquid 353 | utraque 354 | uix 355 | etenim 356 | da 357 | possumus 358 | faciat 359 | frustra 360 | ultro 361 | isdem 362 | sponte 363 | quanta 364 | velut 365 | praesertim 366 | faciam 367 | hae 368 | sim 369 | dicendi 370 | -------------------------------------------------------------------------------- /data/tlg_data/tlg_1000_not_in_greek_v_1.txt: -------------------------------------------------------------------------------- 1 | τοῦτο 2 | αὐτοῦ 3 | εἶναι 4 | ταῦτα 5 | αὐτῶν 6 | αὐτὸν 7 | αὐτῷ 8 | ἦν 9 | ἐστιν 10 | πάντα 11 | τούτων 12 | δι 13 | ὥσπερ 14 | αὐτοῖς 15 | πάλιν 16 | νῦν 17 | ὧν 18 | ἔχει 19 | μόνον 20 | οἷον 21 | μᾶλλον 22 | ἡμῖν 23 | πῶς 24 | α 25 | ἡμῶν 26 | ἔστι 27 | σου 28 | λέγει 29 | μοι 30 | αὐτῆς 31 | μου 32 | τούτου 33 | ὅταν 34 | αὐτοὺς 35 | αὐτὸ 36 | ἐς 37 | ἐπ 38 | ἀντὶ 39 | αὐτὴν 40 | πάντων 41 | γίνεται 42 | ἐπειδὴ 43 | ἡμᾶς 44 | γ 45 | ἔστιν 46 | ἐστὶν 47 | με 48 | τούτοις 49 | ἤδη 50 | ἐστὶ 51 | τοίνυν 52 | πρῶτον 53 | ἔσται 54 | β 55 | τ 56 | ἔχειν 57 | σοι 58 | μάλιστα 59 | ἣν 60 | ταύτην 61 | εἰπεῖν 62 | τοῦτον 63 | εἶπεν 64 | ἄλλων 65 | λέγων 66 | ε 67 | ἐνταῦθα 68 | ἀεὶ 69 | λέγεται 70 | εἴη 71 | σε 72 | εἶτα 73 | λέγειν 74 | πολλὰ 75 | φησιν 76 | τούτῳ 77 | διὸ 78 | ν 79 | πρότερον 80 | ἄλλο 81 | ι 82 | πᾶν 83 | γενέσθαι 84 | φησὶν 85 | ὅσα 86 | μηδὲ 87 | ὑμῶν 88 | ἔφη 89 | αὐτῇ 90 | ὅπως 91 | αὐτὰ 92 | φησὶ 93 | καθάπερ 94 | ἔχων 95 | ὑμῖν 96 | μέντοι 97 | πάντες 98 | ταύτης 99 | ἕως 100 | μηδὲν 101 | ὄντα 102 | αὕτη 103 | ἕτερον 104 | ἤτοι 105 | ἡμεῖς 106 | αὐτόν 107 | τοιαῦτα 108 | εἴρηται 109 | ποιεῖ 110 | πολλάκις 111 | η 112 | ὢν 113 | μέχρι 114 | ἄλλως 115 | κ 116 | ἄλλα 117 | ἑαυτὸν 118 | φησίν 119 | ᾖ 120 | ο 121 | ἐκεῖ 122 | ὑμᾶς 123 | πᾶσαν 124 | ἐκείνου 125 | φησι 126 | λέγω 127 | ἐγένετο 128 | τοιοῦτον 129 | παντὸς 130 | πολὺ 131 | ὅσον 132 | πάντας 133 | τινος 134 | θ 135 | μ 136 | τινὰ 137 | ἑξῆς 138 | ποιεῖν 139 | πολλῶν 140 | ἁπλῶς 141 | οὗτοι 142 | πάντως 143 | ἤγουν 144 | εἰσιν 145 | ἐκείνων 146 | ᾗ 147 | ἕκαστον 148 | τινες 149 | πλὴν 150 | ἦσαν 151 | ὄντων 152 | ποτὲ 153 | αὐτοὶ 154 | ὄντος 155 | ἐστίν 156 | εὖ 157 | πλέον 158 | ἄνω 159 | ἐκεῖνος 160 | εἶπε 161 | ἄλλοις 162 | ὂν 163 | πάνυ 164 | ς 165 | ταύτῃ 166 | εὐθὺς 167 | λ 168 | φησί 169 | ἔξω 170 | τούτους 171 | πάσης 172 | ὅμως 173 | γίνεσθαι 174 | καθόλου 175 | τουτέστιν 176 | ζ 177 | τουτέστι 178 | ἑαυτῷ 179 | ἐμοῦ 180 | πᾶσι 181 | πᾶσα 182 | ἐμοὶ 183 | τοσοῦτον 184 | οὐκέτι 185 | ἔχοντα 186 | ἐκεῖνο 187 | εἰπὼν 188 | χωρὶς 189 | διότι 190 | ἑαυτῶν 191 | ἐντεῦθεν 192 | κάτω 193 | αὖθις 194 | γέγονεν 195 | ἴσως 196 | εἰσι 197 | πολλοὶ 198 | ἁπάντων 199 | ἔνθα 200 | τοιούτων 201 | εἰσὶ 202 | εἴπερ 203 | πρὶν 204 | ἔπειτα 205 | παντὶ 206 | ἄλλοι 207 | πολλοὺς 208 | ἔστω 209 | πᾶσιν 210 | τοῦτ 211 | γίνονται 212 | οὐκοῦν 213 | π 214 | μεταξὺ 215 | ἄνευ 216 | τινὲς 217 | ὑμεῖς 218 | ἐκεῖνον 219 | ὁμοῦ 220 | ϛ 221 | ἀλλήλων 222 | ἔχοντες 223 | ὅπου 224 | γένηται 225 | πολλῷ 226 | σοῦ 227 | τινὸς 228 | αὐτὴ 229 | σφόδρα 230 | ἅπαντα 231 | αὐτούς 232 | ὑφ 233 | πᾶς 234 | γέγονε 235 | ἕνεκα 236 | ἔχον 237 | τοῦτό 238 | ἔχουσι 239 | δηλονότι 240 | ἀνὰ 241 | εἰσὶν 242 | σ 243 | ἄλλους 244 | οὖσα 245 | ἀλλήλοις 246 | οὔ 247 | πάλαι 248 | ἔξωθεν 249 | πόλεις 250 | ἐμὲ 251 | οἷόν 252 | ρ 253 | ἵν 254 | πολλὴν 255 | λέγουσιν 256 | πολλοῖς 257 | ἢν 258 | αὐτήν 259 | αὐτὰς 260 | αὑτοῦ 261 | λέγοντες 262 | ὄντες 263 | οὔσης 264 | γενόμενος 265 | τινὶ 266 | τῶι 267 | ἅπερ 268 | γένοιτο 269 | ἐποίησεν 270 | ἐστί 271 | ποιῆσαι 272 | ἃς 273 | σὲ 274 | φασιν 275 | οὐδέν 276 | οὔτ 277 | ἕκαστος 278 | ἔλεγεν 279 | ἑαυτοὺς 280 | τίνα 281 | τινι 282 | ἑκάστου 283 | τινας 284 | ἥτις 285 | ἀλλήλους 286 | αὐτό 287 | ω 288 | ἄνωθεν 289 | μηδ 290 | οὖσαν 291 | ὅσοι 292 | καθὼς 293 | σοὶ 294 | τοιαύτην 295 | ἐκείνῳ 296 | τῆι 297 | ἔμπροσθεν 298 | ταὐτὸν 299 | ἔν 300 | εἶπον 301 | ἐναντίον 302 | ἐκεῖθεν 303 | ἑτέρου 304 | εἶχε 305 | ὡσαύτως 306 | του 307 | μάλα 308 | τόδε 309 | ἐκείνοις 310 | λίαν 311 | λέγομεν 312 | ταύτας 313 | οἷα 314 | ἔχουσα 315 | ἔχουσιν 316 | ἄλλου 317 | εἶχεν 318 | ἐκεῖνοι 319 | ἐφεξῆς 320 | πολλῆς 321 | ἑκάστῳ 322 | τάδε 323 | τίνος 324 | λέγουσι 325 | ἄλλην 326 | πανταχοῦ 327 | ὧδε 328 | ἄλλον 329 | ἐκείνης 330 | πόθεν 331 | ιβ 332 | υ 333 | ἕνεκεν 334 | φασι 335 | ταῦτ 336 | ἐκείνην 337 | εἰμι 338 | ἐκεῖνα 339 | τάχα 340 | ἅτε 341 | αὐταῖς 342 | εἶχον 343 | ἐναντία 344 | ἑτέρων 345 | λεγόμενον 346 | οὔπω 347 | ἑαυτοῖς 348 | εἰρημένων 349 | ἕτερος 350 | οἵ 351 | ἄχρι 352 | ἦ 353 | λέγοντος 354 | ἐντὸς 355 | ἄμφω 356 | ἐχόντων 357 | ἔλεγον 358 | ἕτερα 359 | ἑτέραν 360 | ὄν 361 | πάσας 362 | ἐκείνους 363 | αὐτίκα 364 | τοιαύτη 365 | ἐκτὸς 366 | ἄλλῳ 367 | πότερον 368 | αὗται 369 | ἔχω 370 | ὄντας 371 | ἔνδον 372 | πολλὰς 373 | ἀμφοτέρων 374 | κα 375 | σχεδὸν 376 | περ 377 | οὐδενὸς 378 | ἐποίησε 379 | ποιῶν 380 | γίγνεται 381 | παῖς 382 | τινων 383 | τέ 384 | λέγεις 385 | ἡνίκα 386 | ποιεῖσθαι 387 | ξ 388 | φασὶ 389 | ἅπαξ 390 | ἐναντίων 391 | τινὰς 392 | πολλοῦ 393 | ἔλεγε 394 | ὄντι 395 | ἑκάστην 396 | γενόμενον 397 | τοιαύτης 398 | λέγεσθαι 399 | ἄλλη 400 | πολὺν 401 | ἑαυτῆς 402 | μηκέτι 403 | γινόμενον 404 | ἐκεῖσε 405 | ἔφην 406 | ἅπαντας 407 | ἔχεις 408 | ἀμφὶ 409 | ἐπειδὰν 410 | ἀμφότερα 411 | ὥστ 412 | ἄλλας 413 | γενομένης 414 | ἔκ 415 | ἄρτι 416 | οὐδέποτε 417 | τοῦδε 418 | -------------------------------------------------------------------------------- /data/greek_paradigms/ekho.txt: -------------------------------------------------------------------------------- 1 | 'χε 2 | 'χέτω 3 | 'χει 4 | 'χειν 5 | 'χῃ 6 | 'χῃς 7 | 'χόντων 8 | 'χοιμ' 9 | 'χουσ' 10 | 'χω 11 | 'χωμεν 12 | ἅχεις 13 | ἅχω 14 | ἕξει 15 | ἕξειν 16 | ἕξεις 17 | ἕξεθ' 18 | ἕξεσθαι 19 | ἕξετ' 20 | ἕξεται 21 | ἕξετε 22 | ἕξετον 23 | ἕξῃ 24 | ἕξοι 25 | ἕξοιεν 26 | ἕξοιμι 27 | ἕξοις 28 | ἕξοιτε 29 | ἕξομαι 30 | ἕξομεν 31 | ἕξομες 32 | ἕξον 33 | ἕξοντα 34 | ἕξονται 35 | ἕξοντας 36 | ἕξοντες 37 | ἕξοντι 38 | ἕξοντος 39 | ἕξουσ' 40 | ἕξουσα 41 | ἕξουσαν 42 | ἕξουσι 43 | ἕξουσιν 44 | ἕξω 45 | ἕξων 46 | ἑξέμεν 47 | ἑξέμεναι 48 | ἑξεῖ 49 | ἑξεῖς 50 | ἑξῆν 51 | ἑξῆς 52 | ἑξῇ 53 | ἑξόμενα 54 | ἑξόμενοι 55 | ἑξόμενον 56 | ἑξόμεθα 57 | ἑξόμεσθα 58 | ἑξόντων 59 | ἑξομένω 60 | ἑξούσης 61 | ἑξοῦντι 62 | ἔσχ' 63 | ἔσχε 64 | ἔσχεν 65 | ἔσχεο 66 | ἔσχεθ' 67 | ἔσχες 68 | ἔσχεσκε 69 | ἔσχετ' 70 | ἔσχετε 71 | ἔσχετο 72 | ἔσχετον 73 | ἔσχηκα 74 | ἔσχηκας 75 | ἔσχηκε 76 | ἔσχηκεν 77 | ἔσχομεν 78 | ἔσχον 79 | ἔσχοντο 80 | ἔσχου 81 | ἔχ' 82 | ἔχε 83 | ἔχεαι 84 | ἔχεεν 85 | ἔχει 86 | ἔχειν 87 | ἔχεις 88 | ἔχεν 89 | ἔχεο 90 | ἔχεθ' 91 | ἔχες 92 | ἔχεσκ' 93 | ἔχεσκε 94 | ἔχεσκεν 95 | ἔχεσκες 96 | ἔχεσκον 97 | ἔχεσθ' 98 | ἔχεσθαι 99 | ἔχεσθε 100 | ἔχετ' 101 | ἔχεται 102 | ἔχετε 103 | ἔχετο 104 | ἔχετον 105 | ἔχευ 106 | ἔχηι 107 | ἔχηις 108 | ἔχηισι 109 | ἔχηισθ' 110 | ἔχηισθα 111 | ἔχην 112 | ἔχηθ' 113 | ἔχησι 114 | ἔχησιν 115 | ἔχησθ' 116 | ἔχησθα 117 | ἔχησθε 118 | ἔχητ' 119 | ἔχηται 120 | ἔχητε 121 | ἔχητον 122 | ἔχῃ 123 | ἔχῃς 124 | ἔχῃσι 125 | ἔχῃσιν 126 | ἔχῃσθα 127 | ἔχοι 128 | ἔχοιεν 129 | ἔχοιμ' 130 | ἔχοιμεν 131 | ἔχοιμι 132 | ἔχοιντο 133 | ἔχοιο 134 | ἔχοιθ' 135 | ἔχοις 136 | ἔχοισ' 137 | ἔχοισα 138 | ἔχοισαι 139 | ἔχοισαν 140 | ἔχοισιν 141 | ἔχοισθα 142 | ἔχοισθε 143 | ἔχοιτ' 144 | ἔχοιτε 145 | ἔχοιτο 146 | ἔχομαι 147 | ἔχομεν 148 | ἔχομες 149 | ἔχον 150 | ἔχονθ' 151 | ἔχοντ' 152 | ἔχοντα 153 | ἔχονται 154 | ἔχοντας 155 | ἔχοντε 156 | ἔχοντες 157 | ἔχοντι 158 | ἔχοντο 159 | ἔχοντος 160 | ἔχου 161 | ἔχουσ' 162 | ἔχουσα 163 | ἔχουσαι 164 | ἔχουσαν 165 | ἔχουσι 166 | ἔχουσιν 167 | ἔχω 168 | ἔχωμαι 169 | ἔχωμεν 170 | ἔχων 171 | ἔχωνθ' 172 | ἔχωνται 173 | ἔχωντι 174 | ἔχωσ' 175 | ἔχωσι 176 | ἔχωσιν 177 | ἐσχέτην 178 | ἐσχήκαμεν 179 | ἐσχήκασι 180 | ἐσχήκασιν 181 | ἐσχήκατε 182 | ἐσχήκατον 183 | ἐσχήκει 184 | ἐσχήκεις 185 | ἐσχήκεισαν 186 | ἐσχήκεσαν 187 | ἐσχήκῃς 188 | ἐσχήκοι 189 | ἐσχηκέναι 190 | ἐσχηκέτω 191 | ἐσχηκός 192 | ἐσχηκόσι 193 | ἐσχηκόσιν 194 | ἐσχηκότα 195 | ἐσχηκότας 196 | ἐσχηκότε 197 | ἐσχηκότες 198 | ἐσχηκότι 199 | ἐσχηκότος 200 | ἐσχηκότων 201 | ἐσχηκυίας 202 | ἐσχηκυίᾳ 203 | ἐσχηκυῖα 204 | ἐσχηκυῖαι 205 | ἐσχηκυῖαν 206 | ἐσχηκυιῶν 207 | ἐσχηκώς 208 | ἐσχόμην 209 | ἐχέμεν 210 | ἐχέσθω 211 | ἐχέσθων 212 | ἐχέσθωσαν 213 | ἐχέτην 214 | ἐχέτω 215 | ἐχέτωσαν 216 | ἐχόμενα 217 | ἐχόμεναι 218 | ἐχόμενοι 219 | ἐχόμενον 220 | ἐχόμενος 221 | ἐχόμεθα 222 | ἐχόμεσθα 223 | ἐχόμην 224 | ἐχόντοιν 225 | ἐχόντων 226 | ἐχοίμαν 227 | ἐχοίμεθα 228 | ἐχοίμην 229 | ἐχοίσαι 230 | ἐχοίσας 231 | ἐχοίσᾳ 232 | ἐχοισᾶν 233 | ἐχομένα 234 | ἐχομέναις 235 | ἐχομένας 236 | ἐχομένη 237 | ἐχομένηι 238 | ἐχομένην 239 | ἐχομένης 240 | ἐχομένῃ 241 | ἐχομένοις 242 | ἐχομένοισι 243 | ἐχομένοισιν 244 | ἐχομένου 245 | ἐχομένους 246 | ἐχομένω 247 | ἐχομένων 248 | ἐχομένως 249 | ἐχομένῳ 250 | ἐχούσαις 251 | ἐχούσας 252 | ἐχούσᾳ 253 | ἐχούσηι 254 | ἐχούσης 255 | ἐχούσῃ 256 | ἐχούσῃσι 257 | ἐχούσῃσιν 258 | ἐχουσᾶν 259 | ἐχουσέων 260 | ἐχουσῶν 261 | ἐχώμεθα 262 | εἴχεο 263 | εἴχεθ' 264 | εἴχεσθε 265 | εἴχετ' 266 | εἴχετε 267 | εἴχετο 268 | εἴχετον 269 | εἴχομεν 270 | εἴχοντο 271 | εἴχου 272 | εἶχ' 273 | εἶχε 274 | εἶχεν 275 | εἶχες 276 | εἶχον 277 | εἰχέσθην 278 | εἰχέτην 279 | εἰχόμεθα 280 | εἰχόμεσθα 281 | εἰχόμην 282 | κἄχειν 283 | κἄχομεν 284 | κἀχόμεσθα 285 | κεἶχον 286 | σχέ 287 | σχέμεν 288 | σχέο 289 | σχέθ' 290 | σχές 291 | σχέσθ' 292 | σχέσθαι 293 | σχέσθε 294 | σχέτε 295 | σχέτο 296 | σχέτω 297 | σχεῖν 298 | σχήσει 299 | σχήσειν 300 | σχήσεις 301 | σχήσεσθ' 302 | σχήσεσθαι 303 | σχήσεσθε 304 | σχήσεται 305 | σχήσετε 306 | σχήσησθα 307 | σχήσῃ 308 | σχήσοι 309 | σχήσομ' 310 | σχήσομαι 311 | σχήσομεν 312 | σχήσοντα 313 | σχήσοντες 314 | σχήσοντος 315 | σχήσουσαι 316 | σχήσουσι 317 | σχήσουσιν 318 | σχήσω 319 | σχήσων 320 | σχῆι 321 | σχῆτε 322 | σχῇ 323 | σχῇς 324 | σχησέμεν 325 | σχησόντων 326 | σχόμεναι 327 | σχόμενοι 328 | σχόμενον 329 | σχόμενος 330 | σχόμεθα 331 | σχόν 332 | σχόντ' 333 | σχόντα 334 | σχόντας 335 | σχόντες 336 | σχόντι 337 | σχόντος 338 | σχόντων 339 | σχοίατ' 340 | σχοίατο 341 | σχοίη 342 | σχοίημεν 343 | σχοίην 344 | σχοίης 345 | σχοίησαν 346 | σχοίητε 347 | σχοίμην 348 | σχοῖ 349 | σχοῖεν 350 | σχοῖμι 351 | σχοῖο 352 | σχοῖς 353 | σχοῖτο 354 | σχομένη 355 | σχομένην 356 | σχομένω 357 | σχούσης 358 | σχοῦ 359 | σχοῦσ' 360 | σχοῦσα 361 | σχοῦσαι 362 | σχοῦσαν 363 | σχοῦσι 364 | σχοῦσιν 365 | σχώμεθα 366 | σχών 367 | σχῶ 368 | σχῶμαι 369 | σχῶμεν 370 | σχῶνται 371 | σχῶσι 372 | σχῶσιν 373 | τοὔξω 374 | τοὐχόμενον 375 | -------------------------------------------------------------------------------- /data/greek_paradigms/eimi.txt: -------------------------------------------------------------------------------- 1 | 'στ' 2 | 'στι 3 | 'νθ' 4 | 'σαν 5 | 'σθ' 6 | 'στ' 7 | 'σται 8 | 'στε 9 | 'στι 10 | 'στί 11 | 'στίν 12 | 'στιν 13 | 'στόν 14 | 'στω 15 | ἅσθ' 16 | ἅστε 17 | ἅω 18 | ἔ' 19 | ἔα 20 | ἔασ' 21 | ἔασι 22 | ἔασιν 23 | ἔατε 24 | ἔηι 25 | ἔην 26 | ἔησι 27 | ἔησιν 28 | ἔησθα 29 | ἔῃ 30 | ἔῃς 31 | ἔῃσι 32 | ἔῃσιν 33 | ἔμεν 34 | ἔμεν' 35 | ἔμεναι 36 | ἔμμεν 37 | ἔμμεν' 38 | ἔμμεναι 39 | ἔμμι 40 | ἔν 41 | ἔνθ' 42 | ἔντ' 43 | ἔντι 44 | ἔοι 45 | ἔοις 46 | ἔον 47 | ἔσαν 48 | ἔσε' 49 | ἔσεαι 50 | ἔσει 51 | ἔσεσθ' 52 | ἔσεσθαι 53 | ἔσεσθε 54 | ἔσεσθον 55 | ἔσετ' 56 | ἔσεται 57 | ἔσηι 58 | ἔσῃ 59 | ἔσκ' 60 | ἔσκε 61 | ἔσκεν 62 | ἔσκες 63 | ἔσκετε 64 | ἔσκον 65 | ἔσμεν 66 | ἔσοιντο 67 | ἔσοιο 68 | ἔσοιθ' 69 | ἔσοιτ' 70 | ἔσοιτο 71 | ἔσομ' 72 | ἔσομαι 73 | ἔσοντ' 74 | ἔσονται 75 | ἔσθ' 76 | ἔσσ' 77 | ἔσσεαι 78 | ἔσσεθ' 79 | ἔσσεσθ' 80 | ἔσσεσθαι 81 | ἔσσεσθε 82 | ἔσσετ' 83 | ἔσσεται 84 | ἔσσηι 85 | ἔσσῃ 86 | ἔσσι 87 | ἔσσο 88 | ἔσσομ' 89 | ἔσσομαι 90 | ἔσσονθ' 91 | ἔσσοντ' 92 | ἔσσονται 93 | ἔστ' 94 | ἔσται 95 | ἔστε 96 | ἔστι 97 | ἔστιν 98 | ἔστον 99 | ἔστω 100 | ἔστων 101 | ἔστωσαν 102 | ἔσχ' 103 | ἔω 104 | ἔωμεν 105 | ἔωντι 106 | ἔωσι 107 | ἔωσιν 108 | ἐμέν 109 | ἐμεν 110 | ἐμμι 111 | ἐμμί 112 | ἐνθ' 113 | ἐντ' 114 | ἐντι 115 | ἐντί 116 | ἐόν 117 | ἐόνθ' 118 | ἐόντ' 119 | ἐόντα 120 | ἐόντας 121 | ἐόντε 122 | ἐόντες 123 | ἐόντεσσιν 124 | ἐόντι 125 | ἐόντος 126 | ἐόντων 127 | ἐοίσαις 128 | ἐοίσας 129 | ἐοῖσα 130 | ἐοῖσαι 131 | ἐοῖσαν 132 | ἐοῖσιν 133 | ἐούσαις 134 | ἐούσας 135 | ἐούσης 136 | ἐούσῃ 137 | ἐούσῃσι 138 | ἐούσῃσιν 139 | ἐοῦσ' 140 | ἐοῦσα 141 | ἐοῦσαι 142 | ἐοῦσαν 143 | ἐοῦσι 144 | ἐοῦσιν 145 | ἐουσᾶν 146 | ἐουσέων 147 | ἐουσῶν 148 | ἐσμέν 149 | ἐσμεν 150 | ἐσόμενα 151 | ἐσόμεναι 152 | ἐσόμενοι 153 | ἐσόμενον 154 | ἐσόμενος 155 | ἐσόμεθ' 156 | ἐσόμεθα 157 | ἐσόμεσθα 158 | ἐσοίμεθα 159 | ἐσοίμην 160 | ἐσομέναις 161 | ἐσομένας 162 | ἐσομένη 163 | ἐσομένηι 164 | ἐσομένην 165 | ἐσομένης 166 | ἐσομένῃ 167 | ἐσομένοις 168 | ἐσομένου 169 | ἐσομένους 170 | ἐσομένων 171 | ἐσομένῳ 172 | ἐσοῦμαι 173 | ἐσοῦνται 174 | ἐσθ' 175 | ἐσσ' 176 | ἐσσεῖθ' 177 | ἐσσεῖται 178 | ἐσσῇ 179 | ἐσσι 180 | ἐσσί 181 | ἐσσίν 182 | ἐσσίονται 183 | ἐσσιν 184 | ἐσσόμεν' 185 | ἐσσόμενα 186 | ἐσσόμενε 187 | ἐσσόμενον 188 | ἐσσόμενος 189 | ἐσσόμεθ' 190 | ἐσσόμεθα 191 | ἐσσόμεσθα 192 | ἐσσομένας 193 | ἐσσομένη 194 | ἐσσομένην 195 | ἐσσομένης 196 | ἐσσομένῃ 197 | ἐσσομένῃσι 198 | ἐσσομένῃσιν 199 | ἐσσομένοιο 200 | ἐσσομένοις 201 | ἐσσομένοισι 202 | ἐσσομένοισιν 203 | ἐσσομένου 204 | ἐσσομένων 205 | ἐσσομένῳ 206 | ἐσσοῦνται 207 | ἐσσουμένων 208 | ἐστ' 209 | ἐστε 210 | ἐστέ 211 | ἐστι 212 | ἐστί 213 | ἐστίν 214 | ἐστιν 215 | ἐστόν 216 | ἐστον 217 | ἐών 218 | έν 219 | έσται 220 | έστιν 221 | εἵμεναι 222 | εἴαθ' 223 | εἴατο 224 | εἴη 225 | εἴημεν 226 | εἴην 227 | εἴης 228 | εἴησαν 229 | εἴητ' 230 | εἴητε 231 | εἴητον 232 | εἴμ' 233 | εἴμεναι 234 | εἴμι 235 | εἴσ' 236 | εἴσι 237 | εἴσιν 238 | εἴτην 239 | εἴω 240 | εἶεν 241 | εἶμεν 242 | εἶν' 243 | εἶναι 244 | εἶθ' 245 | εἶς 246 | εἶτ' 247 | εἶτε 248 | εἶτον 249 | εἰμ' 250 | εἰμέν 251 | εἰμεν 252 | εἰμι 253 | εἰμί 254 | εἰσ' 255 | εἰσι 256 | εἰσί 257 | εἰσίν 258 | εἰσιν 259 | ειμεν 260 | ειμι 261 | εισι 262 | εμεν 263 | ενθ' 264 | εντι 265 | εσσι 266 | εστ' 267 | εστε 268 | εστι 269 | εστί 270 | εστίν 271 | εστιν 272 | εστον 273 | εὖντα 274 | ἤην 275 | ἤμην 276 | ἤστην 277 | ἤτην 278 | ἤτω 279 | ἦ 280 | ἦα 281 | ἦεν 282 | ἦι 283 | ἦις 284 | ἦισ' 285 | ἦισι 286 | ἦμεν 287 | ἦμες 288 | ἦν 289 | ἦθ' 290 | ἦς 291 | ἦσαν 292 | ἦσι 293 | ἦσιν 294 | ἦσθ' 295 | ἦσθα 296 | ἦσθε 297 | ἦστ' 298 | ἦστε 299 | ἦστον 300 | ἦτ' 301 | ἦτε 302 | ἦτον 303 | ᾖ 304 | ᾖς 305 | ᾖσ' 306 | ᾖσι 307 | ᾖσιν 308 | ᾖσθ' 309 | ᾖσθα 310 | ἴσθ' 311 | ἴσθι 312 | ἴω 313 | ἴωμεν 314 | ἴωσ' 315 | ἴωσι 316 | ἴωσιν 317 | ἰόν 318 | ἰόνθ' 319 | ἰόντ' 320 | ἰόντα 321 | ἰόντας 322 | ἰόντε 323 | ἰόντες 324 | ἰόντι 325 | ἰόντοιν 326 | ἰόντος 327 | ἰόντων 328 | ἰοίσας 329 | ἰοῖσ' 330 | ἰοῖσα 331 | ἰοῖσαι 332 | ἰοῖσι 333 | ἰοῖσιν 334 | ἰούσαις 335 | ἰούσας 336 | ἰοῦσ' 337 | ἰοῦσα 338 | ἰοῦσαι 339 | ἰοῦσαν 340 | ἰοῦσι 341 | ἰοῦσιν 342 | ἰουσῶν 343 | ἰών 344 | κἄμμ' 345 | κἄνθ' 346 | κἄσθ' 347 | κἄστ' 348 | κἄστι 349 | κἄστιν 350 | κᾆθ' 351 | κᾆτ' 352 | κἀντ' 353 | κἀντί 354 | κἀστί 355 | κἀστίν 356 | κἀστόν 357 | κεἰμί 358 | κἤν 359 | κἠστί 360 | κὦ 361 | μἤστι 362 | μοὔσθ' 363 | μοὔστι 364 | μοὔστιν 365 | μοὐστί 366 | μοὐστίν 367 | ὄν 368 | ὄνθ' 369 | ὄντ' 370 | ὄντα 371 | ὄντας 372 | ὄντε 373 | ὄντες 374 | ὄντεσσι 375 | ὄντι 376 | ὄντοιν 377 | ὄντος 378 | ὄντων 379 | οἶσ' 380 | οἶσα 381 | οἶσαι 382 | οἶσι 383 | οἶσιν 384 | οὕστε 385 | οὔσα 386 | οὔσαιν 387 | οὔσαις 388 | οὔσας 389 | οὔσηι 390 | οὔσης 391 | οὔσῃ 392 | οὖσ' 393 | οὖσα 394 | οὖσαι 395 | οὖσαν 396 | οὖσι 397 | οὖσιν 398 | οὐσῶν 399 | σοὔστι 400 | σοὐστί 401 | σοὐστίν 402 | τἄν 403 | τοὔν 404 | τοὐστί 405 | ὤν 406 | ὦ 407 | ὦμ' 408 | ὦμεν 409 | ὦμες 410 | ὦντι 411 | ὦσ' 412 | ὦσι 413 | ὦσιν 414 | -------------------------------------------------------------------------------- /data/latin_paradigms/video.txt: -------------------------------------------------------------------------------- 1 | uide 2 | uideam 3 | uideamque 4 | uideamur 5 | uideamus 6 | uideamusque 7 | uideant 8 | uideantur 9 | uidear 10 | uideare 11 | uidearis 12 | uideas 13 | uideat 14 | uideatis 15 | uideatque 16 | uideatur 17 | uideaturque 18 | uidebam 19 | uidebamini 20 | uidebamur 21 | uidebamus 22 | uidebant 23 | uidebantur 24 | uidebanturque 25 | uidebar 26 | uidebaris 27 | uidebat 28 | uidebatque 29 | uidebatur 30 | uidebaturque 31 | uideberis 32 | uidebimur 33 | uidebimus 34 | uidebis 35 | uidebit 36 | uidebitis 37 | uidebitur 38 | uidebo 39 | uidebor 40 | uidebunt 41 | uidebuntur 42 | uidemini 43 | uidemur 44 | uidemus 45 | uidemusque 46 | uiden 47 | uidendae 48 | uidendam 49 | uidendaque 50 | uidendi 51 | uidendis 52 | uidendo 53 | uidendum 54 | uidendumque 55 | uidendus 56 | uidens 57 | uident 58 | uidente 59 | uidentem 60 | uidentes 61 | uidenti 62 | uidentibus 63 | uidentis 64 | uidento 65 | uidentur 66 | uidenturque 67 | uideo 68 | uideoque 69 | uideor 70 | uideram 71 | uiderant 72 | uiderat 73 | uidere 74 | uiderem 75 | uideremur 76 | uideremus 77 | uiderent 78 | uiderentur 79 | uidereque 80 | uiderer 81 | uidereris 82 | uideres 83 | uideret 84 | uideretis 85 | uideretque 86 | uideretur 87 | uidereturque 88 | uideri 89 | uiderier 90 | uiderim 91 | uiderimus 92 | uiderint 93 | uiderintne 94 | uiderintue 95 | uideris 96 | uiderit 97 | uideritis 98 | uideritne 99 | uidero 100 | uiderunt 101 | uides 102 | uidesne 103 | uidesque 104 | uidet 105 | uidete 106 | uidetis 107 | uidetisne 108 | uideto 109 | uidetote 110 | uidetque 111 | uidetur 112 | uideturne 113 | uideturque 114 | uidi 115 | uidimus 116 | uidisse 117 | uidissem 118 | uidissent 119 | uidisses 120 | uidisset 121 | uidisti 122 | uidistis 123 | uidit 124 | uiditque 125 | uisa 126 | uisae 127 | uisaeque 128 | uisam 129 | uisamque 130 | uisaque 131 | uisas 132 | uisast 133 | uisi 134 | uisique 135 | uisis 136 | uisisque 137 | uiso 138 | uisoque 139 | uisos 140 | uisu 141 | uisum 142 | uisumque 143 | uisuque 144 | uisura 145 | uisuram 146 | uisure 147 | uisuri 148 | uisuris 149 | uisuros 150 | uisurum 151 | uisurus 152 | uisus 153 | uisusque 154 | uisust 155 | vide 156 | videam 157 | videamini 158 | videamur 159 | videamus 160 | videant 161 | videantur 162 | videar 163 | videare 164 | videaris 165 | videas 166 | videasque 167 | videat 168 | videatis 169 | videatque 170 | videatur 171 | videaturne 172 | videbam 173 | videbamini 174 | videbamque 175 | videbamur 176 | videbamus 177 | videbant 178 | videbantque 179 | videbantur 180 | videbar 181 | videbare 182 | videbaris 183 | videbarque 184 | videbas 185 | videbat 186 | videbatis 187 | videbatur 188 | videbaturque 189 | videbere 190 | videberis 191 | videbimur 192 | videbimus 193 | videbis 194 | videbit 195 | videbitis 196 | videbitur 197 | videbo 198 | videbor 199 | videbunt 200 | videbuntque 201 | videbuntur 202 | videmini 203 | videmur 204 | videmurne 205 | videmus 206 | videmusne 207 | videmusque 208 | viden 209 | videnda 210 | videndae 211 | videndam 212 | videndi 213 | videndique 214 | videndis 215 | videndo 216 | videndos 217 | videndum 218 | videndumque 219 | videndumst 220 | videndus 221 | videns 222 | vidensque 223 | vident 224 | vidente 225 | videntem 226 | videntes 227 | videnti 228 | videntibus 229 | videntique 230 | videntis 231 | videntium 232 | videntque 233 | videntur 234 | videnturne 235 | video 236 | videon 237 | videone 238 | videoque 239 | videor 240 | videorne 241 | videorque 242 | videram 243 | videramus 244 | viderant 245 | videras 246 | viderat 247 | videratis 248 | videre 249 | viderem 250 | videremini 251 | videremur 252 | videremus 253 | viderent 254 | viderentque 255 | viderentur 256 | viderenturne 257 | viderer 258 | viderere 259 | videreris 260 | videres 261 | videret 262 | videretis 263 | videretque 264 | videretur 265 | videreturne 266 | videreturque 267 | videri 268 | viderier 269 | viderim 270 | viderimus 271 | viderint 272 | viderique 273 | videris 274 | viderisque 275 | viderit 276 | videritis 277 | videritque 278 | videro 279 | viderunt 280 | videruntque 281 | vides 282 | videsne 283 | videt 284 | videte 285 | videtin 286 | videtis 287 | videtisne 288 | videto 289 | videtote 290 | videtque 291 | videtur 292 | videturne 293 | videturque 294 | vidi 295 | vidimus 296 | vidimusque 297 | vidin 298 | vidique 299 | vidisse 300 | vidissem 301 | vidissemque 302 | vidissemus 303 | vidissent 304 | vidissentque 305 | vidisses 306 | vidisset 307 | vidissetis 308 | vidissetque 309 | vidissetve 310 | vidisti 311 | vidistin 312 | vidistine 313 | vidistis 314 | vidit 315 | viditque 316 | visa 317 | visae 318 | visaeque 319 | visam 320 | visamque 321 | visanest 322 | visaque 323 | visas 324 | visast 325 | vise 326 | visen 327 | visi 328 | visique 329 | visis 330 | visisque 331 | viso 332 | vison 333 | visoque 334 | visorum 335 | visos 336 | visosque 337 | visu 338 | visum 339 | visumque 340 | visumst 341 | visun 342 | visuque 343 | visura 344 | visurae 345 | visuram 346 | visuraque 347 | visuras 348 | visure 349 | visuri 350 | visuris 351 | visuros 352 | visurum 353 | visurus 354 | visurusne 355 | visus 356 | visusque 357 | visust 358 | visuve 359 | -------------------------------------------------------------------------------- /make_lists.R: -------------------------------------------------------------------------------- 1 | # -------------------------------------+ 2 | # Stopwords: Latin and Greek 3 | # Make TXT/Markdown stoplists from JSON 4 | # -------------------------------------+ 5 | 6 | source("~/Documents/github/helpers/R/helpers.R") 7 | 8 | 9 | # GREEK ------------------------------------------------------------------- 10 | 11 | # Set version number 12 | version_greek <- "2.8" 13 | 14 | # Convert current JSON list to TXT with Markdown headings 15 | greek_json <- read_file("stopwords_greek.json") 16 | greek_json %>% 17 | str_replace_all("^\\{\n", "") %>% 18 | str_replace_all("\\}\n\\}\n", "") %>% 19 | str_replace_all("\\s*\"([A-Z]+.*)\": [\\[\\{\\],]+\n", "# \\1\n") %>% 20 | str_replace_all("\\s*\"(.*)\": \\[\n", "## \\1\n") %>% 21 | # str_replace_all("[\":\\{\\}\\[\\],]", "\n") %>% 22 | str_replace_all("\\:(?!\")", "\n") %>% 23 | str_replace_all("\\[(?!\")", "\n") %>% 24 | str_replace_all("\\](?!\")", "\n") %>% 25 | str_replace_all("\\{(?!\")", "\n") %>% 26 | str_replace_all("\\}(?!\")", "\n") %>% 27 | str_replace_all("\\\\(?!\")", "\n") %>% 28 | str_replace_all(",", "\n") %>% 29 | str_replace_all('\\"(?!\")', "\n") %>% 30 | str_replace_all("\\\\", "\n") %>% 31 | str_replace_all("\n\\s+", "\n") %>% 32 | str_replace_all("##", "\n##") %>% 33 | str_replace_all("\n#(.)", "\n\n#\\1") %>% 34 | str_replace_all("\n\n\n", "\n\n") %>% 35 | write_file("./test/test_json_txt/stopwords_greek_raw.txt") 36 | 37 | # Add metadata 38 | today <- format(Sys.time(), "%Y-%m-%d") 39 | greek_raw <- read_file("./test/test_json_txt/stopwords_greek_raw.txt") 40 | current_greek_count <- count_items_in_txt_list("./test/test_json_txt/stopwords_greek_raw.txt") 41 | greek_metadata <- paste0( 42 | "# Ancient Greek stopwords", "\n", 43 | "# version ", version_greek, "\n", 44 | "# ", today, "\n", 45 | "# Aurélien Berra", "\n", 46 | "# ", "\n", 47 | "# Ancient Greek stopwords for textual analysis", "\n", 48 | "# language: Ancient Greek (grc)", "\n", 49 | "# type: dataset", "\n", 50 | "# items count: ", current_greek_count, "\n", 51 | "# https://github.com/aurelberra/stopwords", "\n", 52 | "# rights: CC-BY-NC-SA", "\n", 53 | "\n" 54 | ) 55 | stopwords_greek <- paste0(greek_metadata, greek_raw) 56 | stopwords_greek <- utf8::utf8_normalize(stopwords_greek) 57 | write_file(stopwords_greek, "stopwords_greek.txt") 58 | write_file(stopwords_greek, paste("./versions/stopwords_greek_v", str_replace(version_greek, "\\.", "_"), ".txt", sep = "")) 59 | 60 | # Make file without categories as comments 61 | greek_raw %>% 62 | str_replace_all("#.+\n", "") %>% 63 | str_replace_all("\n+", "\n") %>% 64 | write_file("./test/test_json_txt/stopwords_greek_no_comments.txt") 65 | 66 | 67 | # LATIN ------------------------------------------------------------------- 68 | 69 | # Set version number 70 | version_latin <- "2.6" 71 | 72 | # Convert current JSON list to TXT with Markdown headings 73 | latin_json <- read_file("stopwords_latin.json") 74 | latin_json %>% 75 | str_replace_all("^\\{\n", "") %>% 76 | str_replace_all("\\}\n\\}\n", "") %>% 77 | str_replace_all("\\s*\"([A-Z]+.*)\": [\\[\\{\\],]+\n", "# \\1\n") %>% 78 | str_replace_all("\\s*\"(.*)\": \\[\n", "## \\1\n") %>% 79 | # str_replace_all("[\":\\{\\}\\[\\],]", "\n") %>% 80 | str_replace_all("\\:(?!\")", "\n") %>% 81 | str_replace_all("\\[(?!\")", "\n") %>% 82 | str_replace_all("\\](?!\")", "\n") %>% 83 | str_replace_all("\\{(?!\")", "\n") %>% 84 | str_replace_all("\\}(?!\")", "\n") %>% 85 | str_replace_all("\\\\(?!\")", "\n") %>% 86 | str_replace_all(",", "\n") %>% 87 | str_replace_all('\\"(?!\")', "\n") %>% 88 | str_replace_all("\\\\", "\n") %>% 89 | str_replace_all("\n\\s+", "\n") %>% 90 | str_replace_all("##", "\n##") %>% 91 | str_replace_all("\n#(.)", "\n\n#\\1") %>% 92 | str_replace_all("\n\n\n", "\n\n") %>% 93 | write_file("./test/test_json_txt/stopwords_latin_raw.txt") 94 | 95 | # Add metadata 96 | today <- format(Sys.time(), "%Y-%m-%d") 97 | latin_raw <- read_file("./test/test_json_txt/stopwords_latin_raw.txt") 98 | current_latin_count <- count_items_in_txt_list("./test/test_json_txt/stopwords_latin_raw.txt") 99 | latin_metadata <- paste0( 100 | "# Ancient Latin stopwords", "\n", 101 | "# version ", version_latin, "\n", 102 | "# ", today, "\n", 103 | "# Aurélien Berra", "\n", 104 | "# ", "\n", 105 | "# Ancient Latin stopwords for textual analysis", "\n", 106 | "# language: Latin (la, lat)", "\n", 107 | "# type: dataset", "\n", 108 | "# items count: ", current_latin_count, "\n", 109 | "# https://github.com/aurelberra/stopwords", "\n", 110 | "# rights: CC-BY-NC-SA", "\n", 111 | "\n" 112 | ) 113 | stopwords_latin <- paste0(latin_metadata, latin_raw) 114 | write_file(stopwords_latin, "stopwords_latin.txt") 115 | write_file(stopwords_latin, paste("./versions/stopwords_latin_v", str_replace(version_latin, "\\.", "_"), ".txt", sep = "")) 116 | 117 | # Make file without categories as comments 118 | latin_raw %>% 119 | str_replace_all("#.+\n", "") %>% 120 | str_replace_all("\n+", "\n") %>% 121 | write_file("./test/test_json_txt/stopwords_latin_no_comments.txt") 122 | -------------------------------------------------------------------------------- /data/tlg_data/tlg_top_500.txt: -------------------------------------------------------------------------------- 1 | καὶ 2 | δὲ 3 | τὸ 4 | τοῦ 5 | τῶν 6 | τὴν 7 | τῆς 8 | ὁ 9 | ἐν 10 | γὰρ 11 | τὸν 12 | τὰ 13 | μὲν 14 | ἡ 15 | τῷ 16 | ὡς 17 | εἰς 18 | πρὸς 19 | τοῖς 20 | ἢ 21 | τε 22 | ὅτι 23 | ἐπὶ 24 | διὰ 25 | κατὰ 26 | μὴ 27 | τοὺς 28 | οἱ 29 | οὐ 30 | τῇ 31 | δ 32 | οὐκ 33 | περὶ 34 | εἰ 35 | ἐκ 36 | τὰς 37 | τοῦτο 38 | αὐτοῦ 39 | ἀπὸ 40 | ἀλλὰ 41 | οὖν 42 | ἀλλ 43 | εἶναι 44 | ἂν 45 | παρὰ 46 | ταῦτα 47 | μετὰ 48 | αὐτῶν 49 | ὑπὸ 50 | αὐτὸν 51 | αὐτῷ 52 | τι 53 | ἦν 54 | ἐστιν 55 | ἐξ 56 | τις 57 | ἐστι 58 | οὕτως 59 | δέ 60 | τί 61 | οὐδὲ 62 | ταῖς 63 | αἱ 64 | δὴ 65 | θεοῦ 66 | πάντα 67 | τούτων 68 | οὕτω 69 | δι 70 | ἵνα 71 | ὥσπερ 72 | αὐτοῖς 73 | πάλιν 74 | νῦν 75 | γε 76 | οὔτε 77 | ὧν 78 | καθ 79 | ἔχει 80 | μόνον 81 | αὐτὸς 82 | οἷον 83 | μᾶλλον 84 | ἡμῖν 85 | οὐχ 86 | γάρ 87 | κατ 88 | πῶς 89 | οὐδὲν 90 | α 91 | ἡμῶν 92 | ὥστε 93 | ἔστι 94 | ἔτι 95 | ὃ 96 | παρ 97 | σου 98 | λέγει 99 | δύο 100 | μοι 101 | ὑπὲρ 102 | αὐτῆς 103 | μου 104 | ἐπεὶ 105 | τούτου 106 | ὅταν 107 | αὐτοὺς 108 | αὐτὸ 109 | ἐς 110 | οὗ 111 | ἐπ 112 | λόγον 113 | ἀντὶ 114 | αὐτὴν 115 | πάντων 116 | ἄρα 117 | γίνεται 118 | δεῖ 119 | ἐπειδὴ 120 | ἡμᾶς 121 | ἐὰν 122 | λόγος 123 | γ 124 | θεὸς 125 | ἔστιν 126 | τότε 127 | οὗτος 128 | ἐστὶν 129 | πρὸ 130 | με 131 | τούτοις 132 | ἤδη 133 | ἐγὼ 134 | ἐστὶ 135 | τοίνυν 136 | ὦ 137 | πρῶτον 138 | ἔσται 139 | β 140 | τ 141 | ἐφ 142 | ἔχειν 143 | σοι 144 | μάλιστα 145 | ἣν 146 | φύσιν 147 | τίς 148 | ταύτην 149 | εἰπεῖν 150 | ἅμα 151 | τοῦτον 152 | οἷς 153 | εἶπεν 154 | τινα 155 | ὃν 156 | ἄλλων 157 | ὅπερ 158 | λέγων 159 | ε 160 | ἐνταῦθα 161 | γῆς 162 | ἃ 163 | ἀεὶ 164 | μὴν 165 | ὅτε 166 | λέγεται 167 | εἴη 168 | σε 169 | εἶτα 170 | λέγειν 171 | οὐδ 172 | ὁμοίως 173 | πολλὰ 174 | φησιν 175 | ᾧ 176 | σὺν 177 | σῶμα 178 | κύριος 179 | τούτῳ 180 | κἂν 181 | εἴ 182 | ἑαυτοῦ 183 | διὸ 184 | ν 185 | πρότερον 186 | θεὸν 187 | ἄλλο 188 | ι 189 | μήτε 190 | ὃς 191 | πᾶν 192 | μέν 193 | γενέσθαι 194 | ἄν 195 | καί 196 | σὺ 197 | φησὶν 198 | ὅσα 199 | μηδὲ 200 | ἓν 201 | ὑμῶν 202 | ἀνθρώπων 203 | ἔφη 204 | αὐτῇ 205 | ὅ 206 | ὅπως 207 | ὑπ 208 | ὄνομα 209 | αὐτὰ 210 | λόγου 211 | φησὶ 212 | ψυχῆς 213 | μετ 214 | τρόπον 215 | ἄνθρωπος 216 | καθάπερ 217 | γῆν 218 | πόλιν 219 | ἔχων 220 | ὑμῖν 221 | μέντοι 222 | μέρος 223 | θεῷ 224 | πάντες 225 | ταύτης 226 | κυρίου 227 | χριστοῦ 228 | σώματος 229 | ἕως 230 | μηδὲν 231 | ὄντα 232 | αὕτη 233 | ἕτερον 234 | ἤτοι 235 | ἡμεῖς 236 | γοῦν 237 | ἀπ 238 | αὐτόν 239 | τοιαῦτα 240 | δύναμιν 241 | εἴρηται 242 | ποιεῖ 243 | πολλάκις 244 | η 245 | βασιλεὺς 246 | ὢν 247 | λόγῳ 248 | μέχρι 249 | δῆλον 250 | χρὴ 251 | ἄλλως 252 | κ 253 | ἄλλα 254 | πνεῦμα 255 | ἑαυτὸν 256 | φησίν 257 | ᾖ 258 | ὅθεν 259 | βασιλέως 260 | εἶδος 261 | χρόνον 262 | ο 263 | ἐκεῖ 264 | καλῶς 265 | ὑμᾶς 266 | εἴτε 267 | πᾶσαν 268 | ἧς 269 | μή 270 | δοκεῖ 271 | ποτε 272 | ἐκείνου 273 | πατρὸς 274 | φησι 275 | λέγω 276 | ἐγένετο 277 | τοιοῦτον 278 | παντὸς 279 | πολὺ 280 | ὅσον 281 | χάριν 282 | πάντας 283 | τινος 284 | θ 285 | μ 286 | τινὰ 287 | ἑξῆς 288 | ποιεῖν 289 | πόλεως 290 | ἡμέρας 291 | πολλῶν 292 | ἁπλῶς 293 | οὗτοι 294 | γένος 295 | φύσει 296 | πάντως 297 | ὕδωρ 298 | ἤγουν 299 | ἀφ 300 | φύσεως 301 | εἰσιν 302 | ἐκείνων 303 | λοιπὸν 304 | ἀρχὴν 305 | τέλος 306 | ἀρχῆς 307 | ᾗ 308 | πόλις 309 | ἕκαστον 310 | τινες 311 | πλὴν 312 | ἦσαν 313 | ὄντων 314 | ποτὲ 315 | ἄνθρωπον 316 | μέγα 317 | δύναται 318 | ὕστερον 319 | οὓς 320 | πνεύματος 321 | αὐτοὶ 322 | ὄντος 323 | ἐστίν 324 | τόπον 325 | υἱὸς 326 | εὖ 327 | πλέον 328 | ἄνω 329 | μίαν 330 | πλῆθος 331 | που 332 | κύριον 333 | ἐκεῖνος 334 | τό 335 | ἀνάγκη 336 | εἶπε 337 | ὅλως 338 | ὅλον 339 | σημαίνει 340 | ἄλλοις 341 | θεός 342 | ψυχὴν 343 | πραγμάτων 344 | οἳ 345 | λόγους 346 | ὂν 347 | πάνυ 348 | δηλοῖ 349 | ς 350 | ταύτῃ 351 | οὐχὶ 352 | εὐθὺς 353 | αἰτίαν 354 | λ 355 | θεῶν 356 | φησί 357 | βασιλέα 358 | λόγων 359 | ἔξω 360 | τούτους 361 | πατέρα 362 | ἔτη 363 | πῦρ 364 | οὐδεὶς 365 | πάσης 366 | καίτοι 367 | ἀνθρώπου 368 | ὅμως 369 | γίνεσθαι 370 | καθόλου 371 | ἔργον 372 | τουτέστιν 373 | ζ 374 | μεθ 375 | ῥωμαίων 376 | υἱὸν 377 | ἡμέραν 378 | τουτέστι 379 | ἑαυτῷ 380 | πατὴρ 381 | νοῦν 382 | ἐμοῦ 383 | πᾶσι 384 | πᾶσα 385 | ἐμοὶ 386 | τοσοῦτον 387 | βίον 388 | οὐκέτι 389 | μέσον 390 | ἑνὸς 391 | ἔχοντα 392 | ἐκεῖνο 393 | εἰπὼν 394 | δυνάμει 395 | εἷς 396 | χωρὶς 397 | διότι 398 | τρεῖς 399 | ἑαυτῶν 400 | ἐντεῦθεν 401 | κάτω 402 | αὖθις 403 | ἕνα 404 | δόξαν 405 | πρός 406 | γέγονεν 407 | ἴσως 408 | εἰσι 409 | πολλοὶ 410 | ἁπάντων 411 | ἔνθα 412 | τοιούτων 413 | οὐσίας 414 | εἰσὶ 415 | φύσις 416 | νόμον 417 | ἀνθρώποις 418 | τοι 419 | δυνάμεως 420 | εἴπερ 421 | πρὶν 422 | ἔπειτα 423 | φῶς 424 | μέρη 425 | παντὶ 426 | ἀγαθὸν 427 | ἄλλοι 428 | πολλοὺς 429 | χρόνῳ 430 | ὥς 431 | ἔστω 432 | πᾶσιν 433 | τοῦτ 434 | γίνονται 435 | δεύτερον 436 | οὐκοῦν 437 | οὐσίαν 438 | π 439 | μικρὸν 440 | μεταξὺ 441 | ἄνευ 442 | ἴσον 443 | φαίνεται 444 | οἶμαι 445 | τινὲς 446 | ὑμεῖς 447 | ἀδύνατον 448 | πως 449 | ἀνδρῶν 450 | ἐκεῖνον 451 | ἴδιον 452 | ἄνδρα 453 | ὁμοῦ 454 | ϛ 455 | ἰδοὺ 456 | ἀλλήλων 457 | ἔχοντες 458 | ὅπου 459 | αὖ 460 | ζωῆς 461 | ἀγαθῶν 462 | γένηται 463 | ἀνὴρ 464 | πάθος 465 | πολλῷ 466 | σοῦ 467 | ἔδει 468 | τινὸς 469 | αὐτὴ 470 | θάνατον 471 | λαβεῖν 472 | εἰκότως 473 | αἴτιον 474 | πόλεμον 475 | σφόδρα 476 | χρόνου 477 | ἅπαντα 478 | πόλει 479 | χριστὸς 480 | αὐτούς 481 | κόσμου 482 | τῆϲ 483 | χώραν 484 | ὑπάρχει 485 | ὑφ 486 | λόγοις 487 | ἡλίου 488 | πᾶς 489 | μία 490 | γέγονε 491 | ὕδατος 492 | υἱοῦ 493 | δή 494 | ἕνεκα 495 | ἔχον 496 | τοῦτό 497 | λαβὼν 498 | ἔχουσι 499 | δηλονότι 500 | κακῶς 501 | -------------------------------------------------------------------------------- /data/dem_top_500.txt: -------------------------------------------------------------------------------- 1 | καὶ 2 | τῶν 3 | μὲν 4 | τὴν 5 | δὲ 6 | δ 7 | τὸν 8 | τοῦ 9 | τοὺς 10 | ἂν 11 | γὰρ 12 | τὰ 13 | τὸ 14 | τῆς 15 | ὡς 16 | τοῖς 17 | ἐν 18 | τῷ 19 | ὁ 20 | ἢ 21 | μὴ 22 | πρὸς 23 | οὐ 24 | εἰ 25 | οὐκ 26 | εἰς 27 | ὅτι 28 | ὦ 29 | περὶ 30 | ἄνδρες 31 | ὑμῖν 32 | ἀλλ 33 | τούτων 34 | εἶναι 35 | ὑμᾶς 36 | ταῦτα 37 | ἀλλὰ 38 | τῇ 39 | οἱ 40 | τὰς 41 | ὧν 42 | ἐκ 43 | τις 44 | τοίνυν 45 | τι 46 | ἐπὶ 47 | ἐγὼ 48 | ὑμῶν 49 | νῦν 50 | οὖν 51 | ἀθηναῖοι 52 | ἦν 53 | μοι 54 | ὑπὲρ 55 | οὐδ 56 | ἡ 57 | τοῦτο 58 | τί 59 | ταῦτ 60 | παρ 61 | ἃ 62 | διὰ 63 | παρὰ 64 | οὗτος 65 | οὐδὲν 66 | οὐδὲ 67 | αὐτῷ 68 | τούτου 69 | αὐτὸν 70 | κατὰ 71 | τε 72 | τοῦτον 73 | ὑμεῖς 74 | δικασταί 75 | οὔτε 76 | αὐτῶν 77 | λέγειν 78 | δεῖ 79 | ἄν 80 | ἐστιν 81 | μετὰ 82 | αὐτὸς 83 | ἐξ 84 | οὐχ 85 | τούτοις 86 | ἐὰν 87 | δὴ 88 | αὐτοῦ 89 | τούτῳ 90 | αὐτοῖς 91 | ὑπὸ 92 | δίκην 93 | οἷς 94 | δι 95 | τοῦτ 96 | πάντα 97 | νόμον 98 | ἐπειδὴ 99 | πρῶτον 100 | δέ 101 | γάρ 102 | μόνον 103 | ὥστε 104 | ποιεῖν 105 | ἔχειν 106 | ἐφ 107 | εἰπεῖν 108 | γε 109 | πόλει 110 | οὕτως 111 | οὕτω 112 | ἡμῖν 113 | ὥσπερ 114 | οὗτοι 115 | γ 116 | τούτους 117 | οὔτ 118 | πάντων 119 | μᾶλλον 120 | ἐμοῦ 121 | εἴ 122 | καθ 123 | αὐτοὺς 124 | μηδὲν 125 | πῶς 126 | ἵνα 127 | ἄλλων 128 | ἡμῶν 129 | τότε 130 | ἔτι 131 | ὃ 132 | ταῖς 133 | δεῖν 134 | νόμους 135 | ὅπως 136 | ἡμᾶς 137 | πόλιν 138 | οἶμαι 139 | πόλεως 140 | μὴν 141 | ἐμοὶ 142 | ὅ 143 | ἤδη 144 | ταύτην 145 | ἣν 146 | καίτοι 147 | ὃν 148 | ἁπάντων 149 | λέγω 150 | ὅταν 151 | τίς 152 | πάλιν 153 | ταῦθ 154 | πολλὰ 155 | δικαίως 156 | ἐστι 157 | ἔχει 158 | αὑτοῦ 159 | μηδ 160 | οὓς 161 | μέν 162 | ἀληθῆ 163 | πρότερον 164 | ἔστιν 165 | γενέσθαι 166 | τρόπον 167 | χρήματα 168 | πάντες 169 | ἀπὸ 170 | δίκαιον 171 | ἔχων 172 | οὐδεὶς 173 | εὖ 174 | ὃς 175 | ἡμεῖς 176 | με 177 | νόμων 178 | λαβεῖν 179 | τ 180 | ἐκείνου 181 | λέγε 182 | μηδὲ 183 | ἔστι 184 | ἐστὶν 185 | καλῶς 186 | μήτε 187 | πάντας 188 | δήπου 189 | ἐπ 190 | ἵν 191 | οὗ 192 | ὢν 193 | μή 194 | χρόνον 195 | πολλῶν 196 | ἀνθρώπων 197 | αὐτοὶ 198 | ἑαυτοῦ 199 | ἴσως 200 | δίκαια 201 | ἐκεῖνος 202 | ὄντων 203 | σὺ 204 | ἀργύριον 205 | τοῦθ 206 | αὐτὴν 207 | μάρτυρας 208 | κἂν 209 | οὐχὶ 210 | μου 211 | οὐδέν 212 | χρημάτων 213 | ἀρχῆς 214 | πραγμάτων 215 | λόγον 216 | νόμος 217 | ὥστ 218 | αὑτῷ 219 | προσήκει 220 | τοιαῦτα 221 | ἔσται 222 | πατὴρ 223 | πράττειν 224 | ἕκαστος 225 | ᾖ 226 | κατ 227 | ὅτε 228 | αἱ 229 | ἐμὲ 230 | πᾶσιν 231 | ποτ 232 | ᾧ 233 | ἄλλοις 234 | ὅσα 235 | εἰκότως 236 | λόγους 237 | ὄντα 238 | φίλιππος 239 | μαρτυρίας 240 | ὁτιοῦν 241 | ὑπ 242 | φίλιππον 243 | ὑφ 244 | δοκεῖ 245 | ἅπαντα 246 | νυνὶ 247 | αὑτὸν 248 | καί 249 | οὔθ 250 | ἃς 251 | ναῦν 252 | ἀθηναίων 253 | μάλιστα 254 | πατρὸς 255 | χρὴ 256 | μαρτυρίαν 257 | εἶτα 258 | ἧς 259 | ὀρθῶς 260 | τότ 261 | εἴη 262 | αὐτόν 263 | ἐστίν 264 | μνᾶς 265 | ἁγνίου 266 | ἄλλους 267 | εὐθὺς 268 | νόμοι 269 | κακῶς 270 | ποιῆσαι 271 | νὴ 272 | ὅς 273 | οὐκοῦν 274 | ἄλλο 275 | εἰρήνην 276 | ἐκεῖνον 277 | πάνθ 278 | βούλομαι 279 | νομίζω 280 | πάντ 281 | ταύτης 282 | ὕστερον 283 | πόλις 284 | δοῦναι 285 | ἔφη 286 | αὑτῶν 287 | ἐστὶ 288 | ὅμως 289 | σοι 290 | ἅπαντας 291 | λαβὼν 292 | γέγονεν 293 | ἑλλήνων 294 | μήτ 295 | νόμου 296 | οὑτοσὶ 297 | ἐάν 298 | μέντοι 299 | ψήφισμα 300 | ἐκείνων 301 | ἦσαν 302 | τοιοῦτον 303 | ἀντὶ 304 | αὐτῆς 305 | λέγων 306 | πράγματα 307 | εἴπερ 308 | πολλάκις 309 | φιλίππου 310 | ψευδῆ 311 | ἐγώ 312 | ἐκείνῳ 313 | τινες 314 | χάριν 315 | ὅστις 316 | φιλίππῳ 317 | οἳ 318 | ὅτ 319 | ἀκούειν 320 | ἕκαστον 321 | ἐπειδὰν 322 | ἡγοῦμαι 323 | πλὴν 324 | ἄξιον 325 | ἅπαντες 326 | ἔδει 327 | μετ 328 | πόλεμον 329 | δήμῳ 330 | πολλοὺς 331 | λέγει 332 | λόγῳ 333 | μαρτυρια 334 | πρὶν 335 | ἀεὶ 336 | αὐτὸ 337 | νόμοις 338 | χρήματ 339 | εἷς 340 | μαρτυριαι 341 | πᾶσι 342 | ἀφ 343 | δύο 344 | οὐδενὸς 345 | αὐτῇ 346 | οἶδ 347 | ὄντας 348 | των 349 | πρᾶγμα 350 | αὑτοῖς 351 | δῆμος 352 | ἕως 353 | ἅμα 354 | ἓν 355 | ἰδίᾳ 356 | οὖσαν 357 | πολὺ 358 | σαφῶς 359 | δῆλον 360 | ὁμοίως 361 | τοιούτων 362 | δήμου 363 | ἐγένετο 364 | νομοσ 365 | πάνυ 366 | τιν 367 | δῆμον 368 | δί 369 | κοινῇ 370 | οὐδένα 371 | πράγματ 372 | εἰσιν 373 | ᾗ 374 | εἰρήνης 375 | ὅλως 376 | πατρὶ 377 | τουτονὶ 378 | δεινὸν 379 | θεῶν 380 | μέρος 381 | πρέσβεις 382 | ἄλλος 383 | ἀποδοῦναι 384 | λόγος 385 | μεθ 386 | οὑτοσί 387 | ἀκοῦσαι 388 | ἀκριβῶς 389 | ἀνάγκη 390 | ἀνθρώπους 391 | δίκας 392 | λόγου 393 | λόγων 394 | ὄντες 395 | παρα 396 | τίνος 397 | εἶτ 398 | πρὸ 399 | πολλῷ 400 | σκοπεῖν 401 | τοὐναντίον 402 | φανερῶς 403 | ἄνθρωπον 404 | δή 405 | εἰδέναι 406 | ἐκείνους 407 | μηδεὶς 408 | οὐσίαν 409 | πρᾶγμ 410 | ἔπειτα 411 | λαβὲ 412 | παθεῖν 413 | πλέον 414 | δία 415 | ἐμέ 416 | κύριος 417 | ὄντος 418 | ταὐτὰ 419 | ἄλλον 420 | ἔγωγ 421 | μάλιστ 422 | πεπραγμένων 423 | τἄλλα 424 | τοσοῦτον 425 | αὐτούς 426 | γένοιτο 427 | ἴστε 428 | οἰκίαν 429 | ἀργυρίου 430 | δέκα 431 | δίκαι 432 | ἕνεκα 433 | θηβαίους 434 | μ 435 | μὰ 436 | οἴομαι 437 | πολιτῶν 438 | προῖκα 439 | προσῆκεν 440 | φησιν 441 | ἄλλ 442 | δικαστήριον 443 | δυοῖν 444 | ἔχοντες 445 | ποιεῖ 446 | συνθήκας 447 | ἄρ 448 | γίγνεται 449 | δεινὰ 450 | ἑαυτῷ 451 | ἐκείνοις 452 | ἐναντίον 453 | παῖδας 454 | πολλοὶ 455 | πώποτε 456 | τριάκοντα 457 | c 458 | ἀδικεῖν 459 | ἄνευ 460 | πολέμου 461 | σοῦ 462 | ἀπο 463 | ἄρα 464 | ἐπεὶ 465 | ἐπι 466 | κελεύει 467 | ὅπερ 468 | πόλλ 469 | δεῖξαι 470 | εἰσὶν 471 | εἶχεν 472 | πατέρα 473 | χιλίας 474 | χρόνῳ 475 | χωρὶς 476 | λαμβάνειν 477 | ταύτας 478 | ἄλλως 479 | ἔσεσθαι 480 | θεοὺς 481 | νοῦν 482 | ποιήσασθαι 483 | χρῆσθαι 484 | p 485 | βοηθεῖν 486 | δόξαν 487 | πόλεις 488 | πολιτείας 489 | τἀληθῆ 490 | ὑμετέρων 491 | ἄλλοι 492 | ἅπασι 493 | ἁπλῶς 494 | ἐξεῖναι 495 | ὁρῶ 496 | σκεύη 497 | τάλαντα 498 | ἀδίκως 499 | ἅπασιν 500 | δημοσθένης 501 | -------------------------------------------------------------------------------- /data/phi_data/phi_top_500.txt: -------------------------------------------------------------------------------- 1 | et 2 | in 3 | est 4 | non 5 | ut 6 | cum 7 | si 8 | ad 9 | quod 10 | qui 11 | sed 12 | quae 13 | ex 14 | a 15 | quam 16 | de 17 | esse 18 | aut 19 | hoc 20 | nec 21 | se 22 | sunt 23 | etiam 24 | enim 25 | quid 26 | per 27 | ab 28 | sit 29 | atque 30 | id 31 | autem 32 | quo 33 | me 34 | ne 35 | te 36 | ac 37 | nam 38 | tamen 39 | eius 40 | haec 41 | mihi 42 | ita 43 | iam 44 | neque 45 | eo 46 | quidem 47 | pro 48 | ea 49 | quoque 50 | tibi 51 | uel 52 | e 53 | quia 54 | ego 55 | nihil 56 | eum 57 | modo 58 | an 59 | libro 60 | sic 61 | nunc 62 | qua 63 | quem 64 | inter 65 | quibus 66 | esset 67 | erat 68 | causa 69 | m 70 | nisi 71 | hic 72 | potest 73 | tu 74 | tum 75 | ipse 76 | quis 77 | fuit 78 | ille 79 | ante 80 | sine 81 | res 82 | omnia 83 | his 84 | i 85 | idem 86 | sibi 87 | ubi 88 | illa 89 | post 90 | rem 91 | ei 92 | tam 93 | re 94 | c 95 | s 96 | apud 97 | is 98 | vel 99 | magis 100 | tantum 101 | at 102 | erit 103 | deinde 104 | quos 105 | omnes 106 | cui 107 | contra 108 | nos 109 | p 110 | cuius 111 | omnibus 112 | quasi 113 | minus 114 | ergo 115 | vero 116 | rei 117 | eam 118 | o 119 | igitur 120 | posse 121 | dum 122 | t 123 | sub 124 | eorum 125 | sua 126 | inquit 127 | itaque 128 | illi 129 | habet 130 | ipsa 131 | sint 132 | primum 133 | illud 134 | item 135 | eos 136 | satis 137 | nobis 138 | parte 139 | ait 140 | hanc 141 | rerum 142 | semper 143 | propter 144 | suo 145 | tempore 146 | loco 147 | l 148 | possit 149 | rebus 150 | inde 151 | omnis 152 | fuerit 153 | quoniam 154 | omnium 155 | unde 156 | alia 157 | fieri 158 | nomine 159 | alii 160 | maxime 161 | eadem 162 | hunc 163 | hac 164 | pater 165 | facere 166 | quas 167 | saepe 168 | die 169 | aliquid 170 | bene 171 | suis 172 | mea 173 | ipsum 174 | nomen 175 | multa 176 | solum 177 | illum 178 | fuisse 179 | natura 180 | primo 181 | nulla 182 | unum 183 | uero 184 | simul 185 | ob 186 | dies 187 | postea 188 | una 189 | quidam 190 | habere 191 | factum 192 | tempus 193 | senatus 194 | dixit 195 | tunc 196 | licet 197 | dicere 198 | tua 199 | iure 200 | quantum 201 | dicitur 202 | uti 203 | bellum 204 | partem 205 | ideo 206 | numquam 207 | genus 208 | pars 209 | ibi 210 | locum 211 | iis 212 | aliud 213 | eodem 214 | huius 215 | erant 216 | quorum 217 | sum 218 | filius 219 | nemo 220 | animo 221 | suum 222 | debet 223 | supra 224 | dicit 225 | sui 226 | opus 227 | hominum 228 | ius 229 | hinc 230 | causam 231 | quin 232 | magna 233 | sicut 234 | fecit 235 | illo 236 | d 237 | plus 238 | arma 239 | edictum 240 | heres 241 | ista 242 | ipsi 243 | fit 244 | illis 245 | n 246 | suam 247 | huic 248 | duo 249 | homines 250 | facit 251 | essent 252 | facta 253 | cur 254 | omni 255 | siue 256 | manus 257 | usque 258 | potius 259 | ipso 260 | dedit 261 | quaedam 262 | es 263 | animi 264 | usus 265 | diem 266 | populi 267 | romani 268 | castra 269 | genere 270 | prima 271 | vos 272 | manu 273 | forte 274 | bello 275 | haud 276 | urbem 277 | verum 278 | aliis 279 | summa 280 | ratio 281 | uno 282 | publicae 283 | ratione 284 | prius 285 | terra 286 | certe 287 | posset 288 | nostra 289 | tamquam 290 | adhuc 291 | q 292 | filium 293 | publica 294 | meo 295 | bona 296 | circa 297 | aqua 298 | lege 299 | caput 300 | praeter 301 | u 302 | sive 303 | denique 304 | super 305 | fortuna 306 | vis 307 | illam 308 | sane 309 | possunt 310 | patris 311 | quamquam 312 | oportet 313 | filio 314 | armis 315 | secundum 316 | belli 317 | hominem 318 | modum 319 | tot 320 | recte 321 | aliter 322 | pecuniam 323 | suae 324 | r 325 | necesse 326 | aduersus 327 | caesar 328 | corpus 329 | habent 330 | meum 331 | suos 332 | diu 333 | multis 334 | hi 335 | dare 336 | omne 337 | liber 338 | mortem 339 | paulus 340 | dictum 341 | praeterea 342 | hostium 343 | postquam 344 | alio 345 | animum 346 | statim 347 | adeo 348 | milia 349 | intra 350 | totum 351 | alter 352 | tanta 353 | fere 354 | utrum 355 | mox 356 | patrem 357 | facile 358 | alterum 359 | iudices 360 | partes 361 | scilicet 362 | multo 363 | umquam 364 | iudicium 365 | magno 366 | tota 367 | locis 368 | ulpianus 369 | videtur 370 | domum 371 | quando 372 | cura 373 | uidetur 374 | cetera 375 | tertio 376 | locus 377 | fidem 378 | mi 379 | vi 380 | quare 381 | secundo 382 | corpore 383 | signa 384 | bonorum 385 | eas 386 | homo 387 | iudicio 388 | consul 389 | deos 390 | urbe 391 | cicero 392 | ii 393 | decem 394 | sententia 395 | potuit 396 | dici 397 | legatum 398 | nostri 399 | fore 400 | quicquam 401 | numero 402 | di 403 | unus 404 | populo 405 | gratia 406 | tuo 407 | namque 408 | quisque 409 | melius 410 | corporis 411 | prope 412 | habeat 413 | altera 414 | sese 415 | puto 416 | ceteris 417 | nullum 418 | omnem 419 | rex 420 | mare 421 | multum 422 | actio 423 | venit 424 | aliqua 425 | male 426 | dicunt 427 | exercitus 428 | dicta 429 | pecunia 430 | vita 431 | quattuor 432 | annos 433 | potestate 434 | fuerat 435 | iter 436 | verba 437 | solet 438 | nullo 439 | respondit 440 | diximus 441 | illius 442 | alias 443 | v 444 | decimo 445 | anno 446 | iuris 447 | hereditatem 448 | nostris 449 | quamuis 450 | hos 451 | rationem 452 | ora 453 | dari 454 | h 455 | ipsis 456 | habuit 457 | debere 458 | milites 459 | iussit 460 | ceterum 461 | ulla 462 | paulo 463 | romae 464 | nondum 465 | tandem 466 | ipsius 467 | vobis 468 | senatu 469 | castris 470 | agere 471 | quinque 472 | procul 473 | alios 474 | militum 475 | rursus 476 | quidquid 477 | actionem 478 | longe 479 | bonis 480 | consilium 481 | huc 482 | legem 483 | genera 484 | dicam 485 | omnino 486 | generis 487 | praetor 488 | ore 489 | interim 490 | primus 491 | maior 492 | deorum 493 | consilio 494 | publicam 495 | tuis 496 | donec 497 | heredem 498 | uerum 499 | duobus 500 | alius 501 | -------------------------------------------------------------------------------- /data/cic_top_500.txt: -------------------------------------------------------------------------------- 1 | et 2 | in 3 | non 4 | est 5 | ut 6 | cum 7 | quod 8 | ad 9 | qui 10 | si 11 | esse 12 | de 13 | sed 14 | quae 15 | quam 16 | aut 17 | enim 18 | a 19 | quid 20 | me 21 | te 22 | ex 23 | etiam 24 | hoc 25 | atque 26 | id 27 | mihi 28 | sunt 29 | se 30 | sit 31 | quo 32 | autem 33 | nihil 34 | quidem 35 | ne 36 | tamen 37 | nec 38 | ego 39 | ab 40 | tum 41 | neque 42 | haec 43 | ea 44 | ita 45 | ac 46 | modo 47 | re 48 | tu 49 | tibi 50 | iam 51 | esset 52 | nam 53 | quem 54 | eius 55 | vero 56 | eo 57 | qua 58 | quibus 59 | causa 60 | igitur 61 | rem 62 | per 63 | res 64 | ille 65 | nisi 66 | tam 67 | omnia 68 | illa 69 | pro 70 | nunc 71 | eum 72 | nos 73 | fuit 74 | illud 75 | sic 76 | potest 77 | rei 78 | rebus 79 | ipse 80 | sine 81 | vel 82 | erat 83 | is 84 | an 85 | nobis 86 | ante 87 | c 88 | m 89 | omnibus 90 | quis 91 | omnium 92 | his 93 | hic 94 | omnis 95 | itaque 96 | at 97 | publicae 98 | con 99 | rerum 100 | primum 101 | quos 102 | fuisse 103 | posse 104 | idem 105 | sibi 106 | sint 107 | omnes 108 | apud 109 | satis 110 | eos 111 | cuius 112 | aliquid 113 | ei 114 | ipsa 115 | eam 116 | contra 117 | solum 118 | publica 119 | quasi 120 | semper 121 | eorum 122 | dicere 123 | l 124 | magis 125 | ipsum 126 | illi 127 | homines 128 | possit 129 | maxime 130 | vos 131 | hominum 132 | iis 133 | quoniam 134 | multa 135 | iudices 136 | natura 137 | illum 138 | causam 139 | verum 140 | saepe 141 | tua 142 | hanc 143 | erit 144 | p 145 | inquit 146 | deinde 147 | hac 148 | mea 149 | cui 150 | senatus 151 | minus 152 | e 153 | inter 154 | nulla 155 | genere 156 | propter 157 | cicero 158 | illo 159 | ista 160 | fieri 161 | quas 162 | nemo 163 | facere 164 | populi 165 | sum 166 | animi 167 | quoque 168 | huius 169 | quia 170 | numquam 171 | cur 172 | omni 173 | tantum 174 | tempore 175 | hunc 176 | animo 177 | vobis 178 | videtur 179 | quorum 180 | loco 181 | sua 182 | ob 183 | litteras 184 | potius 185 | post 186 | num 187 | litteris 188 | certe 189 | necesse 190 | romani 191 | huic 192 | ipsi 193 | umquam 194 | publicam 195 | hominem 196 | ergo 197 | ratio 198 | nostra 199 | unum 200 | ipso 201 | iure 202 | omnino 203 | suis 204 | alia 205 | denique 206 | quin 207 | d 208 | que 209 | vita 210 | summa 211 | factum 212 | dum 213 | essent 214 | genus 215 | una 216 | suo 217 | aliud 218 | vi 219 | iudicium 220 | eadem 221 | s 222 | ratione 223 | modi 224 | q 225 | vim 226 | vis 227 | velim 228 | habere 229 | verbis 230 | quantum 231 | habet 232 | illam 233 | oratio 234 | posset 235 | quamquam 236 | fore 237 | iudicio 238 | tanta 239 | modum 240 | lege 241 | tuis 242 | iste 243 | multis 244 | illius 245 | illis 246 | quaedam 247 | facile 248 | bene 249 | meo 250 | videatur 251 | eis 252 | etsi 253 | nomen 254 | sin 255 | eodem 256 | multo 257 | populo 258 | di 259 | dicam 260 | magna 261 | ubi 262 | fuerit 263 | consilio 264 | o 265 | plus 266 | nullum 267 | tempus 268 | es 269 | video 270 | bellum 271 | nostri 272 | tuum 273 | suum 274 | die 275 | tuo 276 | meum 277 | rationem 278 | tuae 279 | dixi 280 | sive 281 | hominis 282 | uti 283 | postea 284 | praeter 285 | uno 286 | quicquam 287 | nomine 288 | homo 289 | sal 290 | cn 291 | sententia 292 | vitae 293 | praesertim 294 | attico 295 | nostrum 296 | sane 297 | virtute 298 | erant 299 | nullo 300 | senatu 301 | vir 302 | tui 303 | nostris 304 | tota 305 | fortasse 306 | ius 307 | meam 308 | fere 309 | sumus 310 | dies 311 | bonis 312 | dicitur 313 | ulla 314 | tuam 315 | tur 316 | dicendi 317 | locum 318 | etenim 319 | viri 320 | aliis 321 | ceteris 322 | possunt 323 | prae 324 | bus 325 | istius 326 | aliqua 327 | consilium 328 | puto 329 | oportere 330 | item 331 | opus 332 | suam 333 | partem 334 | dico 335 | dixit 336 | simul 337 | recte 338 | alterum 339 | antea 340 | inquam 341 | potuit 342 | facta 343 | magno 344 | studio 345 | plane 346 | parte 347 | valde 348 | eas 349 | paulo 350 | sui 351 | deorum 352 | rum 353 | venit 354 | pecuniam 355 | dici 356 | tamquam 357 | omnem 358 | possum 359 | scribis 360 | utrum 361 | profecto 362 | scire 363 | kal 364 | senatum 365 | com 366 | civium 367 | meae 368 | nescio 369 | auctoritate 370 | romae 371 | animum 372 | fuerunt 373 | bona 374 | duo 375 | pecunia 376 | vitam 377 | equidem 378 | fit 379 | hominibus 380 | nullam 381 | civitatis 382 | romano 383 | aliquando 384 | ipsis 385 | mei 386 | meis 387 | fuisset 388 | credo 389 | forte 390 | bonum 391 | domum 392 | civis 393 | leges 394 | causae 395 | diu 396 | alii 397 | locus 398 | tot 399 | multi 400 | fidem 401 | naturae 402 | ipsius 403 | salutem 404 | totum 405 | iuris 406 | bonorum 407 | deos 408 | isto 409 | locis 410 | fortuna 411 | melius 412 | vehementer 413 | adhuc 414 | legem 415 | omne 416 | statim 417 | consul 418 | provincia 419 | mus 420 | boni 421 | caesaris 422 | homine 423 | t 424 | bello 425 | minime 426 | arbitror 427 | oratione 428 | horum 429 | videri 430 | i 431 | tandem 432 | tecum 433 | corporis 434 | praeterea 435 | paene 436 | partim 437 | memoria 438 | fecit 439 | istum 440 | vix 441 | noster 442 | mecum 443 | civitate 444 | legibus 445 | neminem 446 | populus 447 | quisquam 448 | nostro 449 | urbem 450 | caesar 451 | dis 452 | suae 453 | tem 454 | idque 455 | lex 456 | verborum 457 | cura 458 | ferre 459 | naturam 460 | belli 461 | multum 462 | summo 463 | debet 464 | genera 465 | prope 466 | licet 467 | animus 468 | futurum 469 | vestra 470 | orationis 471 | mi 472 | videretur 473 | domi 474 | isti 475 | consules 476 | magnum 477 | nonne 478 | aliquo 479 | diem 480 | unde 481 | urbe 482 | dolore 483 | mortem 484 | numero 485 | quare 486 | tuas 487 | videntur 488 | causis 489 | sex 490 | cetera 491 | homini 492 | partes 493 | sis 494 | alter 495 | patres 496 | plura 497 | quisque 498 | sententiam 499 | verba 500 | litterae 501 | -------------------------------------------------------------------------------- /data/data_dcc/dcc_greek_core_list_lemmas.txt: -------------------------------------------------------------------------------- 1 | ὁ 2 | αὐτός 3 | καί 4 | δέ 5 | τίς 6 | εἰμί 7 | οὗτος 8 | ἤ 9 | ἐν 10 | μέν 11 | τις 12 | ὅς 13 | γάρ 14 | οὐ 15 | λέγω 16 | ὡς 17 | τε 18 | εἰς 19 | ἐπί 20 | κατά 21 | ἐγώ 22 | πρός 23 | γίγνομαι 24 | ἐάν 25 | διά 26 | ἀλλά 27 | πᾶς 28 | ἔχω 29 | ἐκ 30 | πολύς 31 | περί 32 | μή 33 | ὅστις 34 | ἄν 35 | σύ 36 | ἀνά 37 | ὅτι 38 | εἰ 39 | ἄλλος 40 | ἀπό 41 | φημί 42 | ὑπό 43 | ποιέω 44 | οὖν 45 | λόγος 46 | παρά 47 | οὕτως 48 | πρότερος 49 | θεός 50 | μετά 51 | ἑαυτοῦ 52 | μέγας 53 | οὐδέ 54 | ἐκεῖνος 55 | τοιοῦτος 56 | οὐδείς 57 | εἶπον 58 | ἀγαθός 59 | γε 60 | δή 61 | πόλις 62 | εἷς 63 | ἵημι 64 | δέω 65 | ἄνθρωπος 66 | ὁράω 67 | μόνος 68 | οὔτε 69 | οἷος 70 | λαμβάνω 71 | δοκέω 72 | ἕτερος 73 | κακός 74 | ἀνήρ 75 | ἐπεί 76 | ὅσος 77 | καλέω 78 | σῶμα 79 | δεῖ 80 | ὥσπερ 81 | δίδωμι 82 | ἔτι 83 | φύσις 84 | μικρός 85 | δύναμαι 86 | ὥστε 87 | ἀρχή 88 | ἕκαστος 89 | ἡμέρα 90 | φύω 91 | ἅπας 92 | ὅμοιος 93 | νῦν 94 | γῆ 95 | δύναμις 96 | καλός 97 | κύριος 98 | μᾶλλον 99 | ὅδε 100 | ὅλος 101 | μέρος 102 | ἄρα 103 | ἐμός 104 | χράομαι 105 | δύο 106 | χρόνος 107 | ἴσος 108 | ὅταν 109 | μόνον 110 | οἶδα 111 | βασιλεύς 112 | ὦ 113 | βούλομαι 114 | φαίνω 115 | γράφω 116 | φέρω 117 | ψυχή 118 | μηδείς 119 | αἴτιος 120 | πάλιν 121 | μάλιστα 122 | ὑπάρχω 123 | ἄρχω 124 | γυνή 125 | ποτε 126 | ἵνα 127 | ὄνομα 128 | ὑπέρ 129 | ἤδη 130 | πατήρ 131 | ἀκούω 132 | γένος 133 | τόπος 134 | πράσσω 135 | πρῶτος 136 | εὑρίσκω 137 | παῖς 138 | ἔρχομαι 139 | υἱός 140 | ὕδωρ 141 | ἴδιος 142 | σός 143 | γιγνώσκω 144 | τυγχάνω 145 | ἵστημι 146 | ἅμα 147 | ἄγω 148 | τρόπος 149 | μήτε 150 | μέσος 151 | ἀλλήλων 152 | ἀεί 153 | φίλος 154 | συμβαίνω 155 | ἔργον 156 | πλέω 157 | τότε 158 | μήν 159 | χρή 160 | δείκνυμι 161 | ζῷον 162 | πρᾶγμα 163 | ἐναντίος 164 | τίθημι 165 | εἶδον 166 | χείρ 167 | μηδέ 168 | ὀλίγος 169 | νόμος 170 | κοινός 171 | οἴομαι 172 | κινέω 173 | πάσχω 174 | πῶς 175 | ὅσπερ 176 | τοσοῦτος 177 | σύν 178 | εἶτα 179 | ἀληθής 180 | δίκαιος 181 | μέλλω 182 | ἐθέλω 183 | λοιπός 184 | ἀνάγκη 185 | ὅτε 186 | δεύτερος 187 | πόλεμος 188 | χώρα 189 | ζάω 190 | πλῆθος 191 | ἥλιος 192 | αἰτία 193 | πείθω 194 | πάρειμι 195 | πλεῖστος 196 | εἶδος 197 | ὅπως 198 | τρεῖς 199 | βίος 200 | νομίζω 201 | κύκλος 202 | πάθος 203 | πρό 204 | ὀνομάζω 205 | μέντοι 206 | ἀρετή 207 | ὑμέτερος 208 | ἔτος 209 | ἀντί 210 | ναῦς 211 | τρίτος 212 | πνεῦμα 213 | ὀρθός 214 | θάλασσα 215 | διαφέρω 216 | μέχρι 217 | δόξα 218 | κεφαλή 219 | πῦρ 220 | ἐλάσσων 221 | πούς 222 | ἱερός 223 | εὐθύς 224 | εἶμι 225 | ταχύς 226 | ποταμός 227 | οὐσία 228 | ἀριθμός 229 | ὕστερος 230 | φυλάσσω 231 | καιρός 232 | οἰκέω 233 | ἀμφότερος 234 | σημεῖον 235 | παρέχω 236 | ἑκάτερος 237 | δηλόω 238 | οἰκεῖος 239 | κελεύω 240 | τέλος 241 | ἡγέομαι 242 | ἄξιος 243 | ἦ 244 | δῆλος 245 | τοίνυν 246 | πολέμιος 247 | ἔρομαι 248 | ἀδελφός 249 | μέγεθος 250 | εἴτε…εἴτε 251 | κεῖμαι 252 | πολλάκις 253 | πίνω 254 | χάρις 255 | ἔπειτα 256 | ζητέω 257 | σχῆμα 258 | τροφή 259 | μανθάνω 260 | ἐνταῦθα 261 | φεύγω 262 | ἵππος 263 | κόσμος 264 | αἷμα 265 | αἱρέω 266 | προστίθημι 267 | ἀξιόω 268 | ἕως 269 | νέος 270 | ἔοικα 271 | κἄν 272 | καθίστημι 273 | τέχνη 274 | χρῆμα 275 | σῴζω 276 | πέμπω 277 | φωνή 278 | ἕνεκα 279 | ἀπόλλυμι 280 | θάνατος 281 | νύξ 282 | ὁδός 283 | ἔθνος 284 | ἀποδίδωμι 285 | νοῦς 286 | μένω 287 | ἀποθνῄσκω 288 | πάνυ 289 | εὖ 290 | κρίνω 291 | ἀναιρέω 292 | μακρός 293 | ἥκω 294 | ἡδονή 295 | μήτηρ 296 | δεινός 297 | διαφορά 298 | κρατέω 299 | δῆμος 300 | οὐρανός 301 | ἕπομαι 302 | ἥσσων 303 | ὄρος 304 | πλήν 305 | τέτταρες 306 | δυνατός 307 | οἶκος 308 | ἄριστος 309 | ῥᾴδιος 310 | ἀφαιρέω 311 | τύχη 312 | φανερός 313 | πρόσωπον 314 | πιστεύω 315 | διδάσκω 316 | ἄνω 317 | τάσσω 318 | ὀφθαλμός 319 | δέχομαι 320 | ἀφικνέομαι 321 | ἱκανός 322 | ἐργάζομαι 323 | μάχη 324 | τρέφω 325 | ἀδύνατος 326 | ἀκριβής 327 | που 328 | ὅθεν 329 | στόμα 330 | χωρίς 331 | κρείσσων 332 | βραχύς 333 | ἰσχυρός 334 | ἀλήθεια 335 | δίκη 336 | χωρίον 337 | ἡδύς 338 | νόσος 339 | λίθος 340 | παλαιός 341 | ἀφίημι 342 | ἄλλως 343 | πρᾶξις 344 | σαφής 345 | σοφός 346 | νικάω 347 | ὁμολογέω 348 | ναός 349 | αὖ 350 | πατρίς 351 | ὀξύς 352 | καίτοι 353 | πλέον 354 | πλέων 355 | γνώμη 356 | τιμή 357 | μεταξύ 358 | προσήκω 359 | πρίν 360 | ἀδικέω 361 | στρατηγός 362 | οὐκέτι 363 | πρέσβυς 364 | παύω 365 | τελευτάω 366 | μίγνυμι 367 | λαός 368 | θυγάτηρ 369 | οἰκία 370 | παραδίδωμι 371 | ἔξω 372 | νῆσος 373 | ἐκεῖ 374 | ἐπιστήμη 375 | ἐάω 376 | θαυμάζω 377 | αἰσθάνομαι 378 | χαίρω 379 | χαλεπός 380 | τέκνον 381 | καταλαμβάνω 382 | μάχομαι 383 | μιμνήσκω 384 | λύω 385 | θνῄσκω 386 | τιμάω 387 | τεῖχος 388 | ἴσως 389 | αἴρω 390 | ἀποκτείνω 391 | στρατιώτης 392 | ἄνευ 393 | πότερος 394 | ἁπλῶς 395 | πίπτω 396 | τέταρτος 397 | κατασκευάζω 398 | ἐχθρός 399 | ἀγών 400 | κωλύω 401 | ἁμαρτάνω 402 | διαφθείρω 403 | πως 404 | πόνος 405 | ἔνθα 406 | τάξις 407 | πειράω 408 | φοβέω 409 | βάλλω 410 | πονηρός 411 | ξένος 412 | βάρβαρος 413 | ὅπου 414 | συμφέρω 415 | πυνθάνομαι 416 | δοῦλος 417 | τέμνω 418 | χρήσιμος 419 | ποῖος 420 | ὅπλον 421 | πίστις 422 | ὑπολαμβάνω 423 | ποιητής 424 | λανθάνω 425 | βελτίων 426 | πάντως 427 | πορεύω 428 | ἀποκρίνω 429 | πέντε 430 | κίνδυνος 431 | κατηγορέω 432 | τρέπω 433 | ὅμως 434 | θεῖος 435 | ἱππεύς 436 | κτάομαι 437 | λείπω 438 | βουλή 439 | ἐλπίς 440 | γραφή 441 | τίκτω 442 | κομίζω 443 | θυμός 444 | βλέπω 445 | φόβος 446 | πολιτεία 447 | στάδιον 448 | φρονέω 449 | τοιόσδε 450 | ὁρμάω 451 | παρασκευάζω 452 | λαλέω 453 | δράω 454 | σκοπέω 455 | βοῦς 456 | ἡμέτερος 457 | γράμμα 458 | ἐρωτάω 459 | πολεμέω 460 | θύω 461 | ἐλαύνω 462 | δέδοικα 463 | σύμμαχος 464 | ἡγεμών 465 | βαρύς 466 | ὧδε 467 | αἰσχρός 468 | εἰρήνη 469 | ἁλίσκομαι 470 | δέκα 471 | ἀμείνων 472 | χείρων 473 | βοηθέω 474 | λαμπρός 475 | ἀπαλλάσσω 476 | βουλεύω 477 | μάλα 478 | αἰτέω 479 | σωτηρία 480 | ἆρα 481 | διώκω 482 | δαίμων 483 | οὐκοῦν 484 | γλῶσσα 485 | ἑπτά 486 | τολμάω 487 | δεσπότης 488 | εἰκός 489 | ἄδικος 490 | εἴκοσι 491 | μυρίος 492 | αὐτίκα 493 | δέκατος 494 | βαίνω 495 | περ 496 | ἐλεύθερος 497 | στρατιά 498 | ἀμφί 499 | συμφορά 500 | ἑκατόν 501 | νίκη 502 | ἔπος 503 | στρατός 504 | φράζω 505 | ἀργύριον 506 | τριάκοντα 507 | ἕξ 508 | πεμπτός 509 | μάρτυς 510 | χαλκοῦς 511 | ἕβδομος 512 | ποῦ 513 | ναί 514 | φῶς 515 | ὀκτώ 516 | ἕκτος 517 | τριακοστός 518 | ἐννέα 519 | πότε 520 | ὄγδοος 521 | ἔνατος 522 | εἰκοστός 523 | ἀγγέλλω 524 | ἑκατοστός 525 | -------------------------------------------------------------------------------- /data/greek_paradigms/gignomai.txt: -------------------------------------------------------------------------------- 1 | 'γένεθ' 2 | 'γένεσθε 3 | ἔγεντ' 4 | ἔγεντο 5 | ἐγέγονεν 6 | ἐγένεο 7 | ἐγένεθ' 8 | ἐγένεσθε 9 | ἐγένεσθον 10 | ἐγένετ' 11 | ἐγένετο 12 | ἐγένευ 13 | ἐγένονθ' 14 | ἐγένοντ' 15 | ἐγένοντο 16 | ἐγένου 17 | ἐγεγένηντο 18 | ἐγεγένητο 19 | ἐγεγενήμην 20 | ἐγεγόνεε 21 | ἐγεγόνεεν 22 | ἐγεγόνει 23 | ἐγεγόνειν 24 | ἐγεγόνεις 25 | ἐγεγόνεισαν 26 | ἐγεγόνεσαν 27 | ἐγενέσθην 28 | ἐγενήθη 29 | ἐγενήθημεν 30 | ἐγενήθην 31 | ἐγενήθης 32 | ἐγενήθησαν 33 | ἐγενήθητε 34 | ἐγενόμαν 35 | ἐγενόμεθ' 36 | ἐγενόμεθα 37 | ἐγενόμεσθα 38 | ἐγενόμην 39 | ἐγίγνεθ' 40 | ἐγίγνεσθε 41 | ἐγίγνετ' 42 | ἐγίγνετο 43 | ἐγίγνονθ' 44 | ἐγίγνοντ' 45 | ἐγίγνοντο 46 | ἐγίγνου 47 | ἐγίνεθ' 48 | ἐγίνεσθε 49 | ἐγίνετ' 50 | ἐγίνετο 51 | ἐγίνοντ' 52 | ἐγίνοντο 53 | ἐγίνου 54 | ἐγιγνόμεθ' 55 | ἐγιγνόμεθα 56 | ἐγιγνόμην 57 | ἐγινέσθην 58 | ἐγινόμεθα 59 | ἐγινόμην 60 | γέγον' 61 | γέγονα 62 | γέγονας 63 | γέγονε 64 | γέγονεν 65 | γένε' 66 | γένεο 67 | γένεθ' 68 | γένεσθ' 69 | γένεσθε 70 | γένετ' 71 | γένετο 72 | γένευ 73 | γένηαι 74 | γένηι 75 | γένηθ' 76 | γένησιν 77 | γένησθ' 78 | γένησθε 79 | γένητ' 80 | γένηται 81 | γένῃ 82 | γένοι' 83 | γένοινθ' 84 | γένοιντ' 85 | γένοιντο 86 | γένοιο 87 | γένοιθ' 88 | γένοισθ' 89 | γένοισθε 90 | γένοιτ' 91 | γένοιτο 92 | γένονθ' 93 | γένοντο 94 | γένου 95 | γένθ' 96 | γέντ' 97 | γέντο 98 | γένωμ' 99 | γένωμαι 100 | γένωνται 101 | γεγάασι 102 | γεγάασιν 103 | γεγάατε 104 | γεγάκειν 105 | γεγαότα 106 | γεγαότος 107 | γεγαυῖα 108 | γεγαυῖαι 109 | γεγαυῖαν 110 | γεγαώς 111 | γεγαῶσα 112 | γεγαῶσι 113 | γεγαῶτ' 114 | γεγαῶτα 115 | γεγαῶτας 116 | γεγαῶτε 117 | γεγαῶτες 118 | γεγαῶτι 119 | γεγαῶτος 120 | γεγένημαι 121 | γεγένηνται 122 | γεγένηντο 123 | γεγένησαι 124 | γεγένησο 125 | γεγένησθε 126 | γεγένησθον 127 | γεγένητ' 128 | γεγένηται 129 | γεγένητο 130 | γεγενήμεθ' 131 | γεγενήμεθα 132 | γεγενήσονται 133 | γεγενήσθω 134 | γεγενήσθωσαν 135 | γεγενῆσθ' 136 | γεγενῆσθαι 137 | γεγενημέν' 138 | γεγενημένα 139 | γεγενημέναι 140 | γεγενημέναιν 141 | γεγενημέναις 142 | γεγενημέναν 143 | γεγενημένας 144 | γεγενημένη 145 | γεγενημένηι 146 | γεγενημένην 147 | γεγενημένης 148 | γεγενημένῃ 149 | γεγενημένοι 150 | γεγενημένοιν 151 | γεγενημένοις 152 | γεγενημένον 153 | γεγενημένος 154 | γεγενημένου 155 | γεγενημένους 156 | γεγενημένω 157 | γεγενημένωι 158 | γεγενημένων 159 | γεγενημένῳ 160 | γεγόναμεν 161 | γεγόνασι 162 | γεγόνασιν 163 | γεγόνατε 164 | γεγόνατον 165 | γεγόνεε 166 | γεγόνει 167 | γεγόνειν 168 | γεγόνεις 169 | γεγόνεισαν 170 | γεγόνεν 171 | γεγόνεσαν 172 | γεγόνηι 173 | γεγόνῃ 174 | γεγόνοι 175 | γεγόνοιεν 176 | γεγόνωσιν 177 | γεγονέναι 178 | γεγονέτω 179 | γεγονόθ' 180 | γεγονός 181 | γεγονόσι 182 | γεγονόσιν 183 | γεγονότ' 184 | γεγονότα 185 | γεγονότας 186 | γεγονότε 187 | γεγονότες 188 | γεγονότι 189 | γεγονότοιν 190 | γεγονότος 191 | γεγονότων 192 | γεγονυίαις 193 | γεγονυίας 194 | γεγονυίᾳ 195 | γεγονυίῃ 196 | γεγονυῖ' 197 | γεγονυῖα 198 | γεγονυῖαι 199 | γεγονυῖαν 200 | γεγονυιῶν 201 | γεγονώς 202 | γεγώς 203 | γεγώτων 204 | γεγῶσ' 205 | γεγῶσα 206 | γεγῶσαν 207 | γεγῶσι 208 | γεγῶσιν 209 | γεγῶτ' 210 | γεγῶτα 211 | γεγῶτας 212 | γεγῶτες 213 | γεγῶτος 214 | γενέο 215 | γενέσκετο 216 | γενέσθ' 217 | γενέσθαι 218 | γενέσθην 219 | γενέσθω 220 | γενέσθων 221 | γενέσθωσαν 222 | γενεῦ 223 | γενήθητε 224 | γενήθητι 225 | γενήσεαι 226 | γενήσει 227 | γενήσεσθ' 228 | γενήσεσθαι 229 | γενήσεσθε 230 | γενήσεσθον 231 | γενήσετ' 232 | γενήσεται 233 | γενήσηι 234 | γενήσῃ 235 | γενήσοιντο 236 | γενήσοιτο 237 | γενήσομαι 238 | γενήσονται 239 | γενηθέν 240 | γενηθέντα 241 | γενηθέντας 242 | γενηθέντες 243 | γενηθέντι 244 | γενηθέντος 245 | γενηθέντων 246 | γενηθείη 247 | γενηθείην 248 | γενηθείης 249 | γενηθείς 250 | γενηθείσαις 251 | γενηθείσας 252 | γενηθείσης 253 | γενηθείσῃ 254 | γενηθεῖεν 255 | γενηθεῖσα 256 | γενηθεῖσαι 257 | γενηθεῖσαν 258 | γενηθεῖσι 259 | γενηθεῖσιν 260 | γενηθεισῶν 261 | γενηθήσεται 262 | γενηθήσῃ 263 | γενηθήσονται 264 | γενηθήτω 265 | γενηθήτωσαν 266 | γενηθῆι 267 | γενηθῆναι 268 | γενηθῇ 269 | γενηθῇς 270 | γενηθησόμενον 271 | γενηθησόμενος 272 | γενηθησομένην 273 | γενηθησομένης 274 | γενηθησομένοις 275 | γενηθησομένων 276 | γενηθῶ 277 | γενηθῶμεν 278 | γενηθῶσι 279 | γενηθῶσιν 280 | γενησόμεν' 281 | γενησόμενα 282 | γενησόμεναι 283 | γενησόμενοι 284 | γενησόμενον 285 | γενησόμενος 286 | γενησόμεθ' 287 | γενησόμεθα 288 | γενησόμεσθα 289 | γενησοίμην 290 | γενησομέναις 291 | γενησομένας 292 | γενησομένη 293 | γενησομένην 294 | γενησομένης 295 | γενησομένῃ 296 | γενησομένοις 297 | γενησομένου 298 | γενησομένους 299 | γενησομένω 300 | γενησομένων 301 | γενησομένῳ 302 | γενησουμέναν 303 | γενόμαν 304 | γενόμεν' 305 | γενόμενα 306 | γενόμεναι 307 | γενόμενε 308 | γενόμενοι 309 | γενόμενον 310 | γενόμενος 311 | γενόμεθ' 312 | γενόμεθα 313 | γενόμεσθα 314 | γενόμην 315 | γενοίαθ' 316 | γενοίατ' 317 | γενοίατο 318 | γενοίμαν 319 | γενοίμεθ' 320 | γενοίμεθα 321 | γενοίμην 322 | γενομένα 323 | γενομέναι 324 | γενομέναιν 325 | γενομέναις 326 | γενομέναν 327 | γενομένας 328 | γενομένᾳ 329 | γενομένη 330 | γενομένηι 331 | γενομένην 332 | γενομένης 333 | γενομένῃ 334 | γενομένῃς 335 | γενομένοιν 336 | γενομένοις 337 | γενομένοισι 338 | γενομένοισιν 339 | γενομένου 340 | γενομένους 341 | γενομένω 342 | γενομένωι 343 | γενομένων 344 | γενομένως 345 | γενομένῳ 346 | γενομενᾶν 347 | γενοῦ 348 | γενώμεθ' 349 | γενώμεθα 350 | γίγνει 351 | γίγνεο 352 | γίγνεθ' 353 | γίγνεσθ' 354 | γίγνεσθαι 355 | γίγνεσθε 356 | γίγνεσθον 357 | γίγνετ' 358 | γίγνεται 359 | γίγνετο 360 | γίγνησθε 361 | γίγνησθον 362 | γίγνητ' 363 | γίγνηται 364 | γίγνῃ 365 | γίγνοινθ' 366 | γίγνοιντ' 367 | γίγνοιντο 368 | γίγνοιο 369 | γίγνοιθ' 370 | γίγνοισθ' 371 | γίγνοισθε 372 | γίγνοιτ' 373 | γίγνοιτο 374 | γίγνομ' 375 | γίγνομαι 376 | γίγνονται 377 | γίγνοντο 378 | γίγνου 379 | γίγνωμαι 380 | γίγνωνται 381 | γίνεαι 382 | γίνει 383 | γίνεο 384 | γίνεθ' 385 | γίνεσθαι 386 | γίνεσθε 387 | γίνετ' 388 | γίνεται 389 | γίνετο 390 | γίνευ 391 | γίνηι 392 | γίνησθε 393 | γίνηται 394 | γίνῃ 395 | γίνοιντ' 396 | γίνοιντο 397 | γίνοιο 398 | γίνοισθε 399 | γίνοιτ' 400 | γίνοιτο 401 | γίνομ' 402 | γίνομαι 403 | γίνονθ' 404 | γίνοντ' 405 | γίνονται 406 | γίνοντο 407 | γίνου 408 | γίνωμαι 409 | γίνωνται 410 | γιγνέσθω 411 | γιγνέσθων 412 | γιγνέσθωσαν 413 | γιγνόμεν' 414 | γιγνόμενα 415 | γιγνόμεναι 416 | γιγνόμενοι 417 | γιγνόμενον 418 | γιγνόμενος 419 | γιγνόμεθ' 420 | γιγνόμεθα 421 | γιγνόμεσθα 422 | γιγνοίμεθ' 423 | γιγνοίμεθα 424 | γιγνοίμην 425 | γιγνομέναιν 426 | γιγνομέναις 427 | γιγνομέναισι 428 | γιγνομέναισιν 429 | γιγνομένας 430 | γιγνομένη 431 | γιγνομένην 432 | γιγνομένης 433 | γιγνομένῃ 434 | γιγνομένοιν 435 | γιγνομένοις 436 | γιγνομένοισι 437 | γιγνομένοισιν 438 | γιγνομένου 439 | γιγνομένους 440 | γιγνομένων 441 | γιγνομένῳ 442 | γιγνώμεθ' 443 | γιγνώμεθα 444 | γινέσκετο 445 | γινέσθω 446 | γινέσθωσαν 447 | γινόμεν' 448 | γινόμενα 449 | γινόμεναι 450 | γινόμενοι 451 | γινόμενον 452 | γινόμενος 453 | γινόμεθ' 454 | γινόμεθα 455 | γινοίατο 456 | γινοίμεθα 457 | γινοίμην 458 | γινομένα 459 | γινομέναις 460 | γινομέναισιν 461 | γινομέναν 462 | γινομένας 463 | γινομένη 464 | γινομένηι 465 | γινομένην 466 | γινομένης 467 | γινομένῃ 468 | γινομένοιο 469 | γινομένοις 470 | γινομένοισι 471 | γινομένοισιν 472 | γινομένου 473 | γινομένους 474 | γινομένω 475 | γινομένωι 476 | γινομένων 477 | γινομένως 478 | γινομένῳ 479 | γινώμεθ' 480 | γινώμεθα 481 | κἀγένοντ' 482 | --------------------------------------------------------------------------------