├── .gitignore ├── stopwords.js ├── package.json ├── README.md ├── dutch.js ├── french.js ├── spanish.js ├── german.js ├── italian.js └── english.js /.gitignore: -------------------------------------------------------------------------------- 1 | npm-debug.log 2 | -------------------------------------------------------------------------------- /stopwords.js: -------------------------------------------------------------------------------- 1 | exports.dutch = require('./dutch').dutch 2 | exports.english = require('./english').english 3 | exports.french = require('./french').french 4 | exports.german = require('./german').german 5 | exports.spanish = require('./spanish').spanish 6 | exports.italian = require('./italian').italian 7 | -------------------------------------------------------------------------------- /package.json: -------------------------------------------------------------------------------- 1 | { "name": "stopwords" 2 | , "version": "0.0.9" 3 | , "description": "require('stopwords').english // or dutch, french, german, italian, spanish" 4 | , "main": "stopwords.js" 5 | , "author": "Huned Botee " 6 | , "repository": { 7 | "url": "git://github.com/huned/node-stopwords.git" 8 | } 9 | } 10 | -------------------------------------------------------------------------------- /README.md: -------------------------------------------------------------------------------- 1 | # Stopwords for node.js # 2 | 3 | main repo: [https://github.com/huned/node-stopwords](https://github.com/huned/node-stopwords) 4 | 5 | ## Overview ## 6 | 7 | Stopwords in multiple languages that you can easily use with your node.js 8 | programs. Currently provides stopwords for the following languages: 9 | 10 | * Dutch 11 | * English 12 | * French 13 | * German 14 | * Spanish 15 | * Italian 16 | 17 | Stopwords in other languages are welcome as pull requests to 18 | [https://github.com/huned/node-stopwords](https://github.com/huned/node-stopwords) 19 | 20 | ## Install ## 21 | 22 | npm install stopwords 23 | 24 | ## Usage ## 25 | ```es6 26 | // get an array of dutch stopwords 27 | require('stopwords').dutch; 28 | 29 | // get an array of english stopwords 30 | require('stopwords').english; 31 | 32 | // get an array of french stopwords 33 | require('stopwords').french; 34 | 35 | // get an array of german stopwords 36 | require('stopwords').german; 37 | 38 | // get an array of spanish stopwords 39 | require('stopwords').spanish; 40 | 41 | // get an array of italian stopwords 42 | require('stopwords').italian; 43 | ``` 44 | ## Contributors 45 | 46 | * Marcel Radischat (contributed German stopwords) 47 | * Leonardo Giovanetti (contributed Spanish stopwords) 48 | * Jean-Elie Barjonet (contributed French stopwords) 49 | * Rocco Musolino (contributed Italian stopwords) 50 | * Wietse de Vries (contributed Dutch stopwords) 51 | * Huned Botee (original author) 52 | 53 | ## License ## 54 | 55 | MIT 56 | -------------------------------------------------------------------------------- /dutch.js: -------------------------------------------------------------------------------- 1 | // http://www.damienvanholten.com/blog/dutch-stop-words/ 2 | exports.dutch = [ 3 | "aan", 4 | "af", 5 | "al", 6 | "alles", 7 | "als", 8 | "altijd", 9 | "andere", 10 | "ben", 11 | "bij", 12 | "daar", 13 | "dan", 14 | "dat", 15 | "de", 16 | "der", 17 | "deze", 18 | "die", 19 | "dit", 20 | "doch", 21 | "doen", 22 | "door", 23 | "dus", 24 | "een", 25 | "eens", 26 | "en", 27 | "er", 28 | "ge", 29 | "geen", 30 | "geweest", 31 | "haar", 32 | "had", 33 | "heb", 34 | "hebben", 35 | "heeft", 36 | "hem", 37 | "het", 38 | "hier", 39 | "hij ", 40 | "hoe", 41 | "hun", 42 | "iemand", 43 | "iets", 44 | "ik", 45 | "in", 46 | "is", 47 | "ja", 48 | "je ", 49 | "kan", 50 | "kon", 51 | "kunnen", 52 | "maar", 53 | "me", 54 | "meer", 55 | "men", 56 | "met", 57 | "mij", 58 | "mijn", 59 | "moet", 60 | "na", 61 | "naar", 62 | "niet", 63 | "niets", 64 | "nog", 65 | "nu", 66 | "of", 67 | "om", 68 | "omdat", 69 | "ons", 70 | "ook", 71 | "op", 72 | "over", 73 | "reeds", 74 | "te", 75 | "tegen", 76 | "toch", 77 | "toen", 78 | "tot", 79 | "u", 80 | "uit", 81 | "uw", 82 | "van", 83 | "veel", 84 | "voor", 85 | "want", 86 | "waren", 87 | "was", 88 | "wat", 89 | "we", 90 | "wel", 91 | "werd", 92 | "wezen", 93 | "wie", 94 | "wij", 95 | "wil", 96 | "worden", 97 | "zal", 98 | "ze", 99 | "zei", 100 | "zelf", 101 | "zich", 102 | "zij", 103 | "zijn", 104 | "zo", 105 | "zonder", 106 | "zou" 107 | ] 108 | -------------------------------------------------------------------------------- /french.js: -------------------------------------------------------------------------------- 1 | exports.french = [ 2 | 'au', 3 | 'aux', 4 | 'avec', 5 | 'ce', 6 | 'ces', 7 | 'dans', 8 | 'de', 9 | 'des', 10 | 'du', 11 | 'elle', 12 | 'en', 13 | 'et', 14 | 'eux', 15 | 'il', 16 | 'je', 17 | 'la', 18 | 'le', 19 | 'leur', 20 | 'lui', 21 | 'ma', 22 | 'mais', 23 | 'me', 24 | 'même', 25 | 'mes', 26 | 'moi', 27 | 'mon', 28 | 'ne', 29 | 'nos', 30 | 'notre', 31 | 'nous', 32 | 'on', 33 | 'ou', 34 | 'par', 35 | 'pas', 36 | 'pour', 37 | 'qu', 38 | 'que', 39 | 'qui', 40 | 'sa', 41 | 'se', 42 | 'ses', 43 | 'son', 44 | 'sur', 45 | 'ta', 46 | 'te', 47 | 'tes', 48 | 'toi', 49 | 'ton', 50 | 'tu', 51 | 'un', 52 | 'une', 53 | 'vos', 54 | 'votre', 55 | 'vous', 56 | 'c', 57 | 'd', 58 | 'j', 59 | 'l', 60 | 'à', 61 | 'm', 62 | 'n', 63 | 's', 64 | 't', 65 | 'y', 66 | 'été', 67 | 'étée', 68 | 'étées', 69 | 'étés', 70 | 'étant', 71 | 'suis', 72 | 'es', 73 | 'est', 74 | 'sommes', 75 | 'êtes', 76 | 'sont', 77 | 'serai', 78 | 'seras', 79 | 'sera', 80 | 'serons', 81 | 'serez', 82 | 'seront', 83 | 'serais', 84 | 'serait', 85 | 'serions', 86 | 'seriez', 87 | 'seraient', 88 | 'étais', 89 | 'était', 90 | 'étions', 91 | 'étiez', 92 | 'étaient', 93 | 'fus', 94 | 'fut', 95 | 'fûmes', 96 | 'fûtes', 97 | 'furent', 98 | 'sois', 99 | 'soit', 100 | 'soyons', 101 | 'soyez', 102 | 'soient', 103 | 'fusse', 104 | 'fusses', 105 | 'fût', 106 | 'fussions', 107 | 'fussiez', 108 | 'fussent', 109 | 'ayant', 110 | 'eu', 111 | 'eue', 112 | 'eues', 113 | 'eus', 114 | 'ai', 115 | 'as', 116 | 'avons', 117 | 'avez', 118 | 'ont', 119 | 'aurai', 120 | 'auras', 121 | 'aura', 122 | 'aurons', 123 | 'aurez', 124 | 'auront', 125 | 'aurais', 126 | 'aurait', 127 | 'aurions', 128 | 'auriez', 129 | 'auraient', 130 | 'avais', 131 | 'avait', 132 | 'avions', 133 | 'aviez', 134 | 'avaient', 135 | 'eut', 136 | 'eûmes', 137 | 'eûtes', 138 | 'eurent', 139 | 'aie', 140 | 'aies', 141 | 'ait', 142 | 'ayons', 143 | 'ayez', 144 | 'aient', 145 | 'eusse', 146 | 'eusses', 147 | 'eût', 148 | 'eussions', 149 | 'eussiez', 150 | 'eussent', 151 | 'ceci', 152 | 'cela', 153 | 'celà', 154 | 'cet', 155 | 'cette', 156 | 'ici', 157 | 'ils', 158 | 'les', 159 | 'leurs', 160 | 'quel', 161 | 'quels', 162 | 'quelle', 163 | 'quelles', 164 | 'sans', 165 | 'soi' 166 | ] 167 | -------------------------------------------------------------------------------- /spanish.js: -------------------------------------------------------------------------------- 1 | // via http://www.ranks.nl/stopwords/spanish.html 2 | exports.spanish = [ 3 | 'a', 4 | 'un', 5 | 'una', 6 | 'unas', 7 | 'unos', 8 | 'uno', 9 | 'sobre', 10 | 'de', 11 | 'todo', 12 | 'también', 13 | 'tras', 14 | 'otro', 15 | 'algún', 16 | 'alguno', 17 | 'alguna', 18 | 'algunos', 19 | 'algunas', 20 | 'ser', 21 | 'es', 22 | 'soy', 23 | 'eres', 24 | 'somos', 25 | 'sois', 26 | 'esto', 27 | 'estoy', 28 | 'esta', 29 | 'estamos', 30 | 'estais', 31 | 'estan', 32 | 'como', 33 | 'en', 34 | 'para', 35 | 'atras', 36 | 'porque', 37 | 'por qué', 38 | 'estado', 39 | 'estaba', 40 | 'ante', 41 | 'antes', 42 | 'siendo', 43 | 'ambos', 44 | 'pero', 45 | 'por', 46 | 'no', 47 | 'poder', 48 | 'sal', 49 | 'al', 50 | 'puede', 51 | 'puedo', 52 | 'más', 53 | 'ya', 54 | 'le', 55 | 'o', 56 | 'me', 57 | 'hasta', 58 | 'durante', 59 | 'ni', 60 | 'ese', 61 | 'contra', 62 | 'eso', 63 | 'mí', 64 | 'mi', 65 | 'el', 66 | 'él', 67 | 'podemos', 68 | 'podeis', 69 | 'pueden', 70 | 'fui', 71 | 'fue', 72 | 'fuimos', 73 | 'fueron', 74 | 'hacer', 75 | 'hago', 76 | 'hace', 77 | 'hacemos', 78 | 'haceis', 79 | 'hacen', 80 | 'cada', 81 | 'fin', 82 | 'incluso', 83 | 'primero', 84 | 'desde', 85 | 'conseguir', 86 | 'consigo', 87 | 'consigue', 88 | 'consigues', 89 | 'conseguimos', 90 | 'consiguen', 91 | 'ir', 92 | 'voy', 93 | 'va', 94 | 'vamos', 95 | 'vais', 96 | 'van', 97 | 'vaya', 98 | 'gueno', 99 | 'ha', 100 | 'tener', 101 | 'tengo', 102 | 'tiene', 103 | 'tenemos', 104 | 'teneis', 105 | 'tienen', 106 | 'la', 107 | 'lo', 108 | 'las', 109 | 'los', 110 | 'su', 111 | 'aqui', 112 | 'mio', 113 | 'poco', 114 | 'tu', 115 | 'tú', 116 | 'te', 117 | 'si', 118 | 'sí', 119 | 'tuyo', 120 | 'ellos', 121 | 'ella', 122 | 'y', 123 | 'del', 124 | 'se', 125 | 'ellas', 126 | 'nos', 127 | 'nosotros', 128 | 'vosotros', 129 | 'vosotras', 130 | 'si', 131 | 'dentro', 132 | 'solo', 133 | 'solamente', 134 | 'saber', 135 | 'sabes', 136 | 'sabe', 137 | 'sabemos', 138 | 'sabeis', 139 | 'saben', 140 | 'ultimo', 141 | 'largo', 142 | 'bastante', 143 | 'haces', 144 | 'muchos', 145 | 'aquellos', 146 | 'aquellas', 147 | 'sus', 148 | 'entonces', 149 | 'tiempo', 150 | 'verdad', 151 | 'verdadero', 152 | 'verdadera', 153 | 'cierto', 154 | 'ciertos', 155 | 'cierta', 156 | 'ciertas', 157 | 'intentar', 158 | 'intento', 159 | 'intenta', 160 | 'intentas', 161 | 'intentamos', 162 | 'intentais', 163 | 'intentan', 164 | 'dos', 165 | 'bajo', 166 | 'arriba', 167 | 'encima', 168 | 'usar', 169 | 'uso', 170 | 'usas', 171 | 'usa', 172 | 'usamos', 173 | 'usais', 174 | 'usan', 175 | 'emplear', 176 | 'empleo', 177 | 'empleas', 178 | 'emplean', 179 | 'ampleamos', 180 | 'empleais', 181 | 'valor', 182 | 'muy', 183 | 'era', 184 | 'eras', 185 | 'eramos', 186 | 'eran', 187 | 'modo', 188 | 'bien', 189 | 'cual', 190 | 'cuando', 191 | 'donde', 192 | 'mientras', 193 | 'quien', 194 | 'con', 195 | 'entre', 196 | 'sin', 197 | 'trabajo', 198 | 'trabajar', 199 | 'trabajas', 200 | 'trabaja', 201 | 'trabajamos', 202 | 'trabajais', 203 | 'trabajan', 204 | 'podria', 205 | 'podrias', 206 | 'podriamos', 207 | 'podrian', 208 | 'podriais', 209 | 'yo', 210 | 'aquel', 211 | 'que', 212 | '1','2','3','4','5','6','7','8','9','0' 213 | ] 214 | -------------------------------------------------------------------------------- /german.js: -------------------------------------------------------------------------------- 1 | exports.german = [ 2 | 'aber', 3 | 'alle', 4 | 'allem', 5 | 'allen', 6 | 'aller', 7 | 'alles', 8 | 'als', 9 | 'also', 10 | 'am', 11 | 'an', 12 | 'ander', 13 | 'andere', 14 | 'anderem', 15 | 'anderen', 16 | 'anderer', 17 | 'anderes', 18 | 'anderm', 19 | 'andern', 20 | 'anderr', 21 | 'anders', 22 | 'auch', 23 | 'auf', 24 | 'aus', 25 | 'bei', 26 | 'bin', 27 | 'bis', 28 | 'bist', 29 | 'da', 30 | 'dadurch', 31 | 'daher', 32 | 'damit', 33 | 'dann', 34 | 'darum', 35 | 'das', 36 | 'dass', 37 | 'dasselbe', 38 | 'dazu', 39 | 'daß', 40 | 'dein', 41 | 'deine', 42 | 'deinem', 43 | 'deinen', 44 | 'deiner', 45 | 'deines', 46 | 'dem', 47 | 'demselben', 48 | 'den', 49 | 'denn', 50 | 'denselben', 51 | 'der', 52 | 'derer', 53 | 'derselbe', 54 | 'derselben', 55 | 'des', 56 | 'deshalb', 57 | 'desselben', 58 | 'dessen', 59 | 'dich', 60 | 'die', 61 | 'dies', 62 | 'diese', 63 | 'dieselbe', 64 | 'dieselben', 65 | 'diesem', 66 | 'diesen', 67 | 'dieser', 68 | 'dieses', 69 | 'dir', 70 | 'doch', 71 | 'dort', 72 | 'du', 73 | 'durch', 74 | 'ein', 75 | 'eine', 76 | 'einem', 77 | 'einen', 78 | 'einer', 79 | 'eines', 80 | 'einig', 81 | 'einige', 82 | 'einigem', 83 | 'einigen', 84 | 'einiger', 85 | 'einiges', 86 | 'einmal', 87 | 'er', 88 | 'es', 89 | 'etwas', 90 | 'euch', 91 | 'euer', 92 | 'eure', 93 | 'eurem', 94 | 'euren', 95 | 'eurer', 96 | 'eures', 97 | 'für', 98 | 'gegen', 99 | 'gewesen', 100 | 'hab', 101 | 'habe', 102 | 'haben', 103 | 'hat', 104 | 'hatte', 105 | 'hatten', 106 | 'hattest', 107 | 'hattet', 108 | 'hier', 109 | 'hin', 110 | 'hinter', 111 | 'ich', 112 | 'ihm', 113 | 'ihn', 114 | 'ihnen', 115 | 'ihr', 116 | 'ihre', 117 | 'ihrem', 118 | 'ihren', 119 | 'ihrer', 120 | 'ihres', 121 | 'im', 122 | 'in', 123 | 'indem', 124 | 'ins', 125 | 'ist', 126 | 'ja', 127 | 'jede', 128 | 'jedem', 129 | 'jeden', 130 | 'jeder', 131 | 'jedes', 132 | 'jene', 133 | 'jenem', 134 | 'jenen', 135 | 'jener', 136 | 'jenes', 137 | 'jetzt', 138 | 'kann', 139 | 'kannst', 140 | 'kein', 141 | 'keine', 142 | 'keinem', 143 | 'keinen', 144 | 'keiner', 145 | 'keines', 146 | 'können', 147 | 'könnt', 148 | 'könnte', 149 | 'machen', 150 | 'man', 151 | 'manche', 152 | 'manchem', 153 | 'manchen', 154 | 'mancher', 155 | 'manches', 156 | 'mein', 157 | 'meine', 158 | 'meinem', 159 | 'meinen', 160 | 'meiner', 161 | 'meines', 162 | 'mich', 163 | 'mir', 164 | 'mit', 165 | 'muss', 166 | 'musst', 167 | 'musste', 168 | 'muß', 169 | 'mußt', 170 | 'müssen', 171 | 'müßt', 172 | 'nach', 173 | 'nachdem', 174 | 'nein', 175 | 'nicht', 176 | 'nichts', 177 | 'noch', 178 | 'nun', 179 | 'nur', 180 | 'ob', 181 | 'oder', 182 | 'ohne', 183 | 'sehr', 184 | 'seid', 185 | 'sein', 186 | 'seine', 187 | 'seinem', 188 | 'seinen', 189 | 'seiner', 190 | 'seines', 191 | 'selbst', 192 | 'sich', 193 | 'sie', 194 | 'sind', 195 | 'so', 196 | 'solche', 197 | 'solchem', 198 | 'solchen', 199 | 'solcher', 200 | 'solches', 201 | 'soll', 202 | 'sollen', 203 | 'sollst', 204 | 'sollt', 205 | 'sollte', 206 | 'sondern', 207 | 'sonst', 208 | 'soweit', 209 | 'sowie', 210 | 'um', 211 | 'und', 212 | 'uns', 213 | 'unse', 214 | 'unsem', 215 | 'unsen', 216 | 'unser', 217 | 'unsere', 218 | 'unses', 219 | 'unter', 220 | 'viel', 221 | 'vom', 222 | 'von', 223 | 'vor', 224 | 'wann', 225 | 'war', 226 | 'waren', 227 | 'warst', 228 | 'warum', 229 | 'was', 230 | 'weg', 231 | 'weil', 232 | 'weiter', 233 | 'weitere', 234 | 'welche', 235 | 'welchem', 236 | 'welchen', 237 | 'welcher', 238 | 'welches', 239 | 'wenn', 240 | 'wer', 241 | 'werde', 242 | 'werden', 243 | 'werdet', 244 | 'weshalb', 245 | 'wie', 246 | 'wieder', 247 | 'wieso', 248 | 'will', 249 | 'wir', 250 | 'wird', 251 | 'wirst', 252 | 'wo', 253 | 'woher', 254 | 'wohin', 255 | 'wollen', 256 | 'wollte', 257 | 'während', 258 | 'würde', 259 | 'würden', 260 | 'zu', 261 | 'zum', 262 | 'zur', 263 | 'zwar', 264 | 'zwischen', 265 | 'über' 266 | ] 267 | -------------------------------------------------------------------------------- /italian.js: -------------------------------------------------------------------------------- 1 | exports.italian = ["a", 2 | "abbastanza", 3 | "abbia", 4 | "abbiamo", 5 | "abbiano", 6 | "abbiate", 7 | "accidenti", 8 | "ad", 9 | "adesso", 10 | "affinche", 11 | "agl", 12 | "agli", 13 | "ahime", 14 | "ahimè", 15 | "ahimé", 16 | "ai", 17 | "al", 18 | "alcuna", 19 | "alcuni", 20 | "alcuno", 21 | "all", 22 | "alla", 23 | "alle", 24 | "allo", 25 | "allora", 26 | "altre", 27 | "altri", 28 | "altrimenti", 29 | "altro", 30 | "altrove", 31 | "altrui", 32 | "anche", 33 | "ancora", 34 | "anni", 35 | "anno", 36 | "ansa", 37 | "anticipo", 38 | "assai", 39 | "attesa", 40 | "attraverso", 41 | "avanti", 42 | "avemmo", 43 | "avendo", 44 | "avente", 45 | "aver", 46 | "avere", 47 | "averlo", 48 | "avesse", 49 | "avessero", 50 | "avessi", 51 | "avessimo", 52 | "aveste", 53 | "avesti", 54 | "avete", 55 | "aveva", 56 | "avevamo", 57 | "avevano", 58 | "avevate", 59 | "avevi", 60 | "avevo", 61 | "avra", 62 | "avrai", 63 | "avranno", 64 | "avrebbe", 65 | "avrebbero", 66 | "avrei", 67 | "avremmo", 68 | "avremo", 69 | "avreste", 70 | "avresti", 71 | "avrete", 72 | "avro", 73 | "avrà", 74 | "avrò", 75 | "avuta", 76 | "avute", 77 | "avuti", 78 | "avuto", 79 | "basta", 80 | "ben", 81 | "bene", 82 | "benissimo", 83 | "brava", 84 | "bravo", 85 | "buono", 86 | "c", 87 | "casa", 88 | "caso", 89 | "cento", 90 | "certa", 91 | "certe", 92 | "certi", 93 | "certo", 94 | "che", 95 | "chi", 96 | "chicchessia", 97 | "chiunque", 98 | "ci", 99 | "ciascuna", 100 | "ciascuno", 101 | "cima", 102 | "cinque", 103 | "cio", 104 | "cioe", 105 | "cioè", 106 | "cioé", 107 | "circa", 108 | "citta", 109 | "città", 110 | "ciò", 111 | "co", 112 | "codesta", 113 | "codesti", 114 | "codesto", 115 | "cogli", 116 | "coi", 117 | "col", 118 | "colei", 119 | "coll", 120 | "coloro", 121 | "colui", 122 | "come", 123 | "cominci", 124 | "comprare", 125 | "comunque", 126 | "con", 127 | "concernente", 128 | "conciliarsi", 129 | "conclusione", 130 | "consecutivi", 131 | "consecutivo", 132 | "consiglio", 133 | "contro", 134 | "cortesia", 135 | "cos", 136 | "cosa", 137 | "cosi", 138 | "così", 139 | "cui", 140 | "d", 141 | "da", 142 | "dagl", 143 | "dagli", 144 | "dai", 145 | "dal", 146 | "dall", 147 | "dalla", 148 | "dalle", 149 | "dallo", 150 | "dappertutto", 151 | "davanti", 152 | "debba", 153 | "degl", 154 | "degli", 155 | "dei", 156 | "del", 157 | "dell", 158 | "della", 159 | "delle", 160 | "dello", 161 | "dentro", 162 | "detto", 163 | "deve", 164 | "devi", 165 | "devo", 166 | "di", 167 | "dice", 168 | "dietro", 169 | "dire", 170 | "dirimpetto", 171 | "diventa", 172 | "diventare", 173 | "diventato", 174 | "dobbiamo", 175 | "dobbiate", 176 | "dopo", 177 | "doppio", 178 | "dov", 179 | "dove", 180 | "dovemmo", 181 | "dovendo", 182 | "dovere", 183 | "dovesse", 184 | "dovessero", 185 | "dovessi", 186 | "dovessimo", 187 | "doveste", 188 | "dovesti", 189 | "dovete", 190 | "dovette", 191 | "dovettero", 192 | "dovetti", 193 | "doveva", 194 | "dovevamo", 195 | "dovevano", 196 | "dovevate", 197 | "dovevi", 198 | "dovevo", 199 | "dovra", 200 | "dovrai", 201 | "dovranno", 202 | "dovrebbe", 203 | "dovrebbero", 204 | "dovrei", 205 | "dovremmo", 206 | "dovremo", 207 | "dovreste", 208 | "dovresti", 209 | "dovrete", 210 | "dovrà", 211 | "dovrò", 212 | "dovunque", 213 | "due", 214 | "dunque", 215 | "durante", 216 | "e", 217 | "ebbe", 218 | "ebbero", 219 | "ebbi", 220 | "ecc", 221 | "ecco", 222 | "ed", 223 | "effettivamente", 224 | "egli", 225 | "ella", 226 | "entrambi", 227 | "eppure", 228 | "era", 229 | "erano", 230 | "eravamo", 231 | "eravate", 232 | "eri", 233 | "ero", 234 | "esempio", 235 | "esse", 236 | "essendo", 237 | "esser", 238 | "essere", 239 | "essi", 240 | "ex", 241 | "fa", 242 | "faccia", 243 | "facciamo", 244 | "facciano", 245 | "facciate", 246 | "faccio", 247 | "facemmo", 248 | "facendo", 249 | "facesse", 250 | "facessero", 251 | "facessi", 252 | "facessimo", 253 | "faceste", 254 | "facesti", 255 | "faceva", 256 | "facevamo", 257 | "facevano", 258 | "facevate", 259 | "facevi", 260 | "facevo", 261 | "fai", 262 | "fanno", 263 | "farai", 264 | "faranno", 265 | "fare", 266 | "farebbe", 267 | "farebbero", 268 | "farei", 269 | "faremmo", 270 | "faremo", 271 | "fareste", 272 | "faresti", 273 | "farete", 274 | "farà", 275 | "farò", 276 | "fatto", 277 | "favore", 278 | "fece", 279 | "fecero", 280 | "feci", 281 | "fin", 282 | "finalmente", 283 | "finche", 284 | "fine", 285 | "fino", 286 | "forse", 287 | "forza", 288 | "fosse", 289 | "fossero", 290 | "fossi", 291 | "fossimo", 292 | "foste", 293 | "fosti", 294 | "fra", 295 | "frattempo", 296 | "fu", 297 | "fui", 298 | "fummo", 299 | "fuori", 300 | "furono", 301 | "futuro", 302 | "generale", 303 | "gente", 304 | "gia", 305 | "giacche", 306 | "giorni", 307 | "giorno", 308 | "giu", 309 | "già", 310 | "giã", 311 | "gli", 312 | "gliela", 313 | "gliele", 314 | "glieli", 315 | "glielo", 316 | "gliene", 317 | "governo", 318 | "grande", 319 | "grazie", 320 | "gruppo", 321 | "ha", 322 | "haha", 323 | "hai", 324 | "hanno", 325 | "ho", 326 | "i", 327 | "ie", 328 | "ieri", 329 | "il", 330 | "improvviso", 331 | "in", 332 | "inc", 333 | "indietro", 334 | "infatti", 335 | "inoltre", 336 | "insieme", 337 | "intanto", 338 | "intorno", 339 | "invece", 340 | "io", 341 | "l", 342 | "là", 343 | "lasciato", 344 | "lato", 345 | "lavoro", 346 | "le", 347 | "lei", 348 | "li", 349 | "lo", 350 | "lontano", 351 | "loro", 352 | "lui", 353 | "lungo", 354 | "luogo", 355 | "lì", 356 | "ma", 357 | "macche", 358 | "magari", 359 | "maggior", 360 | "mai", 361 | "male", 362 | "malgrado", 363 | "malissimo", 364 | "mancanza", 365 | "marche", 366 | "me", 367 | "medesimo", 368 | "mediante", 369 | "meglio", 370 | "meno", 371 | "mentre", 372 | "mesi", 373 | "mezzo", 374 | "mi", 375 | "mia", 376 | "mie", 377 | "miei", 378 | "mila", 379 | "miliardi", 380 | "milioni", 381 | "minimi", 382 | "ministro", 383 | "mio", 384 | "modo", 385 | "molta", 386 | "molte", 387 | "molti", 388 | "moltissimo", 389 | "molto", 390 | "momento", 391 | "mondo", 392 | "mosto", 393 | "nazionale", 394 | "ne", 395 | "negl", 396 | "negli", 397 | "nei", 398 | "nel", 399 | "nell", 400 | "nella", 401 | "nelle", 402 | "nello", 403 | "nemmeno", 404 | "neppure", 405 | "nessun", 406 | "nessuna", 407 | "nessuno", 408 | "niente", 409 | "no", 410 | "noi", 411 | "nome", 412 | "non", 413 | "nondimeno", 414 | "nonostante", 415 | "nonsia", 416 | "nostra", 417 | "nostre", 418 | "nostri", 419 | "nostro", 420 | "novanta", 421 | "nove", 422 | "nulla", 423 | "nuovi", 424 | "nuovo", 425 | "o", 426 | "od", 427 | "oggi", 428 | "ogni", 429 | "ognuna", 430 | "ognuno", 431 | "oltre", 432 | "oppure", 433 | "ora", 434 | "ore", 435 | "osi", 436 | "ossia", 437 | "ottanta", 438 | "otto", 439 | "paese", 440 | "parecchi", 441 | "parecchie", 442 | "parecchio", 443 | "parte", 444 | "partendo", 445 | "peccato", 446 | "peggio", 447 | "per", 448 | "perche", 449 | "perchè", 450 | "perché", 451 | "percio", 452 | "perciò", 453 | "perfino", 454 | "pero", 455 | "persino", 456 | "persone", 457 | "però", 458 | "piedi", 459 | "pieno", 460 | "piglia", 461 | "piu", 462 | "piuttosto", 463 | "più", 464 | "po", 465 | "pochissimo", 466 | "poco", 467 | "poi", 468 | "poiche", 469 | "possa", 470 | "possedere", 471 | "posteriore", 472 | "posto", 473 | "potrebbe", 474 | "preferibilmente", 475 | "presa", 476 | "press", 477 | "prima", 478 | "primo", 479 | "principalmente", 480 | "probabilmente", 481 | "promesso", 482 | "proprio", 483 | "puo", 484 | "pure", 485 | "purtroppo", 486 | "può", 487 | "qua", 488 | "qualche", 489 | "qualcosa", 490 | "qualcuna", 491 | "qualcuno", 492 | "quale", 493 | "quali", 494 | "qualunque", 495 | "quando", 496 | "quanta", 497 | "quante", 498 | "quanti", 499 | "quanto", 500 | "quantunque", 501 | "quarto", 502 | "quasi", 503 | "quattro", 504 | "quel", 505 | "quella", 506 | "quelle", 507 | "quelli", 508 | "quello", 509 | "quest", 510 | "questa", 511 | "queste", 512 | "questi", 513 | "questo", 514 | "qui", 515 | "quindi", 516 | "quinto", 517 | "realmente", 518 | "recente", 519 | "recentemente", 520 | "registrazione", 521 | "relativo", 522 | "riecco", 523 | "rispetto", 524 | "salvo", 525 | "sara", 526 | "sarai", 527 | "saranno", 528 | "sarebbe", 529 | "sarebbero", 530 | "sarei", 531 | "saremmo", 532 | "saremo", 533 | "sareste", 534 | "saresti", 535 | "sarete", 536 | "saro", 537 | "sarà", 538 | "sarò", 539 | "scola", 540 | "scopo", 541 | "scorso", 542 | "se", 543 | "secondo", 544 | "seguente", 545 | "seguito", 546 | "sei", 547 | "sembra", 548 | "sembrare", 549 | "sembrato", 550 | "sembrava", 551 | "sembri", 552 | "sempre", 553 | "senza", 554 | "sette", 555 | "si", 556 | "sia", 557 | "siamo", 558 | "siano", 559 | "siate", 560 | "siete", 561 | "sig", 562 | "solito", 563 | "solo", 564 | "soltanto", 565 | "sono", 566 | "sopra", 567 | "soprattutto", 568 | "sotto", 569 | "spesso", 570 | "srl", 571 | "sta", 572 | "stai", 573 | "stando", 574 | "stanno", 575 | "starai", 576 | "staranno", 577 | "starebbe", 578 | "starebbero", 579 | "starei", 580 | "staremmo", 581 | "staremo", 582 | "stareste", 583 | "staresti", 584 | "starete", 585 | "starà", 586 | "starò", 587 | "stata", 588 | "state", 589 | "stati", 590 | "stato", 591 | "stava", 592 | "stavamo", 593 | "stavano", 594 | "stavate", 595 | "stavi", 596 | "stavo", 597 | "stemmo", 598 | "stessa", 599 | "stesse", 600 | "stessero", 601 | "stessi", 602 | "stessimo", 603 | "stesso", 604 | "steste", 605 | "stesti", 606 | "stette", 607 | "stettero", 608 | "stetti", 609 | "stia", 610 | "stiamo", 611 | "stiano", 612 | "stiate", 613 | "sto", 614 | "su", 615 | "sua", 616 | "subito", 617 | "successivamente", 618 | "successivo", 619 | "sue", 620 | "sugl", 621 | "sugli", 622 | "sui", 623 | "sul", 624 | "sull", 625 | "sulla", 626 | "sulle", 627 | "sullo", 628 | "suo", 629 | "suoi", 630 | "tale", 631 | "tali", 632 | "talvolta", 633 | "tanto", 634 | "te", 635 | "tempo", 636 | "terzo", 637 | "th", 638 | "ti", 639 | "titolo", 640 | "torino", 641 | "tra", 642 | "tranne", 643 | "tre", 644 | "trenta", 645 | "triplo", 646 | "troppo", 647 | "trovato", 648 | "tu", 649 | "tua", 650 | "tue", 651 | "tuo", 652 | "tuoi", 653 | "tutta", 654 | "tuttavia", 655 | "tutte", 656 | "tutti", 657 | "tutto", 658 | "uguali", 659 | "ulteriore", 660 | "ultimo", 661 | "un", 662 | "una", 663 | "uno", 664 | "uomo", 665 | "va", 666 | "vai", 667 | "vale", 668 | "vari", 669 | "varia", 670 | "varie", 671 | "vario", 672 | "verso", 673 | "vi", 674 | "via", 675 | "vicino", 676 | "visto", 677 | "vita", 678 | "voi", 679 | "volta", 680 | "volte", 681 | "vostra", 682 | "vostre", 683 | "vostri", 684 | "vostro", 685 | "è", 686 | "è"] 687 | -------------------------------------------------------------------------------- /english.js: -------------------------------------------------------------------------------- 1 | // via http://tedserbinski.com/files/stopwords.js.txt 2 | exports.english = [ 3 | 'a', 4 | 'able', 5 | 'about', 6 | 'above', 7 | 'abroad', 8 | 'according', 9 | 'accordingly', 10 | 'across', 11 | 'actually', 12 | 'adj', 13 | 'after', 14 | 'afterwards', 15 | 'again', 16 | 'against', 17 | 'ago', 18 | 'ahead', 19 | 'aint', 20 | 'all', 21 | 'allow', 22 | 'allows', 23 | 'almost', 24 | 'alone', 25 | 'along', 26 | 'alongside', 27 | 'already', 28 | 'also', 29 | 'although', 30 | 'always', 31 | 'am', 32 | 'amid', 33 | 'amidst', 34 | 'among', 35 | 'amongst', 36 | 'an', 37 | 'and', 38 | 'another', 39 | 'any', 40 | 'anybody', 41 | 'anyhow', 42 | 'anyone', 43 | 'anything', 44 | 'anyway', 45 | 'anyways', 46 | 'anywhere', 47 | 'apart', 48 | 'appear', 49 | 'appreciate', 50 | 'appropriate', 51 | 'are', 52 | 'arent', 53 | 'around', 54 | 'as', 55 | 'as', 56 | 'aside', 57 | 'ask', 58 | 'asking', 59 | 'associated', 60 | 'at', 61 | 'available', 62 | 'away', 63 | 'awfully', 64 | 'b', 65 | 'back', 66 | 'backward', 67 | 'backwards', 68 | 'be', 69 | 'became', 70 | 'because', 71 | 'become', 72 | 'becomes', 73 | 'becoming', 74 | 'been', 75 | 'before', 76 | 'beforehand', 77 | 'begin', 78 | 'behind', 79 | 'being', 80 | 'believe', 81 | 'below', 82 | 'beside', 83 | 'besides', 84 | 'best', 85 | 'better', 86 | 'between', 87 | 'beyond', 88 | 'both', 89 | 'brief', 90 | 'but', 91 | 'by', 92 | 'c', 93 | 'came', 94 | 'can', 95 | 'cannot', 96 | 'cant', 97 | 'cant', 98 | 'caption', 99 | 'cause', 100 | 'causes', 101 | 'certain', 102 | 'certainly', 103 | 'changes', 104 | 'clearly', 105 | 'cmon', 106 | 'co', 107 | 'co.', 108 | 'com', 109 | 'come', 110 | 'comes', 111 | 'concerning', 112 | 'consequently', 113 | 'consider', 114 | 'considering', 115 | 'contain', 116 | 'containing', 117 | 'contains', 118 | 'corresponding', 119 | 'could', 120 | 'couldnt', 121 | 'course', 122 | 'cs', 123 | 'currently', 124 | 'd', 125 | 'dare', 126 | 'darent', 127 | 'definitely', 128 | 'described', 129 | 'despite', 130 | 'did', 131 | 'didnt', 132 | 'different', 133 | 'directly', 134 | 'do', 135 | 'does', 136 | 'doesnt', 137 | 'doing', 138 | 'done', 139 | 'dont', 140 | 'down', 141 | 'downwards', 142 | 'during', 143 | 'e', 144 | 'each', 145 | 'edu', 146 | 'eg', 147 | 'eight', 148 | 'eighty', 149 | 'either', 150 | 'else', 151 | 'elsewhere', 152 | 'end', 153 | 'ending', 154 | 'enough', 155 | 'entirely', 156 | 'especially', 157 | 'et', 158 | 'etc', 159 | 'even', 160 | 'ever', 161 | 'evermore', 162 | 'every', 163 | 'everybody', 164 | 'everyone', 165 | 'everything', 166 | 'everywhere', 167 | 'ex', 168 | 'exactly', 169 | 'example', 170 | 'except', 171 | 'f', 172 | 'fairly', 173 | 'far', 174 | 'farther', 175 | 'few', 176 | 'fewer', 177 | 'fifth', 178 | 'first', 179 | 'five', 180 | 'followed', 181 | 'following', 182 | 'follows', 183 | 'for', 184 | 'forever', 185 | 'former', 186 | 'formerly', 187 | 'forth', 188 | 'forward', 189 | 'found', 190 | 'four', 191 | 'from', 192 | 'further', 193 | 'furthermore', 194 | 'g', 195 | 'get', 196 | 'gets', 197 | 'getting', 198 | 'given', 199 | 'gives', 200 | 'go', 201 | 'goes', 202 | 'going', 203 | 'gone', 204 | 'got', 205 | 'gotten', 206 | 'greetings', 207 | 'h', 208 | 'had', 209 | 'hadnt', 210 | 'half', 211 | 'happens', 212 | 'hardly', 213 | 'has', 214 | 'hasnt', 215 | 'have', 216 | 'havent', 217 | 'having', 218 | 'he', 219 | 'hed', 220 | 'hell', 221 | 'hello', 222 | 'help', 223 | 'hence', 224 | 'her', 225 | 'here', 226 | 'hereafter', 227 | 'hereby', 228 | 'herein', 229 | 'heres', 230 | 'hereupon', 231 | 'hers', 232 | 'herself', 233 | 'hes', 234 | 'hi', 235 | 'him', 236 | 'himself', 237 | 'his', 238 | 'hither', 239 | 'hopefully', 240 | 'how', 241 | 'howbeit', 242 | 'however', 243 | 'hundred', 244 | 'i', 245 | 'id', 246 | 'ie', 247 | 'if', 248 | 'ignored', 249 | 'ill', 250 | 'im', 251 | 'immediate', 252 | 'in', 253 | 'inasmuch', 254 | 'inc', 255 | 'inc.', 256 | 'indeed', 257 | 'indicate', 258 | 'indicated', 259 | 'indicates', 260 | 'inner', 261 | 'inside', 262 | 'insofar', 263 | 'instead', 264 | 'into', 265 | 'inward', 266 | 'is', 267 | 'isnt', 268 | 'it', 269 | 'itd', 270 | 'itll', 271 | 'its', 272 | 'its', 273 | 'itself', 274 | 'ive', 275 | 'j', 276 | 'just', 277 | 'k', 278 | 'keep', 279 | 'keeps', 280 | 'kept', 281 | 'know', 282 | 'known', 283 | 'knows', 284 | 'l', 285 | 'last', 286 | 'lately', 287 | 'later', 288 | 'latter', 289 | 'latterly', 290 | 'least', 291 | 'less', 292 | 'lest', 293 | 'let', 294 | 'lets', 295 | 'like', 296 | 'liked', 297 | 'likely', 298 | 'likewise', 299 | 'little', 300 | 'look', 301 | 'looking', 302 | 'looks', 303 | 'low', 304 | 'lower', 305 | 'ltd', 306 | 'm', 307 | 'made', 308 | 'mainly', 309 | 'make', 310 | 'makes', 311 | 'many', 312 | 'may', 313 | 'maybe', 314 | 'maynt', 315 | 'me', 316 | 'mean', 317 | 'meantime', 318 | 'meanwhile', 319 | 'merely', 320 | 'might', 321 | 'mightnt', 322 | 'mine', 323 | 'minus', 324 | 'miss', 325 | 'more', 326 | 'moreover', 327 | 'most', 328 | 'mostly', 329 | 'mr', 330 | 'mrs', 331 | 'much', 332 | 'must', 333 | 'mustnt', 334 | 'my', 335 | 'myself', 336 | 'n', 337 | 'name', 338 | 'namely', 339 | 'nd', 340 | 'near', 341 | 'nearly', 342 | 'necessary', 343 | 'need', 344 | 'neednt', 345 | 'needs', 346 | 'neither', 347 | 'never', 348 | 'neverf', 349 | 'neverless', 350 | 'nevertheless', 351 | 'new', 352 | 'next', 353 | 'nine', 354 | 'ninety', 355 | 'no', 356 | 'nobody', 357 | 'non', 358 | 'none', 359 | 'nonetheless', 360 | 'noone', 361 | 'no-one', 362 | 'nor', 363 | 'normally', 364 | 'not', 365 | 'nothing', 366 | 'notwithstanding', 367 | 'novel', 368 | 'now', 369 | 'nowhere', 370 | 'o', 371 | 'obviously', 372 | 'of', 373 | 'off', 374 | 'often', 375 | 'oh', 376 | 'ok', 377 | 'okay', 378 | 'old', 379 | 'on', 380 | 'once', 381 | 'one', 382 | 'ones', 383 | 'ones', 384 | 'only', 385 | 'onto', 386 | 'opposite', 387 | 'or', 388 | 'other', 389 | 'others', 390 | 'otherwise', 391 | 'ought', 392 | 'oughtnt', 393 | 'our', 394 | 'ours', 395 | 'ourselves', 396 | 'out', 397 | 'outside', 398 | 'over', 399 | 'overall', 400 | 'own', 401 | 'p', 402 | 'particular', 403 | 'particularly', 404 | 'past', 405 | 'per', 406 | 'perhaps', 407 | 'placed', 408 | 'please', 409 | 'plus', 410 | 'possible', 411 | 'presumably', 412 | 'probably', 413 | 'provided', 414 | 'provides', 415 | 'q', 416 | 'que', 417 | 'quite', 418 | 'qv', 419 | 'r', 420 | 'rather', 421 | 'rd', 422 | 're', 423 | 'really', 424 | 'reasonably', 425 | 'recent', 426 | 'recently', 427 | 'regarding', 428 | 'regardless', 429 | 'regards', 430 | 'relatively', 431 | 'respectively', 432 | 'right', 433 | 'round', 434 | 's', 435 | 'said', 436 | 'same', 437 | 'saw', 438 | 'say', 439 | 'saying', 440 | 'says', 441 | 'second', 442 | 'secondly', 443 | 'see', 444 | 'seeing', 445 | 'seem', 446 | 'seemed', 447 | 'seeming', 448 | 'seems', 449 | 'seen', 450 | 'self', 451 | 'selves', 452 | 'sensible', 453 | 'sent', 454 | 'serious', 455 | 'seriously', 456 | 'seven', 457 | 'several', 458 | 'shall', 459 | 'shant', 460 | 'she', 461 | 'shed', 462 | 'shell', 463 | 'shes', 464 | 'should', 465 | 'shouldnt', 466 | 'since', 467 | 'six', 468 | 'so', 469 | 'some', 470 | 'somebody', 471 | 'someday', 472 | 'somehow', 473 | 'someone', 474 | 'something', 475 | 'sometime', 476 | 'sometimes', 477 | 'somewhat', 478 | 'somewhere', 479 | 'soon', 480 | 'sorry', 481 | 'specified', 482 | 'specify', 483 | 'specifying', 484 | 'still', 485 | 'sub', 486 | 'such', 487 | 'sup', 488 | 'sure', 489 | 't', 490 | 'take', 491 | 'taken', 492 | 'taking', 493 | 'tell', 494 | 'tends', 495 | 'th', 496 | 'than', 497 | 'thank', 498 | 'thanks', 499 | 'thanx', 500 | 'that', 501 | 'thatll', 502 | 'thats', 503 | 'thats', 504 | 'thatve', 505 | 'the', 506 | 'their', 507 | 'theirs', 508 | 'them', 509 | 'themselves', 510 | 'then', 511 | 'thence', 512 | 'there', 513 | 'thereafter', 514 | 'thereby', 515 | 'thered', 516 | 'therefore', 517 | 'therein', 518 | 'therell', 519 | 'therere', 520 | 'theres', 521 | 'theres', 522 | 'thereupon', 523 | 'thereve', 524 | 'these', 525 | 'they', 526 | 'theyd', 527 | 'theyll', 528 | 'theyre', 529 | 'theyve', 530 | 'thing', 531 | 'things', 532 | 'think', 533 | 'third', 534 | 'thirty', 535 | 'this', 536 | 'thorough', 537 | 'thoroughly', 538 | 'those', 539 | 'though', 540 | 'three', 541 | 'through', 542 | 'throughout', 543 | 'thru', 544 | 'thus', 545 | 'till', 546 | 'to', 547 | 'together', 548 | 'too', 549 | 'took', 550 | 'toward', 551 | 'towards', 552 | 'tried', 553 | 'tries', 554 | 'truly', 555 | 'try', 556 | 'trying', 557 | 'ts', 558 | 'twice', 559 | 'two', 560 | 'u', 561 | 'un', 562 | 'under', 563 | 'underneath', 564 | 'undoing', 565 | 'unfortunately', 566 | 'unless', 567 | 'unlike', 568 | 'unlikely', 569 | 'until', 570 | 'unto', 571 | 'up', 572 | 'upon', 573 | 'upwards', 574 | 'us', 575 | 'use', 576 | 'used', 577 | 'useful', 578 | 'uses', 579 | 'using', 580 | 'usually', 581 | 'v', 582 | 'value', 583 | 'various', 584 | 'versus', 585 | 'very', 586 | 'via', 587 | 'viz', 588 | 'vs', 589 | 'w', 590 | 'want', 591 | 'wants', 592 | 'was', 593 | 'wasnt', 594 | 'way', 595 | 'we', 596 | 'wed', 597 | 'welcome', 598 | 'well', 599 | 'well', 600 | 'went', 601 | 'were', 602 | 'were', 603 | 'werent', 604 | 'weve', 605 | 'what', 606 | 'whatever', 607 | 'whatll', 608 | 'whats', 609 | 'whatve', 610 | 'when', 611 | 'whence', 612 | 'whenever', 613 | 'where', 614 | 'whereafter', 615 | 'whereas', 616 | 'whereby', 617 | 'wherein', 618 | 'wheres', 619 | 'whereupon', 620 | 'wherever', 621 | 'whether', 622 | 'which', 623 | 'whichever', 624 | 'while', 625 | 'whilst', 626 | 'whither', 627 | 'who', 628 | 'whod', 629 | 'whoever', 630 | 'whole', 631 | 'wholl', 632 | 'whom', 633 | 'whomever', 634 | 'whos', 635 | 'whose', 636 | 'why', 637 | 'will', 638 | 'willing', 639 | 'wish', 640 | 'with', 641 | 'within', 642 | 'without', 643 | 'wonder', 644 | 'wont', 645 | 'would', 646 | 'wouldnt', 647 | 'x', 648 | 'y', 649 | 'yes', 650 | 'yet', 651 | 'you', 652 | 'youd', 653 | 'youll', 654 | 'your', 655 | 'youre', 656 | 'yours', 657 | 'yourself', 658 | 'yourselves', 659 | 'youve', 660 | 'z', 661 | 'zero' 662 | ] --------------------------------------------------------------------------------