├── Manifest.txt ├── README ├── language_detector.gemspec ├── lib ├── language_detector.rb ├── model.yml └── training_data │ ├── ar-iso-8859-6.txt │ ├── ar-utf8.txt │ ├── bg-utf8.txt │ ├── cs-iso-8859-2.txt │ ├── cs-utf8.txt │ ├── da-iso-8859-1.txt │ ├── de-utf8.txt │ ├── el-utf8.txt │ ├── en-iso-8859-1.txt │ ├── es-utf8.txt │ ├── et-utf8.txt │ ├── fa-utf8.txt │ ├── fi-utf8.txt │ ├── fr-utf8.txt │ ├── fy-utf8.txt │ ├── ga-utf8.txt │ ├── he-utf8.txt │ ├── hi-utf8.txt │ ├── hr-utf8.txt │ ├── hu-iso-8859-2.txt │ ├── hu-utf8.txt │ ├── io-utf8.txt │ ├── is-utf8.txt │ ├── it-utf8.txt │ ├── ja-euc_jp.txt │ ├── ja-utf8.txt │ ├── ko-utf8.txt │ ├── nl-iso-8859-1.txt │ ├── no-utf8.txt │ ├── pl-utf8.txt │ ├── pt-utf8.txt │ ├── ro-utf8.txt │ ├── ru-utf8.txt │ ├── sl-utf8.txt │ ├── sv-iso-8859-1.txt │ ├── sv-utf8.txt │ ├── th-utf8.txt │ ├── todo │ ├── af.txt │ ├── amharic-utf.txt │ ├── arabic-windows1256.txt │ ├── armenian.txt │ ├── basque.txt │ ├── belarus-windows1251.txt │ ├── bosnian.txt │ ├── breton.txt │ ├── bulgarian-iso8859_5.txt │ ├── catalan.txt │ ├── croatian-ascii.txt │ ├── esperanto.txt │ ├── estonian.txt │ ├── frisian.txt │ ├── georgian.txt │ ├── greek-iso8859-7.txt │ ├── hawaian.txt │ ├── hebrew-iso8859_8.txt │ ├── hindi.txt │ ├── hungarian.txt │ ├── icelandic.txt │ ├── indonesian.txt │ ├── irish.txt │ ├── latin.txt │ ├── latvian.txt │ ├── lithuanian.txt │ ├── malay.txt │ ├── manx.txt │ ├── marathi.txt │ ├── mf.txt │ ├── middle_frisian.txt │ ├── mingo.txt │ ├── nepali.txt │ ├── persian.txt │ ├── quechua.txt │ ├── romanian.txt │ ├── rumantsch.txt │ ├── sanskrit.txt │ ├── scots.txt │ ├── scots_gaelic.txt │ ├── serbian-ascii.txt │ ├── slovak-ascii.txt │ ├── slovak-windows1250.txt │ ├── slovenian-ascii.txt │ ├── slovenian-iso8859_2.txt │ ├── sq.txt │ ├── swahili.txt │ ├── tagalog.txt │ ├── tamil.txt │ ├── thai.txt │ ├── turkish.txt │ ├── ukrainian-koi8_r.txt │ ├── vietnamese.txt │ ├── welsh.txt │ └── yiddish-utf.txt │ ├── uk-utf8.txt │ ├── vi-utf8.txt │ ├── zh-big5.txt │ └── zh-utf8.txt └── test └── language_detector_test.rb /Manifest.txt: -------------------------------------------------------------------------------- 1 | Manifest.txt 2 | README 3 | lib/language_detector.rb 4 | lib/model.yml 5 | test/language_detector_test.rb 6 | -------------------------------------------------------------------------------- /README: -------------------------------------------------------------------------------- 1 | 2 | == Welcome 3 | This is a n-gram based language detector, written in ruby. 4 | 5 | For technical details about language detection, I recommend this paper: http://www.sfs.uni-tuebingen.de/iscl/Theses/kranig.pdf 6 | 7 | == Installation 8 | sudo gem sources -a http://gems.github.com (you only have to do this once) 9 | sudo gem install feedbackmine-language_detector 10 | 11 | == Usage 12 | require 'language_detector' 13 | d = LanguageDetector.new 14 | p d.detect('this text is in English') 15 | 16 | == Thanks 17 | Kevin Burton (http://feedblog.org/2005/08/19/ngram-language-categorization-source/ ). I used all the training data in his ngramcat project. 18 | 19 | == Follow us on twitter 20 | 21 | http://twitter.com/feedbackmine 22 | -------------------------------------------------------------------------------- /language_detector.gemspec: -------------------------------------------------------------------------------- 1 | Gem::Specification.new do |s| 2 | s.name = %q{language_detector} 3 | s.version = "0.1.2" 4 | 5 | s.authors = ["feedbackmine"] 6 | s.description = %q{n-gram based language detector, written in ruby} 7 | s.email = %q{feedbackmine@feedbackmine.com} 8 | s.files = ["README", 9 | "Manifest.txt", 10 | "lib/language_detector.rb", 11 | "lib/model.yml", 12 | "test/language_detector_test.rb"] 13 | #s.has_rdoc = true 14 | s.homepage = %q{http://www.tweetjobsearch.com} 15 | #s.rdoc_options = ["--main", "README.txt"] 16 | s.require_paths = ["lib"] 17 | s.summary = %q{n-gram based language detector, written in ruby} 18 | end 19 | -------------------------------------------------------------------------------- /lib/language_detector.rb: -------------------------------------------------------------------------------- 1 | require 'yaml' 2 | require 'jcode' if RUBY_VERSION < '1.9' 3 | $KCODE = 'u' if RUBY_VERSION < '1.9' 4 | 5 | class LanguageDetector 6 | def detect text 7 | @profiles ||= load_model 8 | 9 | p = LanguageDetector::Profile.new("") 10 | p.init_with_string text 11 | best_profile = nil 12 | best_distance = nil 13 | @profiles.each {|profile| 14 | distance = profile.compute_distance(p) 15 | 16 | if !best_distance || distance < best_distance 17 | best_distance = distance 18 | best_profile = profile 19 | end 20 | } 21 | return best_profile.name 22 | end 23 | 24 | def self.train 25 | 26 | # For a full list of ISO 639 language tags visit: 27 | 28 | # http:#www.loc.gov/standards/iso639-2/englangn.html 29 | 30 | #LARGE profiles follow: 31 | 32 | #NOTE: These profiles taken from the "World War II" node on wikipedia 33 | #with the 'lang' and ?action=raw URI which results in a UTF8 encoded 34 | #file. If we need to get more profile data for a language this is 35 | #always a good source of data. 36 | # 37 | # http:#en.wikipedia.org/wiki/World_War_II 38 | 39 | training_data = [ 40 | # af (afrikaans) 41 | [ "ar", "ar-utf8.txt", "utf8", "arabic" ], 42 | [ "bg", "bg-utf8.txt", "utf8", "bulgarian" ], 43 | # bs (bosnian ) 44 | # ca (catalan) 45 | [ "cs", "cs-utf8.txt", "utf8", "czech" ], 46 | # cy (welsh) 47 | [ "da", "da-iso-8859-1.txt", "iso-8859-1", "danish" ], 48 | [ "de", "de-utf8.txt", "utf8", "german" ], 49 | [ "el", "el-utf8.txt", "utf8", "greek" ], 50 | [ "en", "en-iso-8859-1.txt", "iso-8859-1", "english" ], 51 | [ "et", "et-utf8.txt", "utf8", "estonian" ], 52 | [ "es", "es-utf8.txt", "utf8", "spanish" ], 53 | [ "fa", "fa-utf8.txt", "utf8", "farsi" ], 54 | [ "fi", "fi-utf8.txt", "utf8", "finnish" ], 55 | [ "fr", "fr-utf8.txt", "utf8", "french" ], 56 | [ "fy", "fy-utf8.txt", "utf8", "frisian" ], 57 | [ "ga", "ga-utf8.txt", "utf8", "irish" ], 58 | #gd (gaelic) 59 | #haw (hawaiian) 60 | [ "he", "he-utf8.txt", "utf8", "hebrew" ], 61 | [ "hi", "hi-utf8.txt", "utf8", "hindi" ], 62 | [ "hr", "hr-utf8.txt", "utf8", "croatian" ], 63 | #id (indonesian) 64 | [ "io", "io-utf8.txt", "utf8", "ido" ], 65 | [ "is", "is-utf8.txt", "utf8", "icelandic" ], 66 | [ "it", "it-utf8.txt", "utf8", "italian" ], 67 | [ "ja", "ja-utf8.txt", "utf8", "japanese" ], 68 | [ "ko", "ko-utf8.txt", "utf8", "korean" ], 69 | #ku (kurdish) 70 | #la ? 71 | #lb ? 72 | #lt (lithuanian) 73 | #lv (latvian) 74 | [ "hu", "hu-utf8.txt", "utf8", "hungarian" ], 75 | #mk (macedonian) 76 | #ms (malay) 77 | #my (burmese) 78 | [ "nl", "nl-iso-8859-1.txt", "iso-8859-1", "dutch" ], 79 | [ "no", "no-utf8.txt", "utf8", "norwegian" ], 80 | [ "pl", "pl-utf8.txt", "utf8", "polish" ], 81 | [ "pt", "pt-utf8.txt", "utf8", "portuguese" ], 82 | [ "ro", "ro-utf8.txt", "utf8", "romanian" ], 83 | [ "ru", "ru-utf8.txt", "utf8", "russian" ], 84 | [ "sl", "sl-utf8.txt", "utf8", "slovenian" ], 85 | #sr (serbian) 86 | [ "sv", "sv-iso-8859-1.txt", "iso-8859-1", "swedish" ], 87 | #[ "sv", "sv-utf8.txt", "utf8", "swedish" ], 88 | [ "th", "th-utf8.txt", "utf8", "thai" ], 89 | #tl (tagalog) 90 | #ty (tahitian) 91 | [ "uk", "uk-utf8.txt", "utf8", "ukraninan" ], 92 | [ "vi", "vi-utf8.txt", "utf8", "vietnamese" ], 93 | #wa (walloon) 94 | #yi (yidisih) 95 | [ "zh", "zh-utf8.txt", "utf8", "chinese" ] 96 | ] 97 | 98 | profiles = [] 99 | training_data.each {|data| 100 | p = LanguageDetector::Profile.new data[0] 101 | p.init_with_file data[1] 102 | profiles << p 103 | } 104 | puts 'saving model...' 105 | filename = File.expand_path(File.join(File.dirname(__FILE__), "model.yml")) 106 | File.open(filename, 'w') {|f| 107 | YAML.dump(profiles, f) 108 | } 109 | end 110 | 111 | def load_model 112 | filename = File.expand_path(File.join(File.dirname(__FILE__), "model.yml")) 113 | @profiles = YAML.load_file(filename) 114 | end 115 | 116 | class LanguageDetector::Profile 117 | 118 | PUNCTUATIONS = [?\n, ?\r, ?\t, ?\s, ?!, ?", ?#, ?$, ?%, ?&, ?', ?(, ?), ?*, ?+, ?,, ?-, ?., ?/, 119 | ?0, ?1, ?2, ?3, ?4, ?5, ?6, ?7, ?8, ?9, 120 | ?:, ?;, ?<, ?=, ?>, ??, ?@, ?[, ?\\, ?], ?^, ?_, ?`, ?{, ?|, ?}, ?~] 121 | 122 | LIMIT = 2000 123 | 124 | def compute_distance other_profile 125 | distance = 0 126 | other_profile.ngrams.each {|k, v| 127 | n = @ngrams[k] 128 | if n 129 | distance += (v - n).abs 130 | else 131 | distance += LanguageDetector::Profile::LIMIT 132 | end 133 | } 134 | return distance 135 | end 136 | 137 | attr_reader :ngrams, :name 138 | 139 | def initialize(name) 140 | @name = name 141 | @puctuations = {} 142 | PUNCTUATIONS.each {|p| @puctuations[p] = 1} 143 | @ngrams = {} 144 | end 145 | 146 | def init_with_file filename 147 | ngram_count = {} 148 | 149 | path = File.expand_path(File.join(File.dirname(__FILE__), "training_data/" + filename)) 150 | puts "training with " + path 151 | File.open(path).each_line{ |line| 152 | _init_with_string line, ngram_count 153 | } 154 | 155 | a = ngram_count.sort {|a,b| b[1] <=> a[1]} 156 | i = 1 157 | a.each {|t| 158 | @ngrams[t[0]] = i 159 | i += 1 160 | break if i > LIMIT 161 | } 162 | end 163 | 164 | def init_with_string str 165 | ngram_count = {} 166 | 167 | _init_with_string str, ngram_count 168 | 169 | a = ngram_count.sort {|a,b| b[1] <=> a[1]} 170 | i = 1 171 | a.each {|t| 172 | @ngrams[t[0]] = i 173 | i += 1 174 | break if i > LIMIT 175 | } 176 | end 177 | 178 | def _init_with_string str, ngram_count 179 | tokens = tokenize(str) 180 | tokens.each {|token| 181 | count_ngram token, 2, ngram_count 182 | count_ngram token, 3, ngram_count 183 | count_ngram token, 4, ngram_count 184 | count_ngram token, 5, ngram_count 185 | } 186 | end 187 | 188 | def tokenize str 189 | tokens = [] 190 | s = '' 191 | str.each_byte {|b| 192 | if is_puctuation?(b) 193 | tokens << s unless s.empty? 194 | s = '' 195 | else 196 | s << b 197 | end 198 | } 199 | tokens << s unless s.empty? 200 | return tokens 201 | end 202 | 203 | def is_puctuation? b 204 | @puctuations[b] 205 | end 206 | 207 | def count_ngram token, n, counts 208 | if RUBY_VERSION < '1.9' 209 | token = "_#{token}#{'_' * (n-1)}" if n > 1 && token.jlength >= n 210 | else 211 | token = "_#{token}#{'_' * (n-1)}" if n > 1 && token.length >= n 212 | end 213 | i = 0 214 | while i + n <= token.length 215 | s = '' 216 | j = 0 217 | while j < n 218 | s << token[i+j] 219 | j += 1 220 | end 221 | if counts[s] 222 | counts[s] = counts[s] + 1 223 | else 224 | counts[s] = 1 225 | end 226 | i += 1 227 | end 228 | 229 | return counts 230 | end 231 | 232 | end 233 | 234 | end 235 | 236 | if $0 == __FILE__ 237 | if ARGV.length == 1 && 'train' == ARGV[0] 238 | LanguageDetector.train 239 | else 240 | d = LanguageDetector.new 241 | p d.detect("what language is it is?") 242 | end 243 | end 244 | 245 | -------------------------------------------------------------------------------- /lib/training_data/ar-iso-8859-6.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/ar-iso-8859-6.txt -------------------------------------------------------------------------------- /lib/training_data/ar-utf8.txt: -------------------------------------------------------------------------------- 1 | تعد الحرب العالمية الثانية من الحروب الشموليةً وأكثرها كُلفة في تاريخ البشريةً. ولاتّساع بقعة الحرب وتعدد مسارح المعركة، فكانت دول كثيرة طرفاً من أطراف النزاع. فقد حصدت الحرب العالمية الثانية زهاء 50 مليون نفس بشرية بين عسكري ومدني، واستمرت الحرب المقيتة بين 1939 حتى 1945 باستسلام ال[[يابان]]. 2 | [[صورة:|حاول الحزب النازي الدمج بين شعار المانيا التقليدي وشعار الحزب النازي ليبين ان الأثنان وجهان لعملة واحدة]] 3 | 4 | تكبّد المدنيون خسائر في الأرواح إبّان الحرب العالمية الثانية أكثر من أي حرب عرفها التاريخ، ويعزى السبب لتقليعة القصف الجوي على [[مدينة|المدن]] و[[قرية|القرى]] التي ابتدعها الجيش [[المانيا|الألماني]] على مدن وقرى الحلفاء مما استدعى الحلفاء بالرّد بالمثل، فسقط من المدنيين من سقط من كلا الطرفين. أضف الى ذلك المذابح التي ارتكبها الجيش [[يابان|الياباني]] بحق الشّعبين [[صين|الصيني]] والكوري الى قائمة الضحايا المدنيين ليرتفع عدد الضحايا الأبرياء والجنود الى 50 مليون قتيل، أي ما يعادل 2% من تعداد سكان العالم في تلك الفترة! 5 | 6 | ==تمهيد== 7 | 8 | هتلز النازي وموسوليني الفاشي]] 9 | الإمتعاض من معاملة القوى المنتصرة لألمانيا وسوء وتردي الأوضاع الإقتصادية بسبب التكاليف الباهضة والديون التي تكبّلتها ألمانيا بعد الحرب العالمية الأولى وابرام [[معاهدة فيرساي]] والكساد الإقتصادي العالمي أهّل أدولف هتلر وحزبه اليميني المتطرّف من الأخذ بزمام الأمور واعتلاء كرسي الحكم في ألمانيا. ثم قام هتلر بتحدّي المعاهدات المبرمة بين ألمانيا والحلفاء بعد الحرب العالمية الأولى بالعمل على تطوير الجيش الألماني و حشد القوات والعتاد على الحدود الفرنسية الألمانية و الإتحاد مع ال[[نمسا]] وضم أجزاء من تشيكوسلوفاكيا بمباركة أنجلو-فرنسية. 10 | 11 | في العام 1922، وصل "بينيتو موسوليني" وحزبه الفاشي الى دفّة الحكم في ايطاليا، ويتّفق كل من الحزب الفاشي بقيادة موسوليني والحزب النازي بقيادة هتلر ببعض الأهداف الأيديولوجية، فشكّل الإثنان اتفاقية جمعت بلديهما وسمّيت الإتفاقية بالمحور في العام 1936. أما في ما يتعلّق بالجانب الشرقي من العالم، فقامت الإمبراطورية اليابانية بغزو الصين في سبتمبر 1936. وبالرغم من معارضة الحكومة اليابانية للغزو، الا ان الجيش الإمبراطوري الياباني لم يعبأ بمعارضة حكومة بلاده ومضى قُدُماً في غزوه للصين. 12 | 13 | في العام 1939، قام هتلر بالمطالبة ببعض من أراضي بولندا وقام بالتوقيع على اتفاقية "عدم اعتداء" بين المانيا والإتحاد السوفييتي كردة فعل على إتفاقية الدّفاع المشترك بين كلّ من بريطانيا-فرنسا وبولندا. وفي الأول من سبتمبر 1939، قامت القوات النازية بغزو بولندا، وفي الثالث من سبتمبر من نفس العام، أعلنت كلّ من بريطانيا وفرنسا الحرب على ألمانيا. وفي غضون اسبوعين من الغزو النازي لبولندا، قام الجيش الأحمر بغزو بولندا هو الآخر. وقبل ان يتسنّى للجيش البريطاني والفرنسي من تشكيل هجوم على بولندا لدحر الغزو النازي لبولندا، كانت القوات النازية قد انتهت من السيطرة على بولندا وانهاء مناوشات الجيش البولندي والنازي في غضون 3 أسابيع. 14 | 15 | ==المسرح الأوروبي== 16 | |الثلاثة الكبار : ستالين، روزوفيلت، تشيرشل]] 17 | 18 | تسمّى الفترة التي عقبت الغزو النازي لبولندا (اكتوبر 1939) وحتى الغزو النازي لبلجيكا، وهولندا، و لوكسيمبورج، وانتهاءً بغزو فرنسا (مايو 1940)، بالحرب المزيفة لعدم مشاركة القوى العظمى في مسرح العمليات واقتصار المعارك في المسرح الأوروبي على القوات النازية وصغار الدول بالرّغم من إعلان الحرب على ألمانيا النازية من قِبل بريطانيا وفرنسا. 19 | 20 | تحرّكت القوات النازية والروسية من بولندا واتّجه الجيش الأحمر ليركز بشكل أكثر على دول البلطيق وفنلندا حيث دارت الحرب الشتوية التي شدّت انتباه العالم لإنعدام الأعمال العسكرية في بولندا، بينما اتّجة الجيش النازي جهة الدنمارك والنرويج وعزّزت القوات الفرنسية مواقعها عل الحدود الفرنسية الألمانية، وباستثناء بعض المناوشات العسكرية بين القوات الفرنسية والألمانية، لم يكن هناك شيء يذكر لان كل من فرنسا والمانيا كانتا منهمكتين في حشد الجنود والعتاد في تلك الفترة. في مايو 1940، استعملت القوات النازية تكتيكاً عسكرياً جديداً سمّي بـ "الحرب الخاطفة" (1) مما مكن القوات النازية من السيطرة على فرنسا وهزيمة الجيش الفرنسي والبريطاني. وتقهقر الجيش البريطاني الى مدينة "دنكيرك" الساحلية وترك أسلحته الثقيلة في الساحة الفرنسية فقامت حكومة "تشرشل" باستخدام السفن العسكرية بل وحتّى التجارية في إجلاء الجنود البريطانيين من الساحل الغربي لفرنسا. ولم يبق خيار للحكومة الفرنسية غير خيار الإستسلام للجيش النازي مما مكّن الجيش النازي من إحكام السيطرة على الشمال الفرنسي وتنصيب حكومة فرنسية موالية لألمانيا النازية في الشطر الجنوبي من فرنسا. 21 | 22 | لم يتمكن سلاح الجو الألماني من هزيمة غريمه البريطاني فكان من الضروري قهر سلاح الجو البريطاني ليتسنّى للألمان غزو الإنجليز، فاتّبع الألمان سياسة مكثّفة بالقصف بالقنابل على بريطانيا، أملاً في إخضاع الإنجليز، وباءت محاولات الألمان بالفشل. 23 | 24 | بالرغم من إتفاقية عدم الإعتداء بين ألمانيا والإتحاد السوفييتي، الا ان ألمانيا قامت بغزو للإتحاد السوفييتي في يونيو 1941. فقد أخذ الألمان الروس على حين غرّة، وكسبت ألمانيا أراض روسية شاسعة وأسرت مئات الآلاف من الجنود الروس. وبعدما أفاق [[جوزيف ستالين]] مما ألمّ به، أخذ الروس في إعادة ترتيب أوراقهم خصوصا أن الروس استطاعوا من الإحتفاظ بعتادهم العسكري الثقيل بعد رجوعهم الى الوراء نتيجة الغزو الألماني. إستمات الروس وقدّموا الغالي والنفيس في الذود عن العاصمة موسكو واستمر العناد الألماني حتى فصل الشتاء. ولم يكن في بال هتلر استمرار المقاومة الروسية حتى فصل الشتاء، إذ لم يتم تجهيز الجيش الألماني وتزويده بخطوط الإمداد لهذه الفترة. فمرّ فصل الشتاء على الجيش الألماني بقسوة نتيجة التخطيط السيء لغزو موسكو. وبحلول فصل الربيع، إحتار الألمان بين المضي قدما في إحتلال موسكو أم الإكتفاء بالسيطرة على حقول النفط القوقازية. 25 | 26 | إختار الألمان السيطرة على حقول النفط القوقازية على إحتلال العاصمة موسكو. وفي العام 1942، سحقت القوات السوفييتية قوات المحور الأمامية في الجنوب السوفييتي وقامت بتطويق الجيش الألماني السادس في معركة "ستالينجراد"، واستسلم 300,000 جندي ألماني في نهاية الحصار. كارثة ستالينجراد كانت نقطة التّحول في مسرح العمليات الحربية الأوروبية وبداية العدّ التنازلي لهيمنة "[[رايخ ثالث|الرايخ الثالث]]" على اوروبا. فبعد كارثة ستالينجراد، تكبّد المحور كارثة تونس التي هُزم بها المحور وتم أسر ربع مليون جندي ألماني وإيطالي من جنود المحور. إستعمل الحلفاء شمال أفريقيا كنقطة إنطلاق لقهر مارد المحور من الجنوب بعد إحكام القوات الروسية على الجبهة الشرقية. 27 | 28 | سقطت إيطاليا بعد تحرّك الجيش البريطاني اليها من شمال أفريقيا وبعد مقاومة شرسة من الجيش الألماني للأراضي الإيطالية في سبتمبر 1943. 29 | 30 | أحكم الحلفاء قبضتهم على المارق الألماني ودول المحور ولم يتبقّ الا عُقر دار الرايخ الثالث في برلين، فقامت جحافل الجيش [[ولايات الامريكية المتحدة|الأمريكي]] بالإنزال الشهير على شواطيء "نورماندي" في يونيو 1944 ونتج عن هذا الإنزال تحرير جُل فرنسا وبلجيكا، وهولندا، ولكسمبورغ في أواخر عام 1944. في هذه الأثناء، وصل الجيش الأحمر مشارف مدينة برلين من جهة الشرق، معقل الرايخ الثالث، واُسدل الستار على ألمانيا النازية بانتحار هتلر، ثم استسلام ألمانيا إستسلاماً غير مشروط في 7 مايو 1945. 31 | 32 | ==المسرح الأسيوي== 33 | 34 | صورة جوية لمدينة هيروشيما بعد القاء القنبلة الذرية عليها]] 35 | 36 | قامت القوات اليابانية بغزو الصين قبل اندلاع الحرب العالمية الثانية مما حدى بالولايات المتحدة وحلفاؤها بفرض مقاطعة اقتصادية على اليابان، وعلى أثره، قررت اليابان ضرب ميناء "بيرل هاربر" في 7 ديسمبر 1941، بلا سابق انذار وبدون اعلان للحرب على الولايات المتحدة. تسبب الهجوم على ميناء بيرل هاربر بأضرار جسيمة للأسطول الأمريكي، الا ان حاملات الطائرات الأمريكية لم تُصب بأذى لكون الحاملات في عرض المحيط الهادي لأداء مهمّات لها. كما قامت القوات اليابانية بغزو جنوب أسيا تزامناً مع قصف بيرل هاربر وبالتحديد، ماليزيا، واندونيسيا، والفلبين بمحاولة من اليابان للسيطرة على حقول النفط الاندونيسية. ووصف رئيس الوزراء البريطاني "ونستون تشيرشل" حادثة سقوط سنغافورة بأيدي القوات اليابانية على انه "من أكثر الهزائم مهانة على الإطلاق". 37 | 38 | بالرغم من اتفاق قادة التحالف حتى قبل بداية الحرب العالمية الثانية على دحر وهزيمة المانيا النازية، الا ان جدول أعمال الولايات المتحدة وبعض من دول التحالف ومن ضمنها استراليا، دأبوا على استرجاع الأراضي التي استولت عليها اليابان في منتصف العام 1942. ثم قامت الولايات المتحدة بقيادة الجنرال "دوجلاس مكارثر" بالهجوم ومحاولة استرجاع "غينيا الجديدة"، وجزر سليمان، وبريطانيا الجديدة، وايرلندا الجديدة، والفلبين. وتنامت الضغوط على اليابان بهجوم الولايات المتحدة على السفن التجارية اليابانية وحرمان اليابان من المواد الأولية اللازمة للمجهود الحربي، واشتدّت حدة الضغوط باحتلال الولايات المتحدة للجزر المتاخمة لليابان. 39 | 40 | إستيلاء الحلفاء على جزيرتي "إيو جيما" و "أوكيناوا" اليابانية جعل اليابان في مرمى طائرات وسفن التحالف دون أدنى مشقّة. وإعلان الإتحاد السوفييتي الحرب على اليابان في بداية 1945 ومن ثمّة مهاجمة "منشوريا" الصينية الواقعة تحت الإحتلال الياباني، عجّل في دنو ساعة الأجل للإمبراطورية اليابانية والتي حلّت بقصف الولايات المتحدة بالقنابل الذرية لكل من "هيروشيما" و "ناجازاكي" مما أرغم طوكيو لإعلان الإستسلام اللا مشروط لقوات التحالف. 41 | 42 | ==بعد الحرب== 43 | 44 | على خلاف تصرّف دول التحالف بعد انتصارهم على المحور ومطالبة المنتصر (التحالف) بدفع تكاليف الحرب العالمية الأولى من جيوب الخاسر (المحور)، قامت وزارة الخارجية الأمريكية ممثّلة بوزيرها "جورج مارشال" باستحداث خطّة اقتصادية لإعادة إعمار الدول الخاسرة في الحرب، وعُرفت هذه الخطّة بـ "خطّة مارشال" وقام الكونجرس الأمريكي بتخصيص مليارات الدولارات لإعادة إعمار أوروبا. وتتحمّل "عصبة الأمم" بعض أوزار الحرب العالمية الثانية لفشل العصبة في الحيلولة دون وقوعها، وقد تم استبدال العصبة بهيئة الامم المتحدة في العام 1945. أمّا على الساحة الأوروبية، فقد تنفّس الأوروبيّون الصعداء بزوال شبح الحرب، وصافرات الإنذار، وأزيز القنابل المتساقطة، وبدأت عملية لمّ الشمل بين الألوف المؤلّفة من الأوربيين المشتّتون في أصقاع الأرض وإقامة قوات التحالف ل"[[محاكم نورمبرغ]]" الشهيرة التي اقتصّت بشكل أساسي من القادة النازيين. 45 | 46 | ==هامش== 47 | 48 | 1) الحرب الخاطفة (بالالمانية إستراتيجية حربية جديدة ابتدعها الألمان بحشد القوات الأرضية معزّزة بالدبابات والمعدات الثقيلة وبغطاء جوي من القاذفات يقوم على تمهيد الطريق أمام القوات البرية الغازية على خلاف حرب الخنادق التقليدية المتّبعة في الحرب العالمية الأولى والتي يطول أمدها الى ماشاء الله. 49 | 50 | ==مرجع== 51 | 52 | الحرب العالمية الثانية من الموسوعة الانجليزية] 53 | 54 | [[تصنيف:حروب|عالمية ثانية]] 55 | -------------------------------------------------------------------------------- /lib/training_data/bg-utf8.txt: -------------------------------------------------------------------------------- 1 | ===Начало на войната=== 2 | 3 | През септември [[1939]] г. [[Германия]] нахлува в [[Полша]] и това води до обявяването на война от страна на [[Обединено кралство|Великобритания]], [[Австралия]], [[Канада]], [[Нова Зеландия]], [[Южна Африка]] и [[Франция]] на Германия. След капитулацията на Полша, войната навлиза в период на сравнително ниска активност, известен като [[Фалшива война|Фалшивата война]]. Този период завършва когато Германия напада Дания и Норвегия през април 1940 г. и Холандия, Белгия и Франция през май. Всяка една от нападнатите страни бързо капитулира, а Великобритания и [[Британска общност|Британската общност]] претърпяват унизителна загуба в Норвегия (вижте [[Британските военни операции в Норвегия]]) и почти катастрофално отстъпление от Франция (вижте [[Битка при Дюнкерк|битката при Дюнкерк]]). Великобритания бива заплашена с нападение по суша, вода и въздух (вижте [[Операция тюлен]]), но по време на [[Битка за Великобритания|битката за Великобритания]] [[луфтвафе]] не успява да установи въздушно превъзходство и нахлуването се отлага за неопределен срок. 4 | 5 | ==Северна Африка== 6 | 7 | След като [[Италия]] обявява война на Великобритания и Франция през юни 1940 г. италианските войски в [[Либия]] са подложени на атака от страна на британците в [[Египет]]. Италианските въоръжени сили скоро поемат инициативата и окупират Британска [[Сомалия]] през август, и нахлуват в Египет през септември. Войските на Британия и Британската общност първоначално губят почва, но през декември се пращат подкрепления, които довеждат до обрат. През февруари 1941 г. немците пращат войски,които да помогнат на италианците в Либия [[Африка Корпс]]. Предстоят тежки военни операции. 8 | 9 | ==Югоизточна Европа== 10 | 11 | Италианското нахлуване в [[Гърция]] през декември 1940 г. се превръща в катастрофа и италианските войски са изтласкани в [[Албания]] окупирана от Италия още от 1939 г. Германия напада [[Югославия]] и Гърция през май [[1941]] г., за да помогне на съюзниците си и да предотврати възможността за насилственото прекъсване на производството на нефт в нефтените находища в [[Румъния]] от вражеските войски. 12 | 13 | ==Съветски съюз== 14 | 15 | [[СССР|Съветският съюз]] напада Полша съгласно споразумение с Германия през 1939 г. (вижте Пактът [[Рибентроп-Молотов]]) и окупира половината част от страната. [[Сталин]] получава множество предупреждения от съветски агенти в [[Германия]] и от [[Чърчил]], но приема всичко това като дезинформация от страна на англичаните, с цел да го въвлечат във войната. Затова до момента на немското нападение съветското командване не приема никакви контра-мерки. Немските военни операции в [[Гърция]] и [[Северна Африка]] отлагат заплануваното нападение с няколко седмици и е прахосано голяма част от хубавото време до нападението, започнато на [[22 юни]] [[1941]] г. За подробности относно военните операции, вижте [[Операция Барбароса]]. 16 | 17 | ==Първи значителни поражения на Германия== 18 | 19 | Германия обявява война на [[САЩ]] веднага след атаката на [[Япония]] в [[Пърл Харбър]] през декември 1941 г. САЩ снабдява и предлага до този момент все повече невоенна помощ на Великобритания от началото на войната,а сега цялата боеспособност на американската войска и огромният потенциал за военно производство се насочват срещу Германия. Първото значително поражение е в Северна Африка във втората [[битка при Ел Аламейн]] през [[1942]] г. Приблизително по това време се влошава ситуацията за немците на Източния фронт. Поражението в [[битка при Сталинград|битката при Сталинград]] шокира мнозина от немското върховно командване и немския народ започва да осъзнава, че немските войски не са непобедими. 20 | 21 | ==Примирие c Италия== 22 | 23 | Немското и италианско поражение в Северна Африка позволява на съюзниците да разработят планове за откриването на нов театър на бойни действия на юг. Провежда се десант в Сицилия през юли [[1943]] г., което довежда до свалянето от власт и хвърлянето в затвора на [[Бенито Мусолини]]. През септември се извършва настъпление във вътрешността. Скоро след това се подписва примирие и много от италианските войници са взети в плен от немците. Германците продължават да се бият в Италия и през октомври новото италианско правителство обявява война на Германия. В крайна сметка немците успяват да стабилизират фронта в Италия и съюзниците започват да обмислят план за отварянето на нов фронт. 24 | 25 | [[Категория:Втора световна война]] 26 | 27 | -------------------------------------------------------------------------------- /lib/training_data/cs-iso-8859-2.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/cs-iso-8859-2.txt -------------------------------------------------------------------------------- /lib/training_data/cs-utf8.txt: -------------------------------------------------------------------------------- 1 | '''Fyzika''' (z [[řečtina|řeckého]] (''physis''): ''[[příroda]]'') 2 | je [[Věda|vědní]] obor, který zkoumá [[hmota|hmotu]], její vlastnosti a chování během dějů. Vlastnosti a vztahy mezi nimi popisuje zpravidla jazykem [[matematika|matematiky]]. 3 | 4 | == Rozdělení fyziky == 5 | Fyzikální výzkum lze velmi obecně rozdělit na [[teoretická fyzika|teoretickou fyziku]], [[experiment|experimentální fyziku]] a [[počítačové modelování]]. Ani jedno odvětví dnes nemůže existovat bez zbylých dvou. Teoretická fyzika se snaží vyvodit z experimentálních výsledků obecně platné zákony, naopak experimentální fyzika se snaží potvrdit nebo vyvrátit existující teorie, přitom často objevuje zcela nové jevy. Třetí větev je poměrně mladá, ale s rozvojem [[počítač]]ů se jí v moderní fyzice dostává stále větší důležitosti. Jejím úkolem jsou předpovědi a ověřování teorií na komplexních jevech, kdy je chování jejích jednotlivých částí dáno relativně jednoduchým vztahem, ze kterého ale ihned neplyne chování celého souboru. 6 | 7 | == Fyzikální obory == 8 | Asi nejobyklejší dělení fyziky je podle oborů zájmu 9 | 10 | * [[Akustika]] 11 | * [[Astrofyzika]] 12 | * [[Biofyzika]] 13 | * [[Elektřina a magnetismus]] 14 | * [[Fyzika částic]] 15 | * [[Fyzika kondenzovaného stavu]] 16 | * [[Fyzika plazmatu]] 17 | * [[Kosmologie a gravitace]] 18 | * [[Mechanika]] 19 | * [[Optika]] 20 | * [[Počítačová fyzika]] 21 | * [[Termika]] 22 | 23 | == Vztah fyziky k dalším vědám == 24 | 25 | Fyzika se někdy označuje jako věda ''fundamentální''. Kdybychom disponovali neomezenou výpočetní silou, celá [[chemie]] by se redukovala na řešení rovnic [[kvantové teorie]]. Skutečnost je ale taková, že přímé výpočty ze základních rovnic jsou dnes proveditelné jen pro jednodušší případy. Proto chemie vychází z fyziky jen částečně. Obdobný vztah (přinejmenším podle [[redukcionismus|redukcionistického]] pohledu) platí pro [[biologie|biologii]], ale protože biologické systémy jsou ještě složitější, přímé výpočty jsou ještě méně praktické. Na pomezí mezi fyzikou, biologií a chemií leží [[biofyzika]]. Kromě výpočtů chování [[molekula|molekul]] mají velké uplatnění v biologii i [[lékařství]] zobrazovací metody založené na složitějších fyzikálních základech ([[NMR]], [[pozitronová emisní tomografie|PET]], [[spektroskopie]] a další). 26 | 27 | Fyzika těsně souvisí s [[Astronomie|astronomií]]. 28 | 29 | == Historie fyziky == 30 | 31 | Počátky fyziky lze hledat ve starověku. Fyzika převážně patřila do [[filosofie]], rozvíjela se [[kosmologie]]. Převažující metodou poznání byla úvaha a pozorování. [[Aristoteles|Aristotelova]] fyzika tak odpovídá přirozené, vypozorované zkušenosti - vržený předmět se zastaví, těžké předměty padají dolů, lehké míří nahoru. (Přestože v porovnání se současnou mechanikou se taková teorie zdá úplně špatná, v určitém smyslu pořád platí - je limitou mechaniky ve viskózním prostředí). Výjimkou značně předbíhající dobu byl [[Archimédés]], který prováděl [[experiment]]y a odvodil některé přesné kvantitativní zákony. 32 | 33 | Arisotelovo učení se stalo vrcholem poznání na tisíc let. Pokroků v chemii a astronomii dosáhli arabští učenci, ale ve fyzice vývoj nastal teprve v [[renesance|renesanci]]. V [[Itálie|Itálii]] [[Galileo Galilei]] začal systematicky provádět experimenty, což se stalo základem rozvoje fyziky a [[vědecká metoda|vědecké metody]] vůbec. Galilei také odvodil některé výsledky v mechanice, mimo jiné [[Galileiho princip relativity|princip relativity]]. V astronomii [[Mikuláš Koperník]] navrhl [[heliocentrismus|heliocentrický systém]] a [[Johannes Kepler]] odvodil [[Keplerovy zákony|zákony pohybu nebeských těles]]. [[René Descartes]] a další položili základy pozdější matematizace fyziky ([[kartézské souřadnice]]). 34 | 35 | Ke konci 17. stol [[Isaac Newton]] vydává asi nejvýznamnější dílo v dějinách fyziky vůbec ''Philosophiae Naturalis Principia Mathematica'' (Matematické základy filosofie přírody). Vyslovuje [[Newtonovy pohybové zákony|zákony pohybu]], které jsou základem [[mechanika|mechaniky]] až do 20. století. V jednotném rámci s mechanikou formuluje univerzální zákon [[gravitace]] a odvozuje z něj Keplerovy zákony. Newton vymyslel i potřebný matematický aparát, [[integrál]] a [[derivace]]. 36 | 37 | Klasickou mechaniku rozvíjejí [[Joseph Louis Lagrange|Lagrange]], [[William Rowan Hamilton|Hamilton]], [[Leonhard Euler|Euler]], [[Pierre-Simon Laplace|Laplace]] a další. Úspěšně popisují [[mechanika tekutin|mechaniku tekutin]]. 38 | 39 | [[Charles-Augustin de Coulomb|Coulomb]], [[Alessandro Volta|Volta]] a [[Adré Marie Ampere|Ampere]] studují elektrické jevy. [[Hans Christian Oersted|Oersted]] objevuje magnetické účinky [[elektrický proud|elektrického proudu]]. [[Michael Faraday]] objevuje [[elektrická indukce|indukci]]. V druhé polovině 19. století [[James Clerk Maxwell]] přichází s teorií [[elektromagnetické pole|elektromagnetického pole]], která spojuje a vysvětluje veškeré elektrické a magnetické jevy. Jako důsledek teorie předpovídá [[elektromagnetické vlny]], a přivádí tak na stejný základ i optiku. Předpověď experimentálně ověřil [[Heinrich Rudolf Hertz|Herz]]. 40 | 41 | Roku [[1895]] [[Wilhelm Conrad Röntgen|Roentgen]] objevuje "paprsky X" (rentgenovské záření), o rok později [[Henri Becquerel|Becquerel]] objevuje radioaktivitu, o další rok později [[J.J.Thomspon|Thompson]] [[elektron]]. [[Jáchymov]]ské [[rádium]] studují [[Pierre Curie|Piere]] a [[Marie Curie-Skłodowska|Marie Curie-Skłodowská]]. Vzniká tak [[jaderná fyzika]]. 42 | 43 | V ''zázračném roce'' [[1905]] [[Albert Einstein]] zveřejňuje [[speciální teorie relativity|speciální teorii relativity]], popisující chování [[časoprostor]]u při rychlostech větších než malých (časoprostorovou interpetaci STR popsal [[Hermann Minkowski|Minkowski]]). Kvantové vysvětluje [[fotoefekt]] - Einstein byl první, kdo vzal kvanta vážně. O desetiletí později pak Einstein představuje [[obecná teorie relativity|obecnou teorii relativity]], geometrickou relativistickou čtyřrozměrnou teorii gravitace. 44 | 45 | [[Rozdělení záření černého tělesa]] objevené [[Max Planck|Planckem]], fotoefekt, potíže s modelem atomu, vztahy mezi polohami [[spektrální čáry|spektrálních čar]] a další jevy s diskrétní energetickou strukturou vedly počátkem [[20. století]] k prvním kvantovým hypotézám ([[Niels Bohr|Bohr]] a další). Ucelené teorie [[kvantová mechanika|kvantové mechaniky]] ve dvacátých letech formulovali [[Werner Heisenberg|Heisenberg]] (''"maticová mechanika"'') a [[Erwin Schrödinger|Schrödinger]] (''"vlnová mechanika"''), který dokázal ekvivalenci obou přístupů. Teorii značně zdokonalili [[Paul Dirac]] a [[John von Neumann]]. 46 | 47 | V druhé polovině [[20. století]] byla představena sjednocená [[kvantová teorie pole]], přičemž zásadní úlohu při jejím hledání měl [[Richard Feynman]]. Tato teorie sjednotila [[elektromagnetismus]] se [[slabá interakce|slabou]] a [[silná interakce|silnou interakcí]]. Rozvinuty byly také teorie o vzniku Vesmíru, které vycházejí z hypotézy [[Velký třesk|Velkého třesku]]. Zde za všechny vědce jmenujme [[George Gamow]]a. Od [[80. léta|80. let]] se vrcholná fyzika snaží propracovat [[teorie strun|teorii strun]], která má potenciál sjednotit dva pilíře moderní fyziky: [[kvantová teorie pole|kvantovou teorii pole]] a [[obecná teorie relativity|obecnou teorii relativity]], které jsou vzájemně neslučitelné. Nicméně teorie strun ještě není zcela bezvýhradně uznávanou teorií. 48 | 49 | -------------------------------------------------------------------------------- /lib/training_data/da-iso-8859-1.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/da-iso-8859-1.txt -------------------------------------------------------------------------------- /lib/training_data/el-utf8.txt: -------------------------------------------------------------------------------- 1 | Η '''Ελληνική Γλώσσα''' είναι μία από τις [[Ινδο-Ευρωπαϊκές Γλώσσες]], για την οποία έχουμε συνεχή γραπτά κείμενα από τον [[8ος αιώνας π.Χ.|8ον αιώνα π.Χ.]] μέχρι σήμερα. Επίσης έχουμε μερικά γραπτά κείμενα από τον [[15ος αιώνας π.Χ.|15ον αιώνα π.Χ.]] γραμμένα στη Γραμμική Β. 2 | Οι κυριότερες φάσεις εξέλιξης της Ελληνικής Γλώσσας είναι οι εξής: 3 | 4 | #Πρωτοελληνική. 5 | #Μυκηναϊκή Ελληνική. 6 | #Κλασσική Ελληνική. 7 | #Ελληνιστική Κοινή. 8 | #Μεσαιωνική Ελληνική. 9 | #Νέα Ελληνική (δημοτική). 10 | 11 | ==Φάσεις Εξέλιξης== 12 | ===Πρωτοελληνική=== 13 | Για την πρώτη φάση (Πρωτοελληνική) η οποία τοποθετείται πριν το [[1600 π.Χ.]], οι όποιες γνώσεις μας για την ελληνική γλώσσα βασίζονται σε τεχνικές επανασύνθεσης που προκύπτουν από τη συγκριτική γλωσσολογία. Η Πρωτοελληνική είχε 7 [[πτώση|πτώσεις]] ([[Ονομαστική πτώση|Ονομαστική]], [[Γενική πτώση|Γενική]], [[Δοτική πτώση|Δοτική]], [[Αιτιατική πτώση|Αιτιατική]], [[Αφαιρετική πτώση|Αφαιρετική]], [[Τοπική πτώση|Τοπική]], [[Κλητική πτώση|Κλητική]]). Επίσης είχε διατηρήσει σε πολύ μεγάλο βαθμό τα υπόλοιπα χαρακτηριστικά της ΙΕ "μητρικής" γλώσσας. Είχε τρεις [[γραμματική φωνή|φωνές]] ([[Ενεργητική φωνή|Ενεργητική]], [[Παθητική φωνή|Παθητική]], [[Μέση φωνή|Μέση]]) και τρεις [[γραμματικός αριθμός|αριθμούς]] ([[Ενικός αριθμός|Ενικός]], [[Πληθυντικός αριθμός|Πληθυντικός]], [[Δυϊκός αριθμός|Δυϊκός]]). Σημαντικό χαρακτηριστικό της (που διατηρήθηκε σχεδόν μέχρι τα πρώτα μεταχριστιανικά χρόνια) ήταν ο μουσικός τονισμός. Ο [[τόνος]] στα αρχαία ελληνικά δεν αντιστοιχούσε σε αύξηση της έντασης της φωνής (volume) αλλά σε αύξηση της συχνότητας (pitch). 14 | 15 | ===Μυκηναϊκή Ελληνική=== 16 | Στην αμέσως επόμενη φάση (Μυκηναϊκή Ελληνική) η οποία μαρτυρείται από τις πινακίδες της [[Γραμμική Β|Γραμμικής Β']] και από ορισμένους στίχους των [[Ομηρικά Έπη|Ομηρικών Επών]], παρατηρούμε εξίσου πολλούς αρχαϊσμούς. Π.χ. η γενική των ονομάτων σε -ος σχηματιζόταν με την κατάληξη -υο (πρβλ. Ομηρικό "Πριάμυο"), ενώ υπάρχει φθόγγος (που συμβολίζεται με) "q" ο οποίος βρίσκεται σε λέξεις όπου από την ΙΕ θα αναμέναμε ένα *k^w. Οι πτώσεις Αφαιρετική και Τοπική διατηρούνται αλλά σε μάλλον περιορισμένο βαθμό. 17 | 18 | ===Κλασσική Ελληνική=== 19 | Στην Κλασσική ελληνική, αρχαιότερα κείμενα της οποίας είναι τα [[Ομηρικά Έπη]] και αρχαιότερο τεκμήριο η επιγραφή του Διπύλου, το βασικότερο χαρακτηριστικό είναι η υψηλή [[διάλεκτος|διαλεκτική]] διαφοροποίηση, η οποία οφείλεται πιθανότατα στην πολυδιάσπαση του ελληνικού κόσμου σε διάφορα κρατίδια. Ως προς το αν οι βασικές διάλεκτοι της κλασσικής εποχής ([[Ιωνική διάλεκτος|Ιωνική]], [[Αιολική διάλεκτος|Αιολική]], [[Δωρική διάλεκτος|Δωρική]] κλπ) δημιουργήθηκαν στην [[Ελλάδα]] λόγω της πολιτικής πολυδιάσπασης των [[Έλληνες|Ελλήνων]] ή "ήρθαν" μαζί με τα αντίστοιχα φύλα κατά την [[εποχή του Χαλκού]], οι γνώμες διίστανται. Φαίνεται πως δεν αποκλείεται να συνέβησαν και τα δύο. Πάντως οι διάλεκτοι της κλασσικής εποχής διέφεραν αρκετά μεταξύ τους και δεν θα ήταν υπερβολή να υποστηριχθεί ότι οι ομιλητές τους βρίσκονταν πολλές φορές στα ακραία όρια της αλληλοκατανόησης. 20 | 21 | Μία από τις σημαντικότερες διαλέκτους της κλασσικής εποχής ήταν η [[Αττική διάλεκτος]], που χρησιμοποιούνταν κυρίως στην [[Αθήνα]] αλλά και σα γλώσσα των [[φιλόσοφος|φιλοσόφων]] και των [[επιστήμονας|επιστημόνων]]. Η Αττική διάλεκτος προέρχεται από την [[Ιωνική διάλεκτος|Ιωνική]] (τη βασική διάλεκτο των Ομηρικών Επών) με αρκετές [[Δωρική διάλεκτος|δωρικές]] επιδράσεις. Υιοθετήθηκε σαν επίσημη γλώσσα όλης της Ελλάδας από το [[Φίλιππος Β'|Φίλιππο το Μακεδόνα]] και σαν επίσημη γλώσσα ολόκληρου του ελληνιστικού κόσμου από το γιο του [[Αλέξανδρος ο Μέγας|Αλέξανδρο]]. Από αυτήν προέρχονται απ' ευθείας σχεδόν όλες οι μεταγενέστερες ελληνικές διάλεκτοι. 22 | 23 | Αποτέλεσμα της χρήσης της αττικής διαλέκτου ως δεύτερης (και συχνά πρώτης) γλώσσας από πάρα πολλούς αλλόγλωσσους (αλλά και από ελληνόφωνους που μιλούσαν πρωτύτερα μια άλλη ελληνική διάλεκτο) ήταν σαρωτικές αλλαγές σε όλα τα επίπεδα της μορφολογίας της. Έτσι: 24 | 25 | *Η [ προφορά] άλλαξε ριζικά με κυριότερο χαρακτηριστικό την προφορά των ει, η, υ, υι ως "ι" ([[ιωτακισμός]]) και την απώλεια των φθόγγων F (w) και H (δασεία). 26 | *Ο [[Δυϊκός αριθμός]], το [[απαρέμφατο]] και η [[Μέση φωνή]] χάθηκαν. 27 | *Απλοποιήθηκε σημαντικά το σύστημα [[κλίση]]ς ονομάτων και ρημάτων. 28 | 29 | ===Ελληνιστική Κοινή=== 30 | Το αποτέλεσμα όλων αυτών των μεταβολών ήταν η Ελληνιστική Κοινή, η οποία μαρτυρείται κυρίως στην [[Καινή Διαθήκη]]. Είναι χαρακτηριστικό ότι την ίδια εποχή έχουμε και τους πρώτους Αττικιστές, αυτούς που θεωρούσαν απαραίτητη τη διατήρηση της "αυθεντικής" Αττικής Διαλέκτου, τουλάχιστον στο γραπτό λόγο. 31 | 32 | ===Μεσαιωνική Ελληνική=== 33 | Η Ελληνιστική Κοινή εξελίχθηκε στη Μεσαιωνική Ελληνική, η οποία μαρτυρείται κυρίως από δημοτικά τραγούδια. Τελευταία φωνολογική μεταβολή κατά το [[10ος αιώνας μ.Χ.|10ο αιώνα]] ήταν ο [[ιωτακισμός]] '''και''' του "οι" που ως τότε εξακολουθούσε να προφέρεται σα [[δίφθογγος]]. 34 | 35 | ===Νέα Ελληνική=== 36 | Τα όρια μεταξύ Νέας Ελληνικής και Μεσαιωνικής Ελληνικής δεν είναι ιδιαίτερα σαφή, πάντως τοποθετούνται χονδρικά κάπου στα τελευταία χρόνια του [[Βυζάντιο|Βυζαντίου]]. Κατά την περίοδο αυτή (καθώς και στην [[Τουρκοκρατία]]) είχαμε μία εξίσου έντονη διαλεκτική διαφοροποίηση η οποία συνεχίζονταν μέχρι πριν μερικές δεκαετίες. 37 | 38 | Η σημερινή Νέα Ελληνική (Δημοτική) περιγράφεται με αρκετή σαφήνεια στη [[Νεοελληνική Γραμματική του Μανόλη Τριανταφυλλίδη|Γραμματική]] του [[Μανόλης Τριανταφυλλίδης|Μανόλη Τριανταφυλλίδη]]. Η γραμματική της παραμένει αρκετά σύνθετη (ιδιαίτερα σε ό,τι αφορά το [[ρήμα]] όπου οι αρχαϊσμοί δε σπανίζουν καθόλου) και το λεξιλόγιό της είναι ιδιαίτερα πλούσιο. 39 | 40 | Έχουν ειπωθεί πολλά για την αξία της ελληνικής γλώσσας. Πολλά από αυτά είναι υπερβολές. Για παράδειγμα είναι γεγονός ότι χιλιάδες επιστημονικοί όροι στις ευρωπαϊκές γλώσσες είναι ελληνικά "δάνεια" (αν και οι περισσότεροι είναι όροι που φτιάχθηκαν από ξένους σε μια εποχή που τα ελληνικά ήταν η κατ' εξοχήν ακαδημαϊκή γλώσσα). Ίσως η αξία της Ελληνικής αποδίδεται καλύτερα από τον Οδυσσέα Ελύτη: 41 | 42 | ''Εδώ και τριάντα αιώνες, δεν υπήρξε ούτε ένας στον οποίο να μη γράφτηκε [[ποίηση]] στην Ελληνική Γλώσσα.'' 43 | 44 | ==Βλέπε Επίσης== 45 | * [[Γραμμική Α]] 46 | * [[Γραμμική Β]] 47 | * [[Καθαρεύουσα]] 48 | 49 | -------------------------------------------------------------------------------- /lib/training_data/en-iso-8859-1.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/en-iso-8859-1.txt -------------------------------------------------------------------------------- /lib/training_data/et-utf8.txt: -------------------------------------------------------------------------------- 1 | ''Artikkel vajab toimetamist'' 2 | 3 | Mõiste '''avalikud suhted''' tuleb ingliskeelsest sõnapaarist ''public relations'', lühendina PR. Sageli kasutatakse selle kõrval termineid '''avalikkussuhted''', '''üldsussuhted''' ja '''suhtekorraldus'''. 4 | 5 | Suhtekorraldus omab väga laia tegevushaaret ja sellepärast ei ole suudetud talle ühte ja ainuõiget [[definitsioon]]i leida. Järgnevalt on esitatud mitmeid erinevaid [[definitsioon]]e, milles on välja toodud suhtekorraldusele iseloomulikud jooned. 6 | 7 | 1948. aastal [[definitsioon|defineeris]] [[Avalike Suhete Instistuut]] (The Institute of Public Relations) suhtekorraldust kui planeeritud ja toetatud pingutusi hea tahte ja vastastikkuse mõistmise loomiseks ning säilitamiseks [[organisatsioon]]i ja [[avalikkus]]e vahel. 8 | 9 | Lihtsustatud kujul [[defitsioon|defineeris]] [[Avalike Suhete Instituut]] 1994. aastal suhtekorraldust järgmiselt: suhtekorraldus on [[reputatsioon]], mis on kujunenud selle põhjal, mida sa teed, mida sa ütled ja mida teised ütlevad sinu kohta – teisisõnu, suhtekorraldus on [[distsipliin]], mis aitab kujundada [[reputatsioon]]i eesmärgiga olla aktsepteeritud, nii saada kui anda tuge ning mõjutada arvamust ja käitumist. 10 | 11 | [[Mexico]]s 1978. aastal toimunud [[Ülemaailmne Suhtekorraldusühingute Assamblee|Ülemaailmsel Suhtekorraldusühingute Assambleel]] (World Assambly of Public Relations) töötasid suhtekorralduspraktikud välja järgmise [[definitsioon]]i: suhtekorraldus on [[kunst]] ja [[sotsiaalteadus]], mille eesmärk on analüüsida [[trend]]e, ennustada nende tähtsust ja tähendust, konsulteerida [[organisatsioon]]i liidreid ja viia täide tegevusprogramme, mis kajastaksid nii [[organistatsioon]]i kui [[avalikkus]]e huve. 12 | 13 | Rahvusvaheline [[Avalike Suhete Assosiatsioon]] [[definitsioon|defineeris]] 1987. aastal suhtekorraldust kui kogu [[organisatsioon]]i suhtlemisprotsessi pidevt ja plaanipärast [[juhtimine|juhtimist]] eesmärgiga saavautada mõistmine, toetus ja kontakt [[organistatsioon]]i või [[institutsioon]]i ning teatavate [[sihtgrupp]]idega, kellega on juba kontakt olemas või kellega soovitakse kontakti saada. Sealjuures väärtustatakse [[avalik arvamus|avalikku arvamust]] ning korrelegeeritakse sellega võimaluse piires oma tegevust nii, et etteplaneeritud ja laiahaardelise [[infovahetus]]e abil tagada tõhus koostöö ning ühiste huvide elluviimine. 14 | 15 | 16 | Suhtekorralduse peamiseks eesmärgiks on organisatsiooni eesmärkide saavutamine. 17 | 18 | 19 | '''Suhtekorralduse funktsioonid:''' 20 | 21 | 1) [[avalik arvamus|avaliku arvamuse]] ennetamine, analüüsimine, tõlgendamine; 22 | 23 | 2) [[organisatsioon]]i juhtkonna nõustamine mitmel alal ([[meediasuhted]], [[finantssuhted]], suhted töötajatega, suhted ametivõimudega); 24 | 25 | 3) [[organisatsioonisisene suhtekorraldus|organisatsioonisisese suhtekorralduse]] arendamine, teostamine ja planeerimine; 26 | 27 | 4) [[organisatsioon]]is teostavate programmide ja [[avalikkus]]ega suhtlemise uurimine, juhendamine ja hindamine, et saavutada viimase arusaam [[organisatsioon]]i eesmärkidest; 28 | 29 | 5) planeerimine või kaasa aitamine [[organisatsioon]]i püüdlustele mõjutada või muuta [[avalikkus]]e hoiakuid ja seisukohti [[organisatsioon]]ile soodsas ja soovitud suunas. 30 | 31 | 32 | 33 | 34 | 35 | == Ajalooline ülevaade == 36 | 37 | [[Informatsioon]]i edastamist vaadete või tegevuse mõjutamiseks võib täheldada varajastest [[tsivilisatsioon]]idest peale. Näiteks võib suhetekorralduse algelemente leida muistses [[India]]s, kus varases [[kirjasõna]]s viidati kuninga [[spioon]]idele, kelle ülesanne oli muuhulgas kuninga informeerimine rahva arvamusest, kuninga kaitsmine [[avalikkus]]e ees ja valitsusele soodsate kuulujuttude levitamine. 38 | 39 | Suhtekorraldus tänapäeva mõistes hakkas arenema 19. saj. lõpus. [[Ameerika]] kodusõjale järgnenud aastad tähistavad [[tööstus]]e ja [[ettevõtlus]]e tormilist arengut. 1889. aastal asutas [[Georges Westinghouse]] oma elektrikorporatsioonis esimese suhtekorraldusosakonna. 40 | Tänapäevasele tegevusele andis suure tõuke [[Esimene maailmasõda]] ja [[Ameerika]] [[president]] [[Wilson]]i asutatud [[Avaliku Informatsiooni Komitee]] (Committee on Public Information). Selle komitee ülesandeks oli mobiliseerida [[avalik arvamus]] sõja ja [[Wilson]]i rahueesmärkide toetuseks maal, mis oli sõja väljakuulutamise hetkeks lõhenenud. 1915. aastal asutasid seitse pankurit esimene avalike suhete organisatsiooni, [[Finantsreklaami Assotsiatsioon]]i (Financial Advertisting Association). 41 | 42 | Pärast [[Esimene Maailmasõda|Esimest maailmasõda]] tõusis märgatavalt ühiskonnateadlaste huvi suhtekorralduse vastu. Hoogustusid [[turu-uuring]]ud, sotsiaalsed ülevaated ja [[avalik arvamus|avaliku arvamuse]] küsitlused. 1921. aastal pidas oma esimese ülemaalilmse avaliku [[informatsioon]]i alase [[konverents]]i [[Ameerika Inseneride Assotsiatsioon]] (American Association of Engineers). 1923. aastal ilmus [[Edward L. Bernays]]` lt esimene raamat suhtekorraldusest “Avalikku arvamust kristalliseerides” (“Crystallizing Public Opinion”) [13]. Samal aastal pidas ta esimesd loengud suhtekorraldusest [[New Yorgi Ülikool]]is. Edward L. Bernays`lt pärineb ka mõiste avalike suhete ''(public relations)'' 43 | 44 | 1930- datel aastatel hakati üha enam rõhutama, et avalikud suhted toimivad tuginedes vastutustundelisel tegevusel ja veenval [[propaganda]]l. 30-date aastate alguses asusid tööle ka esimesed [[poliitiline kampaania|poliitilise kampaania]] spetsialistid. 1933. aastal asutasid [[Clem Whitaker]] ja [[Leone Baxter]] [[San Francisco]]s esimese poliitilistele kampaaniatele spetsialiseerunud agentuuri. [[Teise maailmasõja]]-aastad tõid suhtekorralduse peamise töövahendina esiplaanile [[reklaam]]i, mida kirjeldati väljenditega “avalike suhete reklaam'' (public relations advertising), “ühiskondliku teenindamise reklaam'' (public service advertising) või “institutsioonidele tehtav reklaam'' (institutional advertising). 1942. aastal asutati [[Sõjareklaami Nõukogu]] (War Advertising Council), mis töötas koos tööstuse ja [[valitsus]]ega. Selle nõukogu eesmärk oli [[reklaam]]ist võimsa vahendi kujundamine, mille abil panna inimesed sõja jaoks tootma, ratsioneerima nappivaid [[resurss]]e, ostma sõjavõlakirju ja teenima [[relvajõud]]udes. 45 | 46 | Pärast [[Teine maailmasõda|Teist maailmasõda]] suundus [[sõjatööstus]]ele orienteeritud [[majandus]] teeninduskesksusele, avalike suhete tähtsus tõusis ning kerkisid esile uued [[kommunikatsioonivahendid]]. Kirjutati suhtekorralduse teemalisi [[raamat]]uid ja artikleid. Loodi [[Rahvusvaheline Avalike Suhete Assotsiatsioon]] (International Public Relations Association). Sel ajajärgul edenes jõudsalt ka suhtekorraldus alane haridus. 1945. aastal hakati välja andma ajakirja “Public Relation Journal”, millest sai kaks aastat hiljem, 4. augustil 1947. aastal, loodud [[Ameerika Avalike Suhete Ühing]]u (The Public Relations Society of America/PRSA) kuukiri. 47 | 48 | Alates 1960-datest aastatest on suhtekorralduse funktsioonid pidevalt kasvanud tähtsuse ja keerukuse poolest. Suhtekorraldusest on saanud üks olulisemaid tegureid [[organisatsioon]]i ja [[riik|riigi]] arengul. 49 | 50 | [[Eesti]]sse jõudis aktiivsem suhtekorraldus 90-ndate aastate alguses koos [[turumajandus]]ega, kui firmades alustasid tööd suhtekorraldajad. Suhtekorralduse kui [[majandusharu]] tekkimise algust tähistab aga 1994. aasta, kui avalikult turule tuli esimene suhtekorraldusteenuseid pakkuv PR-firma. 1996. asutati [[Eesti Suhtekorraldajate Liit]], mis koondab ainsa [[organisatsioon]]ina [[Eesti]]s suhtekorralduse alal töötavaid inimesi. Samal aastal hakati [[Tartu Ülikool]]is õpetama suhtekorralduse eriala. 1996. alustati [[Tartu Ülikool]]is ka akadeemilise hariduse andmist suhtekorralduse erialal. 51 | -------------------------------------------------------------------------------- /lib/training_data/fa-utf8.txt: -------------------------------------------------------------------------------- 1 | {{تمیزکاری}} 2 | [[تصویر:تصویر ماهواره‌ای خليج‌پارس]] 3 | '''خليج پارس''' در امتداد [[دريای عمان]] و در میان [[شبه‌جزيره‌ی عربستان]] و [[ايران]] قرار دارد. مساحت آن ۲۳۳,۰۰۰ کيلومتر مربع است. از شرق از طريق [[تنگه‌ی هرمز]] و دريای عمان به [[اقيانوس هند]] و [[دريای عرب]] راه دارد، و از غرب به [[دلتای رودخانه|دلتای]]‌ رودخانه‌ی [[اروندرود]]، که حاصل پیوند دو رودخانه‌ی [[دجله]] و [[فرات]] است، ختم می‌شود. 4 | 5 | از [[زبان يونانی|يونانی]] اين خليج، «خليج [[پارس]]»، مورد استفاده‌ قرار مي‌گرفته که از نخستين شاهنشاهی مهم اين منطقه، [[شاهنشاهی پارس]] برگرفته شده است. در [[دهه‌ی ۱۹۶۰ ميلادی]] و با اوج گرفتن [[پان عربيسم]]، برخی از کشورهای عربی خليج فارس را با نام «خليج عربی» ياد کردند. ايران، به نوبه‌ی خود با تصويب دو قطع‌نامه در [[سازمان ملل متحد]]، نام خليج پارس را رسماً وارد اسناد اين سازمان کرد. قطع‌نامه‌ی نخستين به شماره‌ی UNAD 311/Qen در [[۵ مارس]] [[۱۹۷۱ ميلادی|۱۹۷۱]]، و مورد دوم به شماره‌ی UNLA 45.8.2 در [[۱۰ اوت]] [[۱۹۸۴ ميلادی|۱۹۸۴]] تصويب شدند. 6 | 7 | 8 | == '''خليج پارس،از دوران باستان، پارس نام داشته است''' == 9 | 10 | گروه فرهنگ، هستي پود فروش، 46 سال پيش در روز 13 مرداد ماه سال 1337 ايران به دليل تغيير نام خليج فارس به خليج عربي از سوي عراق و برخي ديگر از كشورهاي عربي و انگليس اعتراض خود را به دولت جديد عراق به رهبري قاسم كه با يك كودتاي نظامي بر سر كار آمده بود و تمايل به حركت هاي آزادي خواهانه مصر به رهبري جمال عبدالناصر داشت، اعلام كرد. 11 | 12 | '''خليج پارس''' نامي است به جاي مانده از كهن ترين منابع، زيرا كه از سده هاي قبل از ميلاد سر بر آورده است، و با [[پارس]] و [[فارس]] _ نام سرزمين ملت ايران _ گره خورده است. 13 | خليج فارس، درياي كم عمق و نيمه بسته اي است با مساحت حدود 240 هزار كيلومتر مربع كه در جنوب غربي قاره آسيا و در جنوب [[ايران]] قرار دارد. 14 | زمين شناسان معتقدند كه در حدود پانصد هزار سال پيش، صورت اوليه خليج فارس در كنار دشت هاي جنوبي ايران تشكيل شد و به مرور زمان، بر اثر تغيير و تحول در ساختار دروني و بيروني زمين، شكل ثابت كنوني خود را يافت. قدمت خليج فارس با همين نام چندان ديرينه است كه عده اي معتقدند: «خليج فارس گهواره تمدن عالم يا خاستگاه نوع بشر است.» ساكنان باستاني اين منطقه، نخستين انسان هايي بودند كه روش دريانوردي را آموخته و كشتي اختراع كرده و خاور و باختر را به يكديگر پيوند داده اند. اما دريانوردي ايرانيان در خليج فارس، قريب پانصد سال قبل از ميلاد مسيح و در دوران سلطنت داريوش اول آغاز شد. داريوش بزرگ،‌ نخستين ناوگان دريايي جهان را به وجود آورد. كشتي هاي او طول رودخانه سند را تا سواحل اقيانوس هند و درياي عمان و خليج فارس پيمودند، و سپس شبه جزيره عربستان را دور زده و تا انتهاي درياي سرخ كنوني رسيدند. او براي نخستين بار در محل كنوني كانال سوئز فرمان كندن ترعه اي را داد و كشتي هايش از طريق همين ترعه به درياي مديترانه راه يافتند. در كتيبه اي كه در محل اين كانال به دست آمده نوشته شده است: «من پارسي هستم. از پارس مصر را گشودم. من فرمان كندن اين ترعه را داده ام از رودي كه از مصر روان است به دريايي كه از پارس آيد پس اين جوي كنده شد چنان كه فرمان داده ام و ناوها آيند از مصر از اين آبراه به پارس چنان كه خواست من بود.» 15 | داريوش در اين كتيبه از خليج فارس به نام «دريايي كه از پارس مي آيد» نام برده است و اين نخستين مدرك تاريخي است كه درباره خليج فارس موجود است. 16 | اولين بار يوناني ها بودند كه اين خليج را «پرسيكوس سينوس» يا «سينوس پرسيكوس» كه همان خليج فارس است، ناميده اند. از آنجا كه اين نام براي اولين بار در منابع درست و معتبر تاريخي كه غير ايرانيان نوشته اند آمده است، هيچ گونه شائبه نژادي در وضع آن وجود ندارد. چنان كه يونانيان بودند كه نخستين بار، سرزمين ايران را نيز «[[پارسه]]» و «[[پرسپوليس]]» يعني شهر يا كشور پارسيان ناميدند. استرابن جغرافيدان قرن اول ميلادي نيز به كرات در كتاب خود از خليج فارس نام برده است. وي محل سكونت اعراب را بين درياي سرخ و خليج فارس عنوان مي كند. همچنين «فلاريوس آريانوس» مورخ ديگر يوناني در كتاب تاريخ سفرهاي جنگي اسكندر از اين خليج به نام «پرسيكون كيت» كه چيزي جز خليج فارس، نيست نام مي برد. 17 | البته جست و جو در سفرنامه ها يا كتاب هاي تاريخي بر حجم سندهاي خدشه ناپذيري كه خليج فارس را «خليج فارس» گفته اند، مي افزايد. اين منطقه آبي همواره براي ايرانيان كه صاحب حكومت مقتدر بوده اند و امپراطوري آنها در قرن هاي متوالي بسيار گسترده بود هم از نظر اقتصادي و هم از نظر نظامي اهميت خارق العاده اي داشت. آنها از اين طريق مي توانستند با كشتي هاي خود به درياي بزرگ دسترسي پيدا كنند و به هدف هاي اقتصادي و نظامي دست يابند. 18 | آثار عرب زبان نيز بهترين و غني ترين منابعي هستند كه براي شناسايي و توجيه كيفيت تسميه اين دريا مي تواند در اين بررسي مورد استفاده قرار گيرد. در اين منابع و آثار از درياي فارس و چگونگي آن بيش از آثار فرهنگي موجود در هر زبان ديگري گفت و گو شده است. تمام كساني كه نسبت به متون دوره اسلامي شناختي حداقل داشته باشند با نام مسعود ابن بطوطه، حمدالله مستوفي، ياقوت حموي، حمزه اصفهاني، ناصرخسرو قبادياني، ابوريحان بيروني، ابن بلخي وديگراني كه اكثر آنان كتاب هاي خود را به زبان عربي نيز نوشته اند، آشنا هستند. گذشته از متقدمان نامبرده مي توان از نويسندگان عرب متاخر نيز نام برد كه در آثار خود از نام «خليج فارس» بدون كم و كاست ياد كرده اند. 19 | 20 | 21 | == سابقه جعل عنوان خليج == 22 | 23 | درباره نام خليج فارس تا اوايل دهه 1960 ميلادي هيچ گونه بحث و جدلي در ميان نبوده و در تمام منابع اروپايي و آسيايي و آمريكايي و دايرة المعارف ها و نقشه هاي جغرافيايي اين كشورها نام خليج فارس در تمام زبان ها به همين نام ذكر شده است. 24 | اصطلاح «خليج عربي» براي نخستين بار از طرف يكي از نمايندگان سياسي انگليس در خليج فارس به نام «سر چارلز بلگريو» عنوان شده و در واقع او بوده است كه به قصد تفرقه بين ايران و كشورهاي عرب اين تخم لق را در دهان اعراب شكسته است. سر چارلز بلگريو كه بيش از 30 سال نماينده سياسي و كارگزار دولت انگليس در خليج فارس بوده است، بعد از مراجعت به انگلستان در سال 1966 كتابي درباره سواحل جنوبي خليج فارس منتشر كرد و در آن براي اولين بار نوشت كه «عرب ها ترجيح مي دهند خليج فارس را خليج عربي بنامند». اين نماينده قطعا قبل از انتشار كتاب و مراجعت به انگلستان در تماس با مقامات امارات جنوبي خليج فارس اين فكر را در آنها القا كرده است و تصادفي نيست كه بلافاصله پس از انتشار كتاب سرچارلز بلگريو كه نام قبلي سواحل جنوبي خليج فارس يعني «ساحل دزدان» را بر روي كتاب خود نهاده اصطلاح «الخليج العربي» در مطبوعات كشورهاي عربي رواج پيدا كند و در مكاتبات رسمي به زبان انگليسي نيز اصطلاح «آرابيان گولف» جايگزين اصطلاح معمول و رايج قديمي «پرشين گولف» مي شود. 25 | دولت ايران در همان زمان در برابر اين نام مجعول عكس العمل نشان داد و گمرك و پست ايران از قبول محموله هايي كه به جاي خليج فارس نام خليج عربي بر روي آن نوشته شده بود، خودداري كرد. ايران همچنين در مجامع و كنفرانس هاي بين المللي نيز در صورت به كار بردن اين اصطلاح ساختگي از سوي نمايندگان كشورهاي عرب عكس العمل نشان مي داد. در اين زمان بعضي از كشورهاي عربي حتي اعتبار هنگفتي از محل درآمدهاي كلان نفتي خود در اختيار بعضي از ماموران سياسي در خارج مي گذاردند تا با تطميع مطبوعات خارجي نام مجعول خليج عربي را به جاي خليج فارس رواج بدهند. 26 | در نيمه نخست بهمن ماه سال 1370 شمسي سر ويراستار سازمان ملل متحد با اشاره به اعتراض هاي پياپي نمايندگان ايران در آن سازمان به استفاده از نام ساختگي خليج عربي در اسناد اين سازمان از كاركنان سازمان ملل خواسته تا اعتراض دولت ايران را هميشه در نظر داشته باشند. كار به جايي رسيد كه در يازدهم شهريور ماه سال 1371 هنگامي كه حيدر ابوبكر العطاس نخست وزير جمهوري يمن در اجلاس سران جنبش عدم تعهد كه در جاكارتا پايتخت اندونزي برگزار مي شد، از نام ساختگي خليج عربي استفاده كرد، با اعتراض شديد نمايندگان ايراني رو به رو شد. او سرانجام از نمايندگان ايران عذرخواهي كرد. و اين عمل را غير عمد خواند. همچنين در سال 1337 شمسي در روز 13 مرداد دولت ايران به رژيم عراق «عبدالقاسم» مبني بر تغيير دادن نام خليج فارس به خليج عربي اعتراض كرد. 27 | 28 | 29 | == هدف انگليس از نام گذاري ساختگي خليج فارس == 30 | 31 | انگليس ها نخستين عاملان كاشته شدن اين تخم نفاق بودند زيرا از قديم در صدد بودند كه خليج فارس را تبديل به يك درياي انگليسي كنند. بعدها در دهه 1980 آمريكايي ها هم به پيروي از آنها از تبديل خليج فارس به خليج آمريكايي سخن گفتند. از نظر آمريكايي ها و اروپايي ها اين منطقه «شريان حياتي غرب» در منطقه «استراتژيك غربي» و «حوزه منافع ويژه» است، لذا اگر قادر باشند خليج فارس را به طور مستقيم يا غير مستقيم تحت تسلط خود در مي آورند. 32 | اما واقعيت مطلب اين است كه خليج فارس يك نام كهن تاريخي است كه از بدو تاريخ بر روي اين خليج گذاشته شده است و انگيزه تلاش حساب شده اي كه براي تغيير اين نام به عمل مي آيد جز ايجاد فتنه و اختلاف بين كشورهاي اين منطقه نيست. همچنان كه «ژان ژاك پريني» نويسنده كتاب خليج فارس اعتراف مي كند. «ملل و طوايف بسياري بر كرانه هاي خليج فارس استيلا يافته و فرمانروايي كرده اند ولي روزگارشان سپري شده و منقرض شده اند. تنها قوم [[پارس]] است كه با هوش و درايت خود همچنان پا برجا زيسته و ميراث حاكميت خود را تاكنون نگهداري كرده است.» 33 | 34 | خليج فارس _ پيروز مجتهدزاده 35 | 36 | جغرافياي تاريخي 37 | 38 | خليج فارس _ محمود طلوعي 39 | 40 | 41 | 42 | ==پیوند‌ به بیرون== 43 | -------------------------------------------------------------------------------- /lib/training_data/fy-utf8.txt: -------------------------------------------------------------------------------- 1 | 2 | De '''Twadde Wrâldkriich''', dy't duorre fan [[1939]] oant [[1945]], wurdt sa neamd omdat it de twadde oarloch wie dêr't lannen fan sawat alle kontininten by belutsen wiene. Sawol de earste as de twadde wrâldkriich wiene oarloggen fan in skealje dy syn fergeliking net hat. Yn de 2e wrâldkriich lieten sa'n 55 miljoen minksen it libben. De massamoard op 6 miljoen joaden, meast de [[holokaust]] neamd, troch [[Adolf Hitler]] initiearre en troch [[Heinrich Himmler|Himmler]] en oaren organisearre, is foar in soad minksen in ûnferjitlik trauma bleaun. 3 | 4 | It haadstriidtoaniel wie Europa mar ek Aazje waard bot troffen. De oarloch wreide him út nei de wrâldseeën. De agressors Dútslân, Itaalje en Japan foarmen in pakt. De lannen dy't meiïnoar de tsjinoanfal ynsetten wienen ûnder oaren de [[Feriene Steaten fan Amearika|Feriene Steaten]], [[Grut-Brittanje]], [[Kanada]] en [[Austraalje]]. Sy foarmen in bûnsgenoatskip, koartwei de [[Alliearden]] neamd, stipe troch de measte besette gebieten. 5 | 6 | Foar Nederlân duorre dizze oarloch fan [[10 maaie]] [[1940]] oant [[5 maaie]] 1945. 7 | 8 | == Jeropa == 9 | Twa lannen mei in [[Faksistysk]] regear, [[Dútslân]] en [[Itaalje]], stribben nei 1935 nei gebietsútwreiding. Om't de oare lannen fan Jeropa in hege priis betelje woenen foar frede slagge it Itaalje om [[Etioopje]] en [[Albaanje]], en Dútslân om [[Eastenryk]] en [[Tsjechoslowakije]] yn te nimmen. Mar doe't Dútslân [[Poalen]] binnenfoel ferklearren [[Frankryk]] en Grut-Brittanje Dútslân de oarloch. 10 | 11 | Dútslân en Itaalje oerweldige [[Denemark]], [[Noarwegen]], [[Belgje]], [[Nederlân]], [[Luksemboarch]], [[Frankryk]], [[Jûgoslaavje]] en [[Grikelân]], en krigen [[Hongarije]], [[Bulgarije]] en [[Roemeenje]] as [[bûnsgenoaten]]. De lêste aggressor wie Ruslân dat ek Poalen binnenfoel, [[Estlân]], [[Letlân]] en [[Litouwen]] oerweldige en parten fan [[Finlân]] en Roemeenje ynnaam. [[Sweden]] en [[Switserlân]] bleaunen frij, mar joegen al stipe oan Dútslân, lykas [[Turkije]]. Dútslân en Itaalje oerweldigen ek koloanjes fan harren tsjinstanners yn Noard-Afrika. 12 | 13 | Yn [[1941]] foel [[Dútslân]] [[Ruslân]] oan, dat dêrmei oan de kant fan Grut-Brittanje kaam. Yn [[1942]] waard dúdlik dat Dútslân Ruslân net oerweldigje koe, mar dochs ferklearre Dútslân ek de [[Feriene Steaten fan Amearika]] de oarloch, dyt dêrmei part fan de Alliearden waarden. Yn [[1943]] waarden de koloanjes yn Afrika befrijd en Itaalje oerweldige. Yn [[1944]] oerweldige Ruslân Finlân, Bulgarije en Roemeenje, en befrijde Hongarije, wylst Jûgoslaavje himsels befrijde. Turkije begûn gear te wurkjen mei de Alliearden. Troch twa ynfaasjes yn Frankryk waarden ek Frankryk en Belgje befrijd. Yn [[1945]] waarden de oare lannen befrijd en Dútslân ferslein. 14 | 15 | == Aazje == 16 | Nei it iepenbrekken fan [[Japan]] yn de [[19e ieu]] ûntwikkele dat lân him yn it easten fan Aazje ta in grutmacht. Mar it moast hieltiid noch akseptearje dat de Westerske grutmachten Aazje oerhearsken. Yn [[1931]] naam Japan [[Mantsjoerije]] yn en nei fierdere Japanske aksjes kaam it yn [[1937]] ta in net-ferklearre oarloch tusken Japan en [[Sina]]. Yn [[1940]] seiden de FS harren hannelsferdrach mei Japan op, en Japan fûn nije bûngenoaten yn Dútslân en Itaalje. Yn [[1942]] hie Japan de oermacht op see, en ferdreau de Westerske machten út East- en Súdeast-Aazje. 17 | 18 | It offensyf om ek [[Austraalje]] te oerweldigjen slagge lykwols net, en yn [[1943]] wienen it de FS dy't de oerhân op see hienen. Yn [[1944]] waard dit oerwicht folslein en waarden de eilannen yn de [[Stille Oseaan]] befrijd. Yn [[1945]] waarden de oare besette gebieten befrijd troch Japan ta oerjefte te twingen. 19 | 20 | == Aard == 21 | Mei de Twadde Wrâldkriich wie de ûntwikling dy't begûn wie troch [[Napoleon]] folslein wurden. Net langer waard der besocht in leger fan de tsjinstanner út te skeakeljen; yn stee dêrfan waard besocht gebiet yn te nimmen, mei alle middels dy't nedich wienen. Gefolgen hjirfan wienen in langduorjende besetting, de oerhearsking, en it ferset, fan de oarspronklike befolkingen, en in gefjocht dat yn elts doarp, en somtiden elts hûs, útfjochten waard. Ek de ein fan de oarloch wie hjir in demonstraasje fan. De Feriene Steaten bombardearren [[Hirosjima]] en [[Nagasaki]] yn Japan, net om't de tsjinstanner dêr legere wie, mar allinnich om sa folle skea oan te rjochtsjen dat Japan kapitulearje soe. 22 | 23 | -------------------------------------------------------------------------------- /lib/training_data/hi-utf8.txt: -------------------------------------------------------------------------------- 1 | '''विकिपीडिया''' एक मुक्त [[ज्ञानकोष]] है जो दुनिया भर के इसके योगदानकर्ताओ द्वारा लिखा जा रहा है । 2 | यह् स्थल एक [[विकिविकि]] है जिसका मतलब है कि कोई भी - आप भी - किसी भी लेख को ''इस पन्ने को बदलें'' कडी (जो सभी लेखों में मौजूद है केवल कुछ सुरक्षित पन्नों को छोड़कर) को क्लिक करके अभी बदल सकते हैं । 3 | 4 | == विकिपीडिया को ब्रौज़ करना == 5 | 6 | अंग्रेज़ी विकिपीडिया] में सभी किस्म के विषयों पर बहुत सारी जानकारी है । हिन्दी विकिपीडिया को ब्रौज़ करने के लिये [[मुख्य पृष्ठ]] पर जाईये, एक विषय ढूँडिये जिसमें आप को रुचि हो, और शुरु करें एक्सप्लोर करना । हर एक पन्ने के ऊपर एक खोज डब्बा भी है । 7 | 8 | अगर आप कुछ पढें, और आपको पसंद आए, तो क्यों न उस लेख के [[विकिपीडिया:वार्ता पन्नें|वार्ता पन्ने]] पर एक सन्देश छोडें? पहलें ''इस पन्ने के बारे में बात करें'' कडी को चुने जो आपको वार्ता पन्ने पर ले कर जाएगी । फ़िर ''इस पन्ने को बदलें'' कडी को चुनें | 9 | 10 | अगर कुछ ऐसा है जो हमने कवर नहीं किया है अथवा अगर आपको जो चाहिये वह दूँढने में परेशानी हो रही हो, तो हमें [[विकिपीडिया:रेफ़रन्स डेस्क|रेफ़रन्स डेस्क]] पर पूछें या वह विषय [[विकिपीडिया:माँगे हूए लेख|माँगे हूए लेख]] पर डाल दें । 11 | 12 | == बदलाव करना == 13 | 14 | विकिपीडिया के पन्ने सबलोग बदल सकतें हैं (यह पन्ना भी)। अगर आपको ऐसा लगे की पन्ने में सुधार की आवश्यकता है तो पन्ने के ऊपर या नीचे मौजूद ''इस पन्ने को बदलें'' कडी को चुने । आपको लॉगिन करने की भी आवश्यकता नहीं है । 15 | 16 | मदद करने की शुरुआत करने का एक सरल मार्ग है विकिपीडिया का उपयोग उसी तरह करें जैसे आप किसी भी ज्ञानकोष को करेंगे, पर जब आपको कोई समस्या दिखें - स्पेलिंग में गलती, शायद, या कोई अस्पष्ट वाक्य - तो "इस पन्ने को बदलें" कडी को क्लिक करें और समस्या का समाधान करें । [[विकिपीडिया:पन्नों को बदलने में संकोच ना करें|पन्नों को बदलने में संकोच ना करें]]; अगर किसी पन्ने को सुधारने का आपको कोई मार्ग दिखे, तो उसे सुधारे । गलतियाँ करने के बारे में ज़्यादा चिंता न करें; जब आप वाकई कोई गलती करे, तो आप, या कोई और, बादमें उसे सुधार सकता है । आप को यह डरावना लग सकता है ! पर यह सिस्टम फ़िर भी चलता है । 17 | 18 | हिन्दी विकिपीडिया में लेख लिखने के लिये आप जैसे लोगों की आवश्यकता है । आप [[विकिपीडिया:नया पन्ना कैसे शुरु करें | एक नया पन्ना शुरु कर सकतें है]] या आप कोई भी लेख को बदल सकतें है या बढा सकते है । अगर आपको चिंता है कि आप किसी लेख को बिगाड देंगे, तो [[विकिपीडिया:प्रयोगस्थल |प्रयोगस्थल]] में जाकर जितना जी चाहें पन्ना बदलने का प्रयोग कर सकते है । 19 | 20 | विकिपीडिया के लेख [[विकिपीडिया:निष्पक्षता:निष्पक्ष]] होने चाहिये, अलग अलग पहलुओं को पेश करना चाहिये । 21 | विकिपीडिया को दिये गये सभी योगदान के अन्तर्गत होने चाहिये । अधिक जानकारी के लिये [[विकिपीडिया:कोपिराइट]] देखें । 22 | 23 | उम्मीद है कि विकिपीडिया को योगदान देने में आपको मज़ा आयेगा । 24 | 25 | ==क्या आप जुडना चाहते हैं?== 26 | 27 | कोई भी बदलाव कर सकता है, यह तो है, पर अकाउंट बनाने के [[विकिपीडिया:अकाउंट क्यूँ बनाये?|फ़ायदे]] हैं अगर आपको नियमितता से योगदान देना है | अगर आपको जुडना है, तो [[Special:Userlogin|अकाउंट बनाए]] और [[विकिपीडिया:नये सदस्य लोग|नये सदस्य लोग]] में अपना परिचय दें (परिचय देना आवश्यक नहीं है) । 28 | 29 | == यह भी देखें == 30 | 31 | अधिक जानकारी के लिये यह कुछ कडियाँ है: 32 | 33 | === मदद === 34 | 35 | *[[विकिपीडिया:विकिपीडिया के बारे में|प्रोजेक्ट के बारे में]] 36 | *[[विकिपीडिया:सहायता|सहायता के पन्ने]] - बदलाव करने पर मदद, नये लेख कैसे बनाये, और कई और विषय 37 | *[[विकिपीडिया:अक्सर पूछे जाने वाले सवाल|विकिपीडिया अक्सर पूछे जाने वाले सवाल]] - विकिपीडिया के बारे में अक्सर पूछे जाने वाले सवाल 38 | *[[विकिपीडिया:शब्दकोष|शब्दकोष]] - विकिपीडिया में उपयोग किये गये शब्दों का शब्दकोष 39 | 40 | === विकिसिविक्स का मिनिसिरीस === 41 | ====ट्युटोरियल विभाग ==== 42 | *''[[विकिपीडिया:विकिक्वेट|विकिक्वेट]]'' 43 | *''[[विकिपीडिया:निष्पक्षता|निष्पक्षता]]'' 44 | *''[[विकिपीडिया:विकिपीडिया को योगदान देना|योगदान देना]]'' 45 | 46 | === विकिपीडिया समाज === 47 | 48 | *[[विकिपीडिया:हमें सम्पर्क करें|हमें सम्पर्क करें]] 49 | *[[विकिपीडिया:विकिपीडियन|विकिपीडियन]] 50 | -------------------------------------------------------------------------------- /lib/training_data/hr-utf8.txt: -------------------------------------------------------------------------------- 1 | '''Drugi svjetski rat''' ([[1. rujna]] [[1939]]. - [[2. rujna]] [[1945]].) je međunarodni sukob koji je izbio 21 godinu nakon Velikog Rata (vidi [[Prvi svjetski rat]]). Vođen je na tri kontinenta i svim svjetskim oceanima, u njemu su sudjelovale gotovo sve države koje su tada postojale. [[Rat]] je počeo napadom [[Adolf Hitler|Hitlerove]] [[Njemačka|Njemačke]] na Poljsku, a okončan je kapitulacijom [[Japan|Japana]]. 2 | 3 | Procjenjuje se da broj stradalih ljudi u 2. sv. ratu iznosi nešto manje od 55 milijuna, što ga čini jednom od [[Najveće svjetske katastrofe|najvećih svjetskih katastrofa]]. 4 | 5 | 6 | == Uvod u rat, uzroci i povod == 7 | 8 | === Uzroci === 9 | 10 | Vidi [[Uzrok i povod - razlika]] za pojašnjavanje samih termina.
11 | Uzroci osvajačkih ratova su uvijek isti, teritorijalne pretenzije i izrabljivanje ili istrijebljivanje (vidi [[Genocid]]) drugih naroda. Države koje su izgubile prvi svjetski rat su s vremenom dovoljno ojačale da mogu krenuti ponovo, ovaj put uspješno (izlika onih koji gube) u ratni pohod. Tu se posebno isticala Hitlerova Njemačka, jer to mu je bila jedina želja, a otkad je postao kancelar ništa mu nije stajalo na putu. 12 | Njemačka je [[1918.]] bila poražena, [[Versajski ugovor|Versajskim ugovorom]] iz 1919. teritorijalno je smanjena, i sve čemu se težilo bila je ekspanzija, koja je djelomično ostvarena i prije početka rata zbog pasivnosti [[Saveznici|Saveznika]]. 13 | 14 | === Uvod u rat, širenje Njemačke === 15 | 16 | Njemačka se logično mogla širiti na ona područja gdje žive Nijemci, ili ljudi koji govore njemački jezik. U to doba bila je to Austrija, dio Češke, dio Poljske, dio Francuske (pokrajine Saar, Alzas i Lotaringija), i [[Adolf Hitler]] je čvrsto naumio sva ta područja vratiti matici Njemačkoj. U prvom poglavlju [[Mein Kampf|Mein Kampfa]] stoji da je ujedinjenje Austrije i Njemačke jedan od najbitnijih zadataka. 17 | 18 | ==== Mirnodobsko prekrajanje granica ==== 19 | 20 | Kao prvi dio svoje strategije pripajanja područja sa njemačkim narodom koji je sačinjavao većinu, Njemačka država započela je sa svojom propagandom i lobiranjem i insistiranjem za raspisivanje referenduma. 21 | 22 | Prvi uspjeh bilo je pripajanje pokrajine Saar. Referendumom [[13. siječnja]] [[1935.]] 91% stanovnika Saara glasovao je za pripojenje Njemačkoj, čime je Njemačka dobila rudnike ugljena. 23 | 24 | Izdvajanje Bohemije. 25 | 26 | Pripajanje Austrije. 27 | 28 | === Povod === 29 | 30 | Povod za rat bio je lažni napad Poljske na njemačku radio-stanicu u Gleiwitzu, koji su izveli Nijemci u poljskim uniformama. 31 | 32 | == Prva faza - veliki uspjesi agresora == 33 | 34 | Države koje su sudjelovale u 2. svjetskom ratu su sudjelovale ili na strani [[Saveznici|Saveznika]] ili [[Sile osovine|"sila osovine"]]. U prvoj fazi rata agresor je imao priličan uspjeh, strategija "munjevitog rata" (''blitz-krieg'') bila je iznimno uspješna. 35 | Rat je počeo u rano jutro [[1. rujna]] [[1939]]. napadom Njemačke na Poljsku. U nedjelju [[3. rujna]] diplomatskom notom Velika Britanija je objavila rat Njemačkoj. Istog dana njemačka je mornarica imala prvi plijen: podmornica U-30 torpedirala je putnički brod "Athenia". Francuska je predala diplomatsku notu u nedjelju, a ratno stanje po njoj je nastupilo sutradan, [[4. rujna]] 1939. godine. 36 | 37 | === Poljska, Finska, Norveška, Danska === 38 | 39 | U Poljskoj su se tenkovi borili protiv konjice, jednostavno nisu imali šanse. Poljsko zrakoplovstvo uništeno je u prva dva dana rata. [[Krakow]] je osvojen [[6. rujna]], a dva dana kasnije njemačke trupe bile su na prilazima [[Varšava|Varšave]]. Do [[17. rujna]] 35 poljskih divizija bilo je ili uništeno ili opkoljeno. Podjelom Poljske sa Staljinovim SSSR-om [[28. rujna]] Poljska je nestala kao država. 40 | 41 | Slijedeću veću ratna akciju nije izvela Njemačka, već [[SSSR]] koji je [[30. studenog]] 1939. napao [[Finska|Finsku]]. 42 | 43 | [[9. travnja]] [[1940]]. izvedena je pomorska invazija Njemačke na [[Norveška|Norvešku]] i [[Danska|Dansku]], Danci su se predali, a njemački ratni stroj zagrizao je novu žrtvu. Norveška je kapitulirala [[10. lipnja]] 1940. godine, dakle operacije su trajale dva mjeseca, mjesec dulje nego što je trajalo u Poljskoj. 44 | 45 | === Belgija, Nizozemska, Luksemburg, Francuska === 46 | 47 | [[10. svibnja]] [[1940]]. zemlje Beneluksa došle su na dnevni red. Nizozemska je osvojena praktično desantnim snagama i bombardiranjem Rotterdama. Kapitulacija je potpisana [[15. svibnja]], pet dana poslije početka operacije. Belgija se predala [[28. svibnja]]. Nijemci su probili francusku frontu po sredini, i ulovili sjeverni dio francuske vojske, Britanski ekspedicioni korpus i belgijsku vojsku u klopku, probijanje je počelo 14. svibnja, opkoljavanje je završeno šest dana kasnije. Tad je Hitler dozvolio Britancima da se izvuku, poznata je [[Bitka kod Dunkirka|evakuacija kod Dunkirka]]. Počela je 27. svibnja, a završila 4. lipnja. Spašeno je preko 330 tisuća vojnika. [[14. lipnja]] Nijemci su ušli u Pariz, koji Francuzi nisu branili. [[10. lipnja]] i Mussolinijeva [[Italija]] ušla je u rat napadom na Francusku, ali usprkos 32 divizije nisu se baš iskazali. Francuska se predala [[22. lipnja]] 1940. Time je završio njemački blitz-krieg, pokazala se slabost Italije kao njemačkog saveznika, a ono što slijedi je druga faza rata, u kojoj nije sve išlo baš onako kako je Hitler planirao. 48 | 49 | 50 | == Druga faza rata == 51 | 52 | === Bitka za Britaniju === 53 | 54 | Dok je okršaj kod Dunkirka bio zapravo izvlačenje odsječenih Savezničkih snaga koje nisu imale pozadinu pa se nisu ni ozbiljnije sukobile, [[bitka za Britaniju]] je prvi okršaj drugog svjetskog rata koji je Hitlerova Njemačka izgubila. Operacije su počele 12. kolovoza njemački bombardiranjem, a bitka je završila 15. rujna (njemačka avijacija je nastavili s noćnim bombardiranjem Londona do 3. studenog, no to je bio Hitlerov odušak za izgubljenu bitku). 55 | 56 | === Rusija je došla na red - operacija Barbarossa === 57 | 58 | 59 | 60 | 61 | == Bitke 2. svjetskog rata == 62 | 63 | === Kopnene i zračne bitke === 64 | 65 | * [[Bitka kod Dunkirka]] 66 | * [[Bitka za Britaniju]] 67 | * [[Bitka za Kretu]] 68 | * [[Operacija Barbarossa]] 69 | * [[Bitka za Moskvu]] 70 | * [[Bitka kod Kurska]] 71 | * [[Bitka za Staljingrad]] 72 | * [[Prva bitka kod El Alameina]] 73 | * [[Druga bitka kod El Alameina]] 74 | * [[Bitka za Normandiju]] ili ''Operacija Overlord'' 75 | * [[Operacija Market Garden]] (Bitka za Arnhem) 76 | * [[Bitka kod Monte Cassina]] 77 | * [[Bitka u Ardenima (1944)]] 78 | * [[Bitka za Berlin]] 79 | * [[Bitka za Iwo Jimu]] 80 | * [[Bitka za Okinawu]] 81 | -------------------------------------------------------------------------------- /lib/training_data/hu-iso-8859-2.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/hu-iso-8859-2.txt -------------------------------------------------------------------------------- /lib/training_data/io-utf8.txt: -------------------------------------------------------------------------------- 1 | [[Wikipedio:Pagini revizinda|Revizo bezonata]] 2 | 3 | '''Soviet-Uniono''', Sovietia, Uniono di Socialista Soviet-Republiki (''Soyuz Sovetskih Socialisticheskih Respublik, SSSR'') esis [[stato]] quo existis de [[1922]] til [[1991]]. Ol esis unesma komunista stato, en quo nur komunista partiso esis posibla. 4 | 5 | Soviet-Uniono jacis en [[Europa]] ed [[Azia]]. Chefurbo esis [[Moskva]]. Dum lua existo lua areo kreskis, ma omnatempe ol esis la maxim granda stato en [[mondo]]. Quar statala formacuri fondis Soviet-Uniono, ma, dum fino di lua existo, Soviet-Uniono konsistis ek 15 [[Sovieta-republiko|sovieta-republiki]]. Krulante ol havis areo de 22,4 milioni km2. Tatempe populeso esis plu kam 300 milioni. 6 | 7 | Soviet-Uniono ed anke [[Ukrainia]] e [[Bielorusia]] esis membro di [[Unioninta Nacioni]]. Pluse Soviet-Uniono esis permanenta membro di Sekureso-Konsilero(?) di Unioninta Nacioni. Nuna federativa republiko di [[Rusia]] esas epigono di Soviet-Uniono. 8 | 9 | ==Ante Soviet-Uniono== 10 | En [[Rusia]] [[Regnanto di Rusia|cari]] administris lando despotale. Dum regno di Nikolai 2ma populo ofte revoltis demandante plu demokratio e libereso. Quankam la caro ne voluntis igar chanji en la socio. En [[1906]] la populo revoltis ed igis caro fondar [[senato]], dumo, ma pokope la dumo perdis lua povo retroe a caro. Sociala ne-egaleso efektigis, ke extremista-sinistra idei ganis vasta suporto che povra populo. 11 | 12 | Ye [[1914]] komencis [[unesma mondo-milito]], en quo anke Rusia patroprenis. La populo fatigeskis pro la milito ed esis nekontenta a caro. Revolucionala idei ardoris che soldati ed agrokultivisti. Ye [[1917]] en februaro la revoluciono explozis e la caro esis impulsita rezignar. La dumo e provizora rejimo da [[Kerenski, Aleksandr|Kerenski]] kaptis povo, ma ol prolongis la milito. La stando en lando permanis tensa ed en oktobro (segun anciena kalendaro, nun novembro) mikra grupo di komunisti kaptis povo. Pose l’ evento nomesis la Granda Oktobrala Revoluciono. 13 | 14 | Revolucionero [[Vladimir Lenin]] e bolsheviki (komunisti) komencis administrar ma li recevis vasta rezisto. En Rusia interna milito sangoza inter le Reda (socialisti) e le Blanka (caristi) komencis. Parti ek anciena imperio di Rusia ([[Polonia]], [[Finlando]], [[Estonia]], [[Latvia]], [[Lituania]] ed [[Ukrainia]]) aspiris a nedependeso. La populi di naskinta stati partoprenis la milito en multa maniero: samatempe ca militi esis militi pro propra nedependeso e generale kontra sinistristi. En Rusia bolsheviki fondis [[Red-Armeo]] quo pos nemulta yari, en 1922, vinkis la Blanki e koalisinta povi. 15 | 16 | ==Unesma yari di Soviet-Uniono== 17 | Rusia, Ukrainia, Bielorusia e soviet-republiki di Transkausia fondis ye [[30 di decembro]] en [[1922]] Soviet-Uniono, quo divenis unesma komunista stato en mondo. Ye [[1925]] unionis su anke [[Turkmenistan]] ed [[Uzbekistan]] e ye [[1929]] [[Tadjikistan]]. 18 | 19 | Lenin mortis ye [[1924]], ed on komencis administrar la stato kolegiale. Quankam reale [[Lev Trocki]] e [[Yosif Stalin]] kombatis pro povo. Trocki deziris extensar revoluciono en tota mondo ma Stalin pensis krear socialismo en un stato. Stalin vinkis la kontesto pro povo e finale Trocki esis exilita. Ganinte povo Stalin komencis administrar kom despoto. 20 | 21 | Stalin modernigis l’ agrala stato. On socialigis l’ agrokultivo kreante sovhozi (di stato) e kolhozi (kolektivala). Ca ago efektigis famino en lando, e nulu savas, quante homi mortis pro hungro. Giganta centri industriala fondesis e lando urbizis. Stalin kreis totalitara(?) stato kun sekreta servo (NKVD, GPU, pose KGB). En Soviet-Uniono omna suspektis altru pro anti-sovieta ago. En paranoya atmosfero homi esis arestita e sendita a koncentreyi o simple exekutita. En arkipelago di koncetreyi (GULAG) multa homi mizeris multa yari. 22 | 23 | ==Soviet-Uniono dum duesma mondomilito== 24 | Ante [[duesma mondo-milito|mondomilito]] Soviet-Uniono demandis arei en lua westala landi ([[Finlando]], [[Estonia]], [[Latvia]], [[Lituania]]) por protektar su kontra nacista [[Germania]]. Mikra Baltika stati esis forcita donar a Soviet-Uniono bazi e portui, ma Finlando ne esis voluntario donar lua sulo a nepropra armeo. En autuno [[1939]] ([[30 di novembro]]) Soviet-Uniono atakis Finlando e [[Vintro-milito]] komencis. Pro l’ atako Soviet-Uniono esis exkomunikita ek la [[Ligo dil Nacioni]]. La milito duris til [[13 di marto]] [[1940]] ma Soviet-Uniono ne sucesis konquestar Finlando quo perdis c. 10 % ek lua sulo. 25 | 26 | Soviet-Uniono e Germania subskribis pakto pri ne-atako, ma quankam Germania atakis en [[1941]] Soviet-Uniono. Finlando partoprenis la milito kontra Soviet-Uniono pro retroganar perdita sulo. En komenco Soviet-Uniono retretis, ma Stalin sucesis kolektar suficante forco por represar l’ invado e dum yaro [[1943]] la Fortuno translacis su en sovieta latero. Soviet-Uniono tre mizeris dum duesma mondomilito perdinte milioni de homi. La vinko en milito igis Soviet-Uniono mondala super-povo. 27 | 28 | ==Soviet-Uniono pos duesma mondomilito== 29 | Pos [[duesma mondo-milito|mondomilito]] Soviet-Uniono expansis lua influenco en Est-[[Europa]]. [[Estonia]], [[Latvia]], [[Lituania]] e [[Moldova]] esis konektita a Soviet-Uniono kom sovieta republiki, e [[Polonia]], [[Chekoslovakia]], [[Hungaria]], [[Rumania]], [[Bulgaria]] ed estala parto di [[Est-Germania|Germania]] divenis pokope socialista stati sub Sovietiala komando. La skismo inter Ocidento ed Oriento profundeskis e [[kolda milito]] inter idei komencis. 30 | 31 | Ye [[1953]] [[Yosif Stalin]] mortis. En komenco troiko (trio) Hrushchev–Malenkov–Molotov administris la stato, ma en 1958 [[Nikita Hrushchev]] esis elektita kom chefo di komunista partiso, e talamaniere, di stato. Ja [[1956]] Hrushchev revelabis la obskura e kruela latero di Stalin-ero. L’ atmosfero en lando divenis plu libera. Tekniko progresis en lando: Soviet-Uniono konstruktis propra atomala e hidrogenala bombo, e sendis unesma sputniko ([[satelito]]) aden [[kosmo]] ye [[1957]], unesma homo ye [[1961]]. Soviet-Uniono provokabis [[Usa]] en kontesto, e semblis, ke Soviet-Uniono esos vinkanto. 32 | 33 | Quankam regresiva povi en lando esis nekontenta a Hrushchev. Li pensis, ke des-stalinizo da Hrushchev mustas finar, e nova chefo, [[Leonid Brejnev]] esis elektita. Dum regno di Brejnev la vivo en Soviet-Uniono esis sekura ma omna libera pensi esis konsiderita kom anti-sovieta. En mondo Soviet-Uniono ganis plu e plu autoritato e hegemonio vinkante en lua latero multa nova stati en [[Afrika]] ed [[Azia]]. Malgre suceso en mondo, l' ekonomio en Soviet-Uniono esis malada. Dum [[1970a yari]] Soviet-Uniono atingis en armala kontesto la nivelo di Usa. 34 | 35 | ==Finala tempo di Soviet-Uniono== 36 | La [[1980a yari]] esis la finala fazo di Soviet-Uniono. Leonid Brejnev mortis ye [[1982]], e pos ilu esis kom chefo di stato kurte [[Yuri Andropov]] e [[Konstantin Chernenko]]. En [[1985]] yuna [[Mihail Gorbachov]] esis elektita. Il komprenis, ke homi bezonas libereso, ed il deziris altrigar – inter limiti di socialismo – la lando per nova politiko. Per perestroiko (nove-konstrukto) e glasnosto (klareso, transparenteso) ilu duktis la stato a nova voyo. La rezultato dil nova politiko ne esis quala Gorbachov expektis, pro ke sovieta homi e nacioni prenis povo en lua propra manui. Ye [[1987]] [[Boris Yelcin]] parolis en Centra Komitato di Partiso tre kuraje kontra partisala elito e korupteso di lando ganante suporto di populo ed auritato che homi. 37 | 38 | Ye [[1989]] senatani, insistanta novigi, vinkis l’ elekto. Ministi (exkavisti?) strikis e l’ ekonomiko falis en krizo. Omnaloke en Soviet-Uniono diversa nacioni komencis persekutar una altra. Hegemonio en Est-Europa esabis ja perdita e la [[Berlin-Muro]] krakis ye [[10 di novembro]]. 39 | 40 | Ye [[1990]] en [[Moskva]] 200.000 homi demandis altrigi e novigi en lando. [[Estonia]], [[Latvia]] e [[Lituania]] votis por lua nedependeso. Ye [[19 di agosto]] [[1991]] regresiva grupo kaptis povo, ma la kapto ne sucesis. Boris Yelcin kuraje agis kontra povo-kaptanti samatempe kam Gorbachov esis guardita en lua dacho (vilao) Krimeala. Pose Boris Yelcin esis elektita kom prezidanto di Rusia. En [[26 di decembro]] [[1991]] la chefi di [[Rusia]], [[Bielorusia]] ed [[Ukrainia]] rezolvis cesigar Soviet-Uniono e krear Komunumo(?) di Nedependanta Stati por ex-sovieta stati. 41 | 42 | -------------------------------------------------------------------------------- /lib/training_data/is-utf8.txt: -------------------------------------------------------------------------------- 1 | '''Japan''' (''Nippon/Nihon'' 日本 (letrin tákna [[sól]] og [[rót|rætur]]/uppruna), þýðir bókstaflega „Uppruni sólarinnar“), er [[land]] í [[Austur Asía|Austur-Asíu]], staðsett austur af [[Kóreuskagi|Kóreuskaga]] og vestarlega í [[Kyrrahafið|Kyrrahafinu]]. Nafnið er oft þýtt „Land rísandi sólar“ og er sú þýðing ættuð úr [[kínverska|kínversku]]. Áður en Japan hafði nokkur samskipti við Kína, var landið kallað [[Yamato]] (大和). ''Wa'' (倭) var nafnið sem Kínverjar notuðu snemma þegar þeir töluðu um Japan. 2 | Japan samanstendur af röð [[eyja]], stærstar þeirra eru frá norðri til suðurs, [[Kyushu]] (九州), [[Shikoku]] (四国), [[Honshu]] (本州, stærsta eyjan), og [[Hokkaido]] (北海道). 3 | 4 | == Nafnsifjar == 5 | {{Fallbeyging|Japan||Japan||Japan||Japans||}} 6 | Japan heitir á japönsku ''Nippon'' eða ''Nihon'', bæði heitin eru skrifuð eins á japönsku ritmáli. Japanska nafnið Nippon er fyrir formlega notkun, s.s. á gjaldmiðli, frímerkjum og alþjóðlegum íþróttamótum. Nihon er hversdagslegt heiti Japans sem Japanar nota. Sem dæmi, Japanar kalla sig Nihonjin og tungumál sitt Nihongo: sem bókstaflega þýðir „japanskt fólk“ og „japönsk tunga“. Í Japan nú til dags, hefur nafnið Nippon meiri þjóðernissinnaða merkingu, notað meira af eldra fólki, meðan að Nihon er notað dagsdaglega af mestum hluta þjóðarinnar. 7 | 8 | Heiti Japans á evrópskum tungumálum (þar með talið íslensku) barst með verslunarleiðum til vesturs. Nafn Japans kom fyrst fyrir í skjölum frá Marco Polo sem ''Cipangu'' úr [[mandarín]]. Hins vegar er Japan á [[kantónska|kantónsku]] ''Jatbun'', og þaðan er vestræna heitið líklegast komið. Á [[malajíska|malajísku]] varð kantónska heitið ''Japang'' og hafa [[Portúgal|Portúgalskir]] kaupmenn rekist á það í [[Malakka]] á [[16. öld]]. Talið er að portúgalskir kaupmenn hafi borið nafnið til [[Evrópa|Evrópu]]. Það var fyrst skráð á ensku sem ''Giapan''. 9 | 10 | [[Nihonkoku]] (日本国), er formlegt heiti Japans og þýðir í raun „japanska ríkið“. 11 | 12 | == Saga Japans == 13 | Fornleifarannsóknir benda til þess að búseta manna í Japan hafi hafist fyrir 500.000 árum, á fyrri hluta [[fornsteinöld|fornsteinaldar]]. Á [[Ísöld|ísöldum]] síðustu milljón ára hefur Japan tengst meginlandi [[Asía|Asíu]] (við [[Sakhalin]] í norðri og líklegast [[Kyushu]] í suðri), sem hefur auðveldað búferlaflutninga [[maður|manna]], [[dýr]]a og [[planta|plantna]] til Japanska eyjaklasans, frá því svæði sem er nú [[Kína]] og [[Tævan]]. 14 | 15 | Við lok síðustu ísaldar og með heitara loftslagi tók [[Jomon]]-tímabilið (縄文時代) við u.þ.b. 14.500 f.Kr. Leirker frá Jomon tímabilinu í Japan eru meðal þeirra elstu í heiminum. Þegar tók að líða á Jamon tímabilið tóku að myndast smáþorp víða í Japan. 16 | 17 | Samkvæmt klassískri goðafræði Japans, var Japan sett á laggirnar á 7. öld fyrir Krist af [[Jimmu keisari|Jimmu keisara]], sem samkvæmt goðafræðinni á ættir sínar að rekja til guða. 18 | 19 | Um 300 fyrir Krist tók við [[Yayoi]] (弥生時代) tímabilið sem markaði endalok Jomon tímabilsins. Tímabilið einkenndist af áhrifum frá asíska meginlandinu, til dæmis barst til Japans þekking á [[hrísgrjón|hrísgrjónarækt]] og þekking á [[brons|bronsgerð]]. Jafnframt voru miklir búferlaflutningar frá mörgum hlutum Asíu til Japans á því tímabili. 20 | 21 | Almennt er samt talið víst að einhver tímann um 300 e.Kr. hafi [[Yamatoættin]] sameinað eyjarnar, Honshu, Shikoku, Kyushu og hugsanlega einhvern hluta Kóreuskaga, sem hafi verið upphafið að sameiningu Japans. Á 5. og 6. öld tóku Japanir upp [[kínverska ritkerfið]] og [[Búddismi|búddisma]], fyrst gegnum Kóreuskaga en síðar beint frá Kína. [[Keisari|Keisararnir]] voru aðeins að nafninu til stjórnendur, en gegndu í raun aðeins trúarlegu hlutverki. Raunverulegt vald var í höndum hirðar aðalsmanna sem höfðu arfgeng lénsréttindi. 22 | 23 | Árið 794 tók við [[Fujuwara]] fjölskyldan og [[Kammu keisari]], hann reisti nýja höfuðborg (áður var [[Nara]] höfuðborgin), [[Kayoto|Heian-kyo]] (heitir nú [[Kayoto]]). Fujiwara fjölskyldan efldi veldi sitt með einokun og gifti meðlimi ættarinnar inn í keisarafjöldskylduna til að halda áfram völdum. Það gerðist iðulega að keisarinn sagði af sér og útnefndi yngri mann, ættingja Fujiwara, keisara. Fyrrverandi keisari gekk svo í klaustur og stjórnaði á bakvið tjöldin. 24 | 25 | Slíkur háttur var á lengi vel, en upp úr 900 fóru margir aðalsmenn, sem ekki höfðu mikil völd innan hirðarinnar, að hætta að sætta sig við hætti Fujiwara fjölskyldunar og settust að í héruðum þar sem þeir tóku sér völd og eignuðu sér landsvæði. Til að verja eigin landsvæði mynduðu þeir bændaheri, sem seinna kölluðust [[Samúræji|samúræjar]]. Þetta varð tilefni margra bardaga og hafði mikil áhrif á keisaraveldið. Loks árið [[1185]], sigruðu bræðurnir [[Yoshitsune]] og [[Yoritomo]] úr [[Minamoto]] fjölskylduni [[Taira]] fjölskylduna (sem þá var orðin voldugasta fjölskylda Japans) eftir langar erjur, og komu á sjogúnstjórn (herríkisstjórn)幕府)). Yoshitsune varð fyrsti einráði sjogúninn. Sjogúnstjórnin bar heitið Kamakura Sjogúnstjórnin (鎌倉幕府). 26 | Yoshitsune gerði ýmislegt til að bæta hag samúræja sinna og átti mikinn þátt í að skapa menninguna í kringum þá. Erfingjar Yoshitsune voru samt síðar meir aðeins einráðir opinberlega, en [[Hoju]] fjölskyldan stjórnaði í raun öllu á bakvið tjöldin. 27 | 28 | 29 | Þetta stjórnskipulag hélst lengi vel, eða allt til ársins [[1854]] þegar [[Bandaríkin|Bandaríkjamenn]] voru farnir að beita Japan þrýstingi til að opna hafnir sýnar fyrir erlendum kaupmönnum, en Japan hafði þá verið einangrað síðan snemma á 17. öld. 30 | 31 | Á [[Meiji]]tímabilinu ([[1868]] til [[1912]]) voru lénsréttindi afnumin og Japanska ríkið tók á sig mynd [[kapítalismi|kapítalískra]] ríkja í Evrópu. 32 | 33 | == Stjórnmál == 34 | Í Japan er [[stjórnarskrárbundin konungsstjórn]] með tveggja deilda [[þing]]i, sem kallast [[Kokkai]] (国会). Japan hefur konunglega fjölskyldu, þar sem [[keisari]]nn er hæst settur en samkvæmt núverandi [[stjórnarskrá]] hefur hann engin raunveruleg völd heldur þjónar hann eingöngu formlegu hlutverki [[Þjóðhöfðingi|þjóðhöfðingja]]. [[Framkvæmdavald]]ið, sem heyrir undir Kokkai, er í höndum [[ríkisstjórn]]ar sem samanstendur af [[forsætisráðherra]] og öðrum ráðherrum, sem verða að vera almennir borgarar. Forsætisráðherrann er meðlimur í Kokkai. Forsætisráðherra hefur vald til að ráða og reka ráðherra, en ráðherrarnir þurfa flestir að vera meðlimir í Kokkai. 35 | 36 | == Héraðsskipan Japans == 37 | ''Aðalgrein: [[Héruð í Japan]]'' 38 | 39 | er skipt upp í 47 [[hérað|héruð]] (raðað eftir [[ISO 3166-2 codes for Japan|ISO 3166-2]]): 40 | 41 | *[[Hokkaido hérað|Hokkaido]] 42 | *[[Aomori hérað|Aomori]] 43 | *[[Iwate hérað|Iwate]] 44 | *[[Miyagi hérað|Miyagi]] 45 | *[[Akita hérað|Akita]] 46 | *[[Yamagata hérað|Yamagata]] 47 | *[[Fukushima hérað|Fukushima]] 48 | *[[Ibaraki hérað|Ibaraki]] 49 | *[[Tochigi hérað|Tochigi]] 50 | *[[Gunma hérað|Gunma]] 51 | *[[Saitama hérað|Saitama]] 52 | *[[Chiba hérað|Chiba]] 53 | *[[Tokyo hérað|Tokyo]] 54 | *[[Kanagawa hérað|Kanagawa]] 55 | *[[Niigata hérað|Niigata]] 56 | *[[Toyama hérað|Toyama]] 57 | *[[Ishikawa hérað|Ishikawa]] 58 | *[[Fukui hérað|Fukui]] 59 | *[[Yamanashi hérað|Yamanashi]] 60 | *[[Nagano hérað|Nagano]] 61 | *[[Gifu hérað|Gifu]] 62 | *[[Shizuoka hérað|Shizuoka]] 63 | *[[Aichi hérað|Aichi]] 64 | *[[Mie hérað|Mie]] 65 | 66 | *[[Shiga hérað|Shiga]] 67 | *[[Kyoto hérað|Kyoto]] 68 | *[[Osaka hérað|Osaka]] 69 | *[[Hyogo hérað|Hyogo]] 70 | *[[Nara hérað|Nara]] 71 | *[[Wakayama hérað|Wakayama]] 72 | *[[Tottori hérað|Tottori]] 73 | *[[Shimane hérað|Shimane]] 74 | *[[Okayama hérað|Okayama]] 75 | *[[Hiroshima hérað|Hiroshima]] 76 | *[[Yamaguchi hérað|Yamaguchi]] 77 | *[[Tokushima hérað|Tokushima]] 78 | *[[Kagawa hérað|Kagawa]] 79 | *[[Ehime hérað|Ehime]] 80 | *[[Kochi hérað|Kochi]] 81 | *[[Fukuoka hérað|Fukuoka]] 82 | *[[Saga hérað|Saga]] 83 | *[[Nagasaki hérað|Nagasaki]] 84 | *[[Kumamoto hérað|Kumamoto]] 85 | *[[Oita hérað|Oita]] 86 | *[[Miyazaki hérað|Miyazaki]] 87 | *[[Kagoshima hérað|Kagoshima]] 88 | *[[Okinawa hérað|Okinawa]] 89 | Röðin á héruðunum er frá norðri til suðurs, sem er almennt notuð í Japan. 90 | 91 | == Landafræði == 92 | Japan er stórt [[eyríki]] sem teygir sig eftir hluta af [[Kyrrahafið|Kyrrahafsströnd]] Asíu. Stærstu eyjarnar heita Hokkaido, Honshu (meginlandið), Shikoku, og Kyushu. Að auki eru um 3000 smærri eyjar sem teljast til eyjaklasans. 73% landsins er fjöllótt, með fjallgörðum sem liggja eftir eyjunum endilöngum, venjulega frá norðri til suðurs. Hæsta fjallið er [[Fuji fjall]] sem er 3.776 m. 93 | 94 | == Tenglar == 95 | -------------------------------------------------------------------------------- /lib/training_data/ja-euc_jp.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/ja-euc_jp.txt -------------------------------------------------------------------------------- /lib/training_data/ko-utf8.txt: -------------------------------------------------------------------------------- 1 | 2 | '''한국전쟁'''은 [[1950년]] [[6월 25일]] 시작된 [[대한민국]]과 [[조선민주주의인민공화국]]사이의 전쟁이다. 대한민국을 비롯한 세계 대부분에서 전쟁이 북조선의 남침으로 시작되었다는 것이 정설이나, 북조선에서는 남한이 먼저 북침했다고 주장한다. '''6.25''', '''조국해방전쟁''' 혹은 '''조선전쟁'''이라고도 불린다. 3 | 4 | == 배경 == 5 | 6 | [[한반도]]는 [[제 2차 세계대전]] 이후 [[38선]]을 경계로 남북으로 갈라져, 북쪽에 [[소비에트연방]]의, 남쪽에 [[미합중국]]의 [[군정기|군정]]이 시작되었다. [[이승만]]과 [[김일성]]이 [[1948년]] 각각 대한민국과 조선민주주의인민공화국을 건설함과 동시에 남북간의 긴장은 더욱 강화되었다. 7 | 8 | == 명분 == 9 | 10 | 대한민국과 인민공화국은 모두 상대가 먼저 전쟁을 시작했다고 주장한다. 대한민국에 있어 한국전쟁은 적화통일의 야욕을 가진 북한 공산군의 침략을 저지한 자유민주주의 진영의 방어전이며, [[대한민국국군]]의 주적은 어디까지나 북조선의 인민무력이었다. 북조선의 경우는 약간 다른데, 북조선은 대한민국 정부수립 이후에도 철수하지 않고 남아있던 [[주한미군]]을 남한에 대한 미제의 침략으로 간주, 북조선 인민무력의 명분상 주적은 미군이었다. 일부 수정주의라고 불리는 입장에서는 북한의 남침을 인정하나, 이는 미국의 유도에 의한 것이라는 주장도 있다. 11 | 12 | == 경과 == 13 | 14 | === 전쟁의 발발과 유엔군의 참전 === 15 | 16 | 무방비 상태에서 공격을 당한 국군은 한 대의 전차도 없이 240여 대의 전차를 앞세우고 공격해 오는 인민군에게 밀려 후퇴하였다. [[6월 27일]] 저녁에 [[서울]] 근교까지 밀어닥친 그들과 육박전을 감행했으나, 워낙 전세가 불리하여 정부를 [[대전]]으로 옮겼다. 한편 한국정부는 전쟁이 일어나자 주미국 대사에게 긴급 훈령을 내려 [[미국 국무성]]에 사태의 긴급성을 알렸고, 미국은 [[유엔 안전보장이사회]]를 열어 한국 문제를 건의했다. ‘북한군의 즉각 철퇴 촉구’를 결의하고 북한측에 통고했으나, 이에 응하지 않아 [[6월 27일]] 다시 안전 보장 이사회를 열었다. 결국 미국을 비롯하여 [[영국]], [[프랑스]], [[콜롬비아]], [[터키]] 등 16개국의 회원국이 유엔군을 조직하여 한국전에 참전하기에 이르렀다. 그 동안 대전까지 들어온 인민군이 진로를 세 방면으로 나누어 [[호남]], [[경북]] 왜관([[낙동강]]), [[영천]], [[포항]] 등지로 육박하자, 대전에서 대구로 내려와 있던 한국정부는 다시 [[부산]]으로 이동하였다. 한편 국군을 [[맥아더]] 유엔군 총사령관의 지휘하에 편입, 대폭 증강하여 낙동강 전선을 마지막 방어선으로 삼고 반격하였다. 17 | 18 | 한편 북한에서는 6월 25일 새벽 남한에서 38선전역에 걸쳐 무력침공을 감행하였고 최초에 전선 1-2킬로미터가량 북진에 성공했고 공화국 정부는 바로 공격을 중단할 것을 대한민국정부에 요구했으나 교섭이 결렬되었다. 인민군은 조직적인 반격을 개시해 국군을 38선 밑으로 몰아내고 낙동강까지 진격하였다고 주장하나, 북한의 점령 속도와 한국군의 준비 상황을 미루어 볼 때 설득력이 없다. 19 | 20 | === 인천상륙작전 === 21 | 맥아더 사령관이 지휘하는 유엔군과 국군은 인천 상륙 작전([[9월 15일]])에 성공함으로써 서울을 빼앗긴 지 3개월 만인 [[9월 28일]]에 서울을 되찾았다. 이어 달아나는 인민군을 뒤쫓아 38선을 돌파하여 10월에는 [[평양]]을 거쳐 [[압록강]]에 이르렀고, 11월에는 [[두만강]] 일대까지 진격하였다. 22 | 23 | === 중국의 참전과 1.4 후퇴 === 24 | 25 | 대한민국군에 의한 무력통일을 눈앞에 두었을 때 [[중화인민공화국]]의 [[인민해방군]]이 전쟁에 개입하여 인해 전술로 반격해 왔다. 다시 국군은 50여 만 명의 중공군에 밀려 후퇴하기 시작했다. [[12월 14일]]부터 24일 사이에 동부 전선의 국군 12만과 피난민 10만이 흥남 부두에서 해상으로 철수했고, [[1월 4일]]에는 서울을 다시 내줄 수밖에 없었다. [[1월 7일]]에는 수원이 함락되어 인민무력은 계속 남진했으나, 국군은 이미 병력과 장비를 정비하여 반격 태세를 갖추었다. 인민군은 10여 만의 전사자를 내면서 퇴각하였고, [[3월 2일]]에 아군이 한강을 넘어서 14일에는 서울을 되찾았다. 다시 북진했으나 9·28 수복 후처럼 쉽지 않았다. 적이 이미 전 전선에 참호를 구축했기 때문이었다. 결국 38선 부근에서 일진 일퇴를 거듭하며 전쟁은 오랫동안 계속되었다. 26 | 27 | === 휴전협정 === 28 | 29 | 1951년 7월에 정전 회담이 개시된 후 세계 전쟁사상 처음 보는 제한 전쟁( 휴전이 되면 각기 점령 지역에서 국경이 정해지는 조건으로 싸우는 전쟁)이 벌어졌다. 북한이 소련을 통해 휴전을 제의하였고 유엔군측의 승인으로 휴전이 되었다. 30 | [[1953년]] [[7월 27일]]에 휴전 협정이 조인됨으로써 3년 1개월 만에 한국전쟁 휴전으로 매듭을 지어졌고, 현재까지 그 효력이 이어지고 있다. 31 | 32 | == 피해 == 33 | 3년 1개월에 걸친 동족 상잔의 6·25 전쟁은 남· 북한의 전 국토를 폐허화했고, 참전한 외국의 병력에까지 극심한 해를 입혔다. 6·25 전쟁은 그 밖에도 약 20만 명의 전쟁 미망인과 10만 명이 넘는 전쟁 고아를 만들었다. 그리고 45%에 이르는 공업 시설이 파괴되어 경제적, 사회적 암흑기를 초래했다. 34 | 35 | === 한국 === 36 | 미국의 통계에 의하면 60만명이 전쟁중에 사망하였고, 전체 참전국의 사망자를 모두 합하면 200만명에 달한다고 한다. 한국인 사망자는 백만명이 넘으며 그중 85%는 민간인이다. 소련의 통계에 의하면 북한의 11.1%의 인구가 전쟁을 통하여 사망하였는데 이것은 113만명에 이른다. 남북한 모두 합하여 250만명이 사망하였다. 80%의 산업시설과 공공시설과 교통시설이 파괴되었고, 정부 건물의 사분의 삼이 파괴되었다. 가옥의 절반이 파괴되었다. 37 | 38 | 39 | {{조선민주주의인민공화국 표}} 40 | '''조선 민주주의 인민 공화국 (朝鮮 民主主義 人民 共和國, ) '''은 한반도 북쪽에 위치한 국가이다. 41 | 42 | 국제 언론계에서는 단순한 영어 명칭 ''''''가 가져올 수 있는 혼동을 피하기 위하여, 조선민주주의인민공화국을 '''' (북조선)으로 속칭하듯이, [[대한민국]]을 '''' (남한) 으로 속칭한다. 43 | 44 | 북조선은 자신들이 [[조선 (국호)|조선]]을 계승했다는 뜻에서 국가명을 '조선민주주의인민공화국'이라 부르고 있으며 이에 따라 [[남한]]을 남조선이라 구분하여 부른다. [[대한민국]]과는 상호 불인정 관계에 있으며, 대한민국은 북조선을 불법 반국가단체로 간주한다. 45 | 46 | == 역사 == 47 | * [[일제 강점기]]에 놓여 있었던 [[조선반도]]는 [[1945년]] [[일본]]이 [[이차세계대전]]에서 항복함으로서 자립권을 다시 찾았으나, 정치 사회적으로 혼란상태에 빠졌다. 48 | * [[1946년]] [[2월 8일]] : [[소련]] 군정의 지시에 따라 건국준비를 위한 [[북조선림시인민위원회]]가 건설되었다. 49 | * [[1948년]] [[9월 9일]] : [[맑스-레닌주의]]를 이념으로 한 '''조선민주주의인민공화국'''이 [[38선]] 이북에 건국되었다. 50 | * [[1950년]] [[6월 25일]] : 인민무력과 [[대한민국국군]]과의 전쟁 시작, [[조국해방전쟁]] 혹은 [[6.25]]가 시작되다. 51 | * [[1977년]] : [[조선인민공화국사회주의헌법]]에서 국가의 공식이념이 [[맑스-레닌주의]]에서 [[주체사상]]으로 바뀌다. 52 | * [[1991년]] [[9월 17일]] : [[조선민주주의인민공화국|북조선]]과 [[대한민국]]의 [[]] 동시가입. 53 | 54 | ==수도== 55 | 헌법상 수도는 [[1972년]]까지 [[서울]]로 규정했다. ([[평양]]은 당시까지 림시수도로 취급되었다). 1972년의 개정 헌법은 수도를 평양으로 규정하고있다. 물론, 실질적으로는, 수도 기능은 이전부터 평양이 담당했다. 56 | 57 | 58 | ==정치== 59 | 정치체제는 [[주체사상]]에 근거하는 공산주의 체제를 취하지만, 일당독재 체제를 담당하는 조선노동당의 지배 조직으로서의 형해화가 지적 되어 있어 현재는 국방위원장인 [[김정일]]의 개인 독재 체제라고 일컬어진다. 김정일은 [[선군정치]] 를 내걸고 있다. 元首에 관해서는 국방 위원장이 국가 최고의 직책으로서 사실상의 원수직이지만, 형식상은 외국 사절의 신임장 등을 다는 역할을 완수하는 최고 인민 회의 상임위원장이 원수에 상당하는 것으로 된다. 현재의 최고 인민 회의 상임위원장은 [[김영남]]이다. 60 | 61 | [[김일성]]이 [[1994년]]에 죽고 나서는, 아들 김정일이 [[조선노동당]] 총서기, 조선인민군최고 사령관, 공화국 국방 위원장이 되어 북조선을 통치하고 있다. 62 | 63 | ==군사== 64 | 과거 수십년에 걸쳐 국방을 위해서 막대한 자원을 쏟아 넣어, 세계에서 4번째로 큰 120만에 달하는 대군을 보유하고 있다. 김정일에 의해 [[선군정치]]가 시작된 이후로 북조선은 기존의 [[맑스-레닌주의]]와 결별, 노동자가 아니라 군인이 국가의 근간이라는 방향으로 정책이 바귀었다. 선군정치가 시작된 이래 인민무력에 대한 대우는 한결 나아졌다. 65 | 66 | ==국제관계== 67 | 68 | 폐쇄적인 정치를 하고 있기 때문에, [[중화인민공화국]]과 [[러시아]]를 제외하고, 타국과의 교류가 지극히 적다. 특히 [[미국]]은 이 나라를 [[악의 축]]()의 하나로 평가해, [[일본]]이나 한국 등과 함께, 이 나라가 장기에 걸치는 미사일 개발 계획과 핵개발을 우려하고 있다. 현재, 주변국인 [[대한민국]]·[[일본]]·[[러시아]]·[[중국]]·[[미국]]과 함께, 핵문제를 중심으로 6자회담를 진행시키고 있지만 현재 교착 상태가 계속되고 있다. 69 | 70 | 한국인, 일본인 등의 납치, 일본·한국에 존재하는 공작원, 여러 나라에 대한 마약의 밀수, 미 달러 지폐의 대량 위조, 과거에는 [[대한항공]]기 폭파 사건 (1987), [[랑군]]에서 한국의 요인 폭살 (1983), 한국 대통령 살해 미수 (1974), [[레바논]]인 여성 납치사건 등의 문제가 많다. 71 | 72 | 공작원에 대해서는, 이전에는 [[평양방송]] 의 라디오로 암호 전문을 사용해 지령을 보내고 있었지만, [[2000년]]에 종료했다. 현재는, 모르스 신호나 휴대전화나 [[컴퓨터]]의 메일을 사용해 지령하고 있다는 설도 있다. 73 | 74 | ==행정구역== 75 | * [[북한의 행정구역]] 76 | 77 | == 읽어보기 == 78 | * [[남북기본합의서]] 79 | 80 | '''일제강점기'''([[1910년]] [[8월 29일]] ~ [[1945년]] [[8월 15일]])는 한국 근현대사를 시대별로 나누었을 때 주요 시대 중 하나로, [[한반도]]가 [[일본]]의 [[식민지]] 지배하에 놓였던 시기이다. 일반적으로 이 시기를 일본의 한반도 지배 정책에 따라 3개 시대로 세분하는데, 헌병 경찰 통치기([[1910년]] ~ [[1919년]]), 문화 통치기([[1919년]] ~ [[1931년]]), 민족 말살 통치기([[1931년]] ~ [[1945년]])로 각각 지칭한다. 81 | 82 | 일반적으로 일본의 우파적 사학자들과, [[식민지근대화론]]을 주장하는 일부 한국 사학자들은 일제 강점기 전반기에는 일본이 한반도의 근대화를 도왔다고 주장하는 반면, 한국 사학계에서는 [[조선후기 자본주의맹아론]]에 의거, 이러한 근대화 정책이 개항 이전 및 이후 자생적으로 성장했던 한반도 내의 민족 자본을 말살한 바탕 위에서 일본의 경제 개발이 이루어졌으며, 이는 일본의 영속적인 한반도 지배 의도를 실현시키기 위한 정책이었다는 의견이 지배적이다. 이와 관련하여 하버드 대학에서 이루어진 토론에서는 "한국 병합은 합법적으로 행해졌으며, 이 시대의 시책으로는 선정이라고 말할 수 있다"라는 의견이 다수를 이루었다. 83 | 84 | ==배경== 85 | [[1873년]] [[사이고 다카모리]]가 [[조선]] 측에서 일본과의 외교관계 수립을 거부한다는 것을 들어 공식적으로 [[정한론]]을 제기한 이래 [[메이지 덴노]] 시대의 과두 정부는 일본 국내에 [[정한론]]을 지지하는 여론을 조성하였다. [[1876년]] [[강화도조약]] 이래 일본 정부는 조선을 식민지화시키기 위한 장기적인 계획을 수립하였고, [[1894년]] [[청일전쟁]]과 [[1905년]]의 [[러일전쟁]]에서 승리하여 한반도에서의 독점적인 권리를 따냈다. 그 외에도 [[영일동맹]] [[가쓰라-태프트 밀약]] 등으로 국제적인 인정을 받아, [[1905년]]의 [[을사조약]]으로 조선의 외교권을 침탈한 데 이어 [[한일신협약]], [[기유약조]] 등으로 [[대한제국]]의 배타적 권리를 차례차례 박탈하였다. (이 시기의 자세한 역사는 [[대한제국]]이나 [[개화기]] 등을 참조) 86 | 87 | [[1909년]] 7월에 한국 병합이 각의 결정되었고, [[1909년]] [[10월 26일]]에 항일 독립운동가 [[안중근]]이 [[이토 히로부미]]를 암살하면서, 일본 내에 정한 강경파의 목소리가 높아졌고 한국 병합의 추진이 가속화되었다. [[1910년]] [[8월 29일]], [[한일합방조약]]([[경술국치]]라고도 한다)이 맺어지면서 [[대한제국]]은 일본의 식민지가 되어, 천황 직속의 [[조선총독부]]에 의한 [[1945년]]까지 36년간의 긴 식민 통치가 시작되었다. [[을사조약]]과 [[한일합방조약]]은 [[대한제국]]을 대표하던 황제의 재가가 이루어지지 않은 조약으로, 이 점에 의거하여 당시 이 조약이 국제법상 무효임을 알 수 있다. 88 | 89 | ==헌병 경찰 통치기 : [[1910년]]에서 [[1919년]]까지== 90 | 헌병 경찰 통치기라는 명칭은 [[1910년]] [[9월]]에 창설된 헌병 경찰 제도에서 나왔다. 즉 헌병이 일반 경찰 행정까지 담당하면서, 즉결 처분권 등을 갖는 것을 말한다. 이 당시 통치의 강압성을 단적으로 보여주는 것이 [[조선태형령]]으로, [[갑오개혁]] 때 폐지된 태형을 조선인에게만 적용하여 처벌한 것이다. 또한 이 시기에는 조선인의 각종 단체가 해산당하였다. [[1911년]] [[신민회]]를 해산시킨 [[105인사건]]이 대표적이라 할 수 있다. 91 | 92 | 일본은 [[1912년]]부터 시행된 [[토지조사사업]]을 진행하면서 기한부 신고제로 시행, 이를 잘 알지 못한 농민들의 토지를 침탈하였고, 소유권이 불분명한 마을이나 문중의 토지, 왕실의 토지 등도 [[동양척식주식회사]]에 넘겼다. 침탈된 토지는 일본 이민들에게 싼 값에 팔렸고 이 때에 고래의 [[소작권]] 개념이 무시되는 현상이 나타났다. 이는 한반도에서 이뤄진 최초의 실질적 근대 토지 소유 개념을 도입한 정책이나, [[광무개혁]] 시기에 이뤄진 [[양전사업]]이나 [[지계]]의 발급이 일본측의 방해로 실패했다는 것을 되돌아보건대 그 실질적 의도는 토지의 침탈이었을 가능성이 높다. 이외에도 총독부의 허가에 의해서만 회사를 설립할 수 있다는 [[회사령]]이나, [[산림령]]과 [[임야조사령]], [[어업령]], [[광업령]] 등으로 조선의 경제적 지배권은 대부분 일본에 넘어갔다. 동양 척식 주식회사의 수익이 한반도에 진출한 일본 재벌이나 조선인 지주층의 회사에 투자되면서 한반도의 경제적 개발을 촉진시켰다고 볼 수는 있으나, 민족 자본의 성장은 철저히 금지되었다. 93 | 94 | [[제 1차 세계대전]]이 끝난 와중에 미국 대통령 [[우드로우 윌슨]]이 [[민족자결주의]]를 주창함에 따라 [[1919년]] [[3월 1일]] [[삼일운동]]이 일어나면서 전국적으로 평화적인 만세 시위가 일어났다. 일본은 이를 적극적으로 탄압하여 결과적으로는 실패하였으나, 산발적인 독립 운동이 하나로 일치 단결하는 계기가 되었으며, [[조선총독부]]의 통치 정책 방향 또한 급선회하게 되었다. 95 | 96 | ==문화 통치기 : [[1919년]]에서 [[1931년]]까지== 97 | 3·1 운동에 의해 일본 정부나 총독부측에서는 기존의 통치방식을 심각하게 고려하지 않을 수 없었고, [[사이토 마코토]] 총독의 파견을 기점으로 기존의 강압적 통치에서 회유적 통치로 그 방향을 선회하게 된다. 그 결과 헌병 경찰 제도가 폐지되고 보통 경찰제가 도입되었지만, 실질적으로는 이름만 바꾼 것에 불과하였다. 이 시기에는 단체 활동 및 언론 활동이 허가되었고 아주 기초적인 초등 교육이 확대되었다. 이에 따라 한반도에서는 민족주의 독립운동 계열의 실력 양성 운동이 힘을 얻게 되고, 친일 인사들도 많이 생겨나게 된다. 이는 결국 한반도의 민족 지도자들을 분열시키는 결과를 낳았다. 98 | 99 | 한편으로 이 당시에는 [[산미증식계획]]이 수립되어 한반도의 미곡 생산량을 증대시키는 시도가 이루어졌으나, 오히려 일본으로 유출되는 양이 더 높아져 한반도의 식량 부족이 심각해졌다. 100 | 101 | ==민족 말살 통치기 : [[1931년]]에서 [[1945년]]까지== 102 | [[만주사변]]이 발발하면서 한반도는 일본의 대륙진출기지로서의 기능을 발휘하기 시작하며, 이에 따라 일본의 경제적 지배 정책도 병참 기지화 정책으로 선회한다. 한편으로는 조선인들을 완벽한 일본인으로 만들기 위한 민족 말살 통치가 진행되어, [[내선일체]]와 [[일선동조론]]에 의거한 황국 신민화 정책이 실시된다. 이에 따라 일본은 [[황국신민서사]]의 암기와 [[신사]] 참배 및 "국어"의 사용을 강요하였다. 학교의 한글 교육은 중단되었고, [[창씨개명]]이 강압적으로 행해졌다. 103 | 104 | 그러나 [[1945년]] [[8월 15일]] [[태평양전쟁]]에서의 일본의 패망과 함께 한반도가 해방되면서 일제 강점기는 종결되었다. 105 | 106 | 107 | {{조선민주주의인민공화국 표}} 108 | '''조선 민주주의 인민 공화국 (朝鮮 民主主義 人民 共和國, '''은 한반도 북쪽에 위치한 국가이다. 109 | 110 | 국제 언론계에서는 단순한 영어 명칭 ''''''가 가져올 수 있는 혼동을 피하기 위하여, 조선민주주의인민공화국을 '''' (북조선)으로 속칭하듯이, [[대한민국]]을 '''' (남한) 으로 속칭한다. 111 | 112 | 북조선은 자신들이 [[조선 (국호)|조선]]을 계승했다는 뜻에서 국가명을 '조선민주주의인민공화국'이라 부르고 있으며 이에 따라 [[남한]]을 남조선이라 구분하여 부른다. [[대한민국]]과는 상호 불인정 관계에 있으며, 대한민국은 북조선을 불법 반국가단체로 간주한다. 113 | 114 | == 역사 == 115 | * [[일제 강점기]]에 놓여 있었던 [[조선반도]]는 [[1945년]] [[일본]]이 [[이차세계대전]]에서 항복함으로서 자립권을 다시 찾았으나, 정치 사회적으로 혼란상태에 빠졌다. 116 | * [[1946년]] [[2월 8일]] : [[소련]] 군정의 지시에 따라 건국준비를 위한 [[북조선림시인민위원회]]가 건설되었다. 117 | * [[1948년]] [[9월 9일]] : [[맑스-레닌주의]]를 이념으로 한 '''조선민주주의인민공화국'''이 [[38선]] 이북에 건국되었다. 118 | * [[1950년]] [[6월 25일]] : 인민무력과 [[대한민국국군]]과의 전쟁 시작, [[조국해방전쟁]] 혹은 [[6.25]]가 시작되다. 119 | * [[1977년]] : [[조선인민공화국사회주의헌법]]에서 국가의 공식이념이 [[맑스-레닌주의]]에서 [[주체사상]]으로 바뀌다. 120 | * [[1991년]] [[9월 17일]] : [[조선민주주의인민공화국|북조선]]과 [[대한민국]]의 [[]] 동시가입. 121 | 122 | ==수도== 123 | 헌법상 수도는 [[1972년]]까지 [[서울]]로 규정했다. ([[평양]]은 당시까지 림시수도로 취급되었다). 1972년의 개정 헌법은 수도를 평양으로 규정하고있다. 물론, 실질적으로는, 수도 기능은 이전부터 평양이 담당했다. 124 | 125 | 126 | ==정치== 127 | 정치체제는 [[주체사상]]에 근거하는 공산주의 체제를 취하지만, 일당독재 체제를 담당하는 조선노동당의 지배 조직으로서의 형해화가 지적 되어 있어 현재는 국방위원장인 [[김정일]]의 개인 독재 체제라고 일컬어진다. 김정일은 [[선군정치]] 를 내걸고 있다. 元首에 관해서는 국방 위원장이 국가 최고의 직책으로서 사실상의 원수직이지만, 형식상은 외국 사절의 신임장 등을 다는 역할을 완수하는 최고 인민 회의 상임위원장이 원수에 상당하는 것으로 된다. 현재의 최고 인민 회의 상임위원장은 [[김영남]]이다. 128 | 129 | [[김일성]]이 [[1994년]]에 죽고 나서는, 아들 김정일이 [[조선노동당]] 총서기, 조선인민군최고 사령관, 공화국 국방 위원장이 되어 북조선을 통치하고 있다. 130 | 131 | ==군사== 132 | 과거 수십년에 걸쳐 국방을 위해서 막대한 자원을 쏟아 넣어, 세계에서 4번째로 큰 120만에 달하는 대군을 보유하고 있다. 김정일에 의해 [[선군정치]]가 시작된 이후로 북조선은 기존의 [[맑스-레닌주의]]와 결별, 노동자가 아니라 군인이 국가의 근간이라는 방향으로 정책이 바귀었다. 선군정치가 시작된 이래 인민무력에 대한 대우는 한결 나아졌다. 133 | 134 | ==국제관계== 135 | 136 | 폐쇄적인 정치를 하고 있기 때문에, [[중화인민공화국]]과 [[러시아]]를 제외하고, 타국과의 교류가 지극히 적다. 특히 [[미국]]은 이 나라를 [[악의 축]]()의 하나로 평가해, [[일본]]이나 한국 등과 함께, 이 나라가 장기에 걸치는 미사일 개발 계획과 핵개발을 우려하고 있다. 현재, 주변국인 [[대한민국]]·[[일본]]·[[러시아]]·[[중국]]·[[미국]]과 함께, 핵문제를 중심으로 6자회담를 진행시키고 있지만 현재 교착 상태가 계속되고 있다. 137 | 138 | 한국인, 일본인 등의 납치, 일본·한국에 존재하는 공작원, 여러 나라에 대한 마약의 밀수, 미 달러 지폐의 대량 위조, 과거에는 [[대한항공]]기 폭파 사건 (1987), [[랑군]]에서 한국의 요인 폭살 (1983), 한국 대통령 살해 미수 (1974), [[레바논]]인 여성 납치사건 등의 문제가 많다. 139 | 140 | 공작원에 대해서는, 이전에는 [[평양방송]] 의 라디오로 암호 전문을 사용해 지령을 보내고 있었지만, [[2000년]]에 종료했다. 현재는, 모르스 신호나 휴대전화나 [[컴퓨터]]의 메일을 사용해 지령하고 있다는 설도 있다. 141 | 142 | ==행정구역== 143 | * [[북한의 행정구역]] 144 | 145 | == 읽어보기 == 146 | * [[남북기본합의서]] 147 | 148 | -------------------------------------------------------------------------------- /lib/training_data/nl-iso-8859-1.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/nl-iso-8859-1.txt -------------------------------------------------------------------------------- /lib/training_data/ro-utf8.txt: -------------------------------------------------------------------------------- 1 | ---- 2 | ''Parte din seria [[Wikipedia:WikiCivică|WikiCivică]]'' 3 | ---- 4 | Contrbuitorii la Wikipedia vin din culturi şi ţări diferite şi pot avea puncte de vedere foarte diferite. Tratarea celor din jur cu respect este fundamentală pentru colaborarea serioasă la construcţia unei enciclopedii care se bazează la modul spiritual pe colegialitate şi uniune de păreri (vezi [[Wikipedia:WikiLove|conceptul WikiLove]]). 5 | 6 | Această pagină oferă câteva principii ale '''"Wikichetei"''' (''Wikiquette''), un ghid asupra modului de lucru cu alţii pe Wikipedia. Poţi citi convenţiile cele mai de bază la [[Wikipedia:politica]]. 7 | 8 | == Principii ale etichetei Wikipedia == 9 | * Pe cât posibil, presupune că ceilalţi colaboratori au intenţii bune. Wikipedia a lucrat remarcabil de bine până acum, bazându-se pe o politică de libertate de revizuire cvasi completă. 10 | * Evită să restaurezi versiunile anterioare ale paginilor sau să ştergi. 11 | ** Corectează, revizuieşte, [[Wikipedia:Pagină de discuţii|discută]]. 12 | * Fii educat. 13 | **Lumea nu poate vedea şi şti cât de mult glumeşti. Ironia nu este întodeauna vizibilă, şi un text crud şi insensibil poate fi considerat grosolan. 14 | * [[Wikipedia:Utilizarea semnăturii|Semnează şi datează]] mesajele trimise de tine. 15 | * [[Wikipedia:Angajamentele colaboratorilor|Lucrează în acord]] cu restul [[Wikipedia:Wikipedist|wikipediştiilor]] 16 | * Nu ignora întrebările. 17 | ** Dacă o persoană nu este de acord cu modificarea ta, furnizează motive valide pentru modificarea făcută. 18 | * Admite un punct de vedere dacă nu ai un răspuns; sau admite că nu eşti de acord bazându-te pe intuiţie sau gusturi. 19 | ** Nu purta discuţii cu persoane pe teme pe care nu le poţi susţine. 20 | * Fii prompt în a te scuza. 21 | **În discuţiile în care se iscă conflicte, de multe ori spunem lucruri pe care mai târziu le regretăm. Recunoaşte. 22 | * Fii promt în a accepta o scuză în mod educat, şi fără a răsuci cuţitul în rană. 23 | * Laudă când e necesar. Cu toţii iubim să ne simţim apreciaţi, în special într-un mediu care cere compromisuri. 24 | * Elimină sau reasumă-ţi disputele pe care le-ai iniţiat. 25 | * Ajută la medierea dezacordurilor între alte persoane. 26 | * Dacă discuţia educată eşuează, ia o pauză dacă porţi o discuţie, sau sugerează o pauză dacă mediezi o discuţie. 27 | ** Întoarce-te după o săptămână, sau două. Dacă nimeni nu a apărut un mediator, şi consideri că ar fi necesar, desemnează pe cineva. 28 | ** Pleacă sau găseşte-ţi un alt proiect Wikipedia pentru a te distrage. Serviciile tale sunt ''întodeauna'' necesare [[Wikipedia:Articolul ciot perfect|amplifică un articol]] sau [[Wikipedia:Curăţenieleanup|curăţă]] pe Wikipedia. 29 | * Reţine [[Wikipedia:Ce nu este Wikipedia|ce nu e Wikipedia]]. 30 | * Aruncă o privire peste [[Wikipedia:Greşeli comune|greşelile comune în utilizarea Wikipediei]]. 31 | * Fii [[Wikipedia:Civilizaţie|civilizat]]. 32 | 33 | == Cum să eviţi utilizarea excesivă a paginilor de discuţie == 34 | 35 | Multe persoane ţin mult la ceea ce au scris în articole şi la punctul lor de vedere. Ego-urile lor pot fi rănite uşor de modificări aduse de alţi utilizatori, însă paginile de discuţie nu trebuie folosite pentru a întreţine lupte şi certuri. Aceste pagini sunt bune pentru a calma spiritele şi, mai ales, pentru a ajunge la înţelegeri care să fie spre binele articolelor aflate în discuţie. 36 | 37 | ===Câteva lucruri de ţinut minte=== 38 | 39 | * Articolele de pe Wikipedie se presupune a reprezanta toate punctele de vedere (vezi [[PDVN]]). Paginile de discuţie nu sunt locuri de dezbatere a celor mai juste, mai greşite sau mai bune opinii. Dacă vrei să faci asta, există locuri publice ca [[Usenet]], [[weblog]] sau alte [[wiki]]. 40 | * Dacă cineva nu e de acord cu tine, asta nu înseamnă în mod necesar că (1) acea persoană te urăşte, (2) crede că eşti prost, (3) acea persoană este proastă, (4) acea persoană este rea, etc. Când cineva îşi trimite părerile care nu au legături directe cu articolul, cel mai bine e să le laşi pierdute. 41 | * Wikipedia te invită să [[Wikipedia:fii curajos|fii curajos]]. Înainte de a începe o discuţie, întreabă-te: e într-adevăr necesar a discuta? Pot să furnizez un sumar al reviziei mele şi să aştept ca alţii să obiecteze dacă doresc? 42 | * Poţi să porţi întodeauna o discuţie pe [[Wikipedia:Mailing list ro.wiki|e-mail]] sau pe pagina ta de utilizator, dacă nu e absolut esenţial pentru articol. 43 | 44 | ===Alte câteva sfaturi asupra discuţiei educate=== 45 | 46 | * Atribuie întotdeauna clar punctul de vedere pe care îl trimiţi, în special în replici 47 | ** A cita un post e bine, dar a declara cum îl interpretezi e rău. Înainte de a spune ce a spus cineva, gândeşte-te la faptul că s-ar putea să-l fi interpretat greşit. 48 | * Nu ''eticheta'' sau ''[[wikipedia:fără atacuri la persoană|ataca în mod direct]]'' persoanele sau reviziile lor. 49 | **Termină cu "rasist", "pervers" sau "scris rău", cuvinte care pun persoana căreia i te adresezi în defensivă. Aceasta duce la dificultăţi în a realiza o discuţie productivă asupra unui articol. 50 | 51 | ===Alte sfaturi=== 52 | 53 | Ultimele sfaturi de la [[:en:User:Larry_Sanger|Larry Sanger]]: 54 | *fii deschis şi primitor, nu izolat, 55 | *concentrează-te asupra scrierii unei enciclopedii şi nu a unei dezbateri în stil Usenet, 56 | *recunoaşte şi laudă munca bună, o muncă care e detaliată se limitează la fapte concrete, e bine informat şi bine referenţiat, 57 | *lucrează pentru a înţelege de ce e necesară neutralitatea şi de ce e aşa de esenţială şi de bună pentru acest proiect, 58 | *tratează membrii productivi, bine intenţionaţi ai Wikipediei cu respect şi bunăvoinţă, 59 | *atrage şi onorează persoanele care ştiu mult şi pot scrie bine despre anumite lucruri. 60 | 61 | Profil al unui Wiki-angajament de 62 | * Fă-i pe ceilalţi să se simtă bine veniţi (chiar şi pe cei care participă de mult timp, chiar şi pe cei care nu-ţi plac) 63 | * Creează şi menţine un mediu de amiciţie 64 | * Întoarce şi celălalt obraz (ceea ce include şi evitarea unui potenţial război de editare) 65 | * Laudă, în special pe cei pe care nu-i cunoşti (multora le place să ştie că sunt doriţi şi apreciaţi) 66 | * Iartă! 67 | -------------------------------------------------------------------------------- /lib/training_data/ru-utf8.txt: -------------------------------------------------------------------------------- 1 | '''Вторая мировая война''' [[1939]]—[[1945|45]], крупнейшая в истории [[война]], развязанная [[Германия|Германией]], [[Италия|Италией]] и [[Япония|Японией]]. Участвовали 72 государства, свыше 80% населения земного шара, военные действия охватили территории 40 государств. 2 | 3 | ==Европейский и североафриканский театры военных действий== 4 | 5 | Вторая мировая война началась [[1 сентября]] [[1939]] нападением [[Германия|Германии]] на [[Польша|Польшу]]. 3 сентября [[Великобритания]] и [[Франция]] объявили войну [[Германия|Германии]]. В апреле-мае [[1940]] германские войска оккупировали [[Дания|Данию]], [[Норвегия|Норвегию]], [[Бельгия|Бельгию]], [[Нидерланды]], [[Люксембург]], а в июне — [[Франция|Францию]], 10 июля [[1940]] в войну на стороне [[Германия|Германии]] вступила [[Италия]], войска которой в августе — сентябре захватили Британское Сомали, часть [[Кения|Кении]] и [[Судан]]а, вторглись в [[Египет]]. В декабре они были разбиты и в январе-мае [[1941]] изгнаны из Восточной Африки английскими войсками. В апреле [[1941]] [[Германия]] захватила [[Греция|Грецию]] и [[Югославия|Югославию]]. [[Япония]] оккупировала южные районы [[Китай|Китая]] и северную часть французского Индокитая. 6 | 7 | [[22 июня]] [[1941]] [[Германия]] напала на [[СССР|Советский Союз]] (смотри [[Великая Отечественная война 1941-45|Великая Отечественная война 1941—45]]). В [[1941]]—[[1942|42]] сложилось ядро антигитлеровской коалиции ([[СССР]], [[Великобритания]] и [[США]]). 8 | 9 | Победы [[Красная Армия|Красной Армии]] в Сталинградской битве [[1942]]—[[1943|43]], Курской битве [[1943]] и битве за [[Днепр (река)|Днепр]] [[1943]] ознаменовали перелом в ходе Второй мировой войны. К маю [[1943]] англо-американские войска освободили Северную Африку. В июле [[1943]] рухнул фашистский режим в [[Италия|Италии]], которая в октябре объявила войну [[Германия|Германии]]. Германские войска оккупировали её территорию. В июле-августе 1943 союзные войска высадились в [[Италия|Италии]], в июне [[1944]] – в Нормандии, открыв 2-й фронт. В [[1944]]—[[1945|45]] советские войска освободили страны Центральной и Юго-Восточной Европы. В апреле [[1945]] союзные войска освободили Северную Италию, заняли Западную Германию. 2 мая [[1945]] [[Красная Армия]] овладела [[Берлин]]ом. В полночь 8 мая в предместье [[Берлин]]а Карлсхорсте представители германского командования подписали акт о безоговорочной капитуляции. Берлинская конференция глав правительств [[СССР]], [[США]] и [[Великобритания|Великобритании]] (17 июля-2 августа [[1945]], [[Потсдам]]) определила условия послевоенного устройства мира в [[Европа|Европе]]. 10 | 11 | ==Битва за Атлантику== 12 | К началу Второй мировой войны ВМФ Великобритании значительно превосходил ВМФ Германии. 13 | Считая сражение с линейным флотом Великобритании невозможным, главнокомандующий немецкими ВМФ Редер делал ставку на стратегию крейсерской войны, т. е. борьбы с транспортами противника. Этой идее были подчинены созданные в конце тридцатых годов «карманные линкоры» «Дойчланд», «Адмирал Шеер» и «Адмирал граф Шпее». Для этой же цели предназначались линкоры «Бисмарк» и «Тирпиц». 14 | В мае 1941 года «Бисмарк» был послан в [[Атлантический океан|Атлантику]] в рейд. Он был перехвачен и потоплен кораблями ВМФ Британии. Британия потеряла линейный крейсер «Худ». 15 | После потери «Бисмарка» Гитлер разочаровался в крупных кораблях и передал командование ВМФ Дёницу, который был сторонником подводной войны. 16 | 17 | Было развёрнуто массовое строительство подводных лодок. Сначала их действия приносили успех, но примерно с апреля 1943 года подводный флот Германии начал нести тяжёлые потери. 18 | В ходе битвы за Атлантику, с 1939 по 1945 год, Германия потеряла 340 подводных лодок. Потери союзников составили 4245 транспортных судов. Неограниченная подводная война в Атлантике обескровила германский ВМФ, погибло более 80% экипажей подводных лодок. Германский ВМФ оказался не в состоянии противостоять высадке союзников в Нормандии (из семи тысяч участвовавших в этой операции транспортных судов германским ВМФ удалось потопить только 25). 19 | 20 | ==Дальневосточный и тихоокеанский театр военных действий== 21 | 7 декабря [[1941]], без объявления войны, нападением на [[Перл Харбор]] [[Япония]] развязала войну против [[США]]. В ходе атаки 423-х [[самолёт]]ов с шести янонских авианосцев и в конце было потоплено и серьёзно повреждено 8 линкоров и шесть крейсеров ВМС США. Потерии авиации флота США составили около двухсот самолётов. Потерии в личном сотаве достигли 3500 погибшими и ранеными. Потерии Японии составили всего 29 самолётов. 22 | 23 | В [[1941]] — начале [[1942]] Япония захватила [[Малайзия|Малайзию]], [[Индонезия|Индонезию]], [[Филиппины]], [[Бирма|Бирму]]. 24 | Перелом войны на Тихом океане произошёл в ходе морского сражения при атолле Мидуэй. Японский флот потерял четыре авианосца, флот США — один авианосец. 25 | 26 | В [[1944]]—[[1945|45]] англо-американские войска овладели Маршалловыми и Марианскими островами, [[Филиппины|Филиппинами]] и японским островом Окинава. На японские города [[Хиросима]] ([[6 августа]] [[1945]]) и [[Нагасаки]] ([[9 августа]]) были сброшены атомные бомбы. [[9 августа]] [[1945]] Советский Союз объявил фойну Японии, советские войска разгромили японскую Квантунскую армию, освободили Северо-Восточный Китай, Северную Корею, Южный Сахалин и Курильские острова. [[2 сентября]] [[1945]] [[Япония]] подписала акт о безоговорочной капитуляции. 27 | 28 | В странах, участвовавших во Второй мировой войне, было мобилизовано около 110 млн. человек. В войне погибло до 62 млн. человек (Из них более 20 млн. жителей Советского Союза). 29 | 30 | ==См. также== 31 | *[[Великая Отечественная война 1941-45|Великая Отечественная война 1941—45]] 32 | *[[Первая мировая война|Первая мировая война]] 33 | -------------------------------------------------------------------------------- /lib/training_data/sl-utf8.txt: -------------------------------------------------------------------------------- 1 | '''Druga svetovna vojna''' je bil najbolj obsežen in najdražji oborožen spor v [[zgodovina|zgodovini]] sveta, ki je vključeval večino [[države sveta|svetovnih držav]]. Odvijal se je hkrati po celem svetu in je približno 50 [[milijon]]ov [[človek|ljudi]] stal življenje. Boj se je odvijal večinoma med [[Francija|Francijo]], [[Združeno kraljestvo|Združenim Kraljestvom]], [[Sovjetska zveza|Sovjetsko zvezo]], [[Kitajska|Kitajsko]] in [[Združene države Amerike|Združenim državam Amerike]] proti [[Nemčija|Nemčiji]], [[Italija|Italiji]] in [[Japonska|Japonski]], oziroma med [[zavezniki]] in [[sile osi|silami osi]]. 2 | 3 | == Uvod == 4 | 5 | Vojna se je začela [[1. september|1. septembra]] [[1939]], ko so Nemške čete vdrle na [[Poljska|Poljsko]], končala pa [[2. september|2. septembra]] [[1945]], ko se je vdala [[Japonska]]. V [[Evropa|Evropi]] se je uradno končala že [[8. maj]]a s predajo Nemčije, toda v [[Slovenija|Sloveniji]] in na [[Avstrija|Avstrijskem]] [[Koroška|Koroškem]] pa so boji trajali še do [[15. maj]]a. 6 | 7 | ''(Za celotni pregled '''druge svetovne vojne''' glej [[Kronologija druge svetovne vojne]])'' 8 | 9 | == Vojaško dogajanje == 10 | Celotna vojaško dogajanje med '''drugo svetovno vojno''' lahko razdelimo na naslednje dele: 11 | 12 | * [[Vojna v Evropi]], 13 | * [[Vojna v severni Afriki]], 14 | * [[Vojna za Tihi ocean]] in 15 | * [[Bitka za Atlantik]]. 16 | 17 | == Politično dogajanje == 18 | 19 | 20 | 21 | == [[Orožje in oprema druge svetovne vojne]] == 22 | 23 | 24 | 25 | == Posledice == 26 | S koncem '''druge svetovne vojne''' je svet vstopil v t.i. [[atomska doba|atomsko dobo]]. 27 | 28 | Najpomembnejši politični posledici '''druge svetovne vojne''' sta bili: 29 | * razdelitev [[Evropa|Evrope]] na dva dela (začetek [[hladna vojna|hladne vojne]]) in 30 | * ustanovitev [[Organizacija združenih narodov|Organizacije združenih narodov]] [[24. oktober|24. oktobra]] [[1945]]. 31 | 32 | == Zunanje povezave == 33 | 34 | 35 | == Glej tudi == 36 | * [[Tretji rajh]], [[koncentracijsko taborišče]], [[izumi in pridobitve druge svetovne vojne]]. 37 | * [[osebnosti druge svetovne vojne]] 38 | 39 | 40 | ''[[Republika|Repúblika]] Slovénija''' je [[morje|obmorska]] in [[Alpe|podalpska]] [[država]] na jugu [[Srednja Evropa|Srednje]] [[Evropa|Evrope]], ki na zahodu meji na [[Italija|Italijo]], na severu na [[Avstrija|Avstrijo]], na severovzhodu na [[Madžarska|Madžarsko]], na vzhodu in jugu na [[Hrvaška|Hrvaško]], na jugozahodu pa ima izhod na [[Jadransko morje]]. 41 | 42 | Slovenija je članica [[Organizacija združenih narodov|Organizacije združenih narodov]], zveze [[NATO]], ter [[Evropska unija|Evropske unije]]. 43 | 44 | == Zgodovina == 45 | 46 | ''Glej tudi: [[Zgodovina Slovenije]]'' 47 | 48 | [[Slovani|Slovanski]] predniki današnjih Slovencev so se najverjetneje naselili na ozemlju Slovenije v [[6. stoletje|6. stoletju]]. V [[7. stoletje|7. stoletju]] se je oblikovala [[Karantanija]], prva država Slovencev in ena prvih slovanskih državnih tvorb. Leta [[745]] Karantanija izgubi samostojnost in pade pod bavarsko nadoblast, ti pa pozneje postanejo del [[Frankovska država|Frankovske države]]. Ta si zavzema za pokristjanjevanje prebivalstva. 49 | 50 | Okoli leta [[1000]] so napisani [[Brižinski spomeniki]], prvi pisni dokument v [[slovenščina|slovenščini]] ter tudi prvo slovansko narečje, zapisano v [[latinica|latinici]]. V [[14. stoletje|14. stoletju]] pade večina slovenskega ozemlja v posest [[Habsburžani|Habsburžanov]], kar pozneje postane [[Avstro-Ogrska]]. Slovensko ozemlje je razdeljeno na pokrajine: [[Kranjska|Kranjsko]], [[Goriška|Goriško]] in [[Štajerska|Štajersko]]. 51 | 52 | V letu [[1848]] so v [[Pomlad narodov|Pomladi narodov]] med številnimi narodi tudi Slovenci s političnim programom zahtevali [[Zedinjena Slovenija|združeno Slovenijo]]. 53 | 54 | Z razpadom avstro-ogrske monarhije leta [[1918]] so južni slovanski narodi nekdanje monarhije [[29. oktober|29. oktobra]] [[1918]] razglasili narodno osvoboditev in ustanovitev samostojne [[Država Slovencev, Hrvatov in Srbov|države Slovencev, Hrvatov in Srbov]] s središčem v [[Zagreb]]u. Nevarnost s strani [[Italija|Italije]], ki je zasedla [[Primorska|Primorsko]] in [[Istra|Istro]] ter dele [[Dalmacija|Dalmacije]], in pritisk Srbov po združitvi v skupno državo, sta botrovali [[1. december|1. decembra]] [[1918]] združitev Države SHS s [[Kraljevina Srbija|Kraljevino Srbijo]] v [[Kraljevina Srbov, Hrvatov in Slovencev|Kraljevino Srbov, Hrvatov in Slovencev]], ki se je [[1929]] preimenovala v [[Kraljevina Jugoslavija|Kraljevino Jugoslavija]]. 55 | 56 | Kraljevina Jugoslavija je med [[Druga svetovna vojna|2. svetovno vojno]] razpadla, Slovenci pa so se pridružili [[Demokratična federativna Jugoslavija|Demokratični federativni Jugoslaviji]], uradno razglašeni [[29. november|29. novembra]] [[1945]]. Država se je leto kasneje [[1946]] preimenovala v [[Federativna ljudska republika Jugoslavija|Federativno ljudsko republiko Jugoslavijo]] (FLRJ) in še kasneje leta [[1963]] v [[Socialistična federativna republika Jugoslavija|Socialistično federativno republiko Jugoslavijo]] (SFRJ). 57 | 58 | Današnja Slovenija je na osnovi [[plebiscit]]ne odločitve razglasila neodvisnost od [[SFRJ]] [[25. junij]]a [[1991]]. 59 | 60 | == Politika == 61 | 62 | Slovenski [[vodja države]] je [[seznam predsednikov Slovenije|predsednik]], ki ga izvolijo vsakih pet let. Nosilec izvršilne oblasti v Sloveniji je vlada, ki jo vodi predsednik vlade [[predsednik vlade Slovenije|predsednik vlade]]. Poleg njega sestavljajo vlado še ministri. Tako predsednika vlade kot ministre izvoli državni zbor [[državni zbor]]. 63 | 64 | Dvodomni parlament sestavljata [[državni zbor]] in [[državni svet]]. Državni zbor ima 90 sedežev, ki jih deloma zasedajo neposredno izvoljeni predstavniki in deloma sorazmerno izvoljeni predstavniki. Državni svet ima 40 sedežev, predstavljajo ga družbene, gospodarske, strokovne in krajevno pomembne skupine. Parlamentarne volitve so vsake [[štiri]] leta, v državni svet pa vsakih pet let. 65 | 66 | == Upravna razdelitev == 67 | 68 | Slovenija je upravno razdeljena na 193 [[občina|občin]], med katerimi jih ima 11 status mestne občine (zapisane so '''krepko'''). 69 | *[[Gornji Grad]] 70 | *[[Gornji Petrovci]] 71 | *[[Grad (občina)|Grad]] 72 | *[[Grosuplje]] 73 | *[[Hajdina]] 74 | *[[Hoče-Slivnica]] 75 | *[[Hodoš]] 76 | *[[Horjul]] 77 | *[[Hrastnik]] 78 | *[[Hrpelje-Kozina]] 79 | *[[Idrija]] 80 | *[[Ig]] 81 | *[[Ilirska Bistrica]] 82 | *[[Ivančna Gorica]] 83 | *[[Izola]] 84 | *[[Jesenice]] 85 | *[[Jezersko]] 86 | *[[Juršinci]] 87 | *[[Kamnik]] 88 | *[[Kanal ob Soči]] 89 | *[[Kidričevo]] 90 | *[[Kobarid]] 91 | *[[Kobilje]] 92 | *[[Kočevje]] 93 | *[[Komen]] 94 | *[[Komenda]] 95 | *'''[[Koper]]''' * 96 | *[[Kostel]] 97 | *[[Kozje]] 98 | *'''[[Kranj]]''' * 99 | *[[Kranjska Gora]] 100 | *[[Križevci]] 101 | *[[Krško]] 102 | *[[Kungota]] 103 | *[[Kuzma]] 104 | *[[Laško]] 105 | *[[Lenart]] 106 | *[[Lendava]] 107 | *[[Litija]] 108 | *'''[[Ljubljana]]''' * 109 | *[[Ljubno]] 110 | *[[Ljutomer]] 111 | *[[Logatec]] 112 | *[[Loška dolina]] 113 | *[[Loški Potok]] 114 | *[[Lovrenc na Pohorju]] 115 | *[[Luče]] 116 | *[[Lukovica]] 117 | *[[Majšperk]] 118 | *'''[[Maribor]]''' * 119 | *[[Markovci]] 120 | *[[Medvode]] 121 | *[[Mengeš]] 122 | *[[Metlika]] 123 | *[[Mežica]] 124 | *[[Miklavž na Dravskem polju]] 125 | *[[Miren-Kostanjevica]] 126 | *[[Mirna Peč]] 127 | *[[Mislinja]] 128 | *[[Moravče]] 129 | *[[Moravske Toplice]] 130 | *[[Mozirje]] 131 | *'''[[Murska Sobota]]''' * 132 | *[[Muta]] 133 | *[[Naklo]] 134 | *[[Nazarje]] 135 | *'''[[Nova Gorica]]''' * 136 | *'''[[Novo mesto]]''' * 137 | *[[Odranci]] 138 | *[[Oplotnica]] 139 | *[[Ormož]] 140 | *[[Osilnica]] 141 | *[[Pesnica]] 142 | *[[Piran]] 143 | *[[Pivka]] 144 | *[[Podčetrtek]] 145 | *[[Podlehnik]] 146 | *[[Podvelka]] 147 | *[[Polzela]] 148 | *[[Postojna]] 149 | *[[Prebold]] 150 | *[[Preddvor]] 151 | *[[Prevalje]] 152 | *'''[[Ptuj]]''' * 153 | *[[Puconci]] 154 | *[[Rače-Fram]] 155 | *[[Radeče]] 156 | *[[Radenci]] 157 | *[[Radlje ob Dravi]] 158 | *[[Radovljica]] 159 | *[[Ravne na Koroškem]] 160 | *[[Razkrižje]] 161 | *[[Ribnica]] 162 | *[[Ribnica na Pohorju]] 163 | *[[Rogaška Slatina]] 164 | *[[Rogašovci]] 165 | *[[Rogatec]] 166 | *[[Ruše]] 167 | *[[Selnica ob Dravi]] 168 | *[[Semič]] 169 | *[[Sevnica]] 170 | *[[Sežana]] 171 | *'''[[Slovenj Gradec]]''' * 172 | *[[Slovenska Bistrica]] 173 | *[[Slovenske Konjice]] 174 | *[[Sodražica]] 175 | *[[Solčava]] 176 | *[[Starše]] 177 | *[[Sveta Ana]] 178 | *[[Sveti Andraž v Slovenskih goricah]] 179 | *[[Sveti Jurij]] 180 | *[[Šalovci]] 181 | *[[Šempeter-Vrtojba]] 182 | *[[Šenčur]] 183 | *[[Šentilj]] 184 | *[[Šentjernej]] 185 | *[[Šentjur]] 186 | *[[Škocjan]] 187 | *[[Škofja Loka]] 188 | *[[Škofljica]] 189 | *[[Šmarje pri Jelšah]] 190 | *[[Šmartno pri Litiji]] 191 | *[[Šmartno ob Paki]] 192 | *[[Šoštanj]] 193 | *[[Štore]] 194 | *[[Tabor (občina)|Tabor]] 195 | *[[Tišina (občina)|Tišina]] 196 | *[[Tolmin]] 197 | *[[Trbovlje]] 198 | *[[Trebnje]] 199 | *[[Trnovska vas]] 200 | *[[Trzin]] 201 | *[[Tržič]] 202 | *[[Turnišče]] 203 | *'''[[Velenje]]''' * 204 | *[[Velika Polana]] 205 | *[[Velike Lašče]] 206 | *[[Veržej]] 207 | *[[Videm]] 208 | *[[Vipava]] 209 | *[[Vitanje]] 210 | *[[Vodice]] 211 | *[[Vojnik]] 212 | *[[Vransko]] 213 | *[[Vrhnika]] 214 | *[[Vuzenica]] 215 | *[[Zagorje ob Savi]] 216 | *[[Zavrč]] 217 | *[[Zreče]] 218 | *[[Žalec]] 219 | *[[Železniki]] 220 | *[[Žetale]] 221 | *[[Žiri]] 222 | *[[Žirovnica]] 223 | *[[Žužemberk]] 224 | 225 | ==Geografske koordinate skrajnih točk== 226 | Geografske koordinate skrajnih točk Slovenije so: 227 | * na severu 46°53' [[SGŠ]], 16°14' [[VGD]], naselje Budinci v občini [[Šalovci]], 228 | * na jugu 45°25' SGŠ, 15°10' VGD, naselje Damelj v občini [[Črnomelj]], 229 | * na vzhodu 46°28' SGŠ, 16°36' VGD, naselje Benica v občini [[Lendava]]/Lendva, 230 | * na zahodu 46°17' SGŠ, 13°23' VGD, v naselju Breginj v občini [[Kobarid]]. 231 | 232 | Zračna razdalja po zemljepisni širini znaša 1°28' oziroma 163 km. 233 | Zračna razdalja po zemljepisni dolžini znaša 3°13' oziroma 248 km. 234 | 235 | Vir: ''Ministrstvo za okolje, prostor in energijo - Geodetska uprava Republike Slovenije'' 236 | 237 | ==Prazniki in dela prosti dnevi== 238 | 239 | Zakon o praznikih in dela prostih dnevih v Republiki Sloveniji (Ur. l. RS/I, št. 26-1091/1991) določa naslednje praznike in dela proste dneve: 240 | 241 | '''Prazniki''' 242 | * [[1. januar|1.]] in [[2. januar]] - ''novo leto'' 243 | * [[8. februar]] - ''[[France Prešeren|Prešernov]] dan, slovenski kulturni praznik'' 244 | * [[27. april]] - ''dan upora proti okupatorju'' 245 | * [[1. maj|1.]] in [[2. maj]] - ''praznik dela'' 246 | * [[25. junij]] - ''dan državnosti'' 247 | * [[1. november]] - ''dan spomina na mrtve'' 248 | * [[26. december]] - ''dan samostojnosti'' 249 | 250 | '''Dela prosti dnevi''' 251 | * [[nedelja]] po prvem [[pomlad]]anskem [[ščip]]u - ''velikonočna nedelja in ponedeljek, [[velika noč]]'' 252 | * nedelja sedem [[teden|tednov]] po veliki noči - ''binkoštna nedelja, [[binkošti]]'' 253 | * [[15. avgust]] - ''[[Marijino vnebovzetje]]'' 254 | * [[31. oktober]] - ''dan [[reformacija|reformacije]]'' 255 | * [[25. december]] - ''[[božič]]'' 256 | 257 | == Glej tudi == 258 | 259 | * [[Slovenska književnost]] 260 | * [[Geometrično središče Slovenije]] (Geoss) 261 | * [[Obala Slovenije]] 262 | * [[Slovenska vojska]] 263 | * [[Slovenska osamosvojitvena vojna]] 264 | -------------------------------------------------------------------------------- /lib/training_data/sv-iso-8859-1.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/sv-iso-8859-1.txt -------------------------------------------------------------------------------- /lib/training_data/sv-utf8.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/sv-utf8.txt -------------------------------------------------------------------------------- /lib/training_data/th-utf8.txt: -------------------------------------------------------------------------------- 1 | {{โครง}} 2 | 3 | '''คลื่นสึนามิ''' (จาก[[ภาษาญี่ปุ่น]] 津波 แปลว่า ''คลื่นที่ท่าเรือ'' หรือ ''คลื่นชายฝั่ง'') คือ คลื่นหรือกลุ่มคลื่นที่จุดกำเนิดจากทะเลลึก ซึ่งมักปรากฏหลัง[[แผ่นดินไหว]]ขนาดใหญ่, , [[ภูเขาไฟระเบิด]], [[ดินถล่ม]], [[แผ่นดินทรุด]], หรือ[[อุกกาบาต]]ขนาดใหญ่ตกลงในทะเล คลื่นสึนามิสามารถเข้าทำลาย[[พื้นที่ชายฝั่ง]] ทำให้เกิดการสูญเสียทั้งชีวิตและทรัพย์สินได้ 4 | 5 | == ชื่อเรียก == 6 | ชาวประมง[[ประเทศญี่ปุ่น|ญี่ปุ่น]]เป็นผู้ที่คิดคำเรียกนี้ขึ้น ภายหลังจากที่เขากลับเข้าท่าเรือและพบว่าทุกอย่างถูกทำลายสิ้น โดยไม่ได้สังเกตพบคลื่นดังกล่าวที่บริเวณน้ำลึกเลย ทั้งนี้เนื่องจากคลื่นสึนามิไม่ใช่ปรากฏการณ์ระดับผิวน้ำที่เขตน้ำลึก คลื่นจะมี[[แอมพลิจูด]]ต่ำ และมีความยาวคลื่นสูง ทำให้คลื่นสามารถวิ่งผ่านผู้สังเกตการณ์ที่ผิวน้ำ ซึ่งอาจจะเห็นเป็นเพียงแค่เนินต่ำๆ ในน้ำเท่านั้น 7 | 8 | == สาเหตุ == 9 | คลื่นสึนามิเกิดขึ้นจากการกระทบกระเทือนที่ทำให้น้ำปริมาณมากเกิดการเคลื่อนตัว เช่นแผ่นดินไหว, แผ่นดินถล่ม, หรืออุกกาบาตพุ่งชน 10 | 11 | เมื่อแผ่นดินใต้ทะเลเกิดการเปลี่ยนรูปร่างอย่างกระทันหัน จะทำให้น้ำทะเลเกิดเคลื่อนตัวเพื่อปรับระดับให้เข้าสู่จุดสมดุลย์และจะก่อให้เกิดคลื่นสึนามิ การเปลี่ยนรูปร่างของพื้นทะเลมักเกิดขึ้นเมื่อเกิดแผ่นดินไหวเนื่องจากการขยับของ[[เปลือกโลก]] ซึ่งจะเกิดบริเวณที่ขอบของเปลือกโลกหลายอันเชื่อมต่อกัน ที่เรียกว่า "faults" เช่น บริเวณขอบของมหาสมุทรแปซิฟิก นอกจากแผ่นดินไหวแล้ว ดินถล่มใต้น้ำที่มักเกิดร่วมกับแผ่นดินไหวสามารถทำให้เกิดคลื่นสึนามิได้เช่นกัน 12 | 13 | นอกจากการกระทบกระเทือนที่เกิดใต้น้ำแล้ว การที่พื้นดินขนาดใหญ่ถล่มลงทะเล หรือการตกกระทบพื้นน้ำของเทหวัตถุ ก็สามารถทำให้เกิดคลื่นได้ คลื่นสึนามิที่เกิดในรูปแบบนี้จะลดขนาดลงอย่างรวดเร็วและไม่มีผลกระทบต่อชายฝั่งที่อยู่ห่างไกลมากนัก อย่างไรก็ตาม ถ้าแผ่นดินมีขนาดใหญ่มากพอ อาจทำให้เกิด [[เมกะสึนามิ]] ซึ่งอาจมีความสูงร่วมร้อยเมตรได้ 14 | 15 | ลักษณะการเกิดของสึนามิ]] 16 | 17 | == ลักษณะของคลื่นสึนามิ == 18 | คลื่นสึนามิแตกต่างจากคลื่นธรรมดามาก ตัวคลื่นนั้นสามารถเดินทางได้เป็นระยะทางไกลๆ โดยไม่สูญเสียพลังงาน และสามารถเข้าทำลายชายฝั่งที่อยู่ห่างไกลจากจุดกำเนิดหลายพันกิโลเมตรได้ 19 | โดยทั่วไปแล้วคลื่นสึนามิซึ่งเป็นคลื่นในน้ำ จะเดินทางได้ช้ากว่าการสั่นสะเทือนของแผ่นดินไหวที่เป็นคลื่นที่เดินทางในพื้นดิน ดังนั้น คลื่นอาจเข้ากระทบฝั่งภายหลังจากที่ผู้คนบริเวณนั้นรู้สึกว่าเกิดแผ่นดินไหวเป็นเวลาหลายชั่วโมง 20 | 21 | คลื่นโดยทั่วไปจะมีคุณสมบัติสำคัญที่วัดได้อยู่สองประการคือ ''คาบ'' ซึ่งจะเป็นเวลาระหว่างลูกคลื่นสองลูก และ ''ความยาวคลื่น'' ซึ่งเป็นระยะห่างระหว่างลูกคลื่นสองลูก 22 | ในทะเลเปิด คลื่นสึนามิมีคาบที่นานมาก โดยเริ่มจากไม่กี่นาทีถึงชั่วโมง ในขณะเดียวกันก็มีความยาวคลื่นที่ยาวมาก โดยอาจยาวถึงหลายร้อยกิโลเมตร ในขณะที่คลื่นทั่วไปที่เกิดจากลมที่ชายฝั่งนั้นมีคาบประมาณ 10 วินาที และมีความยาวคลื่นประมาณ 150 เมตรเท่านั้น ความสูงของคลื่นในทะเลเปิดมักน้อยกว่าหนึ่งเมตร ซึ่งทำให้ไม่เป็นที่สังเกตของผู้คนบนเรือ คลื่นจะเคลื่อนที่ด้วยความเร็วตั้งแต่ 500 ถึง 1,000 กิโลเมตรต่อชั่วโมง อย่างไรก็ตาม เมื่อเข้าสู่ชายฝั่งที่มีความลึกลดลง คลื่นจะมีความเร็วที่ต่ำลงและเริ่มก่อตัวเป็นคลื่นสูง โดยอาจมีความสูงได้ถึง 30 เมตรหรือมากกว่านั้น 23 | 24 | คลื่นจะมีพฤติกรรมเป็น "คลื่นน้ำตื้น" เมื่ออัตราส่วนระหว่างความลึกของน้ำและความยาวคลื่นนั้นมีค่าต่ำ ดังนั้น เนื่องจากมีความยาวคลื่นที่สูงมาก คลื่นสึนามิจึงมีคุณสมบัติเป็นคลื่นน้ำตื้นแม้อยู่ในทะเลลึกก็ตาม คลื่นน้ำตื้นนั้นมีความเร็วเท่ากับรากที่สองของผลคูณระหว่างความเร่งจากสนามแรงโน้มถ่วง (9.8 เมตร/วินาที^2) และความลึกของน้ำ ตัวอย่างเช่น ในมหาสมุทรแปซิฟิกที่มีความลึกประมาณ 4,000 เมตร คลื่นจะเคลื่อนที่ด้วยความเร็วประมาณ 200 เมตรต่อวินาที หรือ 720 กิโลเมตรต่อชั่วโมง ส่วนที่ชายฝั่งที่มีความลึก 40 เมตร คลื่นจะมีความเร็วช้าลงเหลือ 20 เมตรต่อวินาที หรือ 72 กิโลเมตรต่อชั่วโมง 25 | 26 | คลื่นสึนามิจะเคลื่อนตัวออกจากแหล่งกำเนิด ดังนั้น ชายฝั่งที่ถูกกำบังโดยแผ่นดินส่วนอื่นๆ มักปลอดภัยจากคลื่น อย่างไรก็ตาม ยังมีโอกาสที่คลื่นจะสามารถเลี้ยวเบนไปกระทบได้ นอกจากนี้ คลื่นไม่จำเป็นต้องมีความแรงเท่ากันในทุกทิศทุกทาง โดยความแรงจะขึ้นกับแหล่งกำเนิดและลักษณะของภูมิประเทศแถบนั้น 27 | 28 | == เมกะสึนามิ และ เซชิ == 29 | มีหลักฐานว่าเมกะสึนามิที่มีความสูงมากกว่า 100 เมตรนั้นเกิดขึ้นได้ เหตุการณ์นี้จะเกิดขึ้นจากเนื้อที่ขนาดใหญ่บางส่วนของเกาะพังทลายลงสู่ทะเล หรืออุกกาบาตตกลงสู่ทะเล เมกะสึนามิจะสามารถทำอันตรายอย่างใหญ่หลวงต่อพื้นที่ชายฝั่งที่อยู่ห่างไกลออกไปได้ 30 | 31 | ปรากฎการณ์ที่เกี่ยวข้องกับสึนามิคือ [[เซชิ]] แผ่นดินไหวที่รุนแรงมักทำให้เกิดทั้งสึนามิและเซชิ มีหลักฐานว่าเซชิอาจเกิดจากสึนามิได้เช่นกัน 32 | 33 | คลื่นสึนามิที่สูงที่สุดที่เคยมีการบันทึกไว้มีความสูงกว่า 500 เมตร โดยเกิดจากแผ่นดินถล่มที่[[มลรัฐอะแลสกา|อะแลสกา]]ในปี [[พ.ศ. 2501]] (ค.ศ. 1958) อย่างไรก็ตาม เมื่อคลื่นไปถึงทะเลเปิดมันได้สลายตัวไปอย่างรวดเร็ว ความสูงของคลื่นสึนามินั้นถูกกำหนดโดยลักษณะของพื้นที่มากกว่าพลังงานที่เกิดจากแผ่นดินถล่ม 34 | 35 | == การศึกษา, สัญญาณเกิดเหตุ, และระบบเตือนภัย == 36 | ''(รอการเพิ่มเติมเนื้อหา)'' 37 | 38 | 39 | == ประวัติ == 40 | มีข้อมูลเก่าแก่หลายอันเกี่ยวกับคลื่นฉับพลันที่มีอำนาจทำลายล้าง โดยเฉพาะที่แถบเมดิเตอเรเนียน ชาว[[ประเทศโปรตุเกส|โปรตุเกส]]ที่รอดชีวิตจากแผ่นดินไหวในปี [[พ.ศ. 2298]] (ค.ศ. 1755) เสียชีวิตด้วยคลื่นสึนามิที่ตามมาในเวลาไม่นานนัก ก่อนที่คลื่นยักษ์จะเข้าฝั่ง น้ำทะเลที่ท่าเรือลดลงจนซากเรือเก่าๆ โผล่ขึ้นมาให้เห็น 41 | 42 | ภูเขาไฟระเบิดครั้งใหญ่ที่เกาะ[[การากาตัว]] ([[:en:Krakatoa|Krakatoa]]) ที่[[ประเทศอินโดนีเซีย|อินโดนีเซีย]]เมื่อปี [[พ.ศ. 2426]] (ค.ศ. 1883) ทำให้เกิดคลื่นสึนามิขนาดใหญ่ที่มีความสูงเกิน 40 เมตรจากระดับน้ำทะเล คลื่นสึนามิถูกสังเกตพบทั่วทั้ง[[มหาสมุทรอินเดีย]], [[มหาสมุทรแปซิฟิก]], ชายฝั่งตะวันตกของอเมริกา, อเมริกาใต้, หรือไกลถึง[[ช่องแคบอังกฤษ]] 43 | 44 | [[แผ่นดินไหวมหาสมุทรอินเดีย พ.ศ. 2547|เหตุการณ์ล่าสุด]] กลุ่มของคลื่นยักษ์เกิดขึ้นเมื่อวันที่ [[26 ธันวาคม]] [[พ.ศ. 2547]] (ค.ศ. 2004) ทำให้มีผู้เสียชีวิตล่าสุดกว่า 68,000 ศพ โดยมีตั้งแต่ผู้ที่อยู่ใกล้บริเวณที่เกิดแผ่นดินไหว เช่น [[ประเทศอินโดนีเซีย|อินโดนีเซีย]]และ[[ประเทศไทย]] ไปจนถึงผู้ที่อยู่ห่างไกลนับพันกิโลเมตรใน[[ประเทศบังกลาเทศ|บังกลาเทศ]], [[ประเทศอินเดีย|อินเดีย]], [[ประเทศศรีลังกา|ศรีลังกา]], [[หมู่เกาะมัลดีลฟ์]], และแม้กระทั่ง[[ประเทศโซมาเลีย|โซมาเลีย]]ที่อยู่ในแถบ[[ทวีปแอฟริกา|แอฟริกา]]ตะวันออก ซึ่งประเทศในแถบนี้ยังไม่มีระบบเตือนภัยคลื่นสึนามิที่สมบูรณ์พอ ทั้งนี้เนื่องจากไม่มีภัยพิบัติที่เกิดจากคลื่นยักษ์มานานตั้งแต่ปี [[พ.ศ. 2426]] (ค.ศ. 1983) และการมุ่งเน้นการพัฒนาระบบเตือนภัย[[พายุโซนร้อน]] 45 | 46 | == อันตรายในอนาคต == 47 | ''(รอการเพิ่มเติมเนื้อหา)'' 48 | 49 | == ดูเพิ่มเติม == 50 | -------------------------------------------------------------------------------- /lib/training_data/todo/af.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/af.txt -------------------------------------------------------------------------------- /lib/training_data/todo/amharic-utf.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/amharic-utf.txt -------------------------------------------------------------------------------- /lib/training_data/todo/arabic-windows1256.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/arabic-windows1256.txt -------------------------------------------------------------------------------- /lib/training_data/todo/armenian.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/armenian.txt -------------------------------------------------------------------------------- /lib/training_data/todo/basque.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/basque.txt -------------------------------------------------------------------------------- /lib/training_data/todo/belarus-windows1251.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/belarus-windows1251.txt -------------------------------------------------------------------------------- /lib/training_data/todo/bosnian.txt: -------------------------------------------------------------------------------- 1 | mnoge od njih budu natjerane. Nedavno se jedna pozalila 2 | Vise nije cula za nju. Nije se nikome javila. Djevojkama 3 | mnogo stranaca, ali i domacih, uglednih privatnika i 4 | bavljenje prostitucijom prijetnjama i batinama. Nama nikad 5 | vunom. 6 | napolje, u auta, kao i u privatne kuce i stanove ako bi ih 7 | prosvercovane su u sleperu koji je bio oblozen staklenom 8 | zna nista, niti ce se ikad saznati, a neke se povremeno 9 | musterija naplacivao od 150 do 300 maraka, u zavisnosti 10 | podij i djevojke, njih sest. Oskudno odjevene u crno-bijelu 11 | relacijama: djevojke - gazde - musterije - policija. Jedan 12 | bavljenje prostitucijom prijetnjama i batinama. Nama nikad 13 | Madjarske i Ukrajine. Najstarija je rodjena 1972. godine, a 14 | iz sobe. S obzirom da je taj pansion udaljen od grada, a 15 | zna nista, niti ce se ikad saznati, a neke se povremeno 16 | djevojkama, izbjeglicama, kojima je obecavao posao u 17 | sta oni rade, ali njih niko ne dira, jer iza njih stoje 18 | i 25 godina, uspio je poslati u Svicarsku. Njihove 19 | svoju zenu i ljubavnicu. Inace, lokacije na kojima se 20 | covjeka. Pomenuti nocni bar kasnije su preuzeli Eso, Naser 21 | 22 | u neki od brojnih barova. Ove djevojke su, ipak, uspjele 23 | i djevojke privela i slucaj predala sudu na dalji postupak. 24 | sluzbenik MUP-a nam se pozalio da bi oni mogli puno vise 25 | pobuniti. Poslije sam danima imala uzasne glavobolje, a 26 | inostranstva. Jedna grupa je dosla preko Madjarske, a druga 27 | Dobile su dozvole za boravak na godinu dana. Oko viza i 28 | 29 | Upuceni kazu da je to "baza za vrbovanje", jer Knezevic 30 | sjedenje, rasporedjenih pored zida, i oguljena metalna 31 | djevojke od 15-ak godina, koje nemaju nikakve dokumente, a 32 | Vukovijama, opcina Kalesija. Akcija je izvedena jer je MUP 33 | ukupno je privedeno njih sest iz Rumunije, Moldavije, 34 | Beograda kao konobarica, sama je iznajmila stan koji je 35 | govori njemacki, engleski i turski, a bosanski slabo. 36 | jer ih ne zele iznositi u javnost. 37 | stoji tada ministar MUP-a TPK Hazim Rancic. Djevojke su 38 | Zena koja joj je pomogla da se prebaci u Hrvatsku 39 | ispricala nam je: "Ta djevojka je Hrvatica. Bila je sama. 40 | "Go-go bar", uz obecanje djevojkama da ce uskoro, kad ode 41 | da su radile u Doboju kod "gazde" Mise Ilica, vlasnika 42 | Moju radnju su zvali 'kuca seksa'. Vidim, radi nocni bar na 43 | Anel od povjerenja 44 | granici sa opcinom Kalesija. Svi ovi barovi su slicni: 45 | zainteresiranih, djevojke su "radile" i preko dana. A ako 46 | konobarice, solidnu placu i smjestaj, tako da su vec mnoge 47 | pobjeci. Pozalile smo se covjeku koji nam se predstavio kao 48 | izdaje, zive mlade djevojke, uredno prijavljene. U 49 | gacicama. Dovoljno da musterija ocijeni da li ce s nekom 50 | djevojaka bilo je vidljivih tragova gasenja cigareta, 51 | seksualno izivljavanje nekolicine muskaraca, i svako je nad 52 | kafane. Na kraju je ipak uspjela pobjeci, ali gore ima 53 | slucaju da se nekome zuri i ne moze cekati na mesingani 54 | on ih i preprodaje, snabdijevajuci tako i druge nocne 55 | se na puno perfidniji nacin nego kad su u pitanju 56 | na kojima se djevojke prisiljavaju na prostituciju, u RS-u 57 | redakciji). Dvojica zive u vec pomenutom gradu u 58 | Trudna je. Gazda nocnog bara u kome ona sad radi trazio je 59 | razloga sto je ovaj "biznis", s jedne strane, zabranjen 60 | iz sobe. S obzirom da je taj pansion udaljen od grada, a 61 | kao konobarica. Polovinom osmog mjeseca, opet preko Zorana 62 | godine. "U Rumuniji nisam imala uslova za zivot, pa mi je 63 | Za jednu noc pet musterija 64 | salon sa posebnim ulazom. U polutami salona, obasjanog 65 | koliko je musterija bila spremna dati, a nama je od toga 66 | pobjeci. Pozalile smo se covjeku koji nam se predstavio kao 67 | Valeria je na podrucje TPK-a prvi put dosla u ratu. Pocela 68 | Malo se toga promijenilo: na Dubravama, oko americke 69 | U dnu hodnika je jedna manja soba, skromnije namjestena - u 70 | imala trojica brace, Bosnjaci iz Bugojna (imena poznata 71 | djevojke. Jedna je uspjela pobjeci i napustila je BiH. 72 | 73 | ona radi u drugom restoranu." 74 | obzirom na situaciju, one su odvezene na Usce, smjestene u 75 | u Tuzli prostitutka mogla kupiti u nocnom baru "Mullen 76 | vani i sporednim stepenistem odvodi na sprat. Gore, iza 77 | BiH i njihov boravak je ilegalan. Situacija je jos gora ako 78 | Zena koja joj je pomogla da se prebaci u Hrvatsku 79 | koje musterije itekako traze. Nas izvor tvrdi da zna na 80 | potrebno je imati propusnicu na kojoj pise: Caffe disco 81 | godine. "U Rumuniji nisam imala uslova za zivot, pa mi je 82 | vlasnik jednog nocnog bara priznaje da je za tri mjeseca 83 | 84 | granici sa opcinom Kalesija. Svi ovi barovi su slicni: 85 | jos djevojaka..." 86 | joj je gazda poceo slati musterije, pijane goste iz svoje 87 | u nju i htio je po svaku cijenu". Trecu iz te grupe Edin je 88 | sex-shopu u Novom Travniku. 89 | drzava. U njemackim zatvorima je proveo cetiri godine od 90 | U Orasju se nalazi jedan od najpoznatijih nocnih barova na 91 | na kojima se djevojke prisiljavaju na prostituciju, u RS-u 92 | najcesce bila od tristo do petsto maraka, pa do hiljadu, 93 | za to namijenjene, djevojke bi imale zdravstvene kartone i 94 | kafane. Na kraju je ipak uspjela pobjeci, ali gore ima 95 | stizale preko Zagreba gdje su tuzlanske gazde imale svog 96 | troskovi usluge, prevoza, hrana, spavanje, menadzerstvo, 97 | drugacije rijesiti. Ona se vratila, ali prosla je kao i 98 | -------------------------------------------------------------------------------- /lib/training_data/todo/breton.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/breton.txt -------------------------------------------------------------------------------- /lib/training_data/todo/bulgarian-iso8859_5.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/bulgarian-iso8859_5.txt -------------------------------------------------------------------------------- /lib/training_data/todo/catalan.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/catalan.txt -------------------------------------------------------------------------------- /lib/training_data/todo/croatian-ascii.txt: -------------------------------------------------------------------------------- 1 | izbjegne neugodni vjetar, kliznuo je zyurno kroz 2 | Zadrzyao je dah i otvorio vrata. Smjesta ga je obuzeo 3 | si mi dva dolara. 4 | da imasy parolu kao syto je 5 | izdaleka da se pocyinja nekakva krivotvorina: uvijek se 6 | pojedinosti nekih dogadjaja, a da nisi kadar da ozyivisy 7 | vrbama. 8 | --- cyulo kakvu kompromitantnu primjedbu i 9 | i gurnuo ga u pneumatsku cijev. Tada 10 | gledati Goldsteinovo lice a da ga ne obuzme mucyna 11 | se moglo nikako biti siguran da Bratstvo ipak nije 12 | Pobjede mogle sve cyetiri vidjeti istovremeno. Bila su to 13 | optuzybama diktaturu Partije, zahtijevao je neodlozyno 14 | djelokrug svijesti stalno sve uzyi. Ni sada, razumije se, nema 15 | rukovodioci obicyavali su se ovdje skupljati prije nego syto su 16 | progutala jedna od prvih velikih cyistki u pedesetim 17 | Kad je imao tri godine, drug Ogilvy je vecj odbijao 18 | nevjerojatno. Svejedno, i dalje je osjecjao osobitu nelagodu, u 19 | Bilo je to uvijek nocju --- hapsyenja su se odvijala 20 | strasyno. Na njemu uopcje nije bilo prozora. Winston 21 | predvidjanje od strane Partije moglo se pisanim dokumentom 22 | svog brata u svakom pokretu. To je nekako djelovalo 23 | volio --- mozyda unucyica. Svako malo starac je ponavljao: 24 | S dubokim nesvjesnim uzdahom koji cyak ni blizina 25 | mjesyavina osjecjaja. Bilo je to mrsyavo zyidovsko lice, s 26 | mjesyavina osjecjaja. Bilo je to mrsyavo zyidovsko lice, s 27 | zatvorenosti u kojoj cyovjek mora zyivjeti. 28 | ljudsko stvorenje nego nekakva lutka. To ne govori 29 | distanciranost, stanovita spasonosna glupost. Nije se 30 | seksom i sentimentalne pjesme komponirane u cijelosti 31 | literaturu. Vjerojatno je --- jer ju je tu i tamo vidjao 32 | izmedju prvog i drugog slova --- tezyak, dubok mrmor, 33 | vladala je prava glad za zyiletima. U svakom danom cyasu 34 | Za tebe, moja Oceanijo! 35 | da gradjane Oceanije opskrbi novinama, filmovima, 36 | medjutim objava o stvarnoj proizvodnji, iz koje proizlazi 37 | --- Zbilja znaju biti bucyni --- rekla je. --- Razocyarani 38 | upotrebljavao staromodno pero, i 39 | izmisyljeno. Winston se cyak nije mogao sjetiti ni kojeg je 40 | u nesyto drugo vecj izmijenjeni u nesyto doslovno 41 | 42 | . Dakako, mi te 43 | izmjene. Cyak i pisane upute koje je Winston primao, a 44 | i vazynom da je Winston imao samo mutnu predodzybu o 45 | trudbenika bili zaposleni na nezamislivom mnosytvu 46 | organizator Omladinskog antispolnog saveza. S devetnaest 47 | 48 | blebetao o sirovom zyeljezu i premasyivanju Devetog 49 | organizator Omladinskog antispolnog saveza. S devetnaest 50 | Stanobloku Pobjede, doista se upravo probijao kroz kantinu 51 | nemilosrdno govorio. Neka mlada zyena koja mu je 52 | njemu lijevo, onaj cyovjek prodorna glasa josy uvijek je 53 | dobro 54 | prijatelje, nego drugove: ali bilo je nekih drugova cyije je 55 | Winston je na telekranu okrenuo pozivnu syifru za 56 | za novine, a na zidu sa strane, na lakom dohvatu 57 | zalo preko glatkoga papira i ispisalo krupnim cyvrstim 58 | nesyto prepametno za mene. Cyuj, Smith, stari moj, da ti 59 | pot- 60 | na kakvog plemicja iz osamnaestog stoljecja kako nudi 61 | i gurnuo ga u pneumatsku cijev. Tada 62 | instrument, koji se rijetko koristio cyak i za potpisivanje, a 63 | telekran 64 | syto mrmljaju u zboropise, bilo je barem desetak ljudi 65 | uvijek ga je ispunjavalo uzyasom. Dakako da je 66 | Parsons je bio kao i Winston namjesytenik u 67 | jer su prije dvije godine isparili i njenog muzya. A 68 | i ostale tome slicyne? 69 | --- ponovo se sagnula. --- Vidite da koljena ne savijam. 70 | i da je apsolutno kadar da ga prijavi kao misaonog 71 | zemljom. Po Londonu su se razmjestile josy samo tri 72 | kraju. Evo telesnimka. . . 73 | sloboda je ropstvo 74 | tekucjine u crtezy. S gnusyanjem je razmisyljao o fizicykoj 75 | referira sluzybeno o nepostojecjim osobama. U potpunosti 76 | nov. Ali to je svakako ustanovio. Cyovjek koji mu je 77 | te godine, buducji da je razmjerno siguran da sam ima 78 | On je stajao na cyelu goleme tajanstvene vojske, 79 | zyurno trcyali dolje, dolje, dolje u neko duboko mjesto u 80 | prije nego bi ih smaknuli. Veoma rijetko, ali ipak, osoba 81 | svih hereza, koje je Goldstein bio autor i koja je potajno 82 | uniformama, naoruzyanih uzglobljenim pendrecima. 83 | napola preplasyeni pogled na vrata. --- Danas nisu bila 84 | Bratom, a onda se upleo u kontrarevolucionarnu 85 | cyin. Napisao je sitnim, nespretnim slovima: 86 | preko puta. Nesyto kao da mu je pouzdano govorilo da 87 | pretpostavkom da svaki njegov zvuk netko prislusykuje i da 88 | Kako je lako, pomislio je Winston, ako ne gledasy oko 89 | pokusyajte opet. Sad je bolje, druzye, sad je 90 | na kakvog plemicja iz osamnaestog stoljecja kako nudi 91 | jednu kulturu, cijeli sustav misyljenja, kao da se Veliki 92 | Mora da su vijesti losye, pomislio je Winston. I 93 | --- Zyalim slucyaj --- rekao je Winston. 94 | grudi, sve plavokoso, vitalno, suncem opaljeno, 95 | niska, tamnokosa i krzyljava. Bilo je neobicyno kako je 96 | oklijevati. Srce mu je tuklo kao bubanj, ali lice mu je, po 97 | 98 | nisyta nije imalo boju osim onih plakata koji su bili 99 | onda je pohvala. 100 | drzyati na licu kad god se cyovjek okrene telekranu. 101 | mu je zadrhtala. Zabiljezyiti nesyto na papiru prijelomni je 102 | nikad nije priznavalo da su u njima izvrsyene bilo kakve 103 | strance na stolici da bi ispio syalicu kave. Za stolom 104 | legenda, dok su crne ocyi gledale duboko u Winstonove. 105 | -------------------------------------------------------------------------------- /lib/training_data/todo/esperanto.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/esperanto.txt -------------------------------------------------------------------------------- /lib/training_data/todo/estonian.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/estonian.txt -------------------------------------------------------------------------------- /lib/training_data/todo/frisian.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/frisian.txt -------------------------------------------------------------------------------- /lib/training_data/todo/georgian.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/georgian.txt -------------------------------------------------------------------------------- /lib/training_data/todo/greek-iso8859-7.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/greek-iso8859-7.txt -------------------------------------------------------------------------------- /lib/training_data/todo/hawaian.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/hawaian.txt -------------------------------------------------------------------------------- /lib/training_data/todo/hebrew-iso8859_8.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/hebrew-iso8859_8.txt -------------------------------------------------------------------------------- /lib/training_data/todo/hindi.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/hindi.txt -------------------------------------------------------------------------------- /lib/training_data/todo/hungarian.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/hungarian.txt -------------------------------------------------------------------------------- /lib/training_data/todo/icelandic.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/icelandic.txt -------------------------------------------------------------------------------- /lib/training_data/todo/indonesian.txt: -------------------------------------------------------------------------------- 1 | Harus diakui, mengangani kasus ekstasi yang sedang marak dewasa ini merupakan 2 | perlu terjadi. 3 | 4 | ini. Peristiwa itu merusak citra LSM, seperti peribahasa "karena nila 5 | Polri. Sayang, keberhasilannya membekuk Zarina, dengan barang bukti berupa 6 | Zarina berbeda dengan Ria Irawan, baik dalam kasus maupun kemampuan akting 7 | Indonesia (PIJAR Indonesia) di Jalan Barkah Manggarai, Jakarta Selatan. 8 | tidak pernah mem-booking kami. Ya pokoknya sebatas kenal di meja saja, 9 | terlalu jauh. 10 | 11 | Fenomena ini kami anggap menarik untuk dijadikan Laporan Utama kali ini. 12 | ditahan. Fifi mengajak Heri bermalam di Hotel Nan Tongga. Tak jelas, 13 | Namun gebrakan menguber tokoh-tokoh PRD tak melulu dikaitkan dengan aktivitas 14 | Reserse Poltabes Ujung Pandang, pada 1990-an, ia amat populer di kalangan 15 | ini, berita itu sungguh memprihatinkan. Terlebih ada dugaan bahwa Zarina 16 | kayak teman biasa gitu," kata seorang cewek kece di situ. 17 | Zarina bersama pengendara motor itu kabur ke arah jalan tikus di kompleks 18 | sejumlah aktivis SBSI masuk daftar cari. Tapi baru Muchtar Pakpahan yang 19 | 20 | Polres Tangerang bahkan memberi aba-aba, seandainya Zarina tidak menyerahkan 21 | SAYA sedih proses keterbukaan dan demokratisasi, yang susah- payah diperjuangkan 22 | Oh, Zarina 23 | 24 | Betulkah kaburnya Zarina semata-mata karena si polisi terkecoh? Atau 25 | 26 | 27 | Pekanbaru, dan Lampung dipanggil dan dimintai keterangan oleh aparat 28 | bagaimana upaya keras polisi menjejaki Zarina, menyisir kawasan Puncak, 29 | di Cipondoh, Tangerang, ditempati familinya. 30 | ia sengaja mampir sebentar agar Zarina, bisa mandi dan ganti baju, sebelum 31 | Budiman Sudjatmiko penganut komunisme. "Dia suka mempelajari gerakan 32 | Bagian ini dilengkapi dengan pendapat sejumlah tokoh kepolisian. 33 | sama-sama syuting. 34 | foto Ade kerap menghias media massa. 35 | 36 | Jenderal Feisal Tanjung mengeluarkan pernyataan penting menyangkut nasib 37 | untuk melimpahkan kasus Ria itu ke pengadilan. 38 | Dimutasi dari Unit Bunuh Culik, Ade berkiprah sebagai penyuluh, bertugas 39 | Malah ngakunya pengin cepat-cepat punya anak," tutur Ismed, yang dipercaya 40 | dan politik. Tapi advokator bukan jadi aktor. Dalam kasus PDI ini mungkin 41 | kegiatan PIJAR stop sama sekali. Di kantor itu cuma terlihat kardus berisi 42 | 43 | 44 | Kiprah Sandy di dunia LSM dimulai pada 1985, ketika Ordo Serikat Jesus 45 | melakukan penggerebekan dan penangkapan di Medan, Bandar Lampung, Jakarta, 46 | dunia?. Catatan ini dianggap berhubungan dengan sejarah PKI yang terkubur 47 | Bogor, Semarang, Yogyakarta, Solo, Surabaya, Malang, dan Ujung Pandang. 48 | perlu terjadi. 49 | Narkotika Polda Metro. 50 | terkubur, dibantai, dihina, dibunuh, dilarang, diawasi, dikhianati. Sekarang 51 | barang-barang ke dalam rumah, yang kelihatan cuma Erwin. "Yang sering 52 | Kedua, ada proses sosial yang merefleksikan kehendak, terutama di kalangan 53 | bermaksud menyembunyikan, melindungi, atau apa? Ini kita perlu tahu," 54 | bersedia membantu. 55 | pihak ketiga yang tak jelas. Diduga ada yang menunggangi situasi sosial 56 | sementara ia menyusun strategi untuk kabur ke luar negeri, misalnya. 57 | itu, dengan kop Plan and Memo di setiap halamannya, terdapat catatan-catatan 58 | katanya. Untuk berjaga-jaga, ia menunjuk Abdul Hakim Garuda Nusantara, 59 | 60 | mungil bertingkat, di Blok K3/21. 61 | itu membuatnya terjungkal. 62 | PRD, yakni Ignatius Putut Ariantoko dan Victor da Costa, Ketua SMID Jakarta, 63 | 64 | (tempat tak dicantumkan). Pada pekan itu, PRD secara "resmi" berubah 65 | diri Ade begitu kuat, sehingga rela menabrak aturan tugas demi kepentingan 66 | sering menjadi kuli dan buruh bangunan untuk merasakan langsung kehidupan 67 | tersangka, aparat keamanan terus mencari tokoh intelektual yang dianggap 68 | 69 | 70 | juga tengah melacak kemungkinan si ibu terkait, atau minimal mengetahui 71 | karena tak pernah menjadi pemeran utama, Zarina kurang dikenal. 72 | 73 | ceramah di UCLA, yang dulu menolaknya menjadi mahasiswa. 74 | Sosial Jakarta (ISJ), lembaga yang dibentuk Serikat Jesuit pada 1985. 75 | untuk menyampaikan keluh kesah ke gedung MPR/DPR di Jalan Gatot Subroto, 76 | Gatra. 77 | bermaksud menyembunyikan, melindungi, atau apa? Ini kita perlu tahu," 78 | Malah ngakunya pengin cepat-cepat punya anak," tutur Ismed, yang dipercaya 79 | Para petugas juga mengaku menemukan 28 butir peluru pistol FN dan 14 80 | Kalau sekarang diam, menurut Bonar Tigor Naipospos, tak berarti LSM ini 81 | Satuan Reserse Polres Tangerang. Ade ditahan di sel Provost Polda Metro. 82 | Kok polisi tidak mau belajar dari kejadian serupa di Batam, Agustus 1993 83 | dalang kerusuhan 27 Juli menunjukkan gejala kemunduran. Kekerasan dan 84 | yakni bekas lapangan milik perusahaan pembuat mesin- mesin pesawat Howard 85 | Peraturan Dinas Kepolisian yang berisi tata cara dan aturan mengantar, 86 | 87 | (LSM). 88 | HARI-hari setelah "Sabtu kelabu", 27 Juli 1996, Jakarta dan daerah-daerah 89 | Penangkapan terhadap tokoh-tokoh PRD dan anak organisasinya memang tak 90 | Goresan tulisan "kalimat-kalimat rawan" itu memang agak berbeda motif 91 | 92 | 93 | banyak diberitakan, menjadi buron karena dituduh sebagai penggerak kerusuhan 94 | -------------------------------------------------------------------------------- /lib/training_data/todo/irish.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/irish.txt -------------------------------------------------------------------------------- /lib/training_data/todo/latin.txt: -------------------------------------------------------------------------------- 1 | conserimus, multos Danaum demittimus Orco. 2 | Huc septem Aeneas collectis navibus omni 3 | `Iam iam nulla mora est; sequor et qua ducitis adsum. 4 | vela dabant laeti, et spumas salis aere ruebant, 5 | non potuisse, tuaque animam hanc effundere dextra, 6 | 7 | vidistis si quam hic errantem forte sororum, 8 | LIBER II 9 | 10 | prospectum late pelago petit, Anthea si quem 11 | idque audire sat est? Iamdudum sumite poenas, 12 | obicitur magis, atque improvida pectora turbat. 13 | fert umero, gradiensque deas supereminet omnis: 14 | Quo molem hanc immanis equi statuere? Quis auctor? 15 | litoraque et latos populos, sic vertice caeli 16 | terga dati, superant capite et cervicibus altis. 17 | prodere voce sua quemquam aut opponere morti. 18 | signantemque vias; tum longo limite sulcus 19 | evasisse viam, subito cum creber ad auris 20 | litoraque et latos populos, sic vertice caeli 21 | virtutesque virosque, aut tanti incendia belli? 22 | et me, quem dudum non ulla iniecta movebant 23 | Talibus insidiis periurique arte Sinonis 24 | et sedet hoc animo, perituraeque addere Troiae 25 | una Eurusque Notusque ruunt creberque procellis 26 | fertur in arva furens cumulo, camposque per omnis 27 | aerea cui gradibus surgebant limina, nexaeque 28 | viginti tauros, magnorum horrentia centum 29 | Ter circum Iliacos raptaverat Hectora muros, 30 | Iamque ibat dicto parens et dona Cupido 31 | cuncta pater fatoque urguenti incumbere vellet. 32 | reddit equus, laetique cavo se robore promunt 33 | `Iuppiter, hospitibus nam te dare iura loquuntur, 34 | remigio alarum, ac Libyae citus adstitit oris. 35 | Hic primum ex alto delubri culmine telis 36 | `Saepe fugam Danai Troia cupiere relicta 37 | quid meus Aeneas in te committere tantum, 38 | sorte tulit, Troiam incensam et prolapsa videntem 39 | implicuit sequiturque patrem non passibus aequis; 40 | emissamque hiemem sensit Neptunus, et imis 41 | ut primum lux alma data est, exire locosque 42 | O passi graviora, dabit deus his quoque finem. 43 | 44 | Eurus equis; stridunt silvae, saevitque tridenti 45 | aptemus: dolus an virtus, quis in hoste requirat? 46 | auditur, propiusque aestus incendia volvunt. 47 | vos agitate fugam: 48 | corripuere sacram effigiem, manibusque cruentis 49 | Quod te per superos et conscia numina veri, 50 | Atque hic ingentem comitum adfluxisse novorum 51 | auratasque trabes, veterum decora alta parentum, 52 | nutrimenta dedit, rapuitque in fomite flammam. 53 | involvens umbra magna terramque polumque 54 | 55 | Bis quinos silet ille dies, tectusque recusat 56 | nota tibi, et nostro doluisti saepe dolore. 57 | Ecce autem telis Panthus elapsus Achivom, 58 | intendunt: scandit fatalis machina muros, 59 | Dividimus muros et moenia pandimus urbis. 60 | prospiciens, summa placidum caput extulit unda. 61 | succedoque oneri; dextrae se parvus Iulus 62 | pressit humi nitens, trepidusque repente refugit 63 | impulit his cingi telis? Aut quo ruis?' inquit; 64 | inscius, atque ultro verbis compellat amicis: 65 | Ilium in Italiam portans victosque Penates: 66 | Hinc ferro accingor rursus clipeoque sinistram 67 | Hoc erat, alma parens, quod me per tela, per ignis 68 | insequitur. Quem das finem, rex magne, laborum? 69 | femineis ululant; ferit aurea sidera clamor. 70 | accipiunt socios atque agmina conscia iungunt. 71 | Obstipuit, retroque pedem cum voce repressit: 72 | 73 | Et iam finis erat, cum Iuppiter aethere summo 74 | et casum insontis mecum indignabar amici. 75 | multaque per caecam congressi proelia noctem 76 | Non ego Myrmidonum sedes Dolopumve superbas 77 | venimus; hic demum collectis omnibus una 78 | impulerat ferro Argolicas foedare latebras, 79 | pectora, si vobis audentem extrema cupido 80 | quos illi fors et poenas ob nostra reposcent 81 | Hinc ferro accingor rursus clipeoque sinistram 82 | 83 | sin absumpta salus, et te, pater optume Teucrum, 84 | `Nate, quis indomitas tantus dolor excitat iras? 85 | regna Liburnorum, et fontem superare Timavi, 86 | Franguntur remi; tum prora avertit, et undis 87 | crateras magnos statuunt et vina coronant. 88 | et breviter Troiae supremum audire laborem, 89 | Italiam, fato profugus, Laviniaque venit 90 | Vina bonus quae deinde cadis onerarat Acestes 91 | convenere, toris iussi discumbere pictis. 92 | Quo molem hanc immanis equi statuere? Quis auctor? 93 | Troes te miseri, ventis maria omnia vecti, 94 | 95 | saucius: illum ardens infesto volnere Pyrrhus 96 | Ter circum Iliacos raptaverat Hectora muros, 97 | inter opima virum leni fluit agmine Thybris: 98 | aeternis regis imperiis, et fulmine terres, 99 | Myrmidonum Dolopumve aut duri miles Ulixi 100 | extulerat, fatisque deum defensus iniquis 101 | protinus ad sedes Priami clamore vocati. 102 | bina manu lato crispans hastilia ferro. 103 | implevitque mero pateram, quam Belus et omnes 104 | 105 | Ipse hostis Teucros insigni laude ferebat, 106 | Iam validam Ilionei navem, iam fortis Achati, 107 | At non ille, satum quo te mentiris, Achilles 108 | proelia: Numquam omnes hodie moriemur inulti.' 109 | Haec ubi dicta, cavum conversa cuspide montem 110 | nuntio, et in tutum versis aquilonibus actam, 111 | Hic Dolopum manus, hic saevus tendebat Achilles; 112 | non illi imperium pelagi saevumque tridentem, 113 | portarum vigiles, et caeco Marte resistunt.' 114 | et magnum falsi implevit genitoris amorem, 115 | Iphitus et Pelias mecum, quorum Iphitus aevo 116 | Et, si fata deum, si mens non laeva fuisset, 117 | posthabita coluisse Samo; hic illius arma, 118 | 119 | Hic mihi nescio quod trepido male numen amicum 120 | Quicquid id est, timeo Danaos et dona ferentis.' 121 | -------------------------------------------------------------------------------- /lib/training_data/todo/latvian.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/latvian.txt -------------------------------------------------------------------------------- /lib/training_data/todo/lithuanian.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/lithuanian.txt -------------------------------------------------------------------------------- /lib/training_data/todo/malay.txt: -------------------------------------------------------------------------------- 1 | Waals (Rajah 6.2). 2 | 3 | menyebabkan arus air yang membekalkan insang mengalir secara malar. 4 | satu cantuman angkubah A, B dan C. Ini bermakna jika A = B = C = 0, A 5 | sumber-sumber asli dan keselamatan nasional. 6 | 2.1 FUNGSI DAN 7 | 8 | berenang perlahan dan lama. Respirasi dalam otot merah melibatkan 9 | Kr [Ar]3d104s24p6 10 | Keluaran pembilang diberi oleh 11 | Sekarang cuba kita teliti peta Karnaugh di dalam Rajah 5.10. Kita 12 | development) bangunkan pusat-pusat dan bantuan 13 | Sendi bagi Kelompok Kata Sendi Namaan, seperti: 14 | (Maka dihukumkan daripada sekalian hukum seperti hukum itu). Ia jua 15 | Menghasilkan reaksi sosial yang negatif Membawa kepada pemencilan dan 16 | Seperti biasa pada tengah hari itu Mukmin berjalan pulang dari 17 | 18 | (basking shark), yang berukuran lebih dari 10 m dan Rhiniodon typus 19 | 20 | "bahasa penakrifan". Bahasa yang digunakan untuk penakrifan 21 | dewasa tidak mempunyai injap dan kaedah respirasinya akan diterangkan 22 | heteroseks, walaupun kegiatan heteroseks digambarkan sebagai norma dan 23 | 24 | bergegar oleh gelak ketawa apabila tiba pada soalan yang mencuit hati. 25 | yang Maha Pemurah lagi yang Maha Mengasihani datang menjemput mereka 26 | dapat dirakamkan pada pita kaset atau floppy disk dansebagainya. 27 | 11. Jangkauan yang berkesan 28 | kembali terlelap. Sebentar kemudian kelihatan sesusuk tubuh berdiri 29 | yang kecil- kecil, yang biasanya tidak akan dimasukkan ke dalam bank. 30 | 31 | 32 | 33 | akaun peminjam itu atau akaun orang lain. 34 | dewasa tidak mempunyai injap dan kaedah respirasinya akan diterangkan 35 | projek yang dibiayai itu. 36 | 37 | kepada cara hidup ini. 38 | terdapat dalam petikan Tuhfat al-Nafis seperti yang berikut ini:96 39 | 40 | dasar r dan m angka 41 | dan kebudayaan juga tidak mahu ketinggalan. Mereka bukan sahaja turut 42 | A. SISTEM BANK -- 43 | sebagai cadangan sudah mencukupi. Bakinya boleh dipinjamkan kepada 44 | Population of Malaysia, 1986. 45 | mengah. Mukmin memperkenalkan Dol dan Kutang kepada kakaknya dan Siti 46 | disediakan di bawah arahan Terpigorev dan dengan kewibawaan Academy of 47 | "Macam mana nak dapatkan ayah, dia kerja jauh dari pejabat." 48 | ekonomi kita bagi membiayai pelaburan jangka panjang, sebahagian 49 | 3.64 ILUSTRASI 50 | 51 | 52 | lebihan tiga. Tetapi 710 ialah pelengkap-9 bagi nombor 210. Ini 53 | sedia ada, dan kedua-dua pihak yang terlibat dapat melihat dan 54 | Berangkatlah segera dengan pendirian dan sikap memihak itu. Nyah! 55 | Sebatian Halida 56 | daripada dana awam bagi tujuan memajukan pertanian. Di samping itu, 57 | 1979 [127] dan kuliah juga telah disampaikan di universiti dan 58 | dalam kurungan selepasnya. 59 | 60 | e. Setiap kali kita menambah satu cabang kepada gambarajah 61 | perambatan yang singkat diutamakan. 62 | satu ialah daripada peningkatan sebenar dalam perbelanjaan. 63 | boleh dibuat berasaskan konfigurasi elektron yang telah diketahui 64 | kesempatan membalas dendam dengan menduduki banyak wilayah di utara. 65 | kelihatan tiga empat orang sedang mengelilinginya. Tidak disedarinya, 66 | 67 | W. Marsden pula dalam kajiannya mendapati bahawa bahasa Melayu dan 68 | cacing 'acorn' adalah berbeza dengan fungsi notokord pada 69 | Walau bagaimanapun, meskipun wacana mungkin dikesan dalam 70 | dan memang wajar jika ditolak oleh tradisi Melayu yang tidak sukakan 71 | kendalian aritmetik seperti mencari pelengkap, mendarab dan membahagi. 72 | jangan tinggalkan desa ini. Teruskan usaha mu!" Nenek Sandang 73 | suatu ketika dahulu di mana kita dikunci di dalam bilik dan merasa 74 | 75 | 6. Selepas kemerdekaan, bank tempatan bertumbuh dengan cepat dan 76 | corak yang tetap (contohnya, memfail mengikut aspek yang 77 | komunikasi merupakan gambaran asas ekonomi masyarakat yang 78 | dijalankan sebaik sahaja komputer itu dipasang semula. Programyang 79 | anggaran perbandingan di antara ciri- ciri konsep yang berkenaan. 80 | 81 | cocok dengan cara hidup haiwan akuatik yang paling maju. Bentuk atau 82 | konsep menegak yang logik (lihat 3.412.1). 83 | meramalkan kesan pasaran. Pengalaman mungkin membawa kepada peraturan 84 | Jika gate DAN dikehendali mengeluarkan aliran arus 1 mA apabila 85 | kebun getah peningalan arwah ayahnya. Apa yang diketahuinya, pokok 86 | didepositkan ke 87 | tersebut telah dapat mengurangkan migrasi luar bandar - ke bandar. 88 | _______________________________________________________ __ 89 | 2. Menukarkan nilai wang dari satu matawang kepada matawang yang 90 | Nenek Sandang Samirah menegur setelah agak lama menyepi. "Tak payah 91 | menerangkan tujuan kedatangan tetamu itu. "Sebenarnya saya pun tidak 92 | "Ayah bangga Mus, jika kau mempunyai semangat begitu. Tengoklah 93 | ditanam menjadi, fikir Ngah. Kuranglah sedikit belanja membeli sayur. 94 | Slametmuljana yang membuat penyelidikannya berdasarkan perbandingan 95 | berbisik cemas. Dan Nenek Sandang Samirah mendakap cucunya yang 96 | 97 | 98 | membolehkan komputer itu mendapat butir-butir yang dikehendaki adalah 99 | ada pertentangan besar di dalam usaha-usaha mencari rezeki, sedangkan 100 | yang diutarakan itu, ialah pergerakan penduduk luar bandar ke bandar 101 | Penggunaan Dana 102 | 1 maka baris 40 mengandungi arahan 103 | 104 | "Entahlah. Kata khatib tadi, ada benda yang hendak diberitahu." 105 | Seperkara yang perlu juga dihuraikan secara sepintas lalu ialah 106 | dalam ruang-ruang tegak. Sungguhpun begitu, murid-murid yang 107 | 108 | (b) Berapakah umur fosil yang paling tua? 109 | -------------------------------------------------------------------------------- /lib/training_data/todo/manx.txt: -------------------------------------------------------------------------------- 1 | shin fo shiaull son y chooid smoo jeh'n thurrys. 2 | reggyryn dy laghyn roish Laa Luanistyn, as cha nel foast fys aym cre'n aght 3 | as ny Vanninagh dooie neesht as v'eh ny charrey mie dooys. 4 | elley, er y nuyoo laa Mee Boaldyn. Daag shin Aerphurt Runnysvie er etlan 5 | sollyssid ayns ny sooillyn eck, as dooyrt mee "S'mayrey t'ou jiu Chatreeney! 6 | clagh vooar ayns jiass yn ellan, cha nee feer foddey ersooyl voish Purt yn 7 | shooyl er y shooyllaghan Phurt ny h'Inshey, as hie mee shaghey Yn "Weather 8 | voish, yn ennym echey as dagh ooilley nhee fod ad feddyn magh. Keayrt dy row 9 | CHA ren mee rieau screeu monney ass y Ghaelg roie ry-hoi soilshaghey magh 10 | er y lhong ain as dy chur cuirrey dooin voish yn ard 'er ynsee jeh'n scoill 11 | adsyn y hoiggal, ta mee lane shickyr dy row yn cheb shoh, feer goll-rish bun 12 | Caesar Cashin 13 | valley ec kione my hurryssyn boallagh shin taggloo ayns y chenn ghlare, agh 14 | jannoo er y clieau! Teiy freoaghaneyn t'ish gra, yn chenn leshtal cheddin!" 15 | Yeeagh ee orrym myr nagh row ee rieau er chlashtyn mychione sleityn, 16 | bleeaney jeig. Va daa naim aym eisht, 'sy cheer shid braar my ayrey as 17 | Eisht, tra va'n baatey glennit v'ee troggit er boayrd baatey traghtee mooar 18 | feed oarlagh dy seyrvoayrd ayn, agh hie ee harrish ny tonnyn mooarey myr 19 | -- t'ad gra "apart-hide" agh ta'n fockley-magh kiart "apart-hate". Screeu 20 | Eisht, tra va'n baatey glennit v'ee troggit er boayrd baatey traghtee mooar 21 | 22 | ry-cheilley?"). By ghoillee eh dy jarroo dy chur baght daue er Ellan Vannin 23 | vooar. Son shickrys cha row agh un carr by chooie da dy chloie dooin -- 24 | lhiggey er dy row ad Aspick Vannin as y Kianoort. 25 | Goll shaghey'n Raggatt, vel fys euish dy vel "Luss y Steep" gaase heese sy 26 | lheimmey magh assym tra honnick mee ooilley ny h-etlanyn aynshid, keeadyn 27 | car ny bleeantyn shen. Hooar mee lioaran ass yn Ellan tammylt er dy henney 28 | va'n rio ny keayrtyn, eisht shooyl ny hrooid as shinyn lane coamrit! 29 | Honnick shin ymmodee baljyn, ram sleih as ram reddyn suimoil elley. Veeit 30 | Lunnin, as son shickyrys haink ooilley ny lughtyn thie ain da'n aerphurt 31 | pene, t'ad loayrt my my-chione agh va mee er chee goll roym reesht D'yllee 32 | Odin. Cha row yn cheayn feer gharroo edyr as cha row agh shey jeh'n skimmee 33 | 34 | chur da Caesar tra v'eh drappal harrish cleigh ennagh, agh haink sheeb ass 35 | ayns shoh roie! " Agh chelleeragh dreggyr mee rhym pene as dooyrt mee, "Cha 36 | Honnick mee dy row eddin y ven aeg ruy jiargaghey as va soilshey ayns ny 37 | She startey red beg doillee eh, agh lurg tree ooryn dy chliaghtey v'eh jeant 38 | magh ass, cha dooyrt mee veg, agh ersooyl lhiam er aght lhiass-etlagh derrey 39 | t'ayn, agh myr garroo as t'eh nish, wheesh shen ny s'girroo v'eh ec y traa 40 | Ec kerroo dys shey er y chlag 'syn astyr va shin faggys da'n traie mastey 41 | whaagh. 42 | ferrishyn daunsey mygeayrt as bayrnyn jiargey as cooatyn geayney orroo! Myr 43 | Arrane Ashoonagh Vannin as eisht hie Feeagh Odin magh ass y phurt as yn 44 | myr v'eh jeeaghyn er ny groink, as nyn ging fud ny bodjalyn beggey va 45 | Haink ny fir-chustym lesh shilley orrin son dy yannoo shickyr nagh row shin 46 | Chidhe", ennym so-hoiggal da Manninagh as Gaelg echey! 47 | Ta cooinaghtyn as skeealyn taaley magh ass beeal Caesar gyn scuirr. Ren shin 48 | Dy jarroo ta mee smooinaghtyn dy jagh yn Gaelg voish yn olk gys yn smessey 49 | reddyn goaill," ta shen dy ghra, dy vel reddyn quaagh ayn as dy vel ny 50 | Hannee shin rish tree laghyn ayns Lerwick as tra v'eh cooie dooin dy 51 | Nish ta shin goll shaghey 'Raby'. "Cha nel Quirk Raby jeh'n kynney euish." 52 | jean ad livrey seose y cheer shid derrey vees yn dooinney jerrinagh ny lhie 53 | lheeah echey as smooinee mee rhym pene, "Cre'n fa ta'n shenn dooinney shen 54 | obbraghey rish daa oor yeig 'sy laa ny daa oor yeig 'syn oie as ny keayrtyn 55 | Va'n laa braew grianagh as cha row fynnyraght dy gheay ayn. Myr shen beign 56 | ayns shamyr vooar fo-halloo raad va ny greienyn mooarey pumpal ushtey magh 57 | scooyrit neesht. Myr shen cha b'eeu eh da Robin ginsh dou dy ghaghtey mee 58 | shoh ooilley ry-chlashtyn bio er Radio Vannin! 59 | shoh bunnys ooilley cour ymmyd thieyn sheelee Eeley. 60 | chooyl as va aggle mooar orrym fakin tonnyn mooarey, tree keayrtyn ny 61 | Va baatyn dy liooar geiyrt orrin stiagh ayns Fjord Trondheim. Tra va tree 62 | "Apartheid" myr screeu mee, (Cha nod sleih ayns Goal gra y fockle dy kiart 63 | 64 | mee er aght fea, as dooyrt mee rhym pene "Cum dty hengey Eoineen, fuirree 65 | veih'n dooinney shen. Ta ny sheeanyn echey feer chooie dooys t'ad kiart 66 | h-Earragh as jees elley voish Ooist as troor voish Ellan Skianagh ee hene. 67 | er bun liorish Goal Vooar 'sy Chaggey Boeragh. Ta ny deiney doo cur ammys 68 | 69 | shen as loayr eh rish 'neen y caillin v'eh er ve sooree urree ooilley ny 70 | 71 | as erreish dou gialdyn nagh yiarrin veg rish e shuyr Emily mychione y 72 | chlea falleayssagh as y sireen gullal myr dy row ad geiyrt er kimmee er y 73 | laue as focklyn folliaghtagh as y lhied. 74 | doaltattym, cheayll mee coraa y daa ven voish laghyn my aegid briaght jeh'n 75 | 76 | Er lhiam dy vel adsyn jannoo ard 'eailley foddey smoo jeh'n laa shen ta 77 | Tra hooar e yishag fys dy row eh sooree er ben aeg voght voish y jiass, hug 78 | feer aalin ta ry-gheddyn ayns shoh. Yeeagh Caesar er y cheer mygeayrt, as 79 | -------------------------------------------------------------------------------- /lib/training_data/todo/marathi.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/marathi.txt -------------------------------------------------------------------------------- /lib/training_data/todo/mf.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/mf.txt -------------------------------------------------------------------------------- /lib/training_data/todo/middle_frisian.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/middle_frisian.txt -------------------------------------------------------------------------------- /lib/training_data/todo/mingo.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/mingo.txt -------------------------------------------------------------------------------- /lib/training_data/todo/nepali.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/nepali.txt -------------------------------------------------------------------------------- /lib/training_data/todo/persian.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/persian.txt -------------------------------------------------------------------------------- /lib/training_data/todo/quechua.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/quechua.txt -------------------------------------------------------------------------------- /lib/training_data/todo/romanian.txt: -------------------------------------------------------------------------------- 1 | dezumfla ciorapii de matase ai domnisoarei atlantide cufarul care 2 | 3 | omului este DADA. 4 | destul de logic. 5 | seama de farurile sirurilor de masini sa impace acea locutiune 6 | intimpla sa sun de o suta de ori ca sa "prind" - ma hotaresc sa dau o raita, tot 7 | tata sau papa? ah, chie, mama, 8 | ah, domnisoara, ba nu, profesoara ! 9 | DEPINDE DE FORMA DATA 10 | buna ziua 11 | Dada e teribil: nu se induioseaza in fata infringerilor inteligentei. 12 | Un manifest este o comunicare facuta lumii intregi, in care nu se 13 | vecinilor. 14 | la TV, unde in plina emisiune ardea o hirtie de 500 de franci (mai mare nu 15 | foarte rapid impopulara, scrie ziarul francez 16 | si cu sens unic. E ceea ce a fost fara indoiala un "cartier popular" acum 17 | strecor in fata si constat ca organizatorii se opresc in fata unei bojdeuci pe 18 | 19 | Astfel intre brazii cu tulpini de ceara 20 | taiate pe din doua, in care vezi stralucind brun sau violet cristalele interioare, 21 | nici metode, nici excese persuazive. 22 | si urlau hienele si gemeau acrobatele in remorci de hirtie. 23 | pe care-o ajut sa se dezbrace si sa se culce 24 | Ca din senin s'a intunecat de tot afara, desi abia e patru, si se face 25 | XIII 26 | transparenta transformare fara efort circular 27 | amorul nostru a fost ca o bomboana invelita in staniol: 28 | generale. Din vagile mele amintiri, aici ar trebui sa se gaseasca mormintul 29 | trupuri umane cu diametrul de kilometri 30 | ca femeile lui kooning. functia si masina 31 | 32 | si as fi purtat lantzug de argint pe coastele costelive. 33 | iata pentru ce veti crapa cu totii, 34 | pe acela care are in miini cheia niagarei omul care schioapata 35 | 36 | 37 | pina la tinerelul cu mustata si creier si pina la masculul cu calvitie si 38 | defavoarea celor doi contracandidati ai sai, Ulm Spineanu si 39 | scara redusa realizat stingaci de un copil grabit sau neglijent. 40 | Dintr'una au ramas numai traversele, sinele au fost ridicate de mult de vreun 41 | 42 | intra pe o straduta ingusta unde aproape se blocheaza. Ce dracu cauta aici? Ma 43 | asupra noastra, antologia 44 | compasulete, 45 | 46 | impotmolit, Bucurestiul are intotdeauna un atu - Franta", 47 | de pe operele de arta ale ultrarealismului socialist; poate avea 48 | piese, un ceas si un aparat de fotografiat. In privinta mormintului lui Eugen 49 | pina la mumia arborescenta 50 | dar iarna, iarna cu tine... tii tu minte, annabell lee, 51 | seama, peste un pod ca in Eliade, peste unul din aceste Finis Africae pe linga 52 | 53 | "Ei" au gasit un mod abil de a ne indeparta, si poate ca dupa douazeci de 54 | cu Romania 55 | dragostea nu moare niciodata. dar 56 | 57 | fi cele mai fericite momente ale zilei; nici un terminal 58 | Dada este dictatura limbajului, 59 | posibila o intoarcere in Romania. 60 | vreun motiv special pentru care s'a oprit circulatia? Nu, zice, ca sa se plimbe 61 | e pace, pace si realism. 62 | sticla plin cu pietre verzi translucide cam de marimea unei unghii, grele si la fel 63 | intriga lui ensor. si birfeala sotilor prin cancelarii. 64 | In orice caz, o initiativa deosebit de reusita ("un bon coup de pub") al dreptei 65 | da' ce se intimpla de fapt? Pai, zice cocoselul-sef, nu vezi? Lumea se plimba. E 66 | XIV 67 | Stapinul locurilor e batrin, schiop si vorbeste cu un accent puternic. E ungur de 68 | decit biografia voastra pe care voi o clociti sub burta cerebelului 69 | 70 | la TV, unde in plina emisiune ardea o hirtie de 500 de franci (mai mare nu 71 | Rumeioara juna, cu burtica mare, 72 | politica a manifestatiei. O buna parte din ceilalti participanti gindesc la fel, 73 | laudat fie'i numele, mai bine ca se zgirceste la asta decit 74 | mult. Totul este invadat de verdeata si parasit, cu vagi arome de Rem sau de 75 | ceata cu ochii mari, cu sinii aproape vizibili prin tesatura capotului. 76 | Casa in care m'am mutat e o casa foarte ciudata (spun ciudata in lipsa unui 77 | 78 | eu ca omul. Voi ramine cu impresia agreabila a unei manifestatii civilizate si 79 | 80 | Parisien", care considera ca, desi comunistii au fost inlaturati de 81 | increderea alegatorilor, pentru a forma un guvern trainic, 82 | si cel mai putin daunator este acela de a te jefui pe tine insuti. Ei 83 | 84 | dragostea ?! toata lumea pare sa creada ca sint lenes, 85 | omului este DADA. 86 | raselor si epistolarul perfectionat al amaraciunii. 87 | si cel mai putin daunator este acela de a te jefui pe tine insuti. Ei 88 | (baietii dintr-a opta poate dincolo de firesc) 89 | Seara, pe la ora opt, tot datoriata acestei Doamne capricioase care este Maria 90 | XV 91 | Seara, pe la ora opt, tot datoriata acestei Doamne capricioase care este Maria 92 | ca si celelalte forme, afaceri, casatorii, vizite, razboaie, 93 | iar noi citeam in statia lui 31 oriana fallaci 94 | ei sint acei care, fara sa stie, ii doresc si-i pregatesc o 95 | 96 | Chemati in amintire fiinta pe care o iubiti cel mai mult. 97 | cu un mar si tigara de sufletu lu Serge. Dupa care onoram cu prezenta noastra 98 | ponderii parlamentare, PNTCD, USD si PNL au acceptat, in 99 | nu fara o oarecare gratie, da de trei ori ocol Coloanei din Iulie si o porneste 100 | o femeie oarecare ma incoltise: 101 | sint o oglinda purtata de-a lungul unei oglinzi. 102 | 103 | oras in care pretul metrului patrat este astronomic dupa cum m'au uluit la 104 | -------------------------------------------------------------------------------- /lib/training_data/todo/rumantsch.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/rumantsch.txt -------------------------------------------------------------------------------- /lib/training_data/todo/sanskrit.txt: -------------------------------------------------------------------------------- 1 | na jaanaami puNyaM na jaanaami tiirthaM na jaanaami muktiM layaM vaa kadaachit.h | 2 | 3 | 4 | jyotirgaNaanaaM pataye dinadhipataye namaH || 16|| 5 | nArAyaNaM nikhilapUrNaguNaikadehaM | 6 | || baalakaaNDa adhyaaya 75-76 || 7 | na chaahvaana.n dhyaana.n tadapi cha na jaane stutikathaaH | 8 | haridashvaH sahasraarchiH saptasaptirmariichimaan.h | 9 | 10 | chidaana.ndaruupaH shivo.ahaM shivo.aham.h || 5|| 11 | prajeshaM rameshaM maheshaM sureshaM dineshaM nishiitheshvaraM vaa kadaachit.h | 12 | yashhTyaa.api taaDyamaano na yatyevamishhTaapuurtaiH 13 | hR^idi chaitanye tishhThati yaGYopaviitaM paramaM pavitraM 14 | 15 | virAjanmandAradrumakusumahArastanataTI 16 | giitaayaaH pustakaM yatra yatra paaThaH pravartate | 17 | GYaanashikhino GYaananishhThaa GYaanayaGYopaviitihaH || 18 | 19 | 20 | para.n jaane maatastvadanusaraNa.n kleshaharaNam.h || 1|| 21 | tvamarthAnAmichchhAdhikamapi samarthA vitaraNe | 22 | 23 | 24 | Adi 25 | 26 | tuma mama priya bharatahi sama bhaaii || 27 | 28 | 29 | mano maunaM kR^itvaa haricharaNayoshchaaru suchiraM 30 | dAxAyaNI xamati sAxAdramApinaya dAxepavIxaNavidhau | 31 | uchyate vishhNurevaikaH sarvaiH sarva guNattvataH || \BC.\SC || 32 | 33 | akartaa.ahamabhoktaa.ahamasaN^gaH parameshvaraH | 34 | 35 | shrIkeshavapradishanAkesha jAtakapilokesha bhagnaravibhU | 36 | || shrii gopaalaka dhyaanam.h || 37 | 38 | namastasyai 59 namastasyai 60 namastasyai namo namaH || 5.61|| 39 | na jaanaami daanaM na cha dhyaanayogaM na jaanaami tantraM na cha stotramantram.h | 40 | OM ata eva na devatA bhUtaM cha OM || \A.\B.\SC || 41 | bhavaani tvatpaaNigrahaNaparipaaTiiphalamidam.h || 7|| 42 | gomedinIjayitapomeyagAdhisuta kAmenivishhTa manasI | 43 | aMbhodijAnusaraNAMbhojabhUpavana kuMbhIna sesha khagarAT.h | 44 | 45 | naaraadhitaasi vidhinaa vividhopachaaraiH 46 | ai maalik tere ba.nde ham 47 | keshava dhR^itamiinashariira jaya jagadiisha hare || 1|| 48 | 49 | svArAma darshanajamArAmayAgatasughorAmanoramalabdhakalaha || 12|| 50 | 51 | keshava dhR^itasuukararuupa jaya jagadiisha hare || 3|| 52 | 53 | na mokshasyaakaa.nkshaa bhavavibhavavaaJNchhaapi cha na me 54 | 55 | jaya hanumaana GYaana guna saagara | 56 | yaati svamaalayamevaM sushhupto bruute yathaivaishha devadatto 57 | duusaro.nkii jayase pahale, | | . 58 | 59 | 60 | vihaaya 61 | chidaana.ndaruupaH shivo.ahaM shivo.aham.h || 6|| 62 | kusa.nsaarapaashaprabaddhaH sadaahaM gatistvaM gatistvaM tvamekaa bhavaani || 2|| 63 | suvarNa kaTikaa soTii gha.nTaa ki.nkiNii naagaraa || 7|| 64 | tatra sarvaaNi tiirthaaNi prayaagaadiini tatra vai || 4|| 65 | sargaadikaale bhagavan.h viriJNchi rupaasyaina.n sargasaamarthyamaapya | 66 | 67 | ratnasAnusharAsanaM rajatAdishR^iN^ganiketanaM 68 | sahaayo jaayate shiighraM yatra giitaa pravartate 5|| 69 | 70 | 71 | 72 | 73 | yAxIravArdhimadanAxINadarpaditijAxobhitAmaragaNA | 74 | aakaashaadvaayurutpanno vaayostejastataH payaH || 11|| 75 | gomedinIjayitapomeyagAdhisuta kAmenivishhTa manasI | 76 | vedavedye pare puMsi jAte dasharathAtmaje | 77 | mukhyataH sarvashabdaishcha vAchya eko janArdanaH | 78 | vaaDhataa vaaDhataa vaaDhe bhedile shuunyama.nDaLaa || 13|| 79 | 80 | 81 | 82 | 83 | OM anupapattestu na sharIraH OM || \A.\B.\SC || 84 | taavadeva niroddhavyaM yaavad.hdhR^iti gataM kshayam.h | 85 | laxmaNaprANadAtA cha dashagrIvasya darpahA || || 86 | 87 | GYAnAna.ndAdibhissarvairguNaiH pUrNAya vishhNave | 88 | 89 | vedavedye pare puMsi jAte dasharathAtmaje | 90 | gaaDhataamrisra.nsashaantyai guuDhamartha.n nivedayet.h | 91 | 92 | iti syaannishchito mukto baddha evaanyathaa bhavet.h || 1|| 93 | yatitvaM kuta ityata aaha -- jitendriyaayeti | jitendriyasya 94 | 95 | 96 | praaNa sakhaa tribhuvana pratipaalaka jiivanake avalaMbana he . 97 | 98 | araNye sharaNye sadaa maaM prapaahi gatistvaM gatistvaM tvamekaa bhavaani || 7|| 99 | 100 | tatraatmalaabhiiyaa.nshlokaan.h udaaharishhyaamaH || 3|| 101 | tayaasii tuLaNaa kaichii brahmaa.nDii paahataa nase | 102 | prexAxilobhakaralAxAra soxita padAxepalaxitadharA | 103 | visheshhatome paramAkhyavidyA vyAkhyAM karomyanvapi chAhameva || 2|| 104 | sachchidaanandaruupo.ahaM nityamuktasvabhaavavaan.h || 7|| 105 | 106 | evaM nididhyasaanopaayatatphalamaaha -- chiditi || yogii svaantaH 107 | namaH padmaprabodhaaya maartaNDaaya namo namaH || 18|| 108 | bhavaani tvatpaaNigrahaNaparipaaTiiphalamidam.h || 7|| 109 | uktA guNAshchAviruddhAstasya vedeshhu sarvathA || \BC.\SC || 110 | 111 | 112 | karmaNyadhikR^itaa ye tu vaidike braahmaNaadayaH | 113 | dhanva.ntare.aN^garuchi dha.nva.ntareritaru dha.nva.nstarIbhavasudhA | 114 | 115 | 116 | gauriina.ndana gajaananaa he duHkhabha.njana gajaananaa | 117 | ta\m+haasuraa R^itvaa vidadhvaMsuryathaashmaanamaakhaNamR^itvaa 118 | shchaNDA mareshahaya tuNDAkR^ite dR^ishama khaNDA malaM pradisha me || 2|| 119 | 120 | yadetasyaishvaryaM tava janani saubhAgyamahimA || 16|| 121 | ahameva paraM brahma nishchitaM chitta chintyataam.h | 122 | 123 | 124 | kadaa maamaabhiitaM bhayajaladhitastaapasatanuM 125 | na chordhva na chaadho na chaantarna baahyaM 126 | 127 | vyomanaathastamobhedii R^igyajuHsaamapaaragaH | 128 | arishhaDvargoparatipuurvakatvaat.h | evaM saadhanavate shrutayaH 129 | 130 | yadi vilaasakalaasu kutuuhalam.h | 131 | namastasyai 47 namastasyai 48 namastasyai namo namaH || 5.49|| 132 | xaNaM brahmaahamasmiiti yaH kuryaadaatmachintanam.h | 133 | jitaasheshhapraaNaanilaparikarasya prajapataH | 134 | raghuvara chhabike samaana raghuvara chhabi baniyaa.N | 135 | Thakaare parvataa aisaa neTakaa saDapaataLuu | 136 | -------------------------------------------------------------------------------- /lib/training_data/todo/scots_gaelic.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/scots_gaelic.txt -------------------------------------------------------------------------------- /lib/training_data/todo/serbian-ascii.txt: -------------------------------------------------------------------------------- 1 | 2 | uopsyte ni postojao. Vinston zakljucyi da necje biti 3 | toga, dok ga je cyovek gutao, osecjao se kao de je udaren 4 | upita Sajm. 5 | kontrarevolucionarnim aktivnostima, bio osudjen na 6 | priznanjima i pogubljenjima, da Bratstvo nije 7 | 8 | su bile armije evidenticyara cyija je duzynost bila da 9 | Sva njihova mrzynja i zyestina bile su okrenute upolje, 10 | sad kad je pocyinjao bivati sposoban da uoblicyi svoje 11 | 1984. Morala je biti tu negde, posyto 12 | Trenutno je, 1984. godine (ako je godina zaista bila 13 | 14 | Prosylost se azyurirala iz dana u dan, skoro iz minuta u 15 | Je'n, 16 | potrosynje pokazuju da je zyivotni standard porastao za 17 | 18 | 19 | ulice kojima se isylo do njega vrvele od cyuvara lica kao u 20 | odmorivsyi se putem u nekoliko navrata. Na svakom 21 | bacjo? Sigurno nesyto tesyko za moj mozak. Smite bacjo, 22 | prosto mit. Ponekad je verovao da ono postoji, a 23 | Na pomen Velikog Brata, Vinstonu prelete preko lica 24 | pre 1960. godine, no mogucje je bilo da je ona u 25 | posebno privlacyan. 26 | 27 | izbijalo trinaest. Vinston Smit, brade zabijene u nedra 28 | od onih cylanaka koje povremeno objavljujesy u 29 | Vecj syest nedelja se brijem istim zyiletom 30 | dzyilitaju. A iznad svega, na kraju, kad isplaze jezik, 31 | dosylo. Okeanija je momentalno bila u ratu sa Evroazijom: 32 | usidrena izmedju Islanda i Faroskih ostrva. 33 | papira na kojoj je bila duga kolona recyi i zadubio se u 34 | izbrisana i zaboravljena. Vecj sad, u jedanaestom izdanju, 35 | radili na nezamislivom mnosytvu raznih poslova. Tu su 36 | No na to ga je bila podstakla i sveska koju je upravo 37 | Tog trenutka lice mu dobi skerletnu boju a iz ocyiju 38 | na proizvodnju raznih vrsta robe syiroke potrosynje 39 | krupnim i urednim velikim slovima: 40 | razlike nema u tome vodi li on dnevnik i dalje ili ne. 41 | jer je bila mlada, lepa i bespolna, jer je zyeleo da spava s 42 | znacyenju. Ti ne shvatasy kakva lepota lezyi u unisytavanju 43 | pretklon do poda 44 | priliku cje slaviti uspomenu na druga Ogilvija. Uistinu, 45 | traktata, i od decyjih cyitanki do recynika Novogovora. 46 | Za Nedelju mrzynje. Znasy, onaj fond iz kucjnih 47 | gomila syuta; i mesta gde su bombe rasycyistile malo visye 48 | bila ukinuta preko dana. To je bio deo akcije sytednje u 49 | Je li onda on 50 | bio prvi izdajica, prvi koji je ukaljao cyistotu Partije. Svi 51 | dokumentacije nisu rado govorili o svom poslu. U 52 | , dodade on s nekim misticynim 53 | potpuno 54 | prekida, mada, strogo uzev, nije uvek bio u pitanju isti 55 | moj mangup gadjao iz pracjke. Dobro sam mu ocyitao. 56 | priznanjima i pogubljenjima, da Bratstvo nije 57 | neoriginalno; s druge strane, izmisliti kakvu pobedu na 58 | ovog puta to biti njegov. Ucyini mu se cyudno da cyovek 59 | zaustavljajucji se. Cyudno je bilo to syto u tom trenutku, u 60 | povere ispravljanje 61 | su na neki nacyin majcyin i sestrin zyivot bili zyrtvovani za 62 | 63 | 64 | tim pravcem, podsecjao na plemicja iz osamnaestog veka 65 | da izbegne ljuti vetar, hitro zamacye u staklenu kapiju 66 | nekad, pre godina i decenija, bio vidjan i sam Goldsytajn. 67 | Pobeda, 68 | sluzyiti se logikom protiv logike, odbacivati moral 69 | krisyom i sa dosta tesykocja, samo zato syto je osecjao da lep 70 | sa nekom senilnom nedotupavnosycju u dugom tankom 71 | , izgovorenu mladalacykim i prilicyno cjurkastim 72 | 73 | izuzetno dobrom obavesytenosycju kojoj obicyni cylanovi 74 | s kojim spavacy u kosymaru otrzye glavu od 75 | pocyinio bi i da nije uopsyte stavio pero na papir - onaj 76 | nacyin izazvali nezadovoljstvo Partije nestanu i da se za 77 | 78 | 79 | kojoj je pisalo CIGARETE 80 | On izvadi iz dzyepa novcyicj od dvadeset pet centi. Tu su, 81 | Zatim baci josy jedan pogled na suparnika u boksu 82 | nula-nula, i ocyigledno resyi da za Dva minuta mrzynje 83 | mozyemo iz ovoga izvucji? Pouku - koja je u isto vreme i 84 | mogle u isto vreme videti sve 85 | nivou, za potrebe proletarijata. Postojao je cyitav niz 86 | parole Partije ispisane masnim velikim slovima: 87 | buducjnost, za prosylost - za neko zamisyljeno doba. A 88 | zasyto 89 | stotine metara duboko a josy uvek nepotonule. 90 | moglo pogoditi, po vlazynosti drsyke na reketu, da je on 91 | zakon i javni poredak; i Ministarstvo obilja, koje je bilo 92 | jednostavni poslovi, tako da je s njima bio gotov pre no 93 | 94 | 95 | Brata ponovo izblede, a na njegovo mesto dodjosye tri 96 | cyak i visye novogovorskih recyi no syto je bilo koji cylan 97 | devete troletke, znacyilo bi isuvisye komplikovati posao 98 | Vinston baci pogled na drugu stranu hodnika. U 99 | smanjiti 100 | 101 | recyi ,losy". Ili, ako hocjesy jacyu verziju recyi ,dobar", cyemu 102 | novih syupljoglavih zyrtava koje su samo cyekale da ih on 103 | 1984. Morala je biti tu negde, posyto 104 | bilo je potpuno nemogucje, jer nijedan zapis, i nijedna 105 | poslovima. 106 | kojoj je pisalo DZYIN 107 | prodoran zyenski glas. 108 | ga od tih tema i navoditi, ukoliko je mogucje, na 109 | iakoje nosio propisni kombinezon, bilo skoro nemogucje 110 | nije 111 | to jedna recy, kao deo sytamparskog sloga izliven ujedno. 112 | , recye on. 113 | povika energicyan mladalacyki glas. 114 | dobrovoljnih aktivnosti uopsyte. Imao je obicyaj da s 115 | rupe za pamcjenje. 116 | 117 | Na Starogovoru (ili standardnom engleskom), to bi 118 | priznavali sve svoje zlocyine i posle toga bivali osudjeni 119 | nismo trebali, je l' se secjasy? Eto sad syta se desilo. Ma 120 | sa Istazijom a u savezu sa Evroazijom. No to je samo 121 | isyli da vide vesyanje, eto syta je. Ja nisam mogla da ih 122 | -------------------------------------------------------------------------------- /lib/training_data/todo/slovak-ascii.txt: -------------------------------------------------------------------------------- 1 | libier. Avonmore nedavno ziskala sto percent akcii miestneho 2 | 3 | vyrovnana uroven vydavkov je na byvanie, vodu, elektrinu a plyn. 4 | - volnom trhu - sa vacsie obchody urobili s akciami 5 | na potraviny a nealkoholicke napoje. Na tieto rodiny v prepocte 6 | Mussa na adresu urokovych sadzieb v Europe a specialne 7 | podmienky na rozvoj a existenciu jednotlivych vyrobcov ocele. 8 | pri splnani podmienok potrebnych na prijatie za clena 9 | 10 | poklada vacsina za dolnu uroven na nakup. Prelomenie hranice 11 | 12 | najvyssia uroven za poslednych 15 mesiacov. 13 | Podla analytikov sa investori obavaju zotrvavat na trhu, 14 | 15 | percenta. Podvecer USD otestoval hranicu 1,80 DEM, 16 | Nasledky afery japonskeho koncernu Sumitomo Corp., ktore viedli 17 | financii a Narodnej banky Rumunska (BNR). Na pomoc maju byt 18 | Celkove mozno povedat, ze aktivita na trhu nezeleznych kovov je 19 | dlheho ropovodu zo zapadneho Kazachstanu do Ciny v hodnote 20 | restrukturalizaciu a operativne bude kontrolovat obchody 21 | 22 | 23 | 24 | kapacitami (VSZ), ktore v sucasnosti expanduju a kapitalovo sa 25 | inflacie len 56,9 %. V auguste bol zaznamenany len mierny 26 | 27 | 7,6 mld. FRF viac ako sa predpokladalo v plane rozpoctu. 28 | nakupene) pozicie pri USD/JPY a DEM/JPY, cim poslali kurz 29 | velmi mierne, posilnili. 30 | -=- 31 | udajov britskeho statistickeho uradu na 845 mil. GBP z novembrovych 32 | predalo sa ich 30 683 kusov v objeme 292 208 387 Sk. Zaujal 33 | hospodarskej sutaze. Vlada sa snazi vylucit skandal, aky sa 34 | (140 - 230 %), Ukrajiny (202 - 274 %), Ciny (10 - 46 %) a z JAR (7 35 | zvysil o 2,3 % oproti augustu minuleho roku a podobne sa 36 | 37 | v 2. stvrtroku k rekordnemu prepadu ceny medi, sa skoncili. 38 | Severoslovenskych tehelni v likvidacii (2259 kusov po 52 39 | ked trh zaplavila vlna nakupov zemneho plynu. Na The New 40 | 3,5 mld. USD. 41 | cenovych ramcov, najma v oblasti cien energie. 42 | V prospech stupajucich ziskov podnikov v rokoch 1998 a 1999 43 | v porovnani s rokom 1995 o 1,1 mil. ton menej, t. j. o 0,2 %. 44 | upozornil na moznost zvysenia obchodneho napatia medzi 45 | 46 | Dna 16. jula, Strasburg: predseda EK Jacques Santer prezentoval 47 | hodnota v relativnom vyjadreni bola 12,5 %. 48 | 6,2-6,4 %. Rast vyrobnych a spotrebitelskych cien bude sice 49 | tak napriek spravam, ze med nahradi v pocitacoch doteraz 50 | vladu a Narodnu banku Rumunska (BNR) k zachrannej akcii 51 | l Svetovy lider v oblasti telekomunikacii, svedska 52 | na ostatnych clenov, aby prave v tejto oblasti doslo 53 | tohtorocnych dvanast percent. Do roku 2000 planuje pivovar 54 | AP-DJ (jk) 55 | v dosledku posilnenia akcii high-tech. Pomer klesajucich 56 | zvysil o 0,4 % v porovnani s julom. Najvacsi narast sa 57 | 58 | v Japonsku k vyvoju kurzov. Okamzite po zverejneni zacali 59 | vysledkoch spolocnosti bude nejake pozitivne prekvapenie. 60 | investori ocakavali, ze vo zverejnovanych ekonomickych 61 | Decembrovy cukor na The London International Financial 62 | 63 | Rast sukromnej spotreby sa v roku 1996 zrychlil takmer na 3 % 64 | Najvacsi pohyb sme zaznamenali pri cene Nafty Gbely 65 | reklamnej kampane. Prve akcie sa zacnu 29. septembra 66 | Silny hospodarsky rast podporuje kurz britskej libry 67 | 68 | 69 | Adig Investment nachadza vo vodorovnom pohybe so sirokou 70 | 71 | exporty pre skandinavsky trh a pod.). Dynamika vykonov svedci 72 | a Polaroidom treti na svete z hladiska produktivity. 73 | ked trh zaplavila vlna nakupov zemneho plynu. Na The New 74 | % v roku 1998, t. j. na 2,25 tis. USD/t). V tycovej oceli su skor 75 | ktorymi trhy prejdu, a odporuca, ako ich co najlepsie zvladnut. 76 | obzvlast vyrazne stupne spotreba ocele v Cine (+20,9 %). Velky 77 | na 2,7 biliona lei. V pripade neuspechu zachrannej akcie, by 78 | bol klucovym faktorom na ich cenovy vyvoj. Pocas spominaneho 79 | obchodu, predovsetkym certifikaty, povazuje Ceska republika 80 | 81 | cestu k euro. Medzi desiatimi najlepsimi nemeckymi akciovymi 82 | mesiacov predstavuju 105 %. V minulom roku dosiahla miera 83 | opat naznacilo moznost skoreho zvysovania urokovych sadzieb 84 | 7,6 mld. FRF viac ako sa predpokladalo v plane rozpoctu. 85 | dennik Monitorul. V pripade Bancorexu rumunske media vidia 86 | psychologicka uroven vsak odolala. Podporou pre dolar je 87 | * Madarsky kapitalovy trh 88 | vykazovala deficit vo vyske 208 mil. USD, oznamila to 89 | a Polaroidom treti na svete z hladiska produktivity. 90 | Pritom ceny valcovanych materialov z antikorovej ocele klesali 91 | azijske krajiny pri sucasnom poklese podielu v ostatnych krajinach 92 | 93 | 94 | posilnil o 5,8 centa na 4,711 USD za uncu. Analytici tento 95 | Prekvapujuce vyroky silnych poslali kurz USD prudko dole 96 | konca financneho roka do zverejnenia auditu. Insider trading 97 | l Podla predbeznych udajov zivotne naklady v zapadnej casti 98 | Morgan Stanley a niektore ine dolezite brokerske domy. The 99 | o takmer 30 % sa znizili hrube vydavky u zamestnancov, u rolnikov 100 | byvanie, v ostatnych tieto vydavky nepresiahnu 30 %. Tento fakt 101 | su najvyssie v rodinach dochodcov (66 Sk). 102 | Harmonogram predaja cennych papierov emitovanych MF SR na 4. stvrtrok 103 | -------------------------------------------------------------------------------- /lib/training_data/todo/slovak-windows1250.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/slovak-windows1250.txt -------------------------------------------------------------------------------- /lib/training_data/todo/slovenian-ascii.txt: -------------------------------------------------------------------------------- 1 | 2 | Winstona je najbolj presunil izraz nebogljene groze na sivkastem 3 | temvecy to, da je bilo nemogocye izogniti se sodelovanju. Po 4 | dodala Winstonu, ko se mu je z mocynim sunkom posrecyilo dotakniti se 5 | Da, 6 | zavracyali, pobijali, smesyili in razkazovali vsesplosynemu strmenju 7 | zyelezu in o tem, kako so prekoracyili Deveto triletko. Telekran je 8 | so se ji zapirala in odpirala kot ribi na suhem. Celo O'Brienov mrki 9 | so zadnje novice -- 10 | Winston je sovrazyil to vajo, ki mu je povzrocyala zbadajocye 11 | nicy: odlomki slucyajno ujetih pogovorov, drobne cyacyke po stenah 12 | 13 | tistikrat, v sanjah, te besede nanj niso napravile mocynega vtisa. 14 | dan, ko bi Miselna policija ne razkrinkala vohunov in saboterjev, ki 15 | Svet zunaj je bil videti mrzel sye skozi zaprto okno. Spodaj na ulici 16 | ali jedi, znotraj in zunaj, v kopeli ali postelji -- nobenega izhoda. 17 | odsek v Oddelku za dokumentacijo, dalecy vecyji od tistega, kjer je 18 | Oceaniji. 19 | partijskih sedezyev a neka zyenska na sedezyih za rajo je zagnala vik 20 | ga je vedno napolnilo z grozo. Seveda je 21 | neopazen belkast prasyek in ga polozyil na vogal platnice, od koder bo 22 | ter 23 | dnu vodnjaka 24 | vsakega dejanja so vkljucyene v dejanje samo. Napisal je: 25 | Winston se ni mogel dolocyno spomriti cyasa, ko njegova dezyela ne 26 | zaplaval v mirni zrak. Glas je raskavo nadaljeval. 27 | Krcyite in iztezajte roke! 28 | obvladuje prihodnost: kdor obvladuje sedanjost, obvladuje 29 | Sytevilka 30 | odstranjevanje odvecynega papirja. Podobnih rezy je bilo na tisocye 31 | Iz veka uniformnosti, iz veka osamljenosti, iz veka Velikega brata, iz 32 | skandirala deklica in sye vedno poskakovala naokrog. 33 | pritrdil pero na drzyalo in posesal usedlino z njega. Pero je bilo 34 | cyasnik 17. 3. 84 vb govor naporocya afriko precyisti 35 | take stvari so bile znane le po nejasnih 36 | pa se je neizprosno nadaljeval. V preblisku se je Winston zavedel, da 37 | narobe obrnjenih prepotenih kratkih hlacy -- so lezyali krizyem po 38 | pipe, da se zye sytiri leta vsak vecyer pokazye v Obcyinskem centru. 39 | DOL Z VELIKIM BRATOM 40 | navzgor in njegova ocyala so sovrazyno poblisnila v Winstonovo smer. 41 | resyilni cyoln poln otrok in helikopter, ki visi nad njimi. neka 42 | Winston se ni mogel dolocyno spomriti cyasa, ko njegova dezyela ne 43 | pravi O'Brien. 44 | vrbovec po kupih gramoza; pa kraji, kjer so bombe razdejale 45 | velikih cyistk v petdesetih letih. 46 | ne pred otroki to ni dokler je ni policija vrgla ven vrgla ven ne 47 | so bili Vohuni, sistematicyno preobrazyali v neobvladljive male 48 | je rekel Winston 49 | verjamem da se ji je kaj zgodilo nikogar nicy ne briga kaj recye raja 50 | tiktakale mimo. Zavedal se ni nicyesar razen praznine papirja pred 51 | telovadnimi vajami, si je prizadeval utreti si pot v zamegleno 52 | dogajale ponocyi. Nenaden sunek v spanju, surova roka, ki stresa za 53 | izdelane tako, da ti ocyi sledijo, medtem ko se premikasy. VELIKI BRAT 54 | obdrzyali v antologijah. In ta dvorana, s svojimi petdesetimi delavci, 55 | Winston je planil v pozor pred telekranom, na katerem se je zye 56 | 57 | v cyedno, temno obleko (Winston si je posebno zapomnil zelo tenke 58 | je kricyal decyek. 59 | bila kvota presezyena. V vsakem primeru pa dvainsyestdeset milijonov 60 | 61 | izpusycyajocy najprej velike zacyetnice, nato pa tudi locyila: 62 | 63 | je menda dobra za hrbtne misyice) -- grozljiva stvar je, da je mogocye 64 | prekinjeni zyivi meji na nasprotni strani polja so se v vetru nalahno 65 | pero je nasladno drselo po gladkem papirju in z velikimi, lepimi 66 | so 67 | bi zaprl zvezek, dokler je cyrnilo sye mokro. 68 | Iz zyepa je vzel kovanec za petindvajset centov. Tudi tam so bile z 69 | prodreti skozi blodnjak ovir iz bodecye zyice, jeklenih vrat in 70 | Danasynja izdaja pa je prinasyala porocyilo o stvarni produkciji, iz 71 | ima rad take stvari. Ja, Tom je zelo spreten za take stvari. 72 | hitrimi, necyitljivimi cyacykami: 73 | cyisto kratkih opomb je bilo v navadi vse narekovati v narekovalnik, 74 | Grupa od trideset do sytirideset! Na svoja mesta, 75 | kot naklonjenost ali pripadnost isti stvari. 76 | 77 | kakor kacyji pastir in se v loku znova pognal dalje. To je bila 78 | zadelo v tilnik. Cyutil je, kakor bi se zadrla vanj rdecye razzyarjena 79 | medtem, ko je sedel in nemocyno razglabljal, skoraj avtomaticyno tudi 80 | 81 | je reekla. 82 | narobe obrnjenih prepotenih kratkih hlacy -- so lezyali krizyem po 83 | je zarjul fant, ko so se vrata za njim zaprla. A 84 | pomoto, ki jo bo lahko urediti v nekaj minutah. Syele pred 85 | 86 | mogocye komunicirati s prihodnostjo? Zye zaradi njene narave je to 87 | Goldsteinu, se mu je zdelo resnicyno. V takih trenutkih se je njegov 88 | lahko ostal vsaj vizualno izven obmocyja telekrana. Seveda ga je bilo 89 | nepotrebno. Ostudna ekstaza strahu in masycyevalnosti, zyelja po 90 | 91 | 92 | verjamem da se ji je kaj zgodilo nikogar nicy ne briga kaj recye raja 93 | , 94 | pojavljale brez ozadja in so bile vecyinoma nerazumljive. Ministrstvo 95 | cyetrtletje na stopetinsytirideset milijonov parov. Resnicyna 96 | 97 | zyenska srednjih let mogocye zyidinja je sedelo na kljunu z majhnim 98 | Kot ponavadi se je na ekranu zasvetil obraz Emmanuela Goldsteina, 99 | ocyi modre in polne solz. Smrdel je po ginu. Zdelo se je, da ga oddaja 100 | onstran morja, pod varstvom svojih tujih placynikov; morda celo -- 101 | -------------------------------------------------------------------------------- /lib/training_data/todo/slovenian-iso8859_2.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/slovenian-iso8859_2.txt -------------------------------------------------------------------------------- /lib/training_data/todo/sq.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/sq.txt -------------------------------------------------------------------------------- /lib/training_data/todo/swahili.txt: -------------------------------------------------------------------------------- 1 | maswala ya umuhimu wa kitaifa, badala ya yale ya kibinafsi na vyama vya 2 | kwa vipindi vyao vya kila siku vya lugha ya Kiswahili. 3 | 4 | Rasta. 5 | 6 | SAITOTI, WAMALWA WAUNGA MKONO MAPENDEKEZO YA KATIBA 7 | ya teknolojia ikiwa ni pamoja na kuanzishwa kwa viwango fulani vya masharti 8 | 9 | Katika hatua ya kihistoria ya kuonyesha uzalendo na uaminifu kwa taifa, 10 | Mombasa Bw Paul Olando, li wajadiliane naye juu ya swala hilo. Walisema 11 | 12 | kutaka kuwa mwanachama wa tume hiyo hadi wakati mkutano wa viongozi wa 13 | Wanawake wawili wanaoaminika walikuwa marafiki wa marehemu Bernard Matheri 14 | 15 | ya kikatiba katika County Hall. 16 | 17 | 18 | ingawaje harambee ni muhimu, baadhi ya watu wameigeuza kuwa njia ya kujipatia 19 | vijana Wakikuyu na kuwapatia pesa kutekeleza ghasia hizo. Hata hivyo, 20 | ya Majimbo akisema hilo ndilo suluhisho pekee la misukosuko ya kisiasa 21 | Aliyekuwa Rais wa Zaire, Mobutu Sese Seko alifariki jana usiku mjini 22 | 23 | 24 | zaidi kunakotokea michafuko. Wakati huo huo, washiriki kwenye semina 25 | Wakuu watatu wa sheria wa nchi za Afrika Mashariki mwishoni mwa wiki 26 | Serikali ya Burundi imejitolea kutafuta amani nchini humo kupitia mashauri 27 | 28 | 29 | 30 | kupigwa risasi nje ya jumba la Nyayo hapa Nairobi, alipokuwa akisindikiza 31 | mteja wake kuhusu ombi la kuachiliwa kwa dhamana. Bw Maitha, kupitia 32 | sheria ya kupigaji kura. 33 | 34 | katika ujenzi wa taifa. 35 | watoto elfu-2 ambao watafunzwa maarifa ya kimsingi kuhusu kazi kama vile 36 | Nairobi. Dkt Mwanzia alisema kwamba uchunguzi kabambe utafanyiwa sheria 37 | 38 | 39 | wanajaribu kuutumia mjadala juu ya mageuzi ili kuonekana kuwa wanahudumia 40 | 41 | taarifa kuhusu mageuzi ya kikatiba, zilizowasilishwa kwa kundi la wabunge 42 | 43 | huo utakuwa na manufaa makubwa kwa wakazi wa sehemu hiyo. 44 | 45 | kukatwa kwa laini zao. 46 | 1 ili kuishurutisha serikali kuwaongeza mishahara. 47 | katika ujenzi wa taifa. 48 | maafa ya Likoni. Askofu Njenga aliaambia waumini katika kanisa la Holy 49 | KIRDI YAFANYIWA MAREKEBISHO 50 | kuzuia baadhi ya magonjwa, yanayosababisha vifo hapa nchini. Aliwatahadharisha 51 | ambayo yangeweza kutibiwa kupitia juhudi za pamoja. 52 | na kundi la majambazi waliojiandaa vilivyo ambao lengo lao lilikuwa kuzusha 53 | 54 | 55 | marekebisho yanaoyoendelea kufanywa katika sekta ya utumishi wa umma. 56 | 57 | muda wa wiki mbili zilizopita. 58 | Bw Kathima pia aliwahimiza viongozi katika sehemu hiyo wahakikishe kwamba 59 | Chini ya idara mpya iliyofanyiwa marekebisho ya VAT , afisi za wilaya 60 | alisema ghasia hizo zitahusisha Waluo na Wakikuyu . Alidai kwamba majangili 61 | inayokabili nchi kabla ya kutekeleza tisho lao la kugoma mnamo Oktoba 62 | 63 | Walisema kile ambacho kundi hilo linafanya ni kwa manufaa ya taifa hili, 64 | makuu ya ushirikiano huo wakati wa mkutano huko Mombasa jana, kwa maandalizi 65 | 66 | 67 | hatua kali ya kutotoka nje ili wavamizi waweze kushikwa na kuadhibiwa," 68 | 69 | Polisi jana waliua jambazi sugu, Bernard Matheri Thuo, au 'Rasta', kwenye 70 | wanajitakia makuu na nia yao tu ni kuimarisha vyama vyao vya kisiasa 71 | 72 | 73 | hizi tatu za Afrika mashariki. 74 | 75 | cha ukosefu wa nguvu za umeme wa mara kwa mara mjini Garissa. 76 | 77 | 78 | alishikwa mnamo Agosti 18 kuhusiana na uvamizi wa Likoni, Mombasa, jana 79 | uuzaji Profesa Karega Mutahi alipofungua warsha ya siku tatu juu ya Kiswahili 80 | riziki. Alisema mkoa wa magharibi unatarajia mavuno mengi kufuatia kunyesha 81 | 82 | 83 | 84 | upande wowote kama vile Ethiopia au Afrika kusini kwani uhusino wa hivi 85 | 86 | kuwachochea wafanye ghasia. Wakiongozwa na mwenyekiti wao Daniel Kongo, 87 | 88 | yataungwa mkono na Wakenya wote wenye nia njama. 89 | wa tume ya uchaguzi, Jaji Zacchaeus Chesoni ambaye alikabidhi mpango 90 | katika Konjoga, wilaya ya Narok. Afisa tawala wa sehemu hiyo, Bw Nyule 91 | hawajakamatwa au kushtakiwa. Awali, Askofu Njenga alisoma taarifa iliyowekwa 92 | na mkurugenzi wa mipango, Dkt Kang'ethe Gitu wakati wa kufunguliwa rasmi 93 | 94 | sasa kati ya Burundi na Tanzania hauridhishi kuedelea na mashauri hayo. 95 | muda wa wiki mbili zilizopita. 96 | kabisa shughuli za kampuni hiyo. Arifa iliyowekwa katika lango kuu la 97 | 98 | Mkutano huo ulifunguliwa na msaidizi wa mkuu wa sheria jaji Aaron Ringera. 99 | Serikali imerejesha amani na utulivu katika mkoa wa Pwani lakini ingali 100 | 101 | 102 | 103 | 104 | kuhusu uandikishaji wa wajumbe kutoka matawi yao. Bw Kamotho aliongeza 105 | KAMATI ZA IPPG KUTOA RIPOTI JUMANNE kamati tatu za kiufundi zilizochaguliwa 106 | "Baadhi ya wabunge hao wanajua vyema kwamba hawana ufuasi na ndiposa 107 | 108 | wakisaidie chama hicho kifedha. 109 | Westlands kwa tikiti ya Ford Asili katika Uchaguzi Mkuu ujao amesema 110 | 111 | pia ilipendekeza serikali itoe ulinzi kwa wagombezi wote wa kiti cha 112 | na akashangaa kwa nini Wakenya fulani wanapinga serikali kama hiyo. 113 | ibada hiyo ni maafisa wakuu wa serikali kama vile Mkuu wa Sheria, Bw 114 | Katika mkutano na waziri wa elimu, Bw Joseph Kamotho,ambaye alitangaza 115 | 116 | 117 | 118 | mari ambazo hazina faida na ambazo haziwezi kuleta mabadiliko katika 119 | la lazima umesaidia kurahisisha mawasiliano kati ya maafisa wa serikali 120 | wa kitaifa John Katumanga walitoka nje wakilalamika kwamba kamwe hawatakubali 121 | -------------------------------------------------------------------------------- /lib/training_data/todo/tagalog.txt: -------------------------------------------------------------------------------- 1 | 2 | "Utang na loob" at "hiya" ang susi daw sa karakter ng Pinoy. 3 | nakaupo roon nang halos walang tulong dahil na rin sa hindi siya dalawin 4 | Mailap sa himas kung nagigipit... 5 | mainit na kape. " May mga nakapila pa namang programa para sa iyo. Baka 6 | "Aalis na muna ako, Andro." 7 | 8 | "Na maaabswelto ako." 9 | Ang tinig ko...pakinggan mong mabuti ang tinig na ito. Natatandaan mo 10 | beses na rin nilang nailigtas ang buhay ng isa't isa kaya't kapwa sila 11 | 12 | "Para talaga akong bibitayin, ha?" biro niya. "Puwede bang mag-last request?" 13 | Nahuli rin ng mga mata niya si Paula na nagtatago sa likod na ilang kababaihan. 14 | Dito. Ihakbang mo ang mga paa mo. Sige na. Naghihintay ako. Halika na. 15 | Oo, kasarinlan/kalayaan--seksing-seksing kambal!--ay matutuklasan 16 | 17 | nagbago na sa loob ng labing tatlong taon. Ang aking mukha ay hindi na 18 | a k d a 19 | 20 | masalimuot 21 | 22 | Kalansay ng mga tangke at mga bungo ng pumatay at namatay ang naghambalang sa disyertong 23 | Ako'y natatakot. Naririnig kong tumitibok ng mabilis ang aking dibdib 24 | 25 | ng mga kasama niya. Kahit paano'y ipinalagay na lamang niyang wala ngang 26 | " Sabi ko na nga ba't magkikita pa tayo. Kasamang Andro." bati ng isang 27 | 28 | Sugapa sa panagimpan, nais mong lumikha ng walang kamatayang obra maestra. 29 | 30 | 31 | na dulot mo. Burahin man at tunawin ng luha ang dugong isinalin mo sa 32 | Ilan silang nagpaiwan. Kasama si Ka Alan, si Ka Ipe at ang binatilyong 33 | ng tuksuhan. Naging si " Ka Safety" pa siya para sa ilang mahilig mag-alaska. 34 | "O nandyan ka pala. Bakit?" 35 | 36 | Kumakamot sa libis, paluhod ang akyat mo tungo sa tore ng gintong pagoda. 37 | Nakakailang hakbang pa lamang palayo si Ka Alan nang tumigil ito at lumingon 38 | kanya, si Inso. 39 | puno. Mahigpit pa rin ang hawak niya sa baril. 40 | 41 | naman niya, siya'y isang ahente. 42 | 43 | siya sa tindi ng kirot. 44 | 45 | Bula, lobo, alitaptap na bunga ng iyong buntonghininga-- 46 | 47 | "Eto o, isuot mo muna," mahinang sabi niya, sabay abot ng kanyang jacket 48 | "Isa pa, putol ni Paula, "bakit nalaman ng mga kaaway na may nangyayaring 49 | 50 | 51 | at sa loob ng panahong ito'y inakala niyang lubos na ang tiwala sa kanya 52 | sa kahapon ang larawan ko. Tama. 53 | Ako'y natatakot. Naririnig kong tumitibok ng mabilis ang aking dibdib 54 | "Higit kitang kailangan ngayon." 55 | ni Nietzsche... 56 | ang ilang taong nasa paligid. 57 | Nakamotorsiklo na ang pangarap. 58 | malayo at wala ka sa poste mo. Iniwan mo ang poste mo," sumbat ni Paula. 59 | Bigla, mula sa may di-kalayuan, isang putul-putol na paswit. Kasunod 60 | 61 | mo nakikilala. Walang bakas ang hugis nito sa iyong gunita. 62 | Pinagtakluban na ng tala at putik ang pamumuti ng iyong mga mata. 63 | kung siya man ay aabot pa sa panahong iyon. 64 | 65 | Balitang ito'y di nasagap sa CNN kundi sa chikachika ng mga SINdikato 66 | tumalikod para umalis. 67 | 68 | May takot ako sa hinaharap na magdadala ng walang katiyakan at sapangambang 69 | habang nagpupuyos-- 70 | "Itsura mo, mukhang hampas-lupa." 71 | 72 | Sugapa sa panagimpan, nais mong lumikha ng walang kamatayang obra maestra. 73 | ngiti iyong magkaiba ang dahilan. Ang isa'y nais magpalakas ng loob at 74 | ni Nietzsche... 75 | Ako'y natatakot. Naririnig kong tumitibok ng mabilis ang aking dibdib 76 | ngiting puno ng pag-unawa. Pinilit niyang sumagot ng ngiti. 77 | Ngunit di na mapipigil S Andro. Sa pagkakahawak niya sa baril, parang 78 | "Aalis na muna ako, Andro." 79 | sa akin. May takot sa aking dibdib na magkaroon ng pagkakataong hindi 80 | 81 | 82 | 83 | 84 | Sa pagkakahawak niya rito ngayon, pakiramdam niya'y napakatagal na niyang 85 | 86 | isang latang ginagawang tasa. 87 | 88 | "Pero paano?" 89 | 90 | " Ano' yo?" 91 | Sa pagkakahawak niya rito ngayon, pakiramdam niya'y napakatagal na niyang 92 | ay nag-eehersisyo. Kung titingnan ay parang napakaraming pinagkakaabalahan 93 | na dulot mo. Burahin man at tunawin ng luha ang dugong isinalin mo sa 94 | naghihintay sa labas ng Winter Palace 95 | 96 | At ayoko rin lalong pahirapan dito ang magiging anak ko." 97 | 98 | Suriin mo: 99 | 100 | Ang ipinagtataka lamang niya, napakabilis magbago ng pagtingin sa kanya 101 | 102 | 103 | " Hayup ka, Inso! May araw ka rin," mahinang sumbat niya rito. 104 | 105 | Nangingiti pa siya ngayon habang nilalaru-laro niya ang safety pin ng 106 | iyo kahit lahat sa aking paligid ay nagpapaalala sa akin ng ating nakalipas. 107 | nakahawak ng baril. 108 | 109 | 110 | 111 | pa akong lumabas ang katotohanan." 112 | 113 | 114 | Mailap sa himas kung nagigipit... 115 | 116 | 117 | isang latang ginagawang tasa. 118 | pag-uusap nila kanina at parirandam niya'y may kung anong kumurot sa 119 | 120 | 121 | mga taon at patuloy na dumami sila sa sona at kinakailangan nilang mag-expand. 122 | nakasungaw 123 | " Hayup ka, Inso! May araw ka rin," mahinang sumbat niya rito. 124 | "Magkano ba, Miss?" [Kalakalin ang sarili upang di magdildil ng poot.] 125 | 126 | 127 | Napatunganga si Paula. Pero agad itong nakabawi. 128 | 129 | 130 | 131 | nararamdaman ang init ng kapeng tumatagos sa latang lalagyan nito. Madali 132 | Paniwalaan mo ako kung aking sabihing walang isang sandali ang lumipasna 133 | 134 | Pakiramay na sa walang pera. 135 | Sapagkat tumaas raw ang GNP, di na kailangang ang NPA. Dumarami ang biktima 136 | -------------------------------------------------------------------------------- /lib/training_data/todo/tamil.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/tamil.txt -------------------------------------------------------------------------------- /lib/training_data/todo/thai.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/thai.txt -------------------------------------------------------------------------------- /lib/training_data/todo/turkish.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/turkish.txt -------------------------------------------------------------------------------- /lib/training_data/todo/ukrainian-koi8_r.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/ukrainian-koi8_r.txt -------------------------------------------------------------------------------- /lib/training_data/todo/vietnamese.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/vietnamese.txt -------------------------------------------------------------------------------- /lib/training_data/todo/welsh.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/todo/welsh.txt -------------------------------------------------------------------------------- /lib/training_data/todo/yiddish-utf.txt: -------------------------------------------------------------------------------- 1 | [TABLE NOT SHOWN] 2 | אַ שיִער נישט דערשטיקטער רוף: 3 | למשל, די איבעריקע אוסיוס "תּ" און "ת" װעט 4 | נאָך אַנדערע אַניִאָנען". 5 | מיט אַ װעסטל-קעשענע, אָדער מיט אַ זײגערל 6 | 7 | )צום לערנען די "אומװיסנדיקע אַרבעטערס"( 8 | געװען 4 יאָר אַלט. כ'בין געקומען אַהײם, 9 | 10 | פֿולע מײַלער, ניט זיך שעם. 11 | ר ליטעראַטור: איר סאַמע נישט-אײַנגעפֿונדעװעטקײט. 12 | אױסניצן צעלן און באַטעריעס. פֿאַרן פּשוטן 13 | צומ סןפֿ, נכ אַרומ 20 יר פֿונ אָרטגראַפֿיסר 14 | פֿינקלט פֿון די בערגער אַראָפּ. 15 | ריכטונג. אױף אַזאַ אױפֿן האַלט די עלעקטראָכעמישע 16 | װי אַזױ מע קען אױסניצן דעם פֿענאָמען לטובֿה 17 | פֿון שלומה-חיים כּהן און לײבל באָטװיניק 18 | לעפֿל אָדער אַ גרױס קלעמערל; אַ מעשענער 19 | 20 | געפֿאָלגט(, און צו מאָל האָט זי זיך אַלײן 21 | װאָס װערן אױסגעקליבן: דער טעמפּעראַטור, 22 | 23 | און מאָלעקולן בײַטן אױס עלעקטראָנען, און 24 | )אַ קלײן גלאָז צו אײַזקרעם-סאָנדײס איז 25 | אַ פּאַטש טאָן אין פּנים, װײַל זי האָט 26 | אַזאַ: בשעת װי די חסידים באַגראָבן זיך 27 | פֿון לויִס קערעל; ייִדיש: ש. בערגער 28 | --- "און אױב כ'װעל יאָ פֿאַרמאַכן דעם פֿענצטער, 29 | 30 | עטלעכע פֿײַנע מעשׂהלעך װעגן קינדער װאָס 31 | אײן זײַט און אַרױף די צװײטע, און אַ פּרוּװ 32 | אַליס אָנגעהױבן װערן גאַנץ שלעפֿעריק, 33 | מײַן לערנען ייִדיש האָט זיך אָנגעהױבן 34 | אַלץ טיפֿער אין ייִדישן "מוזאַק" )די אין-סופֿיקע 35 | 36 | אין אַ ראָזיקן װעסנע-טאָן 37 | דער משכּן, דער ש"ס װאָס װערט כּסדר איבערגעדרוקט, 38 | אײן זײַט און אַרױף די צװײטע, און אַ פּרוּװ 39 | אַ פּלאַן פֿאַר אױסבעסערן דעם ייִדישן 40 | 41 | אָדער קלײנע שטיקלעך מעטאַל? װאָס פּאַסירט 42 | װילדע חיות, אָדער אַנדערע אומאײַנגענעמע 43 | 44 | פֿאַרגרעסערט מײַן װאָקאַבולאַר. 45 | װיסן װאָס הײסט "געאָגראַפֿיש," אַפּשיטא 46 | האָט זי געמאַכט זײער אַ לעפּישע און פֿאַרשלאָפֿענע( 47 | דער משכּן, דער ש"ס װאָס װערט כּסדר איבערגעדרוקט, 48 | אונטערן טירעלע. אַזױ צי אַזױ װעל איך זיך 49 | הײַזער 50 | אַטאָם שטעלט מיט זיך פֿאָר אַ צענטראַלן 51 | )פֿאַרקירצט און פֿאַרבעסערט( 52 | ערקלערונג פֿון אײַנשטײַנס רעלאַטיװיטעט 53 | אַ װיסנשאַפֿטלעכער שפּראַך און טערמינאָלאָגיע 54 | אַראָפּ --- אַזױ ראַפּטום, אַז אַליס האָט 55 | כ'װײס, אַז אין יענער צײַט, האָט מען געװױנט 56 | סײַ מיטן שטײגער לעבן סײַ מיטן שאַפֿן האַלטן 57 | צעלאָזן זיך פֿון דעם מעטאַל אַרײַנצו אין 58 | 59 | 60 | און באַמערקט, אַז זײ זײַנען פֿול מיט שענק 61 | ס'איז שפּעט די שעה, איך קוק אַרױס, 62 | גוט ס'האָט געקענט, װײַל דער הײסער טאָג 63 | געזוכט אין די קדמונישע ספֿרים קדושים. 64 | קומט ג ע װ ײ נ ט ל ע ך פֿאָר אַז מ'עסט אַ 65 | ביז אַרומ דמ 15טנ יר, וט מנ סׂונ קננ רהביליטירנ 66 | 67 | העקלעך. פֿאַרבײַפֿאַלנדיק האָט זי אַראָפּגענומען 68 | אָבער עס זײַנען דאָ ייִדן װאָס פֿרעגן 69 | פֿון דער רעדאַקציע: צו װאָס אַ ייִדישער 70 | פּאַראַלעל. נאָרמאַלע "באַטעריעס", װאָס 71 | 72 | 73 | דערנאָך בין איך געקומען אין ביִאַליק. 74 | "וארשׂתּיך לי." דאָ פֿירט דער קלעזמער-מוזיק 75 | יאָרצענדליקער איז געװאָרן ממש נישט צו 76 | סיום-רעדע, יוני, 1997, ביִאַליק-מיטלשול, 77 | עק פֿון דעם דראָט, צו אַ פּאָלוס פֿון דעם 78 | רעדסטו ייִדיש? 79 | 80 | געהאַט קאַפּיטאַליסטן, סאָציִאַליסטן, 81 | 82 | ר חידוש, און אַליס האָט עס נישט געהאַלטן 83 | אין אַ ראָזיקן װעסנע-טאָן 84 | -------------------------------------------------------------------------------- /lib/training_data/vi-utf8.txt: -------------------------------------------------------------------------------- 1 | (viết tắt từ chữ "PHP: Hypertext Preprocessor") là một ngôn ngữ lập trình kịch bản phía máy chủ, [[mã nguồn mở]], dùng cho mục đích tổng quát. Nó rất thích hợp với [[Internet|web]] và có thể dễ dạng nhúng vào trang [[HTML]]. Do được tối ưu hóa cho các ứng dụng web, tốc độ nhanh, nhỏ gọn, cú pháp giống [[Ngôn ngữ C|C]] và [[Java]], dễ học và thời gian xây dựng sản phẩm tương đối ngắn hơn so với các ngôn ngữ khác nên PHP đã nhanh chóng trở thành một ngôn ngữ lập trình web phổ biến nhất thế giới. 2 | 3 | Đoạn mã sau minh họa giúp cách viết PHP lồng vào các trang HTML dễ dàng như thế nào: 4 | 5 | Thẻ <<?<à sẽ bao gói phần mã PHP giúp cho máy chủ biết cách xử lý phần mã logic nào trên máy chủ. Đây là một điểm khá tiện lợi của PHP giúp cho việc viết mã PHP trở nên khá trực quan và dễ dàng trong việc xây dựng phần giao diện ứng dụng 6 | 7 | Ngôn ngữ, các thư viện, tài liệu gốc của PHP được xây dựng bởi cộng đồng và có sự đóng góp rất lớn của [[Zend Inc.]], công ty do các nhà phát triển cốt lõi của PHP lập nên nhằm tại ra một môi trường chuyên nghiệp để đưa PHP phát triển ở quy mô xí nghiệp. 8 | 9 | ==Lịch sử phát triển của PHP== 10 | 11 | 12 | PHP phát triển lên từ một sản phẩm có tên là [[PHP/FI]]. PHP/FI do [[Rasmus Lerdorf]] tạo ra năm [[1995]], ban đầu được xem như là một tập con đơn giản của các [[mã kịch bản]] [[Perl]] để theo dõi tình hình truy cập đến bản sơ yếu lí lịch của ông trên mạng. Ông đã đặt tên cho bộ mã kịch bản này là 'Personal Home Page Tools'. Khi cần đến các chức năng rộng hơn, Rasmus đã viết ra một bộ thực thi bằng C lớn hơn, để có thể truy vấn với các [[cơ sở dữ liệu]], và giúp cho người sử dụng phát triển các ứng dụng web đơn giản. Rasmus đã quyết định công bố mã nguồn của PHP/FI cho mọi người xem, sử dụng cũng như chữa các lỗi có trong nó đồng thời cải tiến mã nguồn. 13 | 14 | PHP/FI, viết tắt cho chữ Personal Home Page / Forms Interpreter, bao gồm một số các chức năng cơ bản cho PHP như ta đã biết đến chúng ngày nay. Nó có các biến kiểu như Perl, thông dịch tự động các biến của form và cú pháp HTML nhúng. Cú pháp này giống như của Perl, mặc dù hạn chế hơn nhiều, đơn giản và có phần thiếu nhất quán. 15 | 16 | Vào năm [[1997]], PHP/FI 2.0, lần viết lại thứ hai của phiên bản C, đã thu hút được hàng ngàn người sử dụng trên tòan thế giới, với xấp xỉ 50000 tên miền đã được ghi nhận là có cài đặt nó, chiếm khoảng 1% số tên miền có trên mạng Internet. Tuy đã có tới hàng nghìn người tham gia đống góp vào việc tu chỉnh mã nguồn của dự án này thì vào thời đó nó vẫn chủ yếu chỉ là dự án của một người. 17 | 18 | PHP/FI 2.0 được chính thức công bố vào tháng 11 năm 1997, sau một thời gian khá dài chỉ được công bố dưới dạng các bản [[beta]]. Nhưng không lâu sau đó, nó đã được thay thế bởi các bản alpha đầu tiên của PHP 3.0. 19 | 20 | 21 | là phiên bản đầu tiên cho chúng ta thấy một hình ảnh gần gũi với các phiên bản PHP mà chúng ta được biết ngày nay. Nó đã được [[Andi Gutmans]] và [[Zeev Suraski]] tạo ra năm 1997 sau khi viết lại hoàn toàn bộ mã nguồn trước đó. Lý do chính mà họ đã tạo ra phiên bản này là do nhận họ thấy PHP/FI 2.0 hết sức yếu kém trong việc phát triển một ứng dụng [[Thương mại điện tử]] mà họ đang xúc tiến trong một dự án của trường đại học. Trong một nỗ lực hợp tác và bắt đầu xây dựng dựa trên cơ sỏ người dùng đã có của PHP/FI, [[Andi]], [[Rasmus]] và [[Zeev]] đã quyết định hợp tác và công bố PHP 3.0 như là phiên bản thế hệ kế tiếp của PHP/FI 2.0, và chấm dứt phát triển PHP/FI 2.0. 22 | 23 | Một trong những sức mạnh lớn nhất của PHP 3.0 là các tính năng mở rộng mạnh mẽ của nó. Ngoài khả năng cung cấp cho người dùng cuối một cơ sỏ hạ tầng chặt chẽ dùng cho nhiều cơ sở dữ liệu, giao thức và API khác nhau, các tính năng mở rộng của PHP 3.0 đã thu hút rất nhiều nhà phát triển tham gia và đề xuất các mô đun mở rộng mới. Hoàn toàn có thể kết luận được rằng đây chính là điểm mấu chốt dẫn đến thành công vang dội của PHP 3.0. Các tính năng khác được giới thiệu trong PHP 3.0 gồm có hỗ trợ cú pháp [[hướng đối tượng]] và nhiều cú pháp ngôn ngữ nhất quán khác. 24 | 25 | Ngôn ngữ hoàn toàn mới đã được công bố dưới một cái tên mới, xóa bỏ mối liên hệ với việc sử dụng vào mục đích cá nhân hạn hẹp mà cái tên PHP/FI 2.0 gợi nhắc. Nó đã được đặt tên ngắn gọn là 'PHP', một kiểu viết tắt hồi quy của - PHP: Hypertext Preprocessor. 26 | 27 | Vào cuối năm [[1998]], PHP đã phát triển được cơ số cài dặt lên tới hàng chục ngàn người sử dụng và hàng chục ngàn Web site báo cáo là đã cài nó. Vào thời kì đỉnh cao, PHP 3.0 đã được cài đặt cho xấp xỉ 10% số Web server có trên mạng Internet. 28 | 29 | PHP 3.0 đã chính thức được công bố vào tháng 6 năm 1998, sau thời gian 9 tháng được công đồng kiểm nghiệm. 30 | 31 | 32 | Vào mùa đông năm 1998, ngay sau khi PHP 3.0 chính thức được công bố, Andi Gutmans và Zeev Suraski đã bắt đầu bắt tay vào việc viết lại phần lõi của PHP. Mục đích thiết kế là nhằm cải tiến tốc độ xử lý các ứng dụng phức tạp, và cải tiến tính mô đun của cơ sở mã PHP. Những ứng dụng như vậy đã chạy được trên PHP 3.0 dựa trên các tính năng mới và sự hỗ trợ cảu khá nhiều các cở sở dữ liệu và API của bên thứ ba, nhưng PHP 3.0 đã không được thiết kế để xử lý các ứng dụng phức tạp như thế này một cách có hiệu quả. 33 | 34 | Một động cơ mới, có tên 'Zend Engine' (ghép từ các chữ đầu trong tên của Zeev và Andi), đã đáp ứng được các nhu cầu thiết kế này một cách thành công, và lần đầu tiên được giới thiệu vào giữa năm [[1999]]. PHP 4.0, dựa trên động cơ này, và đi kèm với hàng loạt các tính năng mới bổ sung, đã chính thức được công bố vào tháng 5 năm 2000, gần 2 năm sau khi bản PHP 3.0 ra đời. Ngoài tốc độ xử lý được cải thiện rất nhiều, PHP 4.0 đem đến các tính năng chủ yếu khác gồm có sự hỗ trợ nhiều Web server hơn, hỗ trợ phiên làm việc HTTP, tạo bộ đệm thông tin đầu ra, nhiều cách xử lý thông tin người sử dụng nhập vào bảo mật hơn và cung cấp một vài các cấu trúc ngôn ngữ mới. 35 | 36 | Với số nhà phát triển dùng PHP đã lên đến hàng trăm nghìn và hàng triệu site đã công bố cài đặt PHP, chiếm khoảng 20% số tên miền trên mạng Internet. 37 | 38 | Nhóm phát triển PHP cũng đã lên tới con số hàng nghìn người và nhiều nghìn người khác tham gia vào các dự án có liên quan đến PHP như [[PEAR]], [[PECL]] và tài liệu kĩ thuật cho PHP. 39 | 40 | 41 | Sự thành công hết sức to lớn của PHP 4.0 đã không làm cho nhóm phát triển PHP tự mãn. Cộng đồng đã nhanh chóng giúp họ nhận ra những yếu kém của PHP 4 đặc biệt với khả năng hỗ trợ lập trình hướng đối tượng, xử lý [[XML]], không hỗ trợ giao thức máy khách mới của [[]] 4.1 và 5.0, hỗ trợ dịch vụ web yếu. Những điểm này chính là mục đích để Zeev và Andi viết Zend Engine 2.0, lõi của PHP 5.0. [ Một thảo luận trên Slashdot] đã cho thấy việc phát triển PHP 5.0 có thể đã bắt đầu vào thời điểm tháng 12 năm [[2002]] nhưng những bài phỏng vấn Zeev liên quan đến phiên bản này thì đã có mặt trên mạng Internet vào khoảng tháng 7-2002. Ngày [[29 tháng 6]] năm [[2003]], PHP 5 Beta 1 đã chính thức được công bố để cộng đồng kiểm nghiệm. Đó cũng là phiên bản đầu tiên của Zend Engine 2.0. Phiên bản Beta 2 sau đó đã ra mắt vào tháng 10 năm 2003 với sự xuất hiện của hai tính năng rất được chờ đợi: [[]]s, [[]] nhưng [[]]s một tính năng gây tranh cãi khác đã bị loại khỏi mã nguồn. Ngày [[21 tháng 12]] năm 2003: PHP5 Beta 3 đã được công bố để kiểm tra với việc phân phối kèm với [[Tidy]], bỏ hỗ trợ [[]], khả năng gọi các hàm PHP bên trong [[XSLT]], sửa chữa nhiều lỗi và thêm khá nhiều hàm mới. PHP5 bản chính thức đã ra mắt ngày [[13 tháng 7]] năm [[2004]] sau một chuỗi khá dài các bản kiểm tra thử bao gồm Beta 4, RC 1, RC2, RC3. Mặc dù coi đây là phiên bản sản xuất đầu tiên nhưng PHP 5.0 vẫn còn một số lỗi trong đó đáng kể là lỗi xác thực HTTP. Nhóm [[]] đã kỉ niệm sự kiện này bằng hai bài viết về PHP 5.0 đăng trên tờ Thế giới Vi tính (số A) tháng 8-2004. 42 | 43 | Mặc dù đây PHP 5 được coi là đã sẵn sàng cho doanh nghiệp nhưng sự chấp nhận PHP vẫn tiến triển khá chậm chạm đặc biệt là ở Việt Nam. Nhưng những nỗ lực đầu tiên để phổ biến PHP trong đó có dự án xây dựng [[Chuẩn viết mã PHP]] [[tiếng Việt]] đã được xúc tiến. Ngày 24-10-2004, nhóm PHPVietnam đã đề xuất xây dựng PHPVietnam Mailing List đầu tiên trên Google Groups tại địa chỉ: . Tại đây cũng đã diễn ra những thảo luận để xây dựng forum cho cộng đồng 44 | 45 | ==Đóng góp của nguười Việt cho cộng đồng PHP thế giới== 46 | Người Việt chưa đóng góp được gì nhiều. Chủ yếu sự tham gia của người Việt là thông qua việc dịch các file ngôn ngữ và dựa trên những script PHP sẵn có với chút sửa đổi để tạo nên các hệ thống thông tin thuần Việt như Nuke Việt. 47 | 48 | -------------------------------------------------------------------------------- /lib/training_data/zh-big5.txt: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/feedbackmine/language_detector/89102790194150b3a8110ce691f9989b8ce70f8d/lib/training_data/zh-big5.txt -------------------------------------------------------------------------------- /test/language_detector_test.rb: -------------------------------------------------------------------------------- 1 | # -*- coding: utf-8 -*- 2 | require 'test/unit' 3 | require File.dirname(__FILE__) + '/../lib/language_detector' 4 | 5 | class ProfileTest < Test::Unit::TestCase 6 | def test_is_puctuation 7 | p = LanguageDetector::Profile.new("test") 8 | assert p.is_puctuation?(?,) 9 | assert p.is_puctuation?(?.) 10 | assert !p.is_puctuation?(?A) 11 | assert !p.is_puctuation?(?a) 12 | end 13 | 14 | def test_tokenize 15 | p = LanguageDetector::Profile.new("test") 16 | assert_equal ["this", "is", "A", "test"], p.tokenize("this is ,+_ A \t 123 test") 17 | end 18 | 19 | def test_count_ngram 20 | p = LanguageDetector::Profile.new("test") 21 | assert_equal({"w"=>1, "o"=>1, "r"=>1, "d"=>1, "s"=>1}, p.count_ngram('words', 1, {})) 22 | assert_equal({"wo"=>1, "or"=>1, "rd"=>1, "ds"=>1, "_w" => 1, "s_" => 1}, p.count_ngram('words', 2, {})) 23 | assert_equal({"wor"=>1, "ord"=>1, "rds"=>1, "_wo" => 1, "ds_" => 1, "s__" => 1}, p.count_ngram('words', 3, {})) 24 | assert_equal({"word"=>1, "ords"=>1, "_wor" => 1, "rds_" => 1, "ds__" => 1, "s___" => 1}, p.count_ngram('words', 4, {})) 25 | assert_equal({"words"=>1, "_word" => 1, "ords_" => 1, "rds__" => 1, "ds___" => 1, "s____" => 1}, p.count_ngram('words', 5, {})) 26 | assert_equal({}, p.count_ngram('words', 6, {})) 27 | end 28 | 29 | def test_init_with_string 30 | p = LanguageDetector::Profile.new("test") 31 | p.init_with_string("this is ,+_ A \t 123 test") 32 | assert_equal( 33 | [["t_", 30], ["st__", 29], ["st", 16], ["hi", 8], ["_tes", 7], ["is__", 6], ["s___", 5], ["s_", 3], ["his_", 11], ["tes", 10], ["t___", 9], ["es", 12], ["_te", 14], ["est_", 13], ["est", 15], ["te", 4], ["his", 17], ["_th", 20], ["s__", 19], ["st_", 18], ["th", 24], ["_thi", 23], ["t__", 22], ["test", 21], ["thi", 28], ["is_", 27], ["this", 26], ["_i", 25], ["is", 2], ["_t", 1]], 34 | p.ngrams.sort_by { |a,b| a[1] <=> b[1] }, 35 | "This test does not pass in the original repository either: http://github.com/feedbackmine/language_detector" 36 | ) 37 | end 38 | 39 | def test_init_with_file 40 | p = LanguageDetector::Profile.new("test") 41 | p.init_with_file("bg-utf8.txt") 42 | assert !p.ngrams.empty? 43 | end 44 | 45 | def test_compute_distance 46 | p1 = LanguageDetector::Profile.new("test") 47 | p1.init_with_string("this is ,+_ A \t 123 test") 48 | p2 = LanguageDetector::Profile.new("test") 49 | p2.init_with_string("this is ,+_ A \t 123 test") 50 | assert_equal 0, p1.compute_distance(p2) 51 | 52 | p3 = LanguageDetector::Profile.new("test") 53 | p3.init_with_string("xxxx") 54 | assert_equal 24000, p1.compute_distance(p3) 55 | end 56 | end 57 | 58 | class LanguageDetectorTest < Test::Unit::TestCase 59 | def test_detect 60 | d = LanguageDetector.new 61 | 62 | assert_equal "es", d.detect("para poner este importante proyecto en práctica") 63 | assert_equal "en", d.detect("this is a test of the Emergency text categorizing system.") 64 | assert_equal "fr", d.detect("serait désigné peu après PDG d'Antenne 2 et de FR 3. Pas même lui ! Le") 65 | assert_equal "it", d.detect("studio dell'uomo interiore? La scienza del cuore umano, che") 66 | assert_equal "ro", d.detect("taiate pe din doua, in care vezi stralucind brun sau violet cristalele interioare") 67 | assert_equal "pl", d.detect("na porozumieniu, na ³±czeniu si³ i ¶rodków. Dlatego szukam ludzi, którzy") 68 | assert_equal "de", d.detect("sagt Hühsam das war bei Über eine Annonce in einem Frankfurter der Töpfer ein. Anhand von gefundenen gut kennt, hatte ihm die wahren Tatsachen Sechzehn Adorno-Schüler erinnern und daß ein Weiterdenken der Theorie für ihre Festlegung sind drei Jahre Erschütterung Einblick in die Abhängigkeit der Bauarbeiten sei") 69 | assert_equal "fi", d.detect("koulun arkistoihin pölyttymään, vaan nuoret saavat itse vaikuttaa ajatustensa eteenpäinviemiseen esimerkiksi") 70 | # assert_equal "sv", d.detect("enligt all sannolikhet för att få ro oavsiktligt intagit en för") 71 | assert_equal "hu", d.detect("esôzéseket egy kissé túlméretezte, ebbôl kifolyólag a Földet egy hatalmas árvíz mosta el") 72 | assert_equal "fi", d.detect("koulun arkistoihin pölyttymään, vaan nuoret saavat itse vaikuttaa ajatustensa eteenpäinviemiseen esimerkiksi") 73 | assert_equal "nl", d.detect("tegen de kabinetsplannen. Een speciaal in het leven geroepen Landelijk") 74 | assert_equal "da", d.detect("viksomhed, 58 pct. har et arbejde eller er under uddannelse, 76 pct. forsørges ikke længere af Kolding") 75 | assert_equal "cs", d.detect("datují rokem 1862. Naprosto zakázán byl v pocitech smutku, beznadìje èi jiné") 76 | assert_equal "no", d.detect("hånd på den enda hvitere restaurant-duken med en bevegelse så forfinet") 77 | assert_equal "pt", d.detect("popular. Segundo o seu biógrafo, a Maria Adelaide auxiliava muita gente") 78 | assert_equal "en", d.detect("TaffyDB finders looking nice so far!") 79 | end 80 | end 81 | --------------------------------------------------------------------------------