├── LICENSE ├── README.md ├── data ├── augmented │ ├── augmentation-experiment-deepl │ │ ├── augmented-training-set-preprocessed.txt │ │ ├── augmented-training-set.txt │ │ ├── glosses-to-add-for-augmented-sentences.txt │ │ └── sentences-to-augment.txt │ ├── indomain-weather-data │ │ ├── preprocessed_data.txt │ │ ├── preprocessed_data_output.txt │ │ └── preprocessed_data_output_tagged.txt │ ├── ood-3000 │ │ ├── crawled_data_half.txt │ │ ├── crawled_data_half_output.txt │ │ └── crawled_data_half_output_tagged.txt │ └── ood-5000 │ │ ├── data_5000.txt │ │ ├── data_5000_preprocessed.txt │ │ ├── data_5000_preprocessed_output.txt │ │ └── data_5000_preprocessed_output_tagged.txt └── baselines │ ├── dgs_preprocessed │ ├── .history │ ├── README │ ├── dev │ │ ├── .history │ │ ├── german_dev.txt │ │ ├── german_stripped_dev.txt │ │ ├── german_train_dev.txt │ │ ├── glosses_dev.txt │ │ ├── glosses_stem_dev.txt │ │ ├── glosses_tok_dev.txt │ │ └── glosses_train_dev.txt │ ├── test │ │ ├── .history │ │ ├── german_stripped_test.txt │ │ ├── german_test.txt │ │ ├── glosses_stem_test.txt │ │ ├── glosses_test.txt │ │ └── glosses_tok_test.txt │ └── train │ │ ├── german_stripped_train.txt │ │ ├── german_train.txt │ │ ├── glosses_stem_train.txt │ │ ├── glosses_tok_train.txt │ │ └── glosses_train.txt │ └── phoenix_preprocessed │ ├── .history │ ├── README │ ├── phoenix_dev_glosses.txt │ ├── phoenix_dev_glosses_lowercased.txt │ ├── phoenix_dev_sentences.txt │ ├── phoenix_dev_sentences_stripped.txt │ ├── phoenix_test_glosses.txt │ ├── phoenix_test_glosses_lowercased.txt │ ├── phoenix_test_sentences.txt │ ├── phoenix_test_sentences_stripped.txt │ ├── phoenix_train_glosses.txt │ ├── phoenix_train_glosses_concat.txt │ ├── phoenix_train_glosses_lowercased.txt │ ├── phoenix_train_sentences.txt │ └── phoenix_train_sentences_stripped.txt ├── notebooks ├── create-train-set.ipynb ├── dgs_corpus_statistics.ipynb ├── german-gloss-sentences-extraction.ipynb ├── german-sentences-extraction.ipynb ├── tokenize-dgs-custom.ipynb └── training-data-dev-data-similarity.ipynb └── training-scripts ├── dgs-baseline-rnn ├── dgs-baseline-rnn-improved ├── dgs-baseline-transformer ├── dgs-baseline-transformer-improved ├── dgs-bpe-tok ├── dgs-bpe-tok-stemmed ├── dgs-custom-tok ├── dgs-unigram-tok ├── phoenix-baseline-rnn ├── phoenix-baseline-rnn-improved ├── phoenix-baseline-transformer ├── phoenix-baseline-transformer-improved ├── phoenix-bpe-tok ├── phoenix-bpe-tok-reduced └── phoenix-unigram-tok /LICENSE: -------------------------------------------------------------------------------- 1 | GNU GENERAL PUBLIC LICENSE 2 | Version 3, 29 June 2007 3 | 4 | Copyright (C) 2007 Free Software Foundation, Inc. 5 | Everyone is permitted to copy and distribute verbatim copies 6 | of this license document, but changing it is not allowed. 7 | 8 | Preamble 9 | 10 | The GNU General Public License is a free, copyleft license for 11 | software and other kinds of works. 12 | 13 | The licenses for most software and other practical works are designed 14 | to take away your freedom to share and change the works. By contrast, 15 | the GNU General Public License is intended to guarantee your freedom to 16 | share and change all versions of a program--to make sure it remains free 17 | software for all its users. We, the Free Software Foundation, use the 18 | GNU General Public License for most of our software; it applies also to 19 | any other work released this way by its authors. You can apply it to 20 | your programs, too. 21 | 22 | When we speak of free software, we are referring to freedom, not 23 | price. Our General Public Licenses are designed to make sure that you 24 | have the freedom to distribute copies of free software (and charge for 25 | them if you wish), that you receive source code or can get it if you 26 | want it, that you can change the software or use pieces of it in new 27 | free programs, and that you know you can do these things. 28 | 29 | To protect your rights, we need to prevent others from denying you 30 | these rights or asking you to surrender the rights. Therefore, you have 31 | certain responsibilities if you distribute copies of the software, or if 32 | you modify it: responsibilities to respect the freedom of others. 33 | 34 | For example, if you distribute copies of such a program, whether 35 | gratis or for a fee, you must pass on to the recipients the same 36 | freedoms that you received. You must make sure that they, too, receive 37 | or can get the source code. And you must show them these terms so they 38 | know their rights. 39 | 40 | Developers that use the GNU GPL protect your rights with two steps: 41 | (1) assert copyright on the software, and (2) offer you this License 42 | giving you legal permission to copy, distribute and/or modify it. 43 | 44 | For the developers' and authors' protection, the GPL clearly explains 45 | that there is no warranty for this free software. For both users' and 46 | authors' sake, the GPL requires that modified versions be marked as 47 | changed, so that their problems will not be attributed erroneously to 48 | authors of previous versions. 49 | 50 | Some devices are designed to deny users access to install or run 51 | modified versions of the software inside them, although the manufacturer 52 | can do so. This is fundamentally incompatible with the aim of 53 | protecting users' freedom to change the software. The systematic 54 | pattern of such abuse occurs in the area of products for individuals to 55 | use, which is precisely where it is most unacceptable. Therefore, we 56 | have designed this version of the GPL to prohibit the practice for those 57 | products. If such problems arise substantially in other domains, we 58 | stand ready to extend this provision to those domains in future versions 59 | of the GPL, as needed to protect the freedom of users. 60 | 61 | Finally, every program is threatened constantly by software patents. 62 | States should not allow patents to restrict development and use of 63 | software on general-purpose computers, but in those that do, we wish to 64 | avoid the special danger that patents applied to a free program could 65 | make it effectively proprietary. To prevent this, the GPL assures that 66 | patents cannot be used to render the program non-free. 67 | 68 | The precise terms and conditions for copying, distribution and 69 | modification follow. 70 | 71 | TERMS AND CONDITIONS 72 | 73 | 0. Definitions. 74 | 75 | "This License" refers to version 3 of the GNU General Public License. 76 | 77 | "Copyright" also means copyright-like laws that apply to other kinds of 78 | works, such as semiconductor masks. 79 | 80 | "The Program" refers to any copyrightable work licensed under this 81 | License. Each licensee is addressed as "you". "Licensees" and 82 | "recipients" may be individuals or organizations. 83 | 84 | To "modify" a work means to copy from or adapt all or part of the work 85 | in a fashion requiring copyright permission, other than the making of an 86 | exact copy. The resulting work is called a "modified version" of the 87 | earlier work or a work "based on" the earlier work. 88 | 89 | A "covered work" means either the unmodified Program or a work based 90 | on the Program. 91 | 92 | To "propagate" a work means to do anything with it that, without 93 | permission, would make you directly or secondarily liable for 94 | infringement under applicable copyright law, except executing it on a 95 | computer or modifying a private copy. Propagation includes copying, 96 | distribution (with or without modification), making available to the 97 | public, and in some countries other activities as well. 98 | 99 | To "convey" a work means any kind of propagation that enables other 100 | parties to make or receive copies. Mere interaction with a user through 101 | a computer network, with no transfer of a copy, is not conveying. 102 | 103 | An interactive user interface displays "Appropriate Legal Notices" 104 | to the extent that it includes a convenient and prominently visible 105 | feature that (1) displays an appropriate copyright notice, and (2) 106 | tells the user that there is no warranty for the work (except to the 107 | extent that warranties are provided), that licensees may convey the 108 | work under this License, and how to view a copy of this License. If 109 | the interface presents a list of user commands or options, such as a 110 | menu, a prominent item in the list meets this criterion. 111 | 112 | 1. Source Code. 113 | 114 | The "source code" for a work means the preferred form of the work 115 | for making modifications to it. "Object code" means any non-source 116 | form of a work. 117 | 118 | A "Standard Interface" means an interface that either is an official 119 | standard defined by a recognized standards body, or, in the case of 120 | interfaces specified for a particular programming language, one that 121 | is widely used among developers working in that language. 122 | 123 | The "System Libraries" of an executable work include anything, other 124 | than the work as a whole, that (a) is included in the normal form of 125 | packaging a Major Component, but which is not part of that Major 126 | Component, and (b) serves only to enable use of the work with that 127 | Major Component, or to implement a Standard Interface for which an 128 | implementation is available to the public in source code form. A 129 | "Major Component", in this context, means a major essential component 130 | (kernel, window system, and so on) of the specific operating system 131 | (if any) on which the executable work runs, or a compiler used to 132 | produce the work, or an object code interpreter used to run it. 133 | 134 | The "Corresponding Source" for a work in object code form means all 135 | the source code needed to generate, install, and (for an executable 136 | work) run the object code and to modify the work, including scripts to 137 | control those activities. However, it does not include the work's 138 | System Libraries, or general-purpose tools or generally available free 139 | programs which are used unmodified in performing those activities but 140 | which are not part of the work. For example, Corresponding Source 141 | includes interface definition files associated with source files for 142 | the work, and the source code for shared libraries and dynamically 143 | linked subprograms that the work is specifically designed to require, 144 | such as by intimate data communication or control flow between those 145 | subprograms and other parts of the work. 146 | 147 | The Corresponding Source need not include anything that users 148 | can regenerate automatically from other parts of the Corresponding 149 | Source. 150 | 151 | The Corresponding Source for a work in source code form is that 152 | same work. 153 | 154 | 2. Basic Permissions. 155 | 156 | All rights granted under this License are granted for the term of 157 | copyright on the Program, and are irrevocable provided the stated 158 | conditions are met. This License explicitly affirms your unlimited 159 | permission to run the unmodified Program. The output from running a 160 | covered work is covered by this License only if the output, given its 161 | content, constitutes a covered work. This License acknowledges your 162 | rights of fair use or other equivalent, as provided by copyright law. 163 | 164 | You may make, run and propagate covered works that you do not 165 | convey, without conditions so long as your license otherwise remains 166 | in force. You may convey covered works to others for the sole purpose 167 | of having them make modifications exclusively for you, or provide you 168 | with facilities for running those works, provided that you comply with 169 | the terms of this License in conveying all material for which you do 170 | not control copyright. Those thus making or running the covered works 171 | for you must do so exclusively on your behalf, under your direction 172 | and control, on terms that prohibit them from making any copies of 173 | your copyrighted material outside their relationship with you. 174 | 175 | Conveying under any other circumstances is permitted solely under 176 | the conditions stated below. Sublicensing is not allowed; section 10 177 | makes it unnecessary. 178 | 179 | 3. Protecting Users' Legal Rights From Anti-Circumvention Law. 180 | 181 | No covered work shall be deemed part of an effective technological 182 | measure under any applicable law fulfilling obligations under article 183 | 11 of the WIPO copyright treaty adopted on 20 December 1996, or 184 | similar laws prohibiting or restricting circumvention of such 185 | measures. 186 | 187 | When you convey a covered work, you waive any legal power to forbid 188 | circumvention of technological measures to the extent such circumvention 189 | is effected by exercising rights under this License with respect to 190 | the covered work, and you disclaim any intention to limit operation or 191 | modification of the work as a means of enforcing, against the work's 192 | users, your or third parties' legal rights to forbid circumvention of 193 | technological measures. 194 | 195 | 4. Conveying Verbatim Copies. 196 | 197 | You may convey verbatim copies of the Program's source code as you 198 | receive it, in any medium, provided that you conspicuously and 199 | appropriately publish on each copy an appropriate copyright notice; 200 | keep intact all notices stating that this License and any 201 | non-permissive terms added in accord with section 7 apply to the code; 202 | keep intact all notices of the absence of any warranty; and give all 203 | recipients a copy of this License along with the Program. 204 | 205 | You may charge any price or no price for each copy that you convey, 206 | and you may offer support or warranty protection for a fee. 207 | 208 | 5. Conveying Modified Source Versions. 209 | 210 | You may convey a work based on the Program, or the modifications to 211 | produce it from the Program, in the form of source code under the 212 | terms of section 4, provided that you also meet all of these conditions: 213 | 214 | a) The work must carry prominent notices stating that you modified 215 | it, and giving a relevant date. 216 | 217 | b) The work must carry prominent notices stating that it is 218 | released under this License and any conditions added under section 219 | 7. This requirement modifies the requirement in section 4 to 220 | "keep intact all notices". 221 | 222 | c) You must license the entire work, as a whole, under this 223 | License to anyone who comes into possession of a copy. This 224 | License will therefore apply, along with any applicable section 7 225 | additional terms, to the whole of the work, and all its parts, 226 | regardless of how they are packaged. This License gives no 227 | permission to license the work in any other way, but it does not 228 | invalidate such permission if you have separately received it. 229 | 230 | d) If the work has interactive user interfaces, each must display 231 | Appropriate Legal Notices; however, if the Program has interactive 232 | interfaces that do not display Appropriate Legal Notices, your 233 | work need not make them do so. 234 | 235 | A compilation of a covered work with other separate and independent 236 | works, which are not by their nature extensions of the covered work, 237 | and which are not combined with it such as to form a larger program, 238 | in or on a volume of a storage or distribution medium, is called an 239 | "aggregate" if the compilation and its resulting copyright are not 240 | used to limit the access or legal rights of the compilation's users 241 | beyond what the individual works permit. Inclusion of a covered work 242 | in an aggregate does not cause this License to apply to the other 243 | parts of the aggregate. 244 | 245 | 6. Conveying Non-Source Forms. 246 | 247 | You may convey a covered work in object code form under the terms 248 | of sections 4 and 5, provided that you also convey the 249 | machine-readable Corresponding Source under the terms of this License, 250 | in one of these ways: 251 | 252 | a) Convey the object code in, or embodied in, a physical product 253 | (including a physical distribution medium), accompanied by the 254 | Corresponding Source fixed on a durable physical medium 255 | customarily used for software interchange. 256 | 257 | b) Convey the object code in, or embodied in, a physical product 258 | (including a physical distribution medium), accompanied by a 259 | written offer, valid for at least three years and valid for as 260 | long as you offer spare parts or customer support for that product 261 | model, to give anyone who possesses the object code either (1) a 262 | copy of the Corresponding Source for all the software in the 263 | product that is covered by this License, on a durable physical 264 | medium customarily used for software interchange, for a price no 265 | more than your reasonable cost of physically performing this 266 | conveying of source, or (2) access to copy the 267 | Corresponding Source from a network server at no charge. 268 | 269 | c) Convey individual copies of the object code with a copy of the 270 | written offer to provide the Corresponding Source. This 271 | alternative is allowed only occasionally and noncommercially, and 272 | only if you received the object code with such an offer, in accord 273 | with subsection 6b. 274 | 275 | d) Convey the object code by offering access from a designated 276 | place (gratis or for a charge), and offer equivalent access to the 277 | Corresponding Source in the same way through the same place at no 278 | further charge. You need not require recipients to copy the 279 | Corresponding Source along with the object code. If the place to 280 | copy the object code is a network server, the Corresponding Source 281 | may be on a different server (operated by you or a third party) 282 | that supports equivalent copying facilities, provided you maintain 283 | clear directions next to the object code saying where to find the 284 | Corresponding Source. Regardless of what server hosts the 285 | Corresponding Source, you remain obligated to ensure that it is 286 | available for as long as needed to satisfy these requirements. 287 | 288 | e) Convey the object code using peer-to-peer transmission, provided 289 | you inform other peers where the object code and Corresponding 290 | Source of the work are being offered to the general public at no 291 | charge under subsection 6d. 292 | 293 | A separable portion of the object code, whose source code is excluded 294 | from the Corresponding Source as a System Library, need not be 295 | included in conveying the object code work. 296 | 297 | A "User Product" is either (1) a "consumer product", which means any 298 | tangible personal property which is normally used for personal, family, 299 | or household purposes, or (2) anything designed or sold for incorporation 300 | into a dwelling. In determining whether a product is a consumer product, 301 | doubtful cases shall be resolved in favor of coverage. For a particular 302 | product received by a particular user, "normally used" refers to a 303 | typical or common use of that class of product, regardless of the status 304 | of the particular user or of the way in which the particular user 305 | actually uses, or expects or is expected to use, the product. A product 306 | is a consumer product regardless of whether the product has substantial 307 | commercial, industrial or non-consumer uses, unless such uses represent 308 | the only significant mode of use of the product. 309 | 310 | "Installation Information" for a User Product means any methods, 311 | procedures, authorization keys, or other information required to install 312 | and execute modified versions of a covered work in that User Product from 313 | a modified version of its Corresponding Source. The information must 314 | suffice to ensure that the continued functioning of the modified object 315 | code is in no case prevented or interfered with solely because 316 | modification has been made. 317 | 318 | If you convey an object code work under this section in, or with, or 319 | specifically for use in, a User Product, and the conveying occurs as 320 | part of a transaction in which the right of possession and use of the 321 | User Product is transferred to the recipient in perpetuity or for a 322 | fixed term (regardless of how the transaction is characterized), the 323 | Corresponding Source conveyed under this section must be accompanied 324 | by the Installation Information. But this requirement does not apply 325 | if neither you nor any third party retains the ability to install 326 | modified object code on the User Product (for example, the work has 327 | been installed in ROM). 328 | 329 | The requirement to provide Installation Information does not include a 330 | requirement to continue to provide support service, warranty, or updates 331 | for a work that has been modified or installed by the recipient, or for 332 | the User Product in which it has been modified or installed. Access to a 333 | network may be denied when the modification itself materially and 334 | adversely affects the operation of the network or violates the rules and 335 | protocols for communication across the network. 336 | 337 | Corresponding Source conveyed, and Installation Information provided, 338 | in accord with this section must be in a format that is publicly 339 | documented (and with an implementation available to the public in 340 | source code form), and must require no special password or key for 341 | unpacking, reading or copying. 342 | 343 | 7. Additional Terms. 344 | 345 | "Additional permissions" are terms that supplement the terms of this 346 | License by making exceptions from one or more of its conditions. 347 | Additional permissions that are applicable to the entire Program shall 348 | be treated as though they were included in this License, to the extent 349 | that they are valid under applicable law. If additional permissions 350 | apply only to part of the Program, that part may be used separately 351 | under those permissions, but the entire Program remains governed by 352 | this License without regard to the additional permissions. 353 | 354 | When you convey a copy of a covered work, you may at your option 355 | remove any additional permissions from that copy, or from any part of 356 | it. (Additional permissions may be written to require their own 357 | removal in certain cases when you modify the work.) You may place 358 | additional permissions on material, added by you to a covered work, 359 | for which you have or can give appropriate copyright permission. 360 | 361 | Notwithstanding any other provision of this License, for material you 362 | add to a covered work, you may (if authorized by the copyright holders of 363 | that material) supplement the terms of this License with terms: 364 | 365 | a) Disclaiming warranty or limiting liability differently from the 366 | terms of sections 15 and 16 of this License; or 367 | 368 | b) Requiring preservation of specified reasonable legal notices or 369 | author attributions in that material or in the Appropriate Legal 370 | Notices displayed by works containing it; or 371 | 372 | c) Prohibiting misrepresentation of the origin of that material, or 373 | requiring that modified versions of such material be marked in 374 | reasonable ways as different from the original version; or 375 | 376 | d) Limiting the use for publicity purposes of names of licensors or 377 | authors of the material; or 378 | 379 | e) Declining to grant rights under trademark law for use of some 380 | trade names, trademarks, or service marks; or 381 | 382 | f) Requiring indemnification of licensors and authors of that 383 | material by anyone who conveys the material (or modified versions of 384 | it) with contractual assumptions of liability to the recipient, for 385 | any liability that these contractual assumptions directly impose on 386 | those licensors and authors. 387 | 388 | All other non-permissive additional terms are considered "further 389 | restrictions" within the meaning of section 10. If the Program as you 390 | received it, or any part of it, contains a notice stating that it is 391 | governed by this License along with a term that is a further 392 | restriction, you may remove that term. If a license document contains 393 | a further restriction but permits relicensing or conveying under this 394 | License, you may add to a covered work material governed by the terms 395 | of that license document, provided that the further restriction does 396 | not survive such relicensing or conveying. 397 | 398 | If you add terms to a covered work in accord with this section, you 399 | must place, in the relevant source files, a statement of the 400 | additional terms that apply to those files, or a notice indicating 401 | where to find the applicable terms. 402 | 403 | Additional terms, permissive or non-permissive, may be stated in the 404 | form of a separately written license, or stated as exceptions; 405 | the above requirements apply either way. 406 | 407 | 8. Termination. 408 | 409 | You may not propagate or modify a covered work except as expressly 410 | provided under this License. Any attempt otherwise to propagate or 411 | modify it is void, and will automatically terminate your rights under 412 | this License (including any patent licenses granted under the third 413 | paragraph of section 11). 414 | 415 | However, if you cease all violation of this License, then your 416 | license from a particular copyright holder is reinstated (a) 417 | provisionally, unless and until the copyright holder explicitly and 418 | finally terminates your license, and (b) permanently, if the copyright 419 | holder fails to notify you of the violation by some reasonable means 420 | prior to 60 days after the cessation. 421 | 422 | Moreover, your license from a particular copyright holder is 423 | reinstated permanently if the copyright holder notifies you of the 424 | violation by some reasonable means, this is the first time you have 425 | received notice of violation of this License (for any work) from that 426 | copyright holder, and you cure the violation prior to 30 days after 427 | your receipt of the notice. 428 | 429 | Termination of your rights under this section does not terminate the 430 | licenses of parties who have received copies or rights from you under 431 | this License. If your rights have been terminated and not permanently 432 | reinstated, you do not qualify to receive new licenses for the same 433 | material under section 10. 434 | 435 | 9. Acceptance Not Required for Having Copies. 436 | 437 | You are not required to accept this License in order to receive or 438 | run a copy of the Program. Ancillary propagation of a covered work 439 | occurring solely as a consequence of using peer-to-peer transmission 440 | to receive a copy likewise does not require acceptance. However, 441 | nothing other than this License grants you permission to propagate or 442 | modify any covered work. These actions infringe copyright if you do 443 | not accept this License. Therefore, by modifying or propagating a 444 | covered work, you indicate your acceptance of this License to do so. 445 | 446 | 10. Automatic Licensing of Downstream Recipients. 447 | 448 | Each time you convey a covered work, the recipient automatically 449 | receives a license from the original licensors, to run, modify and 450 | propagate that work, subject to this License. You are not responsible 451 | for enforcing compliance by third parties with this License. 452 | 453 | An "entity transaction" is a transaction transferring control of an 454 | organization, or substantially all assets of one, or subdividing an 455 | organization, or merging organizations. If propagation of a covered 456 | work results from an entity transaction, each party to that 457 | transaction who receives a copy of the work also receives whatever 458 | licenses to the work the party's predecessor in interest had or could 459 | give under the previous paragraph, plus a right to possession of the 460 | Corresponding Source of the work from the predecessor in interest, if 461 | the predecessor has it or can get it with reasonable efforts. 462 | 463 | You may not impose any further restrictions on the exercise of the 464 | rights granted or affirmed under this License. For example, you may 465 | not impose a license fee, royalty, or other charge for exercise of 466 | rights granted under this License, and you may not initiate litigation 467 | (including a cross-claim or counterclaim in a lawsuit) alleging that 468 | any patent claim is infringed by making, using, selling, offering for 469 | sale, or importing the Program or any portion of it. 470 | 471 | 11. Patents. 472 | 473 | A "contributor" is a copyright holder who authorizes use under this 474 | License of the Program or a work on which the Program is based. The 475 | work thus licensed is called the contributor's "contributor version". 476 | 477 | A contributor's "essential patent claims" are all patent claims 478 | owned or controlled by the contributor, whether already acquired or 479 | hereafter acquired, that would be infringed by some manner, permitted 480 | by this License, of making, using, or selling its contributor version, 481 | but do not include claims that would be infringed only as a 482 | consequence of further modification of the contributor version. For 483 | purposes of this definition, "control" includes the right to grant 484 | patent sublicenses in a manner consistent with the requirements of 485 | this License. 486 | 487 | Each contributor grants you a non-exclusive, worldwide, royalty-free 488 | patent license under the contributor's essential patent claims, to 489 | make, use, sell, offer for sale, import and otherwise run, modify and 490 | propagate the contents of its contributor version. 491 | 492 | In the following three paragraphs, a "patent license" is any express 493 | agreement or commitment, however denominated, not to enforce a patent 494 | (such as an express permission to practice a patent or covenant not to 495 | sue for patent infringement). To "grant" such a patent license to a 496 | party means to make such an agreement or commitment not to enforce a 497 | patent against the party. 498 | 499 | If you convey a covered work, knowingly relying on a patent license, 500 | and the Corresponding Source of the work is not available for anyone 501 | to copy, free of charge and under the terms of this License, through a 502 | publicly available network server or other readily accessible means, 503 | then you must either (1) cause the Corresponding Source to be so 504 | available, or (2) arrange to deprive yourself of the benefit of the 505 | patent license for this particular work, or (3) arrange, in a manner 506 | consistent with the requirements of this License, to extend the patent 507 | license to downstream recipients. "Knowingly relying" means you have 508 | actual knowledge that, but for the patent license, your conveying the 509 | covered work in a country, or your recipient's use of the covered work 510 | in a country, would infringe one or more identifiable patents in that 511 | country that you have reason to believe are valid. 512 | 513 | If, pursuant to or in connection with a single transaction or 514 | arrangement, you convey, or propagate by procuring conveyance of, a 515 | covered work, and grant a patent license to some of the parties 516 | receiving the covered work authorizing them to use, propagate, modify 517 | or convey a specific copy of the covered work, then the patent license 518 | you grant is automatically extended to all recipients of the covered 519 | work and works based on it. 520 | 521 | A patent license is "discriminatory" if it does not include within 522 | the scope of its coverage, prohibits the exercise of, or is 523 | conditioned on the non-exercise of one or more of the rights that are 524 | specifically granted under this License. You may not convey a covered 525 | work if you are a party to an arrangement with a third party that is 526 | in the business of distributing software, under which you make payment 527 | to the third party based on the extent of your activity of conveying 528 | the work, and under which the third party grants, to any of the 529 | parties who would receive the covered work from you, a discriminatory 530 | patent license (a) in connection with copies of the covered work 531 | conveyed by you (or copies made from those copies), or (b) primarily 532 | for and in connection with specific products or compilations that 533 | contain the covered work, unless you entered into that arrangement, 534 | or that patent license was granted, prior to 28 March 2007. 535 | 536 | Nothing in this License shall be construed as excluding or limiting 537 | any implied license or other defenses to infringement that may 538 | otherwise be available to you under applicable patent law. 539 | 540 | 12. No Surrender of Others' Freedom. 541 | 542 | If conditions are imposed on you (whether by court order, agreement or 543 | otherwise) that contradict the conditions of this License, they do not 544 | excuse you from the conditions of this License. If you cannot convey a 545 | covered work so as to satisfy simultaneously your obligations under this 546 | License and any other pertinent obligations, then as a consequence you may 547 | not convey it at all. For example, if you agree to terms that obligate you 548 | to collect a royalty for further conveying from those to whom you convey 549 | the Program, the only way you could satisfy both those terms and this 550 | License would be to refrain entirely from conveying the Program. 551 | 552 | 13. Use with the GNU Affero General Public License. 553 | 554 | Notwithstanding any other provision of this License, you have 555 | permission to link or combine any covered work with a work licensed 556 | under version 3 of the GNU Affero General Public License into a single 557 | combined work, and to convey the resulting work. The terms of this 558 | License will continue to apply to the part which is the covered work, 559 | but the special requirements of the GNU Affero General Public License, 560 | section 13, concerning interaction through a network will apply to the 561 | combination as such. 562 | 563 | 14. Revised Versions of this License. 564 | 565 | The Free Software Foundation may publish revised and/or new versions of 566 | the GNU General Public License from time to time. Such new versions will 567 | be similar in spirit to the present version, but may differ in detail to 568 | address new problems or concerns. 569 | 570 | Each version is given a distinguishing version number. If the 571 | Program specifies that a certain numbered version of the GNU General 572 | Public License "or any later version" applies to it, you have the 573 | option of following the terms and conditions either of that numbered 574 | version or of any later version published by the Free Software 575 | Foundation. If the Program does not specify a version number of the 576 | GNU General Public License, you may choose any version ever published 577 | by the Free Software Foundation. 578 | 579 | If the Program specifies that a proxy can decide which future 580 | versions of the GNU General Public License can be used, that proxy's 581 | public statement of acceptance of a version permanently authorizes you 582 | to choose that version for the Program. 583 | 584 | Later license versions may give you additional or different 585 | permissions. However, no additional obligations are imposed on any 586 | author or copyright holder as a result of your choosing to follow a 587 | later version. 588 | 589 | 15. Disclaimer of Warranty. 590 | 591 | THERE IS NO WARRANTY FOR THE PROGRAM, TO THE EXTENT PERMITTED BY 592 | APPLICABLE LAW. EXCEPT WHEN OTHERWISE STATED IN WRITING THE COPYRIGHT 593 | HOLDERS AND/OR OTHER PARTIES PROVIDE THE PROGRAM "AS IS" WITHOUT WARRANTY 594 | OF ANY KIND, EITHER EXPRESSED OR IMPLIED, INCLUDING, BUT NOT LIMITED TO, 595 | THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR 596 | PURPOSE. THE ENTIRE RISK AS TO THE QUALITY AND PERFORMANCE OF THE PROGRAM 597 | IS WITH YOU. SHOULD THE PROGRAM PROVE DEFECTIVE, YOU ASSUME THE COST OF 598 | ALL NECESSARY SERVICING, REPAIR OR CORRECTION. 599 | 600 | 16. Limitation of Liability. 601 | 602 | IN NO EVENT UNLESS REQUIRED BY APPLICABLE LAW OR AGREED TO IN WRITING 603 | WILL ANY COPYRIGHT HOLDER, OR ANY OTHER PARTY WHO MODIFIES AND/OR CONVEYS 604 | THE PROGRAM AS PERMITTED ABOVE, BE LIABLE TO YOU FOR DAMAGES, INCLUDING ANY 605 | GENERAL, SPECIAL, INCIDENTAL OR CONSEQUENTIAL DAMAGES ARISING OUT OF THE 606 | USE OR INABILITY TO USE THE PROGRAM (INCLUDING BUT NOT LIMITED TO LOSS OF 607 | DATA OR DATA BEING RENDERED INACCURATE OR LOSSES SUSTAINED BY YOU OR THIRD 608 | PARTIES OR A FAILURE OF THE PROGRAM TO OPERATE WITH ANY OTHER PROGRAMS), 609 | EVEN IF SUCH HOLDER OR OTHER PARTY HAS BEEN ADVISED OF THE POSSIBILITY OF 610 | SUCH DAMAGES. 611 | 612 | 17. Interpretation of Sections 15 and 16. 613 | 614 | If the disclaimer of warranty and limitation of liability provided 615 | above cannot be given local legal effect according to their terms, 616 | reviewing courts shall apply local law that most closely approximates 617 | an absolute waiver of all civil liability in connection with the 618 | Program, unless a warranty or assumption of liability accompanies a 619 | copy of the Program in return for a fee. 620 | 621 | END OF TERMS AND CONDITIONS 622 | 623 | How to Apply These Terms to Your New Programs 624 | 625 | If you develop a new program, and you want it to be of the greatest 626 | possible use to the public, the best way to achieve this is to make it 627 | free software which everyone can redistribute and change under these terms. 628 | 629 | To do so, attach the following notices to the program. It is safest 630 | to attach them to the start of each source file to most effectively 631 | state the exclusion of warranty; and each file should have at least 632 | the "copyright" line and a pointer to where the full notice is found. 633 | 634 | 635 | Copyright (C) 636 | 637 | This program is free software: you can redistribute it and/or modify 638 | it under the terms of the GNU General Public License as published by 639 | the Free Software Foundation, either version 3 of the License, or 640 | (at your option) any later version. 641 | 642 | This program is distributed in the hope that it will be useful, 643 | but WITHOUT ANY WARRANTY; without even the implied warranty of 644 | MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the 645 | GNU General Public License for more details. 646 | 647 | You should have received a copy of the GNU General Public License 648 | along with this program. If not, see . 649 | 650 | Also add information on how to contact you by electronic and paper mail. 651 | 652 | If the program does terminal interaction, make it output a short 653 | notice like this when it starts in an interactive mode: 654 | 655 | Copyright (C) 656 | This program comes with ABSOLUTELY NO WARRANTY; for details type `show w'. 657 | This is free software, and you are welcome to redistribute it 658 | under certain conditions; type `show c' for details. 659 | 660 | The hypothetical commands `show w' and `show c' should show the appropriate 661 | parts of the General Public License. Of course, your program's commands 662 | might be different; for a GUI interface, you would use an "about box". 663 | 664 | You should also get your employer (if you work as a programmer) or school, 665 | if any, to sign a "copyright disclaimer" for the program, if necessary. 666 | For more information on this, and how to apply and follow the GNU GPL, see 667 | . 668 | 669 | The GNU General Public License does not permit incorporating your program 670 | into proprietary programs. If your program is a subroutine library, you 671 | may consider it more useful to permit linking proprietary applications with 672 | the library. If this is what you want to do, use the GNU Lesser General 673 | Public License instead of this License. But first, please read 674 | . 675 | -------------------------------------------------------------------------------- /README.md: -------------------------------------------------------------------------------- 1 | # Neural Machine Translation Methods for Sign Language Translation 2 | 3 | This repository provides complementary material to aid the replication of the experiments described in the paper [Using Neural Machine Translation Methods for Sign Language Translation](https://aclanthology.org/2022.acl-srw.21) (Angelova et al., ACL 2022). 4 | 5 | 6 | ## Introduction 7 | 8 | In this paper, we examine methods and techniques, proven to be helpful for the text-to-text translation of spoken languages in the context of gloss-to-text translation systems, where the glosses are the written representation of the signs. We present one of the first works that include experiments on both parallel corpora of the German Sign Language (PHOENIX14T and the Public DGS Corpus). We experiment with two NMT architectures with optimization of their hyperparameters, several tokenization methods and two data augmentation techniques (back-translation and paraphrasing). 9 | 10 | Through our investigation we achieve a substantial improvement of 5.0 and 2.2 BLEU scores for the models trained on the two corpora respectively. 11 | Our RNN models outperform our Transformer models, and the segmentation method we achieve best results with is BPE, whereas back-translation and paraphrasing lead to minor but not significant improvements. 12 | 13 | ## Content 14 | 15 | The structure of the repository is as following: 16 | 17 | * `notebooks`: Python notebooks containing the code for reproducing the experiments, 18 | * splitting training and test set for the DGS corpus 19 | * measuring statistics for the DGS corpus 20 | * extract glosses and german intepretation from the DGS corpus 21 | * custom tokenization of the DGS corpus 22 | * measure overlap between training, dev and test splits of the DGS corpus 23 | * `training scripts`: bash files including SLURM commands to execute Marian-NMT for training the NMT models reported in the paper 24 | * `data`: the plain-text versions of the paraller corpora for both the DGS and the Phoenix corpora. It includes the training, dev and test split for both the Phoenix and DGS corpus. Additionally, one can find tokenized, stemmed and augmented versions as reported in the paper. 25 | 26 | ## Citation 27 | 28 | This work has been done with the aim to contribute to the research towards the automatic translation of sign languages. We encourage any further research on top of our work and we are happy to answer related questions. The code is released under the GPL-3.0 License. 29 | 30 | If you use the code or derivatives of this repository, please cite: 31 | 32 | ``` 33 | @inproceedings{angelova-etal-2022-using, 34 | title = "Using Neural Machine Translation Methods for Sign Language Translation", 35 | author = {Angelova, Galina and 36 | Avramidis, Eleftherios and 37 | M{\"o}ller, Sebastian}, 38 | booktitle = "Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics: Student Research Workshop", 39 | month = may, 40 | year = "2022", 41 | address = "Dublin, Ireland", 42 | publisher = "Association for Computational Linguistics", 43 | url = "https://aclanthology.org/2022.acl-srw.21", 44 | pages = "273--284", 45 | } 46 | ``` 47 | 48 | More citation formats [here](https://aclanthology.org/2022.acl-srw.21/) 49 | 50 | Please note that the corpora ([Phoenix 2014T](https://www-i6.informatik.rwth-aachen.de/~koller/RWTH-PHOENIX-2014-T/) and [DGS Corpus](https://www.sign-lang.uni-hamburg.de/meinedgs/ling/start_en.html)) have their own licenses and any use of them should be conforming with them and include the appropriate citations. 51 | 52 | -------------------------------------------------------------------------------- /data/baselines/dgs_preprocessed/.history: -------------------------------------------------------------------------------- 1 | 2022-03-17.23-41-48 cp /netscratch/angelova/data/sl-translation/german_*txt . 2 | 2022-03-17.23-42-03 cp /netscratch/angelova/data/sl-translation/glosses_*txt . 3 | 2022-03-17.23-42-47 cp /netscratch/angelova/data/sl-translation/glosses_*txt . 4 | 2022-03-17.23-42-50 mkdir train 5 | 2022-03-17.23-42-53 mv * train/ 6 | 2022-03-17.23-43-01 mkdir test 7 | 2022-03-17.23-43-24 vim README 8 | 2022-03-17.23-44-53 mkdir dev 9 | -------------------------------------------------------------------------------- /data/baselines/dgs_preprocessed/README: -------------------------------------------------------------------------------- 1 | Based on the Angelova et. al 2022 paper 2 | -------------------------------------------------------------------------------- /data/baselines/dgs_preprocessed/dev/.history: -------------------------------------------------------------------------------- 1 | 2022-03-17.23-54-57 cp /netscratch/angelova/experiments/sl-translation/gloss*dev* . 2 | 2022-03-17.23-55-03 cp /netscratch/angelova/experiments/sl-translation/german*dev* . 3 | -------------------------------------------------------------------------------- /data/baselines/dgs_preprocessed/test/.history: -------------------------------------------------------------------------------- 1 | 2022-03-17.23-44-01 cp /netscratch/angelova/experiments/sl-translation/german_*test* 2 | 2022-03-17.23-44-09 cp /netscratch/angelova/experiments/sl-translation/german_*test* . 3 | 2022-03-17.23-44-16 cp /netscratch/angelova/experiments/sl-translation/gloss_*test* . 4 | 2022-03-17.23-44-26 cp /netscratch/angelova/experiments/sl-translation/gloss*test* . 5 | -------------------------------------------------------------------------------- /data/baselines/phoenix_preprocessed/.history: -------------------------------------------------------------------------------- 1 | 2022-03-29.16-55-37 cp /netscratch/angelova/experiments/sl-translation/phoenix_*txt . 2 | 2022-03-29.16-55-58 cp /netscratch/angelova/data/sl-translation/phoenix_train_*txt 3 | 2022-03-29.16-56-00 cp /netscratch/angelova/data/sl-translation/phoenix_train_*txt . 4 | 2022-03-29.16-56-17 less phoenix_train_glosses_concat.txt 5 | 2022-03-29.16-57-13 vim README 6 | 2022-04-01.12-50-00 less phoenix_train_sentences.txt 7 | 2022-04-01.12-50-39 less phoenix_train_glosses.txt 8 | 2022-04-01.12-50-49 less phoenix_train_sentences.txt 9 | 2022-04-01.12-51-14 less phoenix_train_sentences.txt 10 | 2022-04-01.12-51-33 less phoenix_train_glosses_lowercased.txt 11 | -------------------------------------------------------------------------------- /data/baselines/phoenix_preprocessed/README: -------------------------------------------------------------------------------- 1 | Preprocessed parallel corpus for gloss-to-text experiments, as shown in the paper of Angelova et al. 2022 2 | -------------------------------------------------------------------------------- /data/baselines/phoenix_preprocessed/phoenix_dev_glosses.txt: -------------------------------------------------------------------------------- 1 | DRUCK TIEF KOMMEN 2 | ES-BEDEUTET VIEL WOLKE UND KOENNEN REGEN GEWITTER KOENNEN 3 | WIND MAESSIG SCHWACH REGION WENN GEWITTER WIND KOENNEN 4 | MITTWOCH REGEN KOENNEN NORDWEST WAHRSCHEINLICH NORD STARK WIND 5 | JETZT WETTER WIE-AUSSEHEN MORGEN FREITAG SECHSTE MAI ZEIGEN-BILDSCHIRM 6 | DANN STARK SCHNEE SCHNEIEN KOMMEN 7 | SUEDWEST KOMMEN WARM MORGEN SCHON FRANKREICH REGION FUENFZEHN BIS ZWANZIG GRAD WOCHENENDE KOMMEN WARM 8 | MORGEN DAENEMARK IX ZWANZIG MAXIMAL DREISSIG GRAD 9 | SCHOEN ABEND WUENSCHEN 10 | MORGEN MAL SONNE SPEZIELL ALPEN 11 | MAL BISSCHEN SCHNEE NORD MEHR STARK SCHNEE 12 | NORDWEST AUCH TEIL IX REGEN 13 | TAG SUED MITTE WOLKE KRAEFTIG NEBEL 14 | NACHT FUENF GRAD SEE MINUS VIER BERG IX 15 | ABER REGEN ERST FREITAG ABEND SUED KOMMEN REGEN 16 | NORD NUR WOLKE FROST SUED 17 | DRESDEN IX REGION BERG NULL MINUS SECHS NORD neg-FROST neg-HABEN MILD 18 | JETZT WETTER WIE-AUSSEHEN MORGEN 19 | DEUTSCHLAND ZWEI TEIL REGEN SCHWUEL FRISCH KUEHL 20 | SUEDWEST SOWIESO STERN KOENNEN SEHEN 21 | MITTE REGION WOLKE MORGEN KOENNEN REGEN GEWITTER 22 | IX KOENNEN GEFAHR GLATT BESONDERS MITTE REGION SUED DANN KALT 23 | SAMSTAG REGEN BERG REGEN TEILWEISE UMWANDELN SCHNEE SCHNEIEN 24 | SCHOEN WO MEER REGION 25 | WIND SCHWACH MAESSIG WEHEN 26 | TAG DANN SUED SUEDOST REGEN NACH MITTAG IX AUCH GEWITTER 27 | LUFT DRUCK HOCH DESHALB MORGEN SONNE UEBERALL 28 | MORGEN ZEHN GRAD IX SIEBZEHN GRAD OBER FLUSS 29 | HOCH NORD SONNE DESHALB GRENZE HOCH TIEF 30 | FREITAG DANN KOMMEN REGEN IX UEBERWIEGEND WIND 31 | SONNTAG WAHRSCHEINLICH FREUNDLICH IM-VERLAUF WEST SCHNEE SCHNEIEN REGEN 32 | BESONDERS NORDWEST WIND STARK 33 | MISCHUNG NEBEL HOCH NEBEL SONNE BLEIBEN 34 | DIENSTAG RUHIG TROCKEN WETTER 35 | NUR SUED MEHR FREUNDLICH 36 | JETZT WUENSCHEN SCHOEN ABEND 37 | IN-KOMMEND BLEIBEN LUFT DRUCK HOCH KOMMEN BEDEUTEN NEBEL HIMMEL UND SONNE MISCHUNG 38 | MORGEN DREIZEHN REGION SUEDWEST IX VIER ZWANZIG GRAD PASSEN FAST WIE SOMMER 39 | MONTAG AUCH WECHSELHAFT UND MEHR KUEHL 40 | FRANKREICH KOMMEN WOLKE OST NIEDERSACHSEN BAYERN SUEDWEST REGEN 41 | WEHEN SCHWACH MAESSIG 42 | SUED MEHR RUHIG FREUNDLICH BISSCHEN MILD 43 | LIEB ZUSCHAUER GUT ABEND 44 | SOMMER ZWEITAUSEND ELF FAST VORBEI DEUTSCH LAND BISSCHEN WARM MEHR WENIG SONNE ABER ENORM VIEL REGEN 45 | MANCHMAL SCHWACH MAESSIG IX WIND IX WEST STARK WIND 46 | TAG VIEL WOLKE NEBEL BLEIBEN TROCKEN IX SONNE MOEGLICH 47 | SUEDWEST EUROPA SUED BEKOMMEN REGEN 48 | REGION LANG FREUNDLICH 49 | SUED WIND SCHWACH NORD MAESSIG FRISCH SCHAUER KUESTE BERG TEIL STURM ORKAN 50 | BAYERN WALD HEUTE ABEND MINUS FUENF FLUSS DREI GRAD 51 | MORGEN ZWEI GRAD REGION FLUSS NEUN GRAD 52 | MORGEN MEHR WARM IX ALS HEUTE 53 | VIERZEHN BIS NEUNZEHN GRAD KOENNEN 54 | JETZT WIE-AUSSEHEN WETTER MORGEN DONNERSTAG VIER ZWANZIG NOVEMBER 55 | NORDWEST WOLKE MANCHMAL SONNE BISSCHEN IX S+H IX REGEN 56 | DONNERSTAG DANN WIEDER MEHR WIND IX WIND KOMMEN ANFANG IX REGEN KOMMEN GLEICH 57 | SAMSTAG HAUPTSAECHLICH SONNE NORD BISSCHEN REGEN 58 | JETZT WETTER WIE-AUSSEHEN MORGEN DREISSIG OKTOBER 59 | NACHMITTAG KOENNEN SONNE KOENNEN 60 | LIEB ZUSCHAUER poss-EUCH GUT ABEND 61 | IX NORD TIEF KOMMEN WOLKE KOMMEN 62 | WEST FLUSS WEST REGION NACH MITTAG BESSER SONNE MOEGLICH 63 | MORGEN WEST TIEF KOMMEN RICHTUNG OST AUFZIEHEN 64 | REGEN GEWITTER STARK 65 | NORDWEST SPAETER AUFLOESEN 66 | JETZT IN-KOMMEND IX REGEN GEWITTER KOENNEN STARK 67 | TAG SONNE WOLKE WECHSELHAFT TEILWEISE AUCH LANG SONNE 68 | TAG IX REGEN AUCH KOMMEN OST 69 | SUEDOST SCHOEN REST neg-REGION SCHON REGEN 70 | GEWITTER ENORM SUEDWEST BIS-MORGEN NACHT KOMMEN 71 | MORGEN GEWITTER MEISTENS WO SUEDOST REGION BRAND BURG IX NORD TEILWEISE REGEN 72 | WEST LANGSAM VERSCHWINDEN 73 | WIND KUESTE AUCH 74 | HEUTE NACHT FLUSS VIERZEHN GRAD NORD MAXIMAL NULL 75 | HOCH REGION BIS FREITAG MEISTENS WETTER FREUNDLICH SONNE TEMPERATUR STEIGEN 76 | MORGEN NORDWEST ZWEI SONST REGION MINUS FUENF ZWISCHEN EINS ZWISCHEN 77 | WIND MAESSIG FRISCH KUESTE IX STARK WENN GEWITTER IX DANN STURM MOEGLICH 78 | DAZU MORGEN NORD WETTER WECHSELHAFT SONNTAG AUCH MITTE 79 | REGION SO 80 | MONTAG NORD REGION REGEN REGION BESSER IM-VERLAUF REGION REGEN 81 | REGEN DANN MITTWOCH REGEN DONNERSTAG STARK REGEN 82 | SPEZIELL SUEDOST KOENNEN ORT UNWETTER REGEN HAGEL STURM KOENNEN 83 | NORMAL WIND LEICHT MAESSIG KOMMEN WEHEN 84 | JETZT WETTER VORAUSSAGE MORGEN FREITAG VIER ZWANZIG DEZEMBER 85 | OST REGION SONNE MEHR WARM MAXIMAL SECHS ZWANZIG SUED MAXIMAL SIEBEN ZWANZIG GRAD 86 | SUED REGION MEHR WOLKE FLUSS ALPEN MOEGLICH SCHNEE ABER IM-VERLAUF WENIGER 87 | KUEHL SIEBEN GRAD ALLGAEU IX SECHSZEHN NORD 88 | STURM TAGSUEBER DABEI 89 | IHR WUENSCHEN ABEND MACHEN GUT 90 | MONTAG MEISTENS TIEF DRUCK REGION LUFT MEER LUFT KOMMEN 91 | AUCH MORGEN WETTER SUPER neg-HABEN FUENF GRAD NORDOST MILD WO SUEDWEST 92 | NACHT NORD MEHR STURM AUCH KUESTE ORKAN 93 | TAG SCHWACH MAESSIG WEHEN NORD NORDOST FRISCH MAESSIG WEHEN OST STARK WEHEN 94 | FREUNDLICH BLEIBEN REGION SUED BISSCHEN SCHAUER 95 | SCHOEN ABEND AUSRICHTEN 96 | MITTWOCH WECHSELHAFT 97 | AUCH DONNERSTAG WEITER WECHSELHAFT 98 | REST REGION SONNE WOLKE NUR ORT BISSCHEN REGEN 99 | HEUTE NACHT SIEBEN SONST REGION SECHS ZWISCHEN EINS 100 | AUCH WIND STARK STROEMEN REGION STURM ORKAN KUESTE KOENNEN 101 | AB MONTAG DAS-IST-ES DEUTSCH EINFLUSS REGEN 102 | IX WIND UND SCHNEE STUFENWEISE GRENZE 103 | NORDWEST SCHNEE BISSCHEN KOENNEN 104 | SONNTAG RUHIG VERSCHWINDEN 105 | GUT ABEND LIEB ZUSCHAUER 106 | IN-KOMMEND FRUEHLING WETTER MORGEN WARM 107 | WOHER WARM 108 | SCHOEN ABEND WUENSCHEN MACHEN GUT WUENSCHEN 109 | HOFFEN REGION JETZT NORDOST VERLAUFEN VERSCHWINDEN 110 | BERG MORGEN NOCH REGEN IX SCHAUER NORD GEWITTER 111 | JETZT WETTER WIE-AUSSEHEN MORGEN SONNTAG ZEHNTE JANUAR 112 | MORGEN WETTER WIE-AUSSEHEN MITTWOCH ZWOELF MAI 113 | TAG DANN NORD REGION REGEN SUEDOST DOCH BISSCHEN FREUNDLICH 114 | SAMSTAG NORD SUEDOST REGEN ABER GLEICH ZEIT WIND 115 | GERADE RHEIN-PFALZ SAARLAND NORDRHEIN-WESTFALEN GEWITTER 116 | IM-MOMENT DOCH GEWITTER DEUTSCH WETTER DIENST WARNUNG SCHON FERTIG BEKANNTGEBEN 117 | SUED WAHRSCHEINLICH HOCH DRUCK RUHIG FREUNDLICH HERBST 118 | AUCH SAMSTAG NAECHSTE GLEICH IX KOMMEN MEHR KUEHL 119 | WIND SCHWACH WEHEN 120 | REGION MORGEN SECHS BERG ALLGAEU KALT MINUS VIER 121 | MORGEN WERT EIFEL ACHTZEHN BIS SECHS ZWANZIG LAND 122 | MORGEN SONNE UEBERALL KUESTE REGION WOLKE MOEGLICH REGEN neg-VIEL 123 | TROCKEN ENORM 124 | ABEND WUENSCHEN 125 | TIEF REGION SCHWACH MORGEN SOLL EINFLUSS OST REGION SUED 126 | WIND SCHWACH WEHEN 127 | MITTWOCH WEST WOLKE ACHT BIS SECHSZEHN 128 | NEBEL KUEHL 129 | WOLKE REGION SCHAFFEN NUR NORDWEST KOMMEN 130 | SUED SCHWACH WEHEN IX MAESSIG KUESTE FRISCH OST STURM 131 | NACHT TEIL BODEN FROST 132 | JETZT WETTER WIE-AUSSEHEN MORGEN SAMSTAG SIEBTE AUGUST 133 | MORGEN MEISTENS SONNE 134 | NORD KOENNEN BEWOELKT 135 | REGION WEHEN SUED VIEL FRISCH WIND BISSCHEN STURM BERG STURM ORKAN KOENNEN 136 | HEUTE NACHT IX REGION NULL GRAD WENN STERN KOENNEN SEHEN BIS MINUS ZWEI ZWANZIG GRAD 137 | WIND MAESSIG WEHEN 138 | WEST REGION HEUTE NACHT FUENF GRAD REGION HAUPTSAECHLICH FROST MOEGLICH GLATT VORSICHT 139 | HEUTE NACHT TEMPERATUR MINUS DREI MINUS SIEBZEHN WENN KLAR TIEF 140 | TAG MINUS SIEBEN NORD NULL 141 | DAZU WARM LUFT TATSAECHLICH WARM HEISS NAECHSTE-WOCHE KUEHL 142 | OST SUED BERLIN SUED DEUTSCHLAND VIER ZWANZIG GRAD BIS ACHT ZWANZIG GRAD 143 | JETZT WETTER WIE-AUSSEHEN MORGEN SONNTAG SIEBEN ZWANZIG SEPTEMBER 144 | NUR NORD BISSCHEN WOLKE 145 | HEUTE NACHT NORD ZWOELF LAND IX VIER GRAD 146 | MORGEN TAG ACHTZEHN MAXIMAL DREI ZWANZIG GRAD 147 | TAG TEIL NUR EINS GRAD NORD SEE 148 | IM-VERLAUF FRUEH HERBST 149 | SONNTAG SCHNEE WENIG NORD REGION MOEGLICH SONNE 150 | TAG SUEDOST SCHNEE SCHNEIEN FLACH AUCH SCHNEE SCHNEIEN 151 | NORDWEST SCHNEE SCHAUER VERSCHWINDEN 152 | SONNTAG IX WOLKE TEIL FREUNDLICH TROCKEN MINUS FUENF ZWISCHEN MAXIMAL ZWEI GRAD 153 | IM-VERLAUF SCHNEE UMKEHREN REGEN ABER EIS REGEN VORSICHT STRASSE GLATT MOEGLICH 154 | MORGEN TAG IM-VERLAUF SUEDWEST REGION BLEIBEN SO MOEGLICH SCHNEE 155 | NORD REGION SCHWACH MAESSIG WIND 156 | HEUTE NACHT RHEIN ACHT GRAD ALPEN MINUS SECHS 157 | MORGEN SONNE WOLKE WECHSELHAFT NORD REGION SONNE OFT 158 | IX SCHAUER SUEDWEST ABEND GEWITTER KOENNEN 159 | NORDOST BISSCHEN SCHAUER ABEND AUFLOESEN 160 | EIN-PAAR HARMLOS NEBEL DANN KLAR 161 | HEUTE NACHT MINUS ZWEI NORD MITTE MINUS EINS ZWANZIG GRAD 162 | IN-KOMMEND TAG BLEIBEN KALT MITTE EUROPA UNGEFAEHR NULL ZWISCHEN MITTE MEER ZEHN BIS FUENFZEHN 163 | JETZT WETTER WIE-AUSSEHEN MORGEN SAMSTAG ZWEITE OKTOBER 164 | IX DANN SCHNEE KOENNEN ABEND DANN NORD SCHNEE FLACH SCHNEE 165 | GUT ABEND LIEB DU ZUSCHAUER poss-EUCH 166 | MILD NORD AUCH ZWOELF ZWISCHEN VIERZEHN SUED UNGEFAEHR VIERZEHN MAXIMAL SECHSZEHN GRAD 167 | NORD SONNE WOLKE WECHSELHAFT BISSCHEN SCHAUER SUEDWEST BESONDERS SONNE MOEGLICH 168 | HEUTE NACHT DREIZEHN NORD VIER BERG 169 | AM-TAG DREIZEHN OST EINS ZWANZIG FLUSS 170 | DANN KOMMEN SCHAUER STARK MIT GEWITTER 171 | UND IM-VERLAUF UEBERALL WECHSELHAFT MOEGLICH SCHNEE 172 | JETZT WETTER WIE-AUSSEHEN MORGEN DIENSTAG NEUNTE FEBRUAR 173 | WIE-AUSSEHEN IN-KOMMEND SAMSTAG SCHNEE SCHNEIEN BESONDERS NORD WAHRSCHEINLICH SONNE 174 | HEUTE NACHT TEMPERATUR MINUS FUENF NORD BIS PLUS DREI WEST FLUSS 175 | IX PLUS SECHS GRAD VOR POMMERN REGION BISSCHEN FROST 176 | DABEI NORD MEHR MILD 177 | ABER TAGSUEBER IX MEHR KUEHL 178 | MONTAG VIEL REGION FREUNDLICH KUESTE SUEDOST KURZ WOLKE TEIL REGEN 179 | DIENSTAG WEST MEHR WOLKE SCHAUER 180 | NORDWEST SPAETER AUCH WOLKE DANN DABEI GEWITTER SCHAUER 181 | MITTWOCH SINKEN KUEHLER WECHSELHAFT SONNE WOLKE SCHAUER GEWITTER WEST 182 | TAG KLAR STERN SEHEN KOENNEN FROST 183 | STUNDE AUCH MEISTENS REGEN ERST WEST DANN REGION 184 | UND TAG BLEIBEN KUEHL SECHS GRAD BAYERN IX REGION AUCH S+H IX AUCH 185 | ABER DAZWISCHEN REGION MILD NEUN BIS VIERZEHN GRAD 186 | SUEDWEST DEUTSCH LAND BISSCHEN FEUCHT KOMMEN IX MOEGLICH SCHAUER GEWITTER WAHRSCHEINLICH 187 | WOCHE WARM AUCH SONNE JEDEN-TAG GRAD STEIGEN 188 | SCHOEN ABEND WUENSCHEN 189 | AUCH OBER FLUSS BIS ABEND MEHR WOLKE 190 | NACHT TEIL WOLKE TEIL KLAR SCHAUER GEWITTER 191 | JETZT WETTER MORGEN FREITAG EINS ZWANZIG MAI 192 | WETTER WIE-AUSSEHEN MORGEN MONTAG EINS ZWANZIG FEBRUAR 193 | AM-TAG REGION SCHNEE FLUSS REGEN 194 | NORD KALT KOMMEN ZONE DAZWISCHEN 195 | NORD FLUSS SUED TROCKEN IX 196 | ZONE KOENNEN REGEN TEILWEISE SCHNEE REGEN UMWANDELN GEFRIEREN 197 | NEUN GRAD REGION MINUS ACHT NORDOST 198 | FREITAG SUEDOST SONNE FREITAG DANN MEHR WOLKE REGEN KOENNEN 199 | NORD SUEDOST AUCH KOENNEN REGEN GEWITTER DABEI 200 | SONNTAG UEBERWIEGEND SONNE 201 | NORD SCHAUER 202 | MONTAG AEHNLICH WETTER ABER BISSCHEN MEHR WARM 203 | MONTAG UEBERWIEGEND SCHAUER OST GEWITTER SUED WEST LANG FREUNDLICH 204 | SUEDWEST KLAR MORGEN VIER BIS NEUN GRAD 205 | REGION BIS ABEND TROCKEN 206 | NORD DEUTSCHLAND IX KLAR LUFT IX NEBEL UND TEILWEISE BISSCHEN DAZWISCHEN REGEN HERZ BERG BAYERN REGION 207 | MORGEN NORD FREUNDLICH 208 | JETZT WETTER WIE-AUSSEHEN MORGEN SONNTAG SECHS ZWANZIG SEPTEMBER 209 | HEUTE NACHT neg-KAUM NUR NORDWEST BISSCHEN REGEN SONST REGION RUHIG 210 | ALPEN LANG SCHNEE 211 | HEUTE NACHT MEHR SCHNEE NORD SUEDOST 212 | MORGEN BESONDERS NORD REGION UND WEST REGEN KOENNEN 213 | WIND KOMMEN DANN SCHNEE WITTERUNG 214 | JETZT WETTER MORGEN DIENSTAG SECHSTE APRIL 215 | JETZT WIE-AUSSEHEN WETTER MORGEN MITTWOCH EINS ZWANZIG OKTOBER 216 | ABEND FLUSS WEST REGION MOEGLICH REGEN 217 | WIND WEHEN MAESSIG WEHEN 218 | NORD NORDWEST MEHR VIEL WOLKE 219 | SCHNEE MEHR KUESTE REGION 220 | MORGEN WIEDER WETTER RUHIG FREUNDLICH WETTER HOCH DRUCK 221 | NACHT MINUS DREI BIS PLUS VIER NORD PLUS FUENF IX 222 | MORGEN ZEHN BIS FUENFZEHN REGION SECHSZEHN BIS DREI ZWANZIG 223 | OST WARM REGION BIS DREISSIG GRAD REGION UEBERSPRINGEN REGION KUEHL NUR FUENFZEHN SECHSZEHN GRAD 224 | NORD EUROPA TIEF KOMMEN 225 | WIND WEHEN FRISCH KOMMEN HOCH STURM 226 | SCHOEN ABEND MACHEN poss-EUCH GUT 227 | OST SUED HEUTE NACHT TROCKEN AUCH KLAR DANN TEIL REGION SCHAUER 228 | FUENFZEHN GRAD REGION SAUER LAND NUR SECHS GRAD 229 | MONTAG SONNE WARM WEITER 230 | IN-KOMMEND WETTER WECHSELHAFT 231 | LUFT KUEHL REGION TIEF HOCH REGION KOMMEN KUEHL 232 | MORGEN AUCH HOCH LUFT VIEL SONNE 233 | WIE-AUSSEHEN IN-KOMMEND SONNTAG OST SPEZIELL SCHNEE NORD BLEIBEN WIND 234 | LANGSAM STEIGEN WARM FLUSS ACHTZEHN BIS ZWANZIG GRAD REGION ZWOELF BIS ACHTZEHN GRAD KUEHL poss-SEIN 235 | REGEN negalp-AUCH ABER KUEHL 236 | NACHT SYLT DREIZEHN GRAD MITTE BERG TAL NULL GRAD 237 | MITTWOCH NAECHSTE DASSELBE 238 | DONNERSTAG DEUTSCH LAND WECHSELHAFT UEBERWIEGEND REGEN MOEGLICH STARK WIND 239 | IX MORGEN IM-VERLAUF IX ANFANG FREUNDLICH ABER WOLKE KOMMEN OST 240 | MORGEN IX WEHEN IX NORD FRISCH WIND 241 | WETTER WIE-AUSSEHEN MORGEN SONNTAG SECHS SEPTEMBER 242 | NAECHSTE WOCHE MILD ABER WECHSELHAFT 243 | MORGEN VIER GRAD REGION SECHS BIS ELF GRAD FLUSS BIS ZWOELF GRAD 244 | TAG MINUS DREI NORDOST PLUS VIERZEHN GRAD SUED 245 | MITTWOCH ALLE GUT SONNE SCHOEN SECHSZEHN BIS FUENF ZWANZIG GRAD 246 | ANDERE TEMPERATUR 247 | GLEICH OST VIER GRAD 248 | MILD ACHT BIS NEUN GRAD 249 | SCHOEN ABEND poss-EUCH MACHEN GUT poss-EUCH 250 | JETZT WETTER MORGEN FREITAG SIEBEN ZWANZIG AUGUST 251 | SUEDOST REGEN VIEL 252 | IX REGEN KOENNEN BESONDERS NORD 253 | TAG DANN WEST FREUNDLICH SONNE DABEI 254 | DEUTSCH WETTER DIENST WARNUNG 255 | NORDWEST IX AUCH KOMMEN SONNE MEISTENS 256 | OST DRUCKFLAECHE STARK BESONDERS IN-KOMMEND KOENNEN GEWITTER REGEN 257 | SO GEWITTER VON HOCH IX REGION NORD EUROPA REGION WARM LUFT KOMMEN KUEHL LUFT WEST KOMMEN 258 | WOLKE DABEI HEUTE NACHT KOENNEN REGEN KOMMEN SUEDOST REGEN 259 | DAZU KOENNEN GEWITTER 260 | SUED MEHR FREUNDLICH 261 | DARUM WARNUNG DEUTSCH WETTER DIENST WARNUNG INFORMIEREN 262 | AUCH OBER FLUSS HOCH FLUSS FROST 263 | AUCH SCHNEE KOMMEN 264 | BLEIBEN IM-VERLAUF 265 | MORGEN NORD KAUM GEWITTER REGION SONNE 266 | AUCH NAH FLUSS UND ALPEN AUCH MOEGLICH NEBEL 267 | TAG ZEHN GRAD BISSCHEN BEWOELKT ACHTZEHN GRAD FLUSS IX 268 | FREITAG BISSCHEN VERSCHWINDEN BISSCHEN VERSCHWINDEN NORD BISSCHEN REGEN BISSCHEN STELLENWEISE VIERZEHN GRAD UNGEFAEHR 269 | SKANDINAVIEN HOCH KOMMEN KALT KOMMEN 270 | FRANKREICH KOMMEN TIEF KOMMEN WOLKE KOMMEN KOENNEN SCHNEE REGEN 271 | KUESTE HEUTE NACHT SCHNEE REGION WOLKE BISSCHEN TROCKEN 272 | NORD MORGEN KOENNEN SONNE 273 | SUED VERAENDERN KAUM WIE HEUTE SONNE ODER NEBEL 274 | NACHT VIERZEHN NORD SECHS ALLGAEU 275 | TAG VIERZEHN NORD REGEN EINS ZWANZIG FLUSS 276 | MORGEN FRUEH VERSCHWINDEN LANGSAM SCHNELL NORDOST BISSCHEN WOLKE BLEIBEN TROCKEN 277 | KUESTE BISSCHEN WOLKE ABER neg-REGEN neg-HABEN 278 | IX AUCH WIND DABEI TEMPERATUR FUENF BIS UNGEFAEHR DREIZEHN GRAD REGION 279 | NORDWEST REGEN ODER SCHNEE VORSICHT GLATT KOENNEN 280 | KOMMEN LOCH ABER TROTZDEM SCHAUER 281 | SUEDOST SCHWACH WEHEN MAESSIG 282 | NAECHSTE WOCHE WECHSELHAFT WOLKE TEIL REGEN 283 | KOENNEN IX MEHR KUEHL KOMMEN AB DIENSTAG LUFT HOCH HOEHER TEMPERATUR HOEHER MEHR FREUNDLICH 284 | DONNERSTAG BIS SECHS ZWANZIG GRAD VIEL SONNE 285 | WEST MEHR SCHAUER GEWITTER 286 | NACHT WOLKE KOMMEN BLEIBEN KLAR HIMMEL STERN SEHEN 287 | IN-KOMMEND SCHNEE 288 | FREITAG SAMSTAG NORD WIND REGEN SUED FREUNDLICH TROCKEN 289 | WEHEN WIND SCHWACH MAESSIG BERG FRISCH WIND 290 | MORGEN WETTER WIE-AUSSEHEN MITTWOCH ZWEITE JUNI 291 | SONNTAG WEST NORDWEST WIEDER VIEL WOLKE BISSCHEN REGEN OST KOMMEN FREUNDLICH 292 | MEHR SCHNEE SCHNEIEN MOEGLICH SCHNEIEN AUCH MOEGLICH 293 | WETTER WARNUNG VON DEUTSCH WETTER DIENST 294 | WIND SCHWACH WEHEN ZEIGEN-BILDSCHIRM 295 | SAMSTAG NORD SCHAUER REGION FREUNDLICH SUED IM-VERLAUF REGEN 296 | SONNTAG ALPEN IX AUCH REGEN NORD SCHAUER MITTE MEHR FREUNDLICH SONNE 297 | NORD HEUTE NACHT KLAR HIMMEL STERN KOENNEN SEHEN SUEDWEST REGEN KOENNEN NEBEL BEREICH 298 | JETZT IM-MOMENT NACHT NOCH WARM IX MORGEN FRUEH MEHR KUEHL 299 | LIEB ZUSCHAUER GUT ABEND 300 | FRISCH MORGEN ANGENEHM DEUTSCH LAND 301 | ABER IM-MOMENT DANN VIEL REGEN REGION OST REGION 302 | OST LANGSAM ABER SUED WEITER REGEN GEWITTER 303 | HEUTE NACHT NORD MITTE KLAR STERN KOENNEN SEHEN 304 | REGION NEBEL 305 | SUED REGEN KOENNEN DABEI BLITZ DONNER 306 | MORGEN REGION REGEN DABEI NORD DANN AUFLOESEN DANN SONNE DABEI 307 | NACH MITTAG NORDWEST WOLKE KOENNEN REGEN 308 | AB MONTAG IN-KOMMEND WETTER WECHSELHAFT WIND 309 | AB DIENSTAG STURM KOENNEN 310 | TEIL REGEN BERG MOEGLICH SCHNEE 311 | ABER IN-KOMMEND MILD DANN WIEDER SCHNEE GRENZE AUF 312 | SUED NEBEL REGION KOENNEN LANG NEBEL 313 | WENN SONNE HABEN DANN SCHAFFEN ELF GRAD NEBEL NUR DREI GRAD 314 | NACHT TEMPERATUR VIER BIS NEUN 315 | SPAETER REGEN UEBERALL REGION 316 | HEUTE NACHT ELF GRAD BERG ALLGAEU BIS SIEBZEHN FLUSS 317 | LIEB ZUSCHAUER GUT ABEND 318 | TAG HAUPTSAECHLICH WOLKE NEBEL DANN TEIL SCHNEE SCHNEIEN REGEN 319 | SUEDWEST BISSCHEN SONNE 320 | WENN KLAR MOEGLICH NEBEL NORD 321 | MORGEN UEBERWIEGEND WOLKE TROPFEN 322 | SPAETER VERSCHWINDEN 323 | WENN NEBEL neg-HABEN FREUNDLICH 324 | OST NACHT GEFAHR WIND 325 | IX NACHT WAHRSCHEINLICH LOCKER ORT NEBEL HABEN LANG BLEIBEN 326 | TAG VOGEL LAND MINUS ACHT NORD MINUS DREI GRAD 327 | WOLKE HEUTE NACHT NORDWEST WOLKE BISSCHEN REGEN 328 | NACHT SECHS GRAD SEE MINUS DREI FLUSS 329 | LEIDER DURCHGEHEND DAUER REGEN NACHT SUED DEUTSCHLAND REGEN 330 | JETZT WETTER WIE-AUSSEHEN MORGEN MITTWOCH EINS DREISSIG MAERZ 331 | BERG IX DURCHGEHEND REGEN 332 | DIENSTAG UEBERALL VIEL SONNE WOLKE LOCKER TROCKEN 333 | SUED VIERHUNDERT SIEBENHUNDERT METER HOEHE MOEGLICH SCHNEE ENORM 334 | MORGEN TEMPERATUR NULL BIS SIEBEN GRAD FLUSS MOEGLICH ACHT GRAD 335 | MORGEN NORD WEST REGEN REGION NEBEL WOLKE HIMMEL 336 | KUESTE WIND HABEN 337 | UND DAZU STURM NORD KUESTE STURM 338 | NACHT SEE SCHWER STURM MORGEN ORKAN HABEN DESHALB FRISCH MAESSIG WEHEN 339 | AUCH BIS FREITAG WIEDER SINKEN KUEHL 340 | SCHOEN ABEND MACHEN GUT 341 | FREITAG MEHR WOLKE neg-SONNE NORDOST SCHNEE SCHNEIEN 342 | LIEB ZUSCHAUER poss-EUCH GUT ABEND 343 | ZWANZIG BIS UEBER ZWANZIG GRAD 344 | HEUTE NACHT SCHON WEST REGEN LANGSAM KOMMEN FLUSS REGION NOCH 345 | WIE HERBST 346 | SCHOEN ABEND WUENSCHEN 347 | REGION SUEDOST SONNE NORDWEST UEBERWIEGEND WOLKE IX REGEN SUEDOST AUCH SCHAUER 348 | WETTER WIE-AUSSEHEN MORGEN SONNTAG VIERZEHN FEBRUAR 349 | WIE-AUSSEHEN IN-KOMMEND MONTAG MAL SONNE MAL WOLKE WEST BISSCHEN SCHNEE 350 | ZWEI TIEF 351 | WEST TAG REGEN IX KOENNEN SCHNEE REGEN KALT FROST OST WOLKE BEWOELKT FREUNDLICH 352 | NORDOST TIEF KOMMEN WOLKE REGEN 353 | JETZT WETTER WIE-AUSSEHEN MORGEN DIENSTAG SIEBEN ZWANZIG JULI 354 | UNGEMUETLICH SUED BESSER ALS NORD 355 | HEUTE NACHT NORD MITTE 356 | HEUTE NACHT ZWISCHEN FUENF ZWISCHEN TAG MITTE BERG DREIZEHN IX NEUNZEHN GRAD 357 | TAG FUENF GRAD NEBEL UND FUENFZEHN GRAD FOEHN REGION 358 | SUEDOST poss-SEIN FREUNDLICH SONNE 359 | SAMSTAG SONNTAG DANN WECHSELHAFT IX REGEN BESONDERS SONNTAG KOENNEN STURM 360 | IM-VERLAUF IM-VERLAUF TEMPERATUR REGION 361 | SUED MEHR FREUNDLICH IX NORD NICHT ORT AUCH SCHAUER GEWITTER KURZ 362 | SONNTAG BIS DREISSIG GRAD MOEGLICH WIEDER UNWETTER 363 | WETTER SO KNAPP VERAENDERN MEISTENS BLEIBEN WOLKE TROCKEN WETTER 364 | OST SUEDOST UEBERWIEGEND WOLKE BISSCHEN SCHNEE 365 | HEUTE NACHT KLAR HIMMEL KOENNEN MINUS FUENFZEHN GRAD NORDOST WEHEN MINUS DREI GRAD 366 | JETZT WETTER VORAUS INFORMIEREN MORGEN MONTAG EINS DREISSIG JANUAR 367 | HEUTE-NACHT TROCKEN IX REGEN MEISTENS REGION 368 | HEUTE-NACHT IX EINS GRAD MINUS SIEBEN REGION 369 | REGION KOMMEN SONNE SEHEN KOENNEN 370 | MONTAG WEITER SONNE WEST SCHAUER GEWITTER 371 | IHR WUENSCHEN WISSEN SOMMER WEITER WIE LAUFEN WIE-AUSSEHEN DAMEN UND HERREN poss-EUCH 372 | BLEIBEN HOCH TIEF HOCH TIEF 373 | DANN REGEN VERSCHWINDEN WIND STURM WEST KOMMEN 374 | DANN ABEND KOENNEN BISSCHEN REGEN GEWITTER BERG IX 375 | VIEL REGEN neg-HABEN 376 | WEST AUS FUENF ZWANZIG VIERZEHN BIS ACHTZEHN GRAD 377 | MORGEN WECHSELHAFT ABER IX MORGEN BISSCHEN BESSER RUHIG 378 | NACHT SCHNEE MEHR REGION KOMMEN DANN MORGEN SCHNEE SCHNEIEN NORDOST LANG SCHNEE SCHNEIEN 379 | FLUSS SUED MOEGLICH SONNE BLEIBEN TROCKEN 380 | SUED WEHEN BISSCHEN WEHEN NORD FRISCH NATUR STARK STURM SEE MEER SCHWER STURM BERG E+R+Z BERG AUCH ORKAN 381 | KOELN REGION IX DREIZEHN GRAD ALPEN DREI GRAD 382 | DANN WETTER WECHSELHAFT 383 | MITTE ZONE neg-MOEGEN STARK WOLKE ODER REGEN 384 | KOMMEN IX KALT KOMMEN IX SCHNEE GLATT KOENNEN 385 | MORGEN NORDOST NOCH REGEN SCHNEE REGEN BERG IX NOCH SCHNEE DURCHGEHEND 386 | HOCH KOMMEN OST KOMMEN MORGEN DEUTSCH LAND VIEL SONNE TROCKEN 387 | DESHALB NAECHSTE WOCHE KOMMEN 388 | IM-VERLAUF NACHT NORD WOLKE BISSCHEN REGEN 389 | TAG SUED FREUNDLICH UNTEN KOMMEN MEHR REGEN TROPFEN 390 | DARUNTER TAG IM-VERLAUF MEHR WARM 391 | TROTZDEM BLEIBEN SCHAUER GEWITTER NOCH 392 | ICH OSTERN WETTER ZUFRIEDEN 393 | MITTAG TEMPERATUR SUED WARM poss-MEIN NICHT 394 | NORD MORGEN BEWOELKT REGION REGEN 395 | SUED MEISTENS TROCKEN EINIGE WOLKE NEBEL MAL SONNE 396 | IM-VERLAUF MITTE AUCH WOLKE AUFLOESEN 397 | SAMSTAG AUCH DANN SONNTAG WEST BISSCHEN SCHAUER GEWITTER 398 | SUEDOST SCHNEE REGION TROCKEN MINUS ACHT BIS PLUS EINS ZWISCHEN 399 | BERG MEISTENS SCHNEE REGEN BERG ABER SUED REGION REGEN UNGEFAEHR TAUSEND ZWEIHUNDERT IX SCHNEE 400 | TAG EINS ZWANZIG GRAD SYLT IX UND NEUN ZWANZIG GRAD REGION UND REGION 401 | ABER JETZT OST KOMMEN SCHWUEL LUFT AUFZIEHEN 402 | NEU KOMMEN REGEN ABER MEHR ANGENEHM NASE LUFT 403 | HEUTE NACHT AB MORGEN NACHMITTAG NORD HARZ REGION STURM 404 | NORD MORGEN SIEBEN REGION FLUSS BIS FUENFZEHN 405 | MORGEN MEISTENS ZWEI BIS SECHS GRAD ABER BAYERN REGION BISSCHEN KALT MITTE REGION AUCH 406 | REGEN REGION UND IX TEILWEISE AUCH SONNE DABEI 407 | MITTWOCH SONNE NICHT NUR WEST SCHNEE REGEN MISCHUNG DANN BEISEITE 408 | SUED NOCH BISSCHEN NOCH WETTER GUT WETTER 409 | REST REGION MEHR MEISTENS WOLKE BESONDERS KUESTE IX MEHR REGEN 410 | BESONDERS NAH FLUSS NEBEL FELD 411 | MORGEN REGEN KOMMEN SCHWARZ WALD BERG REGION SCHNEE SIEBENHUNDERT FUENFHUNDERT METER BERG SCHON SCHNEE 412 | MORGEN IX MILD ZWOELF NORD ZWEI GRAD 413 | JETZT WETTER VORAUS INFORMIEREN MORGEN DONNERSTAG ZWANZIG JANUAR 414 | HEUTE-NACHT STURM KOENNEN 415 | MORGEN SCHWACH MAESSIG ZEIGEN-BILDSCHIRM WIND 416 | MORGEN EINS ZWANZIG REGION BIS ACHT ZWANZIG 417 | UNTEN REGION IN-KOMMEND WIE-AUSSEHEN TEIL WECHSELHAFT SONNE WOLKE UNTERSCHIED GEWITTER KOENNEN 418 | MORGEN WETTER WIE-AUSSEHEN FREITAG ZEHNTE JULI 419 | SAMSTAG SUEDWEST UEBERWIEGEND TROCKEN IX SONNE SCHAUER NORDWEST DANN GEWITTER 420 | SAMSTAG SONNTAG HOCH SPANIEN IX VERBREITEN SONNE AUCH TEIL TATSAECHLICH SCHON SOMMER TEMPERATUR 421 | OST REGION IX SONNE WAHRSCHEINLICH DANN ABEND IX REGEN IX 422 | MOEGLICH HEUTE NACHT FROST GLATT VORSICHT FLUSS MOEGLICH PLUS ACHT 423 | HEUTE NACHT SECHS BIS DREIZEHN GRAD TAG TEMPERATUR STEIGEN ZEHN GRAD ALPEN BIS FUENF ZWANZIG GRAD WEST 424 | MITTWOCH SUED NORD BISSCHEN REGEN SONST REGION FREUNDLICH 425 | JETZT WETTER WIE-AUSSEHEN MORGEN MONTAG FUENFTE JULI 426 | TIEF NORD EUROPA DIESE NORDWEST MORGEN SCHAUER SUEDOST GEWITTER 427 | DONNERSTAG NEBEL AUFLOESEN WOLKE BEWOELKT HABEN2 428 | ENDLICH SONNE ABER DEUTSCH KAUM 429 | ABER MILD MEHR MEER IX ODER SUEDWEST MINUS EINS MINUS ZWEI GRAD UNGEFAEHR MEHR 430 | TEMPERATUR IN-KOMMEND MEHR 431 | TAG BESONDERS NORDOST ALPEN SCHAUER KOENNEN DANN SONNE WOLKE WECHSELHAFT SUEDWEST HAUPTSAECHLICH SONNE 432 | MORGEN WEST VERBREITEN 433 | IN-KOMMEND MEHR KUEHL WENIGER WIND STARK 434 | BERG REGION REGEN 435 | DIENSTAG MITTWOCH TIEF KOMMEN MOEGLICH REGEN GEWITTER 436 | SCHWARZ WALD FUENF ZWANZIG C+M HARZ BIS SECHZIG C+M 437 | REGION ANDERS MILD HINREICHEND HEUTE NACHT HINREICHEND SCHNEE 438 | A HOCH KOMMEN SAMSTAG SONNTAG MEHR SONNE TEMPERATUR STEIGEN 439 | JETZT WETTER WIE-AUSSEHEN MORGEN MITTWOCH SECHSZEHN FEBRUAR ZEIGEN-BILDSCHIRM 440 | JETZT WIE-AUSSEHEN WETTER MORGEN FREITAG ELF DEZEMBER 441 | HOCH KOMMEN OST KOMMEN ES-BEDEUTET MORGEN FREUNDLICH WETTER 442 | REGION SONNE SCHAUER GEWITTER SUED IX ENORM HAGEL STARK REGEN STURM 443 | NACHT KOMMEN REGEN STARK OST SUEDOST KLAR SEHEN STERN KOENNEN 444 | HEUTE NACHT AUFKLAREN MORGEN NACH MITTAG SCHON NORD SEE SCHON BISSCHEN REGEN IX MILD LUFT 445 | WOCHE DANN HOCH KOMMEN WARM 446 | MITTE NORD HEUTE NACHT BISSCHEN REGEN IX 447 | SONNTAG SCHEINEN ALPEN AUCH SCHAUER MOEGLICH 448 | JETZT WETTER MORGEN SAMSTAG ZEHNTE APRIL WIE-AUSSEHEN ZEIGEN-BILDSCHIRM 449 | NACHT NULL BIS ZEHN FLUSS BIS SIEBEN GRAD 450 | JETZT WETTER WIE-AUSSEHEN MORGEN DONNERSTAG VIERTE OKTOBER 451 | SUEDOST MEISTENS TROCKEN 452 | MORGEN HAUPTSAECHLICH WOLKE VERSCHWINDEN IX 453 | SONST REGION HAUPTSAECHLICH REGEN 454 | WIND NORD SCHWACH MAESSIG WEHEN SCHWACH WEHEN 455 | HEUTE NACHT TEMPERATUR ELF BIS ACHTZEHN GRAD 456 | MORGEN OST REGION ZWEI GRAD REGION DREIZEHN GRAD 457 | GROSSBRITANNIEN REGION FRANKREICH MITTE EUROPA REGION TIEF KOMMEN SCHNEIEN SCHNEE WENIG NUR IX 458 | WOCHENENDE IM-VERLAUF MONTAG DIENSTAG NORDOST DANN KALT 459 | REGION LUFT TIEF KOMMEN DANN SONNTAG SCHNEE REGEN GEFRIEREN 460 | MORGEN TEIL UEBERWIEGEND WOLKE TEIL SONNE OST UEBERWIEGEND MEHR SONNE DABEI 461 | AUCH DIENSTAG WOLKE MEHR REGEN ODER SCHNEE 462 | HEUTE NACHT NORD TEIL STURM BERG ORKAN 463 | MORGEN REGEN NORDOST SCHNELL VERSCHWINDEN SCHON SCHAUER 464 | HOCH OST KOMMEN MORGEN SOLL EINFLUSS DEUTSCH LAND 465 | HEUTE NACHT RUHRGEBIET ZWANZIG GRAD MITTE BERG MOEGLICH ELF GRAD 466 | JETZT WETTER MORGEN FREITAG VIERZEHN MAI 467 | REGION MEHR SONNE 468 | SCHNEE WARUM HEUTE NACHT KALT ZEIGEN-BILDSCHIRM LEICHT FROST MINUS EINS BIS MINUS VIER NUR WEST FROST KEIN 469 | NORD TAG REGEN KOMMEN NOCH-NICHT SONNE FREUNDLICH SONNE DABEI UND STURM WIND 470 | NACHT IX BISSCHEN REGEN HOCH SCHNEE 471 | REGION TEIL KLAR NORD GEBEN SCHAUER 472 | DIESE WARNUNG UNWETTER DEUTSCH WETTER DIENST 473 | HAUPTSAECHLICH NORD MITTE REGEN GEWITTER 474 | WEST TEIL SCHNEE SCHNEIEN TEIL REGEN HEUTE NACHT MOEGLICH REGEN MIT EIS GLATT GEFAHR 475 | SCHOEN ABEND poss-EUCH 476 | SUED WEHEN IX WEHEN KOENNEN STURM KOENNEN NORD SCHWER STURM 477 | ROSTOCK ACHT REGION LEIPZIG ACHTZEHN GRAD ZONE 478 | MORGEN A HOCH KOMMEN REGION FREUNDLICH 479 | DIENSTAG KOMMEN REGEN KOENNEN GEWITTER UNWETTER REGEN HAGEL KRAEFTIG WIND KOENNEN 480 | AB MITTAG ZWISCHEN KOMMEN WOLKE MEISTENS REGEN 481 | JETZT WETTER MORGEN FREITAG DREI ZWANZIG JULI 482 | SKANDINAVIEN NORD WOLKE TIEF AUCH DEUTSCHLAND REGION KOMMEN 483 | FREITAG BLEIBEN WARM NASS SAMSTAG DANN SUEDWEST REGEN UND KUEHL 484 | MORGEN DREI GRAD REGION BAYERN WALD IX ZWOELF KOELN 485 | MITTWOCH WIND KOENNEN STURM REGEN 486 | UND JETZT WETTER MORGEN DIENSTAG SECHS ZWANZIG JANUAR 487 | WIND NORD WEHEN WENIG UNTEN STARK WEHEN 488 | JETZT MORGEN WETTER WIE-AUSSEHEN DIENSTAG DREISSIG MAERZ 489 | KUEHL KOMMEN 490 | TEMPERATUR SAMSTAG SONNTAG IX GLEICH 491 | TAG NORDOST SECHSZEHN REGION IX DREI ZWANZIG GRAD 492 | GUT ABEND LIEB ZUSCHAUER 493 | SO VIEL SCHNEE ANFANG DEZEMBER TJA SELTEN BISHER WENN UEBER SICHT NULL FAST REGION DEUTSCHLAND REGION SCHNEE HABEN2 494 | NORD AUCH REGEN DABEI SUEDWEST BLEIBEN TROCKEN 495 | WIE-AUSSEHEN IN-KOMMEND MITTWOCH BLEIBEN WOLKE IX KOENNEN REGEN WEST KOENNEN SONNE 496 | WIND SCHWACH MAESSIG IX WEHEN 497 | HALLO GUT ABEND 498 | WINTER SCHON HABEN MITTE BERG SCHON WEISS BODEN 499 | IX SUED DANN RUHIG MEHR TROCKEN AUCH BISSCHEN SONNE 500 | WEST SUEDWEST TIEF KOMMEN SCHAUER GEWITTER KOENNEN DEUTSCH WETTER DIENST WARNUNG 501 | SUED SCHWACH NORD MAESSIG KUESTE STARK STURM 502 | MORGEN ZWANZIG GRAD NORD BIS ACHT ZWANZIG REGION 503 | DONNERSTAG SONNE TEILWEISE REGEN STARK GEWITTER 504 | FREITAG RUHIG MEHR KUEHL 505 | REGEN REGION VIEL HIMMEL REGION SUEDWEST AUCH LOCH neg-WOLKE negalp-KEIN 506 | HEUTE NACHT DREIZEHN BIS DREI GRAD ALPEN WAHRSCHEINLICH ZWISCHEN NULL 507 | MORGEN NACH MITTAG GEWITTER REGEN AUCH 508 | MORGEN TEMPERATUR ACHT BIS SECHSZEHN GRAD 509 | OST REGION ZUERST WARM VIER AUCH SUED BAYERN WARM 510 | DANN STURM WEHEN OST FRISCH WIND BERG KOENNEN STURM 511 | JETZT WETTER MORGEN SONNTAG ZWOELF DEZEMBER WIE-AUSSEHEN ZEIGEN-BILDSCHIRM 512 | MORGEN SONNE IX KOMMEN 513 | SUED SCHWACH WEHEN IX MAESSIG WEHEN 514 | IX MORGEN NEUNZEHN GRAD REGION SIEBEN ZWANZIG GRAD 515 | JETZT WETTER WIE-AUSSEHEN MORGEN SONNTAG SIEBTE OKTOBER 516 | MORGEN DEUTSCH LAND IX TIEF KOMMEN KUEHL KOMMEN 517 | MITTWOCH TEIL SONNE TEIL WOLKE BLEIBEN TROCKEN 518 | NORDOST WIEDER WOLKE ABER SONST NUR BISSCHEN WOLKE 519 | HEUTE NACHT PLUS DREI REGION NULL ZWISCHEN LEICHT FROST MINUS EINS MINUS ZWEI 520 | -------------------------------------------------------------------------------- /data/baselines/phoenix_preprocessed/phoenix_dev_glosses_lowercased.txt: -------------------------------------------------------------------------------- 1 | druck tief kommen 2 | es-bedeutet viel wolke und koennen regen gewitter koennen 3 | wind maessig schwach region wenn gewitter wind koennen 4 | mittwoch regen koennen nordwest wahrscheinlich nord stark wind 5 | jetzt wetter wie-aussehen morgen freitag sechste mai zeigen-bildschirm 6 | dann stark schnee schneien kommen 7 | suedwest kommen warm morgen schon frankreich region fuenfzehn bis zwanzig grad wochenende kommen warm 8 | morgen daenemark ix zwanzig maximal dreissig grad 9 | schoen abend wuenschen 10 | morgen mal sonne speziell alpen 11 | mal bisschen schnee nord mehr stark schnee 12 | nordwest auch teil ix regen 13 | tag sued mitte wolke kraeftig nebel 14 | nacht fuenf grad see minus vier berg ix 15 | aber regen erst freitag abend sued kommen regen 16 | nord nur wolke frost sued 17 | dresden ix region berg null minus sechs nord neg-frost neg-haben mild 18 | jetzt wetter wie-aussehen morgen 19 | deutschland zwei teil regen schwuel frisch kuehl 20 | suedwest sowieso stern koennen sehen 21 | mitte region wolke morgen koennen regen gewitter 22 | ix koennen gefahr glatt besonders mitte region sued dann kalt 23 | samstag regen berg regen teilweise umwandeln schnee schneien 24 | schoen wo meer region 25 | wind schwach maessig wehen 26 | tag dann sued suedost regen nach mittag ix auch gewitter 27 | luft druck hoch deshalb morgen sonne ueberall 28 | morgen zehn grad ix siebzehn grad ober fluss 29 | hoch nord sonne deshalb grenze hoch tief 30 | freitag dann kommen regen ix ueberwiegend wind 31 | sonntag wahrscheinlich freundlich im-verlauf west schnee schneien regen 32 | besonders nordwest wind stark 33 | mischung nebel hoch nebel sonne bleiben 34 | dienstag ruhig trocken wetter 35 | nur sued mehr freundlich 36 | jetzt wuenschen schoen abend 37 | in-kommend bleiben luft druck hoch kommen bedeuten nebel himmel und sonne mischung 38 | morgen dreizehn region suedwest ix vier zwanzig grad passen fast wie sommer 39 | montag auch wechselhaft und mehr kuehl 40 | frankreich kommen wolke ost niedersachsen bayern suedwest regen 41 | wehen schwach maessig 42 | sued mehr ruhig freundlich bisschen mild 43 | lieb zuschauer gut abend 44 | sommer zweitausend elf fast vorbei deutsch land bisschen warm mehr wenig sonne aber enorm viel regen 45 | manchmal schwach maessig ix wind ix west stark wind 46 | tag viel wolke nebel bleiben trocken ix sonne moeglich 47 | suedwest europa sued bekommen regen 48 | region lang freundlich 49 | sued wind schwach nord maessig frisch schauer kueste berg teil sturm orkan 50 | bayern wald heute abend minus fuenf fluss drei grad 51 | morgen zwei grad region fluss neun grad 52 | morgen mehr warm ix als heute 53 | vierzehn bis neunzehn grad koennen 54 | jetzt wie-aussehen wetter morgen donnerstag vier zwanzig november 55 | nordwest wolke manchmal sonne bisschen ix s+h ix regen 56 | donnerstag dann wieder mehr wind ix wind kommen anfang ix regen kommen gleich 57 | samstag hauptsaechlich sonne nord bisschen regen 58 | jetzt wetter wie-aussehen morgen dreissig oktober 59 | nachmittag koennen sonne koennen 60 | lieb zuschauer poss-euch gut abend 61 | ix nord tief kommen wolke kommen 62 | west fluss west region nach mittag besser sonne moeglich 63 | morgen west tief kommen richtung ost aufziehen 64 | regen gewitter stark 65 | nordwest spaeter aufloesen 66 | jetzt in-kommend ix regen gewitter koennen stark 67 | tag sonne wolke wechselhaft teilweise auch lang sonne 68 | tag ix regen auch kommen ost 69 | suedost schoen rest neg-region schon regen 70 | gewitter enorm suedwest bis-morgen nacht kommen 71 | morgen gewitter meistens wo suedost region brand burg ix nord teilweise regen 72 | west langsam verschwinden 73 | wind kueste auch 74 | heute nacht fluss vierzehn grad nord maximal null 75 | hoch region bis freitag meistens wetter freundlich sonne temperatur steigen 76 | morgen nordwest zwei sonst region minus fuenf zwischen eins zwischen 77 | wind maessig frisch kueste ix stark wenn gewitter ix dann sturm moeglich 78 | dazu morgen nord wetter wechselhaft sonntag auch mitte 79 | region so 80 | montag nord region regen region besser im-verlauf region regen 81 | regen dann mittwoch regen donnerstag stark regen 82 | speziell suedost koennen ort unwetter regen hagel sturm koennen 83 | normal wind leicht maessig kommen wehen 84 | jetzt wetter voraussage morgen freitag vier zwanzig dezember 85 | ost region sonne mehr warm maximal sechs zwanzig sued maximal sieben zwanzig grad 86 | sued region mehr wolke fluss alpen moeglich schnee aber im-verlauf weniger 87 | kuehl sieben grad allgaeu ix sechszehn nord 88 | sturm tagsueber dabei 89 | ihr wuenschen abend machen gut 90 | montag meistens tief druck region luft meer luft kommen 91 | auch morgen wetter super neg-haben fuenf grad nordost mild wo suedwest 92 | nacht nord mehr sturm auch kueste orkan 93 | tag schwach maessig wehen nord nordost frisch maessig wehen ost stark wehen 94 | freundlich bleiben region sued bisschen schauer 95 | schoen abend ausrichten 96 | mittwoch wechselhaft 97 | auch donnerstag weiter wechselhaft 98 | rest region sonne wolke nur ort bisschen regen 99 | heute nacht sieben sonst region sechs zwischen eins 100 | auch wind stark stroemen region sturm orkan kueste koennen 101 | ab montag das-ist-es deutsch einfluss regen 102 | ix wind und schnee stufenweise grenze 103 | nordwest schnee bisschen koennen 104 | sonntag ruhig verschwinden 105 | gut abend lieb zuschauer 106 | in-kommend fruehling wetter morgen warm 107 | woher warm 108 | schoen abend wuenschen machen gut wuenschen 109 | hoffen region jetzt nordost verlaufen verschwinden 110 | berg morgen noch regen ix schauer nord gewitter 111 | jetzt wetter wie-aussehen morgen sonntag zehnte januar 112 | morgen wetter wie-aussehen mittwoch zwoelf mai 113 | tag dann nord region regen suedost doch bisschen freundlich 114 | samstag nord suedost regen aber gleich zeit wind 115 | gerade rhein-pfalz saarland nordrhein-westfalen gewitter 116 | im-moment doch gewitter deutsch wetter dienst warnung schon fertig bekanntgeben 117 | sued wahrscheinlich hoch druck ruhig freundlich herbst 118 | auch samstag naechste gleich ix kommen mehr kuehl 119 | wind schwach wehen 120 | region morgen sechs berg allgaeu kalt minus vier 121 | morgen wert eifel achtzehn bis sechs zwanzig land 122 | morgen sonne ueberall kueste region wolke moeglich regen neg-viel 123 | trocken enorm 124 | abend wuenschen 125 | tief region schwach morgen soll einfluss ost region sued 126 | wind schwach wehen 127 | mittwoch west wolke acht bis sechszehn 128 | nebel kuehl 129 | wolke region schaffen nur nordwest kommen 130 | sued schwach wehen ix maessig kueste frisch ost sturm 131 | nacht teil boden frost 132 | jetzt wetter wie-aussehen morgen samstag siebte august 133 | morgen meistens sonne 134 | nord koennen bewoelkt 135 | region wehen sued viel frisch wind bisschen sturm berg sturm orkan koennen 136 | heute nacht ix region null grad wenn stern koennen sehen bis minus zwei zwanzig grad 137 | wind maessig wehen 138 | west region heute nacht fuenf grad region hauptsaechlich frost moeglich glatt vorsicht 139 | heute nacht temperatur minus drei minus siebzehn wenn klar tief 140 | tag minus sieben nord null 141 | dazu warm luft tatsaechlich warm heiss naechste-woche kuehl 142 | ost sued berlin sued deutschland vier zwanzig grad bis acht zwanzig grad 143 | jetzt wetter wie-aussehen morgen sonntag sieben zwanzig september 144 | nur nord bisschen wolke 145 | heute nacht nord zwoelf land ix vier grad 146 | morgen tag achtzehn maximal drei zwanzig grad 147 | tag teil nur eins grad nord see 148 | im-verlauf frueh herbst 149 | sonntag schnee wenig nord region moeglich sonne 150 | tag suedost schnee schneien flach auch schnee schneien 151 | nordwest schnee schauer verschwinden 152 | sonntag ix wolke teil freundlich trocken minus fuenf zwischen maximal zwei grad 153 | im-verlauf schnee umkehren regen aber eis regen vorsicht strasse glatt moeglich 154 | morgen tag im-verlauf suedwest region bleiben so moeglich schnee 155 | nord region schwach maessig wind 156 | heute nacht rhein acht grad alpen minus sechs 157 | morgen sonne wolke wechselhaft nord region sonne oft 158 | ix schauer suedwest abend gewitter koennen 159 | nordost bisschen schauer abend aufloesen 160 | ein-paar harmlos nebel dann klar 161 | heute nacht minus zwei nord mitte minus eins zwanzig grad 162 | in-kommend tag bleiben kalt mitte europa ungefaehr null zwischen mitte meer zehn bis fuenfzehn 163 | jetzt wetter wie-aussehen morgen samstag zweite oktober 164 | ix dann schnee koennen abend dann nord schnee flach schnee 165 | gut abend lieb du zuschauer poss-euch 166 | mild nord auch zwoelf zwischen vierzehn sued ungefaehr vierzehn maximal sechszehn grad 167 | nord sonne wolke wechselhaft bisschen schauer suedwest besonders sonne moeglich 168 | heute nacht dreizehn nord vier berg 169 | am-tag dreizehn ost eins zwanzig fluss 170 | dann kommen schauer stark mit gewitter 171 | und im-verlauf ueberall wechselhaft moeglich schnee 172 | jetzt wetter wie-aussehen morgen dienstag neunte februar 173 | wie-aussehen in-kommend samstag schnee schneien besonders nord wahrscheinlich sonne 174 | heute nacht temperatur minus fuenf nord bis plus drei west fluss 175 | ix plus sechs grad vor pommern region bisschen frost 176 | dabei nord mehr mild 177 | aber tagsueber ix mehr kuehl 178 | montag viel region freundlich kueste suedost kurz wolke teil regen 179 | dienstag west mehr wolke schauer 180 | nordwest spaeter auch wolke dann dabei gewitter schauer 181 | mittwoch sinken kuehler wechselhaft sonne wolke schauer gewitter west 182 | tag klar stern sehen koennen frost 183 | stunde auch meistens regen erst west dann region 184 | und tag bleiben kuehl sechs grad bayern ix region auch s+h ix auch 185 | aber dazwischen region mild neun bis vierzehn grad 186 | suedwest deutsch land bisschen feucht kommen ix moeglich schauer gewitter wahrscheinlich 187 | woche warm auch sonne jeden-tag grad steigen 188 | schoen abend wuenschen 189 | auch ober fluss bis abend mehr wolke 190 | nacht teil wolke teil klar schauer gewitter 191 | jetzt wetter morgen freitag eins zwanzig mai 192 | wetter wie-aussehen morgen montag eins zwanzig februar 193 | am-tag region schnee fluss regen 194 | nord kalt kommen zone dazwischen 195 | nord fluss sued trocken ix 196 | zone koennen regen teilweise schnee regen umwandeln gefrieren 197 | neun grad region minus acht nordost 198 | freitag suedost sonne freitag dann mehr wolke regen koennen 199 | nord suedost auch koennen regen gewitter dabei 200 | sonntag ueberwiegend sonne 201 | nord schauer 202 | montag aehnlich wetter aber bisschen mehr warm 203 | montag ueberwiegend schauer ost gewitter sued west lang freundlich 204 | suedwest klar morgen vier bis neun grad 205 | region bis abend trocken 206 | nord deutschland ix klar luft ix nebel und teilweise bisschen dazwischen regen herz berg bayern region 207 | morgen nord freundlich 208 | jetzt wetter wie-aussehen morgen sonntag sechs zwanzig september 209 | heute nacht neg-kaum nur nordwest bisschen regen sonst region ruhig 210 | alpen lang schnee 211 | heute nacht mehr schnee nord suedost 212 | morgen besonders nord region und west regen koennen 213 | wind kommen dann schnee witterung 214 | jetzt wetter morgen dienstag sechste april 215 | jetzt wie-aussehen wetter morgen mittwoch eins zwanzig oktober 216 | abend fluss west region moeglich regen 217 | wind wehen maessig wehen 218 | nord nordwest mehr viel wolke 219 | schnee mehr kueste region 220 | morgen wieder wetter ruhig freundlich wetter hoch druck 221 | nacht minus drei bis plus vier nord plus fuenf ix 222 | morgen zehn bis fuenfzehn region sechszehn bis drei zwanzig 223 | ost warm region bis dreissig grad region ueberspringen region kuehl nur fuenfzehn sechszehn grad 224 | nord europa tief kommen 225 | wind wehen frisch kommen hoch sturm 226 | schoen abend machen poss-euch gut 227 | ost sued heute nacht trocken auch klar dann teil region schauer 228 | fuenfzehn grad region sauer land nur sechs grad 229 | montag sonne warm weiter 230 | in-kommend wetter wechselhaft 231 | luft kuehl region tief hoch region kommen kuehl 232 | morgen auch hoch luft viel sonne 233 | wie-aussehen in-kommend sonntag ost speziell schnee nord bleiben wind 234 | langsam steigen warm fluss achtzehn bis zwanzig grad region zwoelf bis achtzehn grad kuehl poss-sein 235 | regen negalp-auch aber kuehl 236 | nacht sylt dreizehn grad mitte berg tal null grad 237 | mittwoch naechste dasselbe 238 | donnerstag deutsch land wechselhaft ueberwiegend regen moeglich stark wind 239 | ix morgen im-verlauf ix anfang freundlich aber wolke kommen ost 240 | morgen ix wehen ix nord frisch wind 241 | wetter wie-aussehen morgen sonntag sechs september 242 | naechste woche mild aber wechselhaft 243 | morgen vier grad region sechs bis elf grad fluss bis zwoelf grad 244 | tag minus drei nordost plus vierzehn grad sued 245 | mittwoch alle gut sonne schoen sechszehn bis fuenf zwanzig grad 246 | andere temperatur 247 | gleich ost vier grad 248 | mild acht bis neun grad 249 | schoen abend poss-euch machen gut poss-euch 250 | jetzt wetter morgen freitag sieben zwanzig august 251 | suedost regen viel 252 | ix regen koennen besonders nord 253 | tag dann west freundlich sonne dabei 254 | deutsch wetter dienst warnung 255 | nordwest ix auch kommen sonne meistens 256 | ost druckflaeche stark besonders in-kommend koennen gewitter regen 257 | so gewitter von hoch ix region nord europa region warm luft kommen kuehl luft west kommen 258 | wolke dabei heute nacht koennen regen kommen suedost regen 259 | dazu koennen gewitter 260 | sued mehr freundlich 261 | darum warnung deutsch wetter dienst warnung informieren 262 | auch ober fluss hoch fluss frost 263 | auch schnee kommen 264 | bleiben im-verlauf 265 | morgen nord kaum gewitter region sonne 266 | auch nah fluss und alpen auch moeglich nebel 267 | tag zehn grad bisschen bewoelkt achtzehn grad fluss ix 268 | freitag bisschen verschwinden bisschen verschwinden nord bisschen regen bisschen stellenweise vierzehn grad ungefaehr 269 | skandinavien hoch kommen kalt kommen 270 | frankreich kommen tief kommen wolke kommen koennen schnee regen 271 | kueste heute nacht schnee region wolke bisschen trocken 272 | nord morgen koennen sonne 273 | sued veraendern kaum wie heute sonne oder nebel 274 | nacht vierzehn nord sechs allgaeu 275 | tag vierzehn nord regen eins zwanzig fluss 276 | morgen frueh verschwinden langsam schnell nordost bisschen wolke bleiben trocken 277 | kueste bisschen wolke aber neg-regen neg-haben 278 | ix auch wind dabei temperatur fuenf bis ungefaehr dreizehn grad region 279 | nordwest regen oder schnee vorsicht glatt koennen 280 | kommen loch aber trotzdem schauer 281 | suedost schwach wehen maessig 282 | naechste woche wechselhaft wolke teil regen 283 | koennen ix mehr kuehl kommen ab dienstag luft hoch hoeher temperatur hoeher mehr freundlich 284 | donnerstag bis sechs zwanzig grad viel sonne 285 | west mehr schauer gewitter 286 | nacht wolke kommen bleiben klar himmel stern sehen 287 | in-kommend schnee 288 | freitag samstag nord wind regen sued freundlich trocken 289 | wehen wind schwach maessig berg frisch wind 290 | morgen wetter wie-aussehen mittwoch zweite juni 291 | sonntag west nordwest wieder viel wolke bisschen regen ost kommen freundlich 292 | mehr schnee schneien moeglich schneien auch moeglich 293 | wetter warnung von deutsch wetter dienst 294 | wind schwach wehen zeigen-bildschirm 295 | samstag nord schauer region freundlich sued im-verlauf regen 296 | sonntag alpen ix auch regen nord schauer mitte mehr freundlich sonne 297 | nord heute nacht klar himmel stern koennen sehen suedwest regen koennen nebel bereich 298 | jetzt im-moment nacht noch warm ix morgen frueh mehr kuehl 299 | lieb zuschauer gut abend 300 | frisch morgen angenehm deutsch land 301 | aber im-moment dann viel regen region ost region 302 | ost langsam aber sued weiter regen gewitter 303 | heute nacht nord mitte klar stern koennen sehen 304 | region nebel 305 | sued regen koennen dabei blitz donner 306 | morgen region regen dabei nord dann aufloesen dann sonne dabei 307 | nach mittag nordwest wolke koennen regen 308 | ab montag in-kommend wetter wechselhaft wind 309 | ab dienstag sturm koennen 310 | teil regen berg moeglich schnee 311 | aber in-kommend mild dann wieder schnee grenze auf 312 | sued nebel region koennen lang nebel 313 | wenn sonne haben dann schaffen elf grad nebel nur drei grad 314 | nacht temperatur vier bis neun 315 | spaeter regen ueberall region 316 | heute nacht elf grad berg allgaeu bis siebzehn fluss 317 | lieb zuschauer gut abend 318 | tag hauptsaechlich wolke nebel dann teil schnee schneien regen 319 | suedwest bisschen sonne 320 | wenn klar moeglich nebel nord 321 | morgen ueberwiegend wolke tropfen 322 | spaeter verschwinden 323 | wenn nebel neg-haben freundlich 324 | ost nacht gefahr wind 325 | ix nacht wahrscheinlich locker ort nebel haben lang bleiben 326 | tag vogel land minus acht nord minus drei grad 327 | wolke heute nacht nordwest wolke bisschen regen 328 | nacht sechs grad see minus drei fluss 329 | leider durchgehend dauer regen nacht sued deutschland regen 330 | jetzt wetter wie-aussehen morgen mittwoch eins dreissig maerz 331 | berg ix durchgehend regen 332 | dienstag ueberall viel sonne wolke locker trocken 333 | sued vierhundert siebenhundert meter hoehe moeglich schnee enorm 334 | morgen temperatur null bis sieben grad fluss moeglich acht grad 335 | morgen nord west regen region nebel wolke himmel 336 | kueste wind haben 337 | und dazu sturm nord kueste sturm 338 | nacht see schwer sturm morgen orkan haben deshalb frisch maessig wehen 339 | auch bis freitag wieder sinken kuehl 340 | schoen abend machen gut 341 | freitag mehr wolke neg-sonne nordost schnee schneien 342 | lieb zuschauer poss-euch gut abend 343 | zwanzig bis ueber zwanzig grad 344 | heute nacht schon west regen langsam kommen fluss region noch 345 | wie herbst 346 | schoen abend wuenschen 347 | region suedost sonne nordwest ueberwiegend wolke ix regen suedost auch schauer 348 | wetter wie-aussehen morgen sonntag vierzehn februar 349 | wie-aussehen in-kommend montag mal sonne mal wolke west bisschen schnee 350 | zwei tief 351 | west tag regen ix koennen schnee regen kalt frost ost wolke bewoelkt freundlich 352 | nordost tief kommen wolke regen 353 | jetzt wetter wie-aussehen morgen dienstag sieben zwanzig juli 354 | ungemuetlich sued besser als nord 355 | heute nacht nord mitte 356 | heute nacht zwischen fuenf zwischen tag mitte berg dreizehn ix neunzehn grad 357 | tag fuenf grad nebel und fuenfzehn grad foehn region 358 | suedost poss-sein freundlich sonne 359 | samstag sonntag dann wechselhaft ix regen besonders sonntag koennen sturm 360 | im-verlauf im-verlauf temperatur region 361 | sued mehr freundlich ix nord nicht ort auch schauer gewitter kurz 362 | sonntag bis dreissig grad moeglich wieder unwetter 363 | wetter so knapp veraendern meistens bleiben wolke trocken wetter 364 | ost suedost ueberwiegend wolke bisschen schnee 365 | heute nacht klar himmel koennen minus fuenfzehn grad nordost wehen minus drei grad 366 | jetzt wetter voraus informieren morgen montag eins dreissig januar 367 | heute-nacht trocken ix regen meistens region 368 | heute-nacht ix eins grad minus sieben region 369 | region kommen sonne sehen koennen 370 | montag weiter sonne west schauer gewitter 371 | ihr wuenschen wissen sommer weiter wie laufen wie-aussehen damen und herren poss-euch 372 | bleiben hoch tief hoch tief 373 | dann regen verschwinden wind sturm west kommen 374 | dann abend koennen bisschen regen gewitter berg ix 375 | viel regen neg-haben 376 | west aus fuenf zwanzig vierzehn bis achtzehn grad 377 | morgen wechselhaft aber ix morgen bisschen besser ruhig 378 | nacht schnee mehr region kommen dann morgen schnee schneien nordost lang schnee schneien 379 | fluss sued moeglich sonne bleiben trocken 380 | sued wehen bisschen wehen nord frisch natur stark sturm see meer schwer sturm berg e+r+z berg auch orkan 381 | koeln region ix dreizehn grad alpen drei grad 382 | dann wetter wechselhaft 383 | mitte zone neg-moegen stark wolke oder regen 384 | kommen ix kalt kommen ix schnee glatt koennen 385 | morgen nordost noch regen schnee regen berg ix noch schnee durchgehend 386 | hoch kommen ost kommen morgen deutsch land viel sonne trocken 387 | deshalb naechste woche kommen 388 | im-verlauf nacht nord wolke bisschen regen 389 | tag sued freundlich unten kommen mehr regen tropfen 390 | darunter tag im-verlauf mehr warm 391 | trotzdem bleiben schauer gewitter noch 392 | ich ostern wetter zufrieden 393 | mittag temperatur sued warm poss-mein nicht 394 | nord morgen bewoelkt region regen 395 | sued meistens trocken einige wolke nebel mal sonne 396 | im-verlauf mitte auch wolke aufloesen 397 | samstag auch dann sonntag west bisschen schauer gewitter 398 | suedost schnee region trocken minus acht bis plus eins zwischen 399 | berg meistens schnee regen berg aber sued region regen ungefaehr tausend zweihundert ix schnee 400 | tag eins zwanzig grad sylt ix und neun zwanzig grad region und region 401 | aber jetzt ost kommen schwuel luft aufziehen 402 | neu kommen regen aber mehr angenehm nase luft 403 | heute nacht ab morgen nachmittag nord harz region sturm 404 | nord morgen sieben region fluss bis fuenfzehn 405 | morgen meistens zwei bis sechs grad aber bayern region bisschen kalt mitte region auch 406 | regen region und ix teilweise auch sonne dabei 407 | mittwoch sonne nicht nur west schnee regen mischung dann beiseite 408 | sued noch bisschen noch wetter gut wetter 409 | rest region mehr meistens wolke besonders kueste ix mehr regen 410 | besonders nah fluss nebel feld 411 | morgen regen kommen schwarz wald berg region schnee siebenhundert fuenfhundert meter berg schon schnee 412 | morgen ix mild zwoelf nord zwei grad 413 | jetzt wetter voraus informieren morgen donnerstag zwanzig januar 414 | heute-nacht sturm koennen 415 | morgen schwach maessig zeigen-bildschirm wind 416 | morgen eins zwanzig region bis acht zwanzig 417 | unten region in-kommend wie-aussehen teil wechselhaft sonne wolke unterschied gewitter koennen 418 | morgen wetter wie-aussehen freitag zehnte juli 419 | samstag suedwest ueberwiegend trocken ix sonne schauer nordwest dann gewitter 420 | samstag sonntag hoch spanien ix verbreiten sonne auch teil tatsaechlich schon sommer temperatur 421 | ost region ix sonne wahrscheinlich dann abend ix regen ix 422 | moeglich heute nacht frost glatt vorsicht fluss moeglich plus acht 423 | heute nacht sechs bis dreizehn grad tag temperatur steigen zehn grad alpen bis fuenf zwanzig grad west 424 | mittwoch sued nord bisschen regen sonst region freundlich 425 | jetzt wetter wie-aussehen morgen montag fuenfte juli 426 | tief nord europa diese nordwest morgen schauer suedost gewitter 427 | donnerstag nebel aufloesen wolke bewoelkt haben2 428 | endlich sonne aber deutsch kaum 429 | aber mild mehr meer ix oder suedwest minus eins minus zwei grad ungefaehr mehr 430 | temperatur in-kommend mehr 431 | tag besonders nordost alpen schauer koennen dann sonne wolke wechselhaft suedwest hauptsaechlich sonne 432 | morgen west verbreiten 433 | in-kommend mehr kuehl weniger wind stark 434 | berg region regen 435 | dienstag mittwoch tief kommen moeglich regen gewitter 436 | schwarz wald fuenf zwanzig c+m harz bis sechzig c+m 437 | region anders mild hinreichend heute nacht hinreichend schnee 438 | a hoch kommen samstag sonntag mehr sonne temperatur steigen 439 | jetzt wetter wie-aussehen morgen mittwoch sechszehn februar zeigen-bildschirm 440 | jetzt wie-aussehen wetter morgen freitag elf dezember 441 | hoch kommen ost kommen es-bedeutet morgen freundlich wetter 442 | region sonne schauer gewitter sued ix enorm hagel stark regen sturm 443 | nacht kommen regen stark ost suedost klar sehen stern koennen 444 | heute nacht aufklaren morgen nach mittag schon nord see schon bisschen regen ix mild luft 445 | woche dann hoch kommen warm 446 | mitte nord heute nacht bisschen regen ix 447 | sonntag scheinen alpen auch schauer moeglich 448 | jetzt wetter morgen samstag zehnte april wie-aussehen zeigen-bildschirm 449 | nacht null bis zehn fluss bis sieben grad 450 | jetzt wetter wie-aussehen morgen donnerstag vierte oktober 451 | suedost meistens trocken 452 | morgen hauptsaechlich wolke verschwinden ix 453 | sonst region hauptsaechlich regen 454 | wind nord schwach maessig wehen schwach wehen 455 | heute nacht temperatur elf bis achtzehn grad 456 | morgen ost region zwei grad region dreizehn grad 457 | grossbritannien region frankreich mitte europa region tief kommen schneien schnee wenig nur ix 458 | wochenende im-verlauf montag dienstag nordost dann kalt 459 | region luft tief kommen dann sonntag schnee regen gefrieren 460 | morgen teil ueberwiegend wolke teil sonne ost ueberwiegend mehr sonne dabei 461 | auch dienstag wolke mehr regen oder schnee 462 | heute nacht nord teil sturm berg orkan 463 | morgen regen nordost schnell verschwinden schon schauer 464 | hoch ost kommen morgen soll einfluss deutsch land 465 | heute nacht ruhrgebiet zwanzig grad mitte berg moeglich elf grad 466 | jetzt wetter morgen freitag vierzehn mai 467 | region mehr sonne 468 | schnee warum heute nacht kalt zeigen-bildschirm leicht frost minus eins bis minus vier nur west frost kein 469 | nord tag regen kommen noch-nicht sonne freundlich sonne dabei und sturm wind 470 | nacht ix bisschen regen hoch schnee 471 | region teil klar nord geben schauer 472 | diese warnung unwetter deutsch wetter dienst 473 | hauptsaechlich nord mitte regen gewitter 474 | west teil schnee schneien teil regen heute nacht moeglich regen mit eis glatt gefahr 475 | schoen abend poss-euch 476 | sued wehen ix wehen koennen sturm koennen nord schwer sturm 477 | rostock acht region leipzig achtzehn grad zone 478 | morgen a hoch kommen region freundlich 479 | dienstag kommen regen koennen gewitter unwetter regen hagel kraeftig wind koennen 480 | ab mittag zwischen kommen wolke meistens regen 481 | jetzt wetter morgen freitag drei zwanzig juli 482 | skandinavien nord wolke tief auch deutschland region kommen 483 | freitag bleiben warm nass samstag dann suedwest regen und kuehl 484 | morgen drei grad region bayern wald ix zwoelf koeln 485 | mittwoch wind koennen sturm regen 486 | und jetzt wetter morgen dienstag sechs zwanzig januar 487 | wind nord wehen wenig unten stark wehen 488 | jetzt morgen wetter wie-aussehen dienstag dreissig maerz 489 | kuehl kommen 490 | temperatur samstag sonntag ix gleich 491 | tag nordost sechszehn region ix drei zwanzig grad 492 | gut abend lieb zuschauer 493 | so viel schnee anfang dezember tja selten bisher wenn ueber sicht null fast region deutschland region schnee haben2 494 | nord auch regen dabei suedwest bleiben trocken 495 | wie-aussehen in-kommend mittwoch bleiben wolke ix koennen regen west koennen sonne 496 | wind schwach maessig ix wehen 497 | hallo gut abend 498 | winter schon haben mitte berg schon weiss boden 499 | ix sued dann ruhig mehr trocken auch bisschen sonne 500 | west suedwest tief kommen schauer gewitter koennen deutsch wetter dienst warnung 501 | sued schwach nord maessig kueste stark sturm 502 | morgen zwanzig grad nord bis acht zwanzig region 503 | donnerstag sonne teilweise regen stark gewitter 504 | freitag ruhig mehr kuehl 505 | regen region viel himmel region suedwest auch loch neg-wolke negalp-kein 506 | heute nacht dreizehn bis drei grad alpen wahrscheinlich zwischen null 507 | morgen nach mittag gewitter regen auch 508 | morgen temperatur acht bis sechszehn grad 509 | ost region zuerst warm vier auch sued bayern warm 510 | dann sturm wehen ost frisch wind berg koennen sturm 511 | jetzt wetter morgen sonntag zwoelf dezember wie-aussehen zeigen-bildschirm 512 | morgen sonne ix kommen 513 | sued schwach wehen ix maessig wehen 514 | ix morgen neunzehn grad region sieben zwanzig grad 515 | jetzt wetter wie-aussehen morgen sonntag siebte oktober 516 | morgen deutsch land ix tief kommen kuehl kommen 517 | mittwoch teil sonne teil wolke bleiben trocken 518 | nordost wieder wolke aber sonst nur bisschen wolke 519 | heute nacht plus drei region null zwischen leicht frost minus eins minus zwei 520 | -------------------------------------------------------------------------------- /data/baselines/phoenix_preprocessed/phoenix_test_glosses.txt: -------------------------------------------------------------------------------- 1 | REGEN SCHNEE REGION VERSCHWINDEN NORD REGEN KOENNEN REGION STERN KOENNEN SEHEN 2 | DONNERSTAG NORDWEST REGEN REGION SONNE WOLKE WECHSELHAFT DANN FREITAG AEHNLICH WETTER 3 | KRAEFTIG AB MORGEN FRUEH MEISTENS SCHNEE SCHNEIEN KALT REGEN 4 | WOCHENENDE SONNE SAMSTAG SCHOEN TEMPERATUR BIS SIEBZEHN GRAD REGION 5 | DEUTSCH LAND MORGEN HOCH DRUCK KOMMEN WOLKE AUFLOESEN 6 | SONNTAG NAECHSTE NORDWEST WOLKE SONNE WOLKE GEWITTER REGEN DABEI 7 | WAHRSCHEINLICH SCHAUER GEWITTER STARK 8 | IM-VERLAUF BLEIBEN KALT ENORM SCHNEE KOENNEN 9 | WOCHENENDE IX MEHR KALT 10 | MORGEN DANN HERBST MISCHUNG HOCH NEBEL WOLKE SONNE 11 | ABER IM-VERLAUF NEBEL HOCH NEBEL IX 12 | MORGEN LANG BLEIBEN 13 | DEUTSCH LAND SCHWACH DRUCK UNTERSCHIED 14 | REGION FEUCHT REGION IX GEWITTER REGION 15 | AEHNLICH WIE HEUTE SECHS ZWISCHEN ELF GRAD 16 | NORD NACHT ANFANG ENORM SCHAUER GEWITTER DANN WOLKE VERSCHWINDEN 17 | BIS ABEND IN-KOMMEND DANN KOMMEN NIEDERUNG 18 | JETZT WETTER VORAUSSAGE FUER MORGEN FREITAG FUENFZEHN OKTOBER 19 | NORD SEE MEHR WOLKE NORD MEISTENS REGEN 20 | HEUTE ABEND SUED BISSCHEN KLAR HIMMEL BISSCHEN NEBEL AUCH DABEI 21 | NORD NORDWEST MEISTENS REGEN AUCH MOEGLICH BISSCHEN GEWITTER 22 | MORGEN UEBERWIEGEND SONNE 23 | SAMSTAG SUEDOST REGEN NORD DANN WIND STARK SONST REGEN IX TEILWEISE AUCH SONNE DABEI 24 | DONNERSTAG SUEDOST WEITER WECHSELHAFT NORDWEST MEHR FREUNDLICH SONNE 25 | WEST NORDWEST VERSCHWINDEN 26 | MORGEN OST SUEDOST MISCHUNG SONNE WOLKE TEILWEISE REGEN GEWITTER 27 | TEMPERATUR NULL GRAD KALT NORD MINUS FUENF GRAD 28 | NAECHSTE WOCHE LUFT KOMMEN MEHR KUEHL 29 | DIENSTAG HAUPTSAECHLICH SONNE ABER WOLKE AUCH HABEN2 WECHSELHAFT MOEGLICH REGEN ODER GEWITTER 30 | SONNTAG NORD MITTE REGION REGEN NORD STURM 31 | SUED REGION BESSER 32 | DONNERSTAG EXTREM WETTER REGION TEMPERATUR UNTERSCHIED SECHS BIS ZWANZIG GRAD 33 | AUCH SAMSTAG REGEN SCHNEE SCHNEIEN IM-VERLAUF WEST NORDWEST MEHR FREUNDLICH 34 | SUEDWEST NULL OST MINUS SIEBEN MOEGLICH 35 | SUED REGION KOENNEN NACHT FROST BODEN 36 | TAG BERG SECHS GRAD IX REGION DREIZEHN GRAD REGION 37 | JETZT MORGEN WETTER WIE-AUSSEHEN MORGEN FUENFZEHN OKTOBER 38 | HEUTE NACHT PLUS VIER OST MINUS VIER REGION 39 | JETZT MORGEN WETTER WIE-AUSSEHEN DREIZEHN OKTOBER 40 | WEST FREUNDLICH 41 | AUCH DONNERSTAG 42 | FREITAG VIEL WOLKE BEWOELKT 43 | SUEDOST SCHNEE KOENNEN 44 | TAG OST VIEL SONNE WEST REGEN FLUSS REGION 45 | ZUERST GEWITTER NUR WEST RISIKO JEDEN-TAG OST MEHR OST KOENNEN GEWITTER WEST 46 | MORGEN VOR MITTAG NORD STARK WIND WEHEN SCHWACH 47 | OBWOHL PLUS SONST REGION FROST 48 | BESONDERS KALT SUED SUEDOST 49 | MORGEN WETTER WIE-AUSSEHEN SONNTAG ZWOELF JULI 50 | HEUTE NACHT SINKEN VIERZEHN BIS SIEBEN GRAD 51 | MORGEN KOENNEN SIEBZEHN REGION FUENF ZWANZIG REGION 52 | DIENSTAG MITTWOCH SONNE WOLKE WECHSELHAFT SCHAUER TYPISCH REGION REGEN GEWITTER KOENNEN 53 | JETZT WETTER VORAUS INFORMIEREN MORGEN DIENSTAG ERSTE FEBRUAR 54 | OST REGION ANFANG FREUNDLICH SPAETER NORDWEST AUCH SONNE SONST REGION WOLKE 55 | SCHAUER GEWITTER STARK KUEHL 56 | REGION TAGSUEBER DANN WOLKE DANN SUEDWEST GEWITTER KOENNEN 57 | WIND SCHWACH 58 | GUT SCHOEN ABEND MITTEILEN 59 | WEST NORDWEST IX SCHAUER IX 60 | WEHEN REGION FRISCH WIND SCHAUER IX 61 | MORGEN SAMSTAG FUENFTE DEZEMBER WIE-AUSSEHEN WETTER 62 | WETTER BISSCHEN RUHIG DANN MORGEN IX REGION TIEF KOMMEN 63 | WOLKE REGEN WENN BERG IX AUCH SCHNEE SCHNEIEN 64 | SONNTAG MEHR MILD VIEL WOLKE REGEN NORDWEST WIND 65 | MONTAG DIENSTAG WECHSELHAFT MAL AUCH SONNE 66 | HEUTE NACHT MEHR LOCKER WOLKE ODER KLAR STERN SEHEN NORDWEST WOLKE 67 | MORGEN TATSAECHLICH REGEN GEWITTER KOENNEN 68 | SAMSTAG MEHR FREUNDLICH TROCKEN MEHR WARM 69 | SONNTAG REGION REGEN GEWITTER KOMMEN 70 | IX MEER SCHWER STURM 71 | WOLKE DAS-IST-ES NACHT ZWEI BIS ACHT neg-HABEN FROST 72 | MORGEN WETTER WIE-AUSSEHEN ERSTE APRIL DONNERSTAG 73 | HEUTE NACHT TIEF KOMMEN AUCH KUEHL AUFZIEHEN MORGEN WECHSELHAFT WETTER 74 | FREITAG SONNE WOLKE WECHSELHAFT SCHAUER KOENNEN IX ABER SONNE LANG 75 | MISCHUNG NEBEL AUFLOESEN DANN WOLKE SONNE 76 | MONTAG ANFANG WECHSELHAFT MEHR KUEHL 77 | SCHON MORGEN DREISSIG GRAD SUED FRANKREICH AUCH WARM HIER DEUTSCH LAND SCHON SUEDWEST FUENF ZWANZIG GRAD 78 | DONNERSTAG MEHR SCHOEN MEHR WARM 79 | NACH MITTAG ABEND BISSCHEN REGEN NORD WEST 80 | SCHWACH NORD STURM WEHEN NORD SUED SCHWER WEHEN STURM 81 | DONNERSTAG WECHSELHAFT FREITAG WEST KOMMEN FREUNDLICH 82 | SCHWACH WEHEN BERG WEHEN NORD WEHEN IX WEHEN 83 | WIND SCHWACH VERSCHIEDEN WEHEN 84 | MONTAG WECHSELHAFT MAL SONNE WOLKE BESONDERS REGION SCHAUER GEWITTER 85 | WIND SCHWACH SUED WIND ZEIGEN-BILDSCHIRM 86 | SUEDWEST KOMMEN MEHR TROCKEN 87 | MORGEN ACHTZEHN NORD DANN SECHS ZWANZIG REGION 88 | WIND REGION 89 | NAECHSTE SONNTAG WIEDER SCHLECHTER WECHSELHAFT 90 | DANN REGEN OST REGION MILD FUENFZEHN SECHSZEHN 91 | JETZT WETTER VORAUS INFORMIEREN MORGEN DIENSTAG EINS ZWANZIG JUNI 92 | FLUSS MILD SECHSZEHN GRAD FLUSS NUR ACHT GRAD 93 | HOCH FLUSS WARM DREISSIG GRAD IX NORD FRISCH ACHTZEHN GRAD 94 | NORMAL KUEHL ANGENEHM JA DANN DONNERSTAG NORD REGEN STURM WEHEN KOENNEN 95 | MILD WEHEN ICH 96 | MORGEN WETTER WIE-AUSSEHEN DIENSTAG NEUNZEHN APRIL 97 | MORGEN ORT SCHAUER BESONDERS SUEDOST TATSAECHLICH GEWITTER HAUPTSAECHLICH REGEN UNWETTER MOEGLICH 98 | HEUTE NACHT UEBERWIEGEND REGION ORT REGEN 99 | NORDOST MEHR WOLKE REGEN 100 | FREITAG WENN NEBEN AUFLOESEN SONNE 101 | NORDWEST MORGEN ZWANZIG BIS DREI ZWANZIG GRAD REGION FUENF ZWANZIG BIS NEUN ZWANZIG GRAD 102 | TIEF KOMMEN MILD 103 | BODEN GEFRIEREN FLUSS IX BERUHIGEN PLUS STEIGEN 104 | TRUEB DIESE BILD 105 | WEST KAUM SCHNEE AUFTAUCHEN ABER AUSNAHME ACHTUNG MEER 106 | WEST MEHR MILD MINUS VIER BIS MINUS SIEBEN 107 | HALLO GUT ABEND LIEB IX ZUSCHAUER BEGRUESSEN 108 | MORGEN SUEDOST WIRKLICH WIE HEUTE UNGEFAEHR NORDWEST WOLKE MEHR IX 109 | IM-VERLAUF UMSTELLEN REDUZIEREN KUEHL BESONDERS SAMSTAG SONNTAG 110 | KOMMEN TIEF DRUCK DESHALB DEUTSCHLAND REGEN KUEHL REGEN 111 | ALPEN SUED NACHT SECHS MAXIMAL FUENFZEHN FLUSS 112 | AEHNLICH WETTER DONNERSTAG 113 | FREITAG SUEDWEST SONNE IM-VERLAUF 114 | SONST REGEN 115 | REGION MEHR FREUNDLICH HOCH DRUCK KOMMEN BIS REGION 116 | DIENSTAG WEST FREUNDLICH IX SCHAUER GEWITTER 117 | HOCH WASSER GEFAHR WETTER DIENST WARNUNG UNWETTER 118 | SUEDOST REGION VERSCHWINDEN LANGSAM IM-VERLAUF 119 | U IX MORGEN DREI FLUSS BIS DREI GRAD 120 | FREITAG SONNE WOLKE SUED ANFANG REGEN 121 | AUCH BISSCHEN SONNE MORGEN MEISTENS REGEN TAG IM-VERLAUF KOMMEN 122 | FLUSS REGION SCHAUER NORDWEST WARM KOMMEN 123 | IX NACHMITTAG KOMMEN REGEN VIERHUNDERT ACHTHUNDERT METER UEBER SCHNEE 124 | SUED OST NOCH REGEN BERG SCHNEE NORD REGION NACH MITTAG ANFANG REGEN 125 | JETZT WETTER WIE-AUSSEHEN MORGEN MITTWOCH ACHTE SEPTEMBER 126 | NORD FRISCH IX WEHEN IX WEHEN IM-VERLAUF SPAETER NORD STARK WEHEN 127 | DONNERSTAG BESONDERS SUED SUEDOST REGEN IX 128 | SONNTAG UEBERWIEGEND OST SUED SCHAUER GEWITTER REGION FREUNDLICH 129 | NAECHSTE WOCHE KUEHL ABWECHSELN WETTER 130 | MORGEN KUESTE REGION ZEHN GRAD BAYERN REGION ZWEI GRAD 131 | DANN NEU WOLKE KOMMEN STROEMEN NACH MITTAG KOENNEN REGEN SCHON WIND KOMMEN 132 | DEUTSCH LAND TIEF DRUCK KOMMEN IM-VERLAUF TAG BEWOELKT BISSCHEN REGEN SCHNEE SCHNEIEN 133 | HEUTE NACHT ODER FLUSS NOCH SCHNEE SCHNEIEN 134 | NORDOST MIT SCHNEE SCHNEIEN 135 | WIND SCHWACH MAESSIG UNTEN KOMMEN IX KOMMEN 136 | MORGEN SIEBEN FLUSS NUR TEIL MINUS EINS 137 | KALT LUFT BLEIBEN BIS FREITAG MINUS 138 | NORD WIND SCHWACH UNTERSCHIED SONST MAESSIG 139 | WENN BERG UNTEN BERG FRISCH WIND 140 | NAECHSTE ANFANG WOCHE WIE-IMMER SO 141 | WETTER WIE-AUSSEHEN MORGEN MONTAG ACHTZEHN APRIL 142 | SONNE BISSCHEN WOLKE NORDWEST NACHMITTAG BISSCHEN SCHAUER 143 | HEUTE NACHT KUESTE REGEN SUED AUCH IX LANGSAM AUFLOESEN 144 | NORD BISSCHEN REGEN SCHNEE HAGEL 145 | WOCHENENDE BLEIBEN TAUEN DAZU REGEN BLEIBEN 146 | HEUTE WETTER MORGEN SAMSTAG EINS ZWANZIG OKTOBER 147 | OST NEBEL neg-HABEN SONNE REGION 148 | WEST REGION IM-VERLAUF MORGEN WOLKE ABER BLEIBEN TROCKEN REGEN neg-HABEN 149 | SUED WOLKE KOMMEN BISSCHEN REGEN KOENNEN REGION KLAR LOCKER WOLKE 150 | NORDWEST ZONE NEBEL 151 | ZONE AUFLOESEN MORGEN MEISTENS SONNE 152 | REGION HOCH DRUCK KOMMEN SKANDINAVIEN KOMMEN DARUM KOMMEN FREUNDLICH 153 | OST SIEBEN GRAD FUENFZEHN FLUSS 154 | SAMSTAG VIEL SONNE BESONDERS ALPEN KUESTE WOLKE KOENNEN 155 | SUED BISSCHEN SCHAUER MOEGLICH 156 | WENN NEBEL TAG AUFLOESEN SONNE 157 | SUED REGION REGEN IX BISSCHEN WOLKE 158 | NORD WIND SCHWACH MAESSIG IX WEHEN SONST REGION VERSCHIEDEN WEHEN 159 | AUCH DABEI SCHNEE REGEN 160 | NORD TROCKEN IX 161 | MORGEN IX SCHNEE REGEN SCHNEE REGEN 162 | SAMSTAG BESSER 163 | UND DANN SONNTAG IX REGION KOMMEN KALT 164 | SCHOEN ABEND AUSRICHTEN 165 | TEIL AUCH KLAR 166 | SUED TATSAECHLICH UEBERWIEGEND GEWITTER 167 | HEUTE NACHT DREIZEHN ZWISCHEN ACHTZEHN GRAD SCHWUEL WARM 168 | REGION BESONDERS SUED BERG WARM GEWITTER 169 | SCHNEE AUCH FROST 170 | FUER HEUTE WETTER BESSER RUHIG 171 | SAMSTAG TEIL SCHNEE BISSCHEN NORD REGION KLAR HIMMEL 172 | HEUTE NACHT BESONDERS REGION BADEN W BIS SACHSEN IX SONST REGION IX SCHNEE SCHNEIEN SCHAUER 173 | VORSICHT poss-SEIN ACHTUNG STRASSE GLATT 174 | HEUTE NACHT NOCH KALT HAUPTSAECHLICH MITTE BERG REGION 175 | MORGEN FRUEH WAHRSCHEINLICH SUED REGION MOEGLICH SCHNEE 176 | FREITAG LANGSAM SINKEN TEMPERATUR SINKEN WEST OST REGEN 177 | SAMSTAG SONNTAG KUEHL HERBST SO IN-KOMMEND 178 | SCHOEN ABEND TSCHUESS 179 | NORD SEE HOCH DEUTSCH LAND KOMMEN 180 | AUCH SAMSTAG SONNTAG VIEL SONNE DANN TEMPERATUR STEIGEN 181 | TAG OST SECHSZEHN MAXIMAL SIEBEN ZWANZIG GRAD FLUSS 182 | WIND SCHWACH UNTERSCHIED KOMMEN 183 | IX AUCH FRISCH IX KOMMEN 184 | MORGEN SPANIEN KOMMEN DANN FREITAG HAUPTSAECHLICH SCHNEE 185 | BESONDERS NORD SUEDWEST HEUTE NACHT KOENNEN SCHNEE 186 | SCHOEN ABEND poss-EUCH MACHEN GUT 187 | NACHT ZWOELF KOELN REGION EINS REGION IX 188 | AM-TAG ELF VOGEL LAND 189 | HEUTE NACHT BESONDERS REGION KOMMEN REGEN REGION REGEN 190 | TAG SAUER LAND VIER REGION ZWOELF GRAD 191 | NEUNZEHN GRAD NORD SECHS ZWANZIG THUERINGEN SACHSEN TAG KLAR 192 | HEUTE WETTER MORGEN MITTWOCH SIEBEN ZWANZIG JANUAR 193 | MORGEN ERWARTEN NOCHEINMAL RUHIG WETTER IX TROCKEN WINTER 194 | WENN NEBEL VERSCHWINDEN SUED MORGEN SONNE WOLKE KOMMEN ABER WOLKE BEWEGEN 195 | DEUTSCH HIER LAND SUEDOST HOCH DRUCK FREUNDLICH 196 | NORD OST DEUTSCHLAND MORGEN DIESE LOS KOMMEN DESHALB SONNE 197 | HIER NACHT HAUPTSAECHLICH NORDWEST SCHAUER GEWITTER HEFTIG REGEN MOEGLICH 198 | GUT ABEND LIEB DU ZUSCHAUER 199 | EIN-PAAR STUNDE NOCH FUENF ZENTIMETER HOEHE SCHNEE 200 | OST SUED BISSCHEN SCHAUER BIS ZWISCHEN-MITTE SCHNEE TEIL NEBEL WOLKE ODER SONNE 201 | MITTWOCH KOMMEN REGEN REGION 202 | KOMMEN MISCHUNG NEBEL WOLKE SONNE 203 | FLUSS WEST UND NORD MEHR TROCKEN 204 | ABER STARK WOLKE HIMMEL KOENNEN NEBEL TEILWEISE SOLL SONNE DABEI 205 | MEHR FREUNDLICH MEHR 206 | HEUTE NACHT WAHRSCHEINLICH REGEN NORD 207 | SUED WIND SCHWACH MAESSIG WEHEN FRISCH STARK BOEE 208 | FREITAG RUHIG WETTER BESONDERS NORD FREUNDLICH GLEICH SAMSTAG AUCH NUR NORD BISSCHEN SCHNEE SCHNEIEN UND NIESELREGEN FROST 209 | LIEB ZUSCHAUER GUT ABEND 210 | WETTER VERAENDERN ENORM GESTERN ORKAN STURM ORKAN 211 | NAECHSTE REGEN AB DONNERSTAG WAHRSCHEINLICH 212 | REGION HEUTE NACHT STURM 213 | MORGEN LEICHT MAESSIG WIND NORDWEST FRISCH WEHEN 214 | SCHOEN ABEND NOCH IHR 215 | AUCH TAG VIEL SONNE SPAETER IX QUELL WOLKE 216 | MITTWOCH DONNERSTAG NORD WIND BLEIBEN TEIL REGEN 217 | VON-UNTEN NACH-NORD MEHR FREUNDLICH 218 | GUT ABEND BEGRUESSEN 219 | JETZT NACHT KOMMEN FROST 220 | JETZT WETTER WIE-AUSSEHEN MORGEN DIENSTAG FUENF ZWANZIG MAI 221 | MORGEN WETTER WIE-AUSSEHEN DONNERSTAG SIEBEN ZWANZIG AUGUST 222 | SAMSTAG KUEHL WENIGER NORD STARK WIND 223 | AB SONNTAG TEMPERATUR STEIGEN SONNE LANG 224 | MORGEN KOENNEN REGEN GEWITTER UNWETTER KOENNEN 225 | OST SUEDOST NACHT ANFANG NOCH REGEN HAGEL 226 | NORDOST HEUTE NACHT TROCKEN IN-KOMMEND REGEN NORDWEST REGEN 227 | NORD IX SCHNEE KOENNEN 228 | HEUTE NACHT MEHR KLAR STERN KOENNEN SEHEN LEICHT WOLKE BESONDERS NAH FLUSS MITTE SUED REGION NEBEL QUELL WOLKE 229 | MORGEN WETTER WIE-AUSSEHEN FREITAG ACHT ZWANZIG AUGUST 230 | SCHOTTLAND WOLKE TIEF NORWEGEN 231 | WOLKE NAEHERN DEUTSCH LAND KUEHL KOMMEN 232 | SKANDINAVIEN IX HOCH MEHR KOMMEN 233 | FLUSS BIS L REGION WOLKE SONST KLAR LOCKER REGION 234 | ABER NACHT MEHR WOLKE 235 | MITTE MEER TIEF KOMMEN NORD KOMMEN MORGEN FAST REGION WOLKE HIMMEL 236 | NORD MORGEN MUESSEN TROCKEN DANN REGION REGEN VIEL 237 | BAYERN SACHSEN IX SCHAUER GEWITTER AUCH EIN-PAAR IX KOENNEN SEHEN HIMMEL 238 | NORD REGEN 239 | WOCHENENDE MEHR WARM WETTER WECHSELHAFT GEWITTER UND SONNE DABEI 240 | MORGEN REGEN KOMMEN WEST KOMMEN SPEZIELL BADEN WUERTTEMBERG BAYERN REGION 241 | JETZT WETTER WIE-AUSSEHEN MORGEN SAMSTAG ZWEITE APRIL 242 | FLUSS NORDOST HEUTE ABEND NOCH WOLKE KOENNEN REGEN SUEDOST 243 | MONTAG UEBERALL WECHSELHAFT ABER KUEHL 244 | AB DIENSTAG IN-KOMMEND LANGSAM WIEDER ZURUECK FREUNDLICH WARM 245 | A REGION WETTER BIS SUED DEUTSCHLAND KOMMEN 246 | GUT FREUNDLICH SONNE GUT 247 | SAMSTAG HAUPTSAECHLICH MEHR WOLKE SONNE WENIG IX SUEDOST REGEN KOENNEN SUEDWEST BISSCHEN SCHAUER 248 | WIND MAESSIG FRISCH STARK STURM BERG SCHWER STURM SUEDOST SCHWACH WIND 249 | MONTAG HEFTIG REGEN NORDOST REGEN AUCH DAZU WIND REGION 250 | WETTER WIE-AUSSEHEN poss-MEIN SAMSTAG ZWOELF DEZEMBER 251 | TEILWEISE REGEN KOMMEN IX 252 | NORDWEST VERSCHWINDEN NORD KOENNEN BISSCHEN GEWITTER 253 | WIND HEUTE NACHT WEHEN NORD STURM KOENNEN STURM BERG STURM ORKAN 254 | OST SEE TIEF DRUCK ZONE NORD NOCH SCHNEE SCHNEIEN 255 | WOCHENENDE HAUPTSAECHLICH SONNE HIMMEL SCHOEN MEHR WARM 256 | MONTAG MOEGLICH REGEN GEWITTER MEHR WOLKE REGION ABER BLEIBEN WARM SONNE GUT 257 | DAZU IX WIND WEHEN LEICHT 258 | JETZT WIE-AUSSEHEN WETTER MORGEN FREITAG ZWANZIG NOVEMBER 259 | SUED WIND NUR SCHWACH NORD WEHEN BISSCHEN WEHEN KUESTE STARK STURM WEHEN DAS-WAR-ES 260 | ABER REGION WECHSELHAFT SUEDOST WECHSELHAFT GRUND IX UNGARN IX WECHSELHAFT TIEF KOMMEN 261 | LUFT KALT FEUCHT DARUM KOMMEN DEUTSCHLAND EINFLUSS 262 | KOMMEN KRAEFTIG WAS WOCHENENDE VIEL SONNE TEMPERATUR STEIGEN 263 | AUCH ABEND ZWISCHEN NACHT IM-VERLAUF DANN REGEN REGION REGEN VERSCHWINDEN 264 | DANN REGION WOLKE KLAR IX NEBEL 265 | MORGEN REGION SONNE IX WOLKE BEWOELKT 266 | SUED REGION BESONDERS BAYERN WALD BIS ALPEN DANN REGEN NACH MITTAG KOENNEN 267 | AUCH DEUTSCH WETTER DIENST SCHON WARNUNG UNWETTER KOENNEN 268 | MONTAG ABEND BEWOELKT HIER 269 | NACHT HIMMEL KLAR 270 | DIENSTAG BESONDERS OST MEHR FREUNDLICH LANG ABER AUCH DABEI SCHAUER GEWITTER 271 | NACHT NORD NORDOST WOLKE OST REGION MOEGLICH IX REGEN 272 | SONST REGION WOLKE LOCKER 273 | DOCH WOLKE ABER REGEN WENIG 274 | MORGEN NEUN GRAD IX MAXIMAL SIEBZEHN GRAD REGION 275 | MONTAG ANFANG AB LOS WECHSELHAFT KUEHL 276 | TAG REGION SONNE SUEDWEST BISSCHEN WOLKE 277 | IX SCHLECHT BODEN FROST MOEGLICH 278 | SUED WIND MAESSIG NORD WIND STARK EIN-PAAR WIND NORD MEER WIE ORKAN MOEGLICH 279 | SEHEN KREISEN REGEN KOMMEN neg-HABEN neg-HABEN neg-HABEN 280 | MORGEN SCHAUER NICHT VIEL SONNE MEISTENS MENSCHEN FROH 281 | REGION SECHS GRAD REGION MINUS EINS BIS FUENF GRAD 282 | JETZT WETTER WIE-AUSSEHEN MORGEN DONNERSTAG DRITTE DEZEMBER 283 | REGION SUEDOST HAUPTSAECHLICH BEWOELKT TROCKEN SONNE WOLKE 284 | SUEDOST LOCKER NACHT KOENNEN GEWITTER 285 | NACHT STURM 286 | NAH TIEF LUFT DRUCK STARK UNTERSCHIED DESHALB TEIL WIND 287 | HOCH KOMMEN DANN IN-KOMMEND EINFLUSS HIER WETTER 288 | DARUNTER NEBEL LANG IN-KOMMEND DANEBEN SONNE BERG OBEN DANN DURCHGEHEND SONNE 289 | JETZT WETTER WIE-AUSSEHEN MORGEN FREITAG ACHTE OKTOBER 290 | BESONDERS IX NORD HEUTE NACHT MEISTENS WOLKE WAHRSCHEINLICH REGEN 291 | SUED VIEL NEBEL HOCH NEBEL MORGEN STARK NEBEL 292 | HEUTE NACHT ALLGAEU IX NORD VIER GRAD FLUSS DANN NORD DREIZEHN 293 | RUHIG TROCKEN FREUNDLICH NAECHSTE BLEIBEN 294 | FREITAG SUEDWEST SCHNEE REGEN TIEF WEST AUCH HABEN2 REGEN 295 | GUT ABEND LIEB ZUSCHAUER BEGRUESSEN 296 | MORGEN TAG TRUEB 297 | WIND ZEIGEN-BILDSCHIRM SCHWACH MAESSIG 298 | NORD WIND KOENNEN 299 | MORGEN OST ZEHN BIS DREIZEHN WEST BIS SIEBZEHN GRAD 300 | SAMSTAG WECHSELHAFT 301 | BESONDERS FREUNDLICH NORDOST BISSCHEN BEREICH 302 | SONNTAG REGEN TEIL GEWITTER 303 | SUEDOST DURCH REGEN 304 | IN-KOMMEND TIEF AUFZIEHEN WETTER WECHSELHAFT TEMPERATUR REDUZIEREN 305 | BEREICH SUED MEHR FREUNDLICH 306 | SONST VIEL WOLKE NORD KOMMEN SCHAUER GEWITTER KOENNEN 307 | HEUTE REGION SCHWACH MAESSIG WIND ZEIGEN-BILDSCHIRM 308 | ZEHN ELF ZWISCHEN SONST REGION ZWEI ZWISCHEN NEUN 309 | SUED SONNTAG OFT SONNE SONST REGION VIEL WOLKE ORT REGEN 310 | DEUTSCH LAND KOMMEN KUEHL HEISS GETRENNT WARMFRONT 311 | DEUTSCH LAND MORGEN HOCH DRUCK KOMMEN SONNE TROCKEN 312 | REGION IX KUEHL FUENFZEHN SECHSZEHN DREI ZWANZIG BIS SECHS ZWANZIG GRAD 313 | NORDOST BLEIBEN TROCKEN 314 | SAMSTAG SCHNEE WENIG REGION MANCHMAL JA 315 | AUCH SONNE MOEGLICH 316 | SAMSTAG NORD WIND 317 | NAECHSTE WOCHE GLEICH WEITER SO 318 | NORD TATSAECHLICH WOLKE MORGEN BISSCHEN REGEN 319 | HEUTE NACHT NORD NORDOST IX REGEN 320 | MORGEN UEBERWIEGEND BEWOELKT NEBEL AUCH SUED IX SONNE 321 | NORDOST BEWOELKT IX REGEN 322 | REGION SICHER GEFRIEREN LAGE 323 | MORGEN NORD ACHT SUEDWEST SIEBZEHN MAXIMAL 324 | DIENSTAG HAUPTSAECHLICH SONNE NORDOST WOLKE MOEGLICH REGEN 325 | WETTER MORGEN SIE DIENSTAG VIERZEHN SEPTEMBER 326 | WOCHENENDE VIEL REGEN negalp-AUCH negalp-AUCH 327 | GUT ABEND LIEB ZUSCHAUER 328 | WIE-AUSSEHEN IN-KOMMEND 329 | MITTWOCH NORD REGEN SUED MEHR FREUNDLICH 330 | REGION KOMMEN STARK DANN VIEL SONNE 331 | JETZT MORGEN WETTER WIE-AUSSEHEN ZEIGEN-BILDSCHIRM DONNERSTAG DRITTE MAERZ 332 | HEUTE NACHT VIERZEHN REGION OST NUR SECHS GRAD 333 | MORGEN DREIZEHN REGION SONST FUENFZEHN BIS ZWEI ZWANZIG GRAD 334 | NACHT SCHNEE LEICHT KUESTE TIEF SUED REGEN DABEI 335 | SONNTAG VIEL WOLKE IX REGEN IX UND SCHNEE BERG KOENNEN SCHNEE 336 | JETZT WIE-AUSSEHEN WETTER MORGEN SONNTAG FUENFTE DEZEMBER 337 | HEUTE NACHT STERN SEHEN MEISTENS NEBEL AUCH 338 | NORDWEST SCHAUER STURM KOMMEN 339 | ABEND STURM BERG ORKAN MOEGLICH 340 | TEMPERATUR WIE-IMMER 341 | NORDWEST FREUNDLICH 342 | WIND ZEIGEN-BILDSCHIRM WIND WEHEN WIND KOENNEN OST REGION HOCH STURM KOENNEN 343 | HEUTE NACHT SELTEN TATSAECHLICH KOMMEN KUESTE 344 | SUED WAHRSCHEINLICH WOLKE KLAR 345 | MORGEN FRUEH IX MOEGLICH NEBEL 346 | MORGEN IX NORDOST WOLKE UEBERWIEGEND SCHAUER 347 | HEUTE ABEND SUED REGION NOCH REGEN GEWITTER REGION KLAR HIMMEL BISSCHEN WOLKE 348 | MORGEN NORD WOLKE SONNE WECHSELHAFT MOEGLICH SCHAUER GEWITTER 349 | ES-BEDEUTET WIND WEHEN ABER HAUPTSAECHLICH SCHWACH MAESSIG WEHEN 350 | MORGEN NORD FUENFZEHN GRAD REGION FLUSS VIER ZWANZIG GRAD MOEGLICH 351 | SONNTAG BLEIBEN SO 352 | IN-KOMMEND WETTER WIE-AUSSEHEN MORGEN SAMSTAG ACHTZEHN JULI 353 | KOMMEN KALT LUFT SO DESHALB WETTER WECHSELHAFT 354 | OST SUED HEUTE ABEND UEBERWIEGEND REGEN STARK GEWITTER 355 | DEUTSCH WETTER DIENST SAGEN WARNUNG 356 | BESONDERS SUEDWEST WEHEN 357 | JETZT INFORMIEREN WETTER MORGEN MONTAG ACHT ZWANZIG NOVEMBER 358 | MORGEN SUED DAUER NEBEL NUR ZWEI MAXIMAL ELF 359 | SONNTAG MONTAG BLEIBEN SO MEHR KUEHL AUCH WECHSELHAFT 360 | HEUTE NACHT SIEBEN MAXIMAL VIERZEHN TAG SUED ZWEI ZWANZIG GRAD REGION ZWEI ZWANZIG GRAD 361 | SAMSTAG SUED FREUNDLICH NORD EINIGE SCHAUER 362 | IN-KOMMEND REGION TIEF DRUCK ENORM LUFT BLEIBEN 363 | S+H VOR POMMERN UND BRAND BURG MORGEN DURCHGEHEND REGEN 364 | SAMSTAG IX NOCH BISSCHEN REGEN SONST REGION FREUNDLICH TROCKEN 365 | KUESTE IX DREISSIG GRAD 366 | MORGEN WIND WEHEN SCHWACH NORD UEBERWIEGEND WIND 367 | HEUTE NACHT VIERZEHN IX UNTEN ALPEN VIER DANN 368 | AUCH SO WEITER MITTWOCH 369 | ABER DONNERSTAG HEISS ZURUECK SUED DARUM NORD REGEN KUEHL 370 | MORGEN WETTER WIE-AUSSEHEN FREITAG NEUN OKTOBER 371 | NORD HEUTE NACHT WIND 372 | MORGEN SCHWACH MAESSIG WEHEN 373 | SAMSTAG DANN REGEN KOMMEN 374 | OST ERSTMAL FREUNDLICH 375 | WEST KOMMEN LOCH SONNE DA 376 | MITTE BERG VIER NORDWEST ZWOELF GRAD WOLKE 377 | OST MEISTENS SONNE 378 | MONTAG IN-KOMMEND AUCH SONNE ABER SCHWER GEWITTER DABEI 379 | SONST NUR BISSCHEN REGEN ABER REGION RECHNEN neg-HABEN 380 | IHR SCHOEN ABEND 381 | MORGEN IX MEISTENS WOLKE 382 | REGION BERG IX BISSCHEN SCHNEE SCHNEIEN MOEGLICH 383 | MORGEN TEMPERATUR VOGEL LAND MAXIMAL NEUN GRAD 384 | SUEDOST DEUTSCH LAND BLEIBEN LANG IM-VERLAUF GUT IM-VERLAUF MOEGLICH GEWITTER 385 | NORDWEST MORGEN WECHSEL SONNE WOLKE DAZU STARK REGEN NACH MITTAG GEWITTER 386 | DONNERSTAG FREITAG WETTER BLEIBEN 387 | HEUTE FEUCHT WARM HEISS ENORM MOEGLICH GEWITTER AUCH STARK 388 | TIEF O+P+H+E+L+I+A KALT KOMMEN MITTE EUROPA 389 | BERG SCHON SCHNEE 390 | KUEHL NAECHSTE BESSER SONNE KOMMEN DANN WARM 391 | JETZT SCHOEN ABEND MITTEILEN 392 | JETZT WIE-AUSSEHEN WETTER MORGEN DONNERSTAG NEUNZEHN NOVEMBER 393 | BISSCHEN WEHEN TEMPERATUR ALPEN IX KOENNEN BIS ZEHN GRAD 394 | VIEL WASSER STROEMEN KOENNEN UEBERSCHWEMMUNG 395 | MORGEN SUEDOST WOLKE HAUPTSAECHLICH ALPEN MOEGLICH REGEN 396 | HEUTE NACHT ACHT BIS ZWEI GRAD KLAR HIMMEL MOEGLICH BODEN FROST 397 | HEUTE-NACHT STERN HABEN BISSCHEN FROST MOEGLICH SONST NULL BIS VIER GRAD 398 | MITTWOCH DONNERSTAG WECHSELHAFT BISSCHEN REGEN SCHNEE MEHR TIEF SCHNEE HABEN 399 | SCHOTTLAND REGION UND SUED EUROPA SUED REGION DAZWISCHEN MORGEN LUFT MILD KOMMEN 400 | IX ENORM WARM IN-KOMMEND 401 | ABER BISSCHEN KUEHL REDUZIEREN 402 | HEUTE NACHT BESONDERS NORD TAG NORDWEST WIND 403 | NORD AUCH SCHWER WIND 404 | BERG ORKAN MOEGLICH 405 | HEUTE NACHT NORD REGION ELF GRAD ALPEN EINS GRAD 406 | NACHMITTAG MITTE REGION ZEHN GRAD SUED SECHSZEHN GRAD 407 | DONNERSTAG BESONDERS NORDWEST REGEN STURM KOENNEN 408 | IX AUCH GEWITTER 409 | SUEDOST SONNE DABEI 410 | WEST REGION REGEN BERG SCHNEE SCHAUER DABEI 411 | HEUTE NACHT NORD MEISTENS WOLKE BESONDERS REGION IX U IX SCHAUER 412 | NORDWEST HAUPTSAECHLICH TROCKEN MANCHMAL WOLKE SONNE TEIL NEBEL 413 | MORGEN SUEDOST TEIL REGEN MOEGLICH SCHNEE 414 | NORD MEHR GUT MANCHMAL WOLKE TROCKEN 415 | WIND SCHWACH MAESSIG WEHEN 416 | MITTWOCH MISCHUNG WOLKE NEBEL NORDWEST BISSCHEN SCHAUER REGION TROCKEN 417 | WEST HIMMEL STERN KOENNEN SEHEN ABER negalp-STIMMT MORGEN WIEDER REGEN 418 | ABER WEST WOLKE DICK IX ANFANG REGEN 419 | BERG ANFANG IX SCHNEE AUCH 420 | NORDWEST REGEN KOMMEN 421 | MONTAG FAST UEBERALL SONNE MEER BERG IX MEHR WOLKE ABER NUR BISSCHEN ORT REGEN 422 | JETZT SCHOEN ABEND TSCHUESS 423 | WIND MAESSIG IX STARK IX WEHEN 424 | IX AUCH STURM 425 | IX MORGEN ZWEI ZWANZIG GRAD 426 | NORD NUR SECHSZEHN GRAD 427 | SONNTAG NORD WOLKE IX SCHAUER 428 | SONST REGION VIEL SONNE 429 | DIENSTAG ABEND IX WOLKE SCHAUER GEWITTER 430 | RUSSLAND IX TROCKEN HEISS SCHEINEN FUENF DREISSIG BIS VIERZIG GRAD 431 | DIESE BLEIBEN BRAND WEITER 432 | HIER HEUTE NACHT SUEDOST FRISCH ZEHN ELF GRAD 433 | JETZT WETTER MORGEN DONNERSTAG SIEBZEHN DEZEMBER 434 | TAG AUCH SCHEINEN 435 | IX WEST IX SCHNEE SCHEINEN MOEGLICH GLATT 436 | MITTE MAL KLAR HIMMEL 437 | TEMPERATUR REGEN MEHR KUEHL SONST GUT 438 | DAZU LUFT ENORM WARM FEUCHT KOENNEN GEWITTER 439 | DEUTSCH WETTER DIENST BEKANNTGEBEN MOEGLICH GEWITTER KOMMEN 440 | MORGEN VOR MITTAG REGEN OST REGION REGEN BRAND BURG REGEN VOR POMMERN OST 441 | ZWANZIG GRAD IN-KOMMEND 442 | GRUND HOCH TIEF WIEDER UND SUED REGION LUFT FEUCHT WARM SUED REGION SONNE 443 | ABEND GEWITTER KOENNEN 444 | JETZT WIE-AUSSEHEN MORGEN DONNERSTAG ACHTE APRIL WETTER 445 | SCHOEN ABEND poss-EUCH 446 | FLUSS A SUED SONNE STRAHLEN AUCH SUED 447 | HIER AUCH ICH HIER SCHAU-MAL ZEIGEN-BILDSCHIRM 448 | ABER SAMSTAG SONNTAG 449 | IN-KOMMEND HIER NACHT BAYERN HIER WALD BISSCHEN REGEN 450 | SONST HIMMEL SEHEN STERN NEBEL 451 | TEMPERATUR DREIZEHN ZWISCHEN FUENF GRAD 452 | MORGEN IX SIEBZEHN GRAD 453 | NEU WOCHE WECHSELHAFT 454 | SCHOEN ABEND MITTEILEN 455 | JETZT WETTER WIE-AUSSEHEN MORGEN SONNTAG NEUNZEHNTE DEZEMBER 456 | IX TEIL REGEN GEFRIEREN 457 | ZUERST SCHWACH WEHEN IX WEHEN IX WEHEN 458 | IX SCHON WARNUNG DEUTSCH WETTER DIENST STURM KOENNEN 459 | MORGEN NORD NEUN GRAD SUED ACHTZEHN GRAD 460 | MITTWOCH NORDWEST KOMMEN REGEN SCHAUER TEIL GEWITTER 461 | EIN-PAAR-TAGE BLEIBEN SO WECHSELHAFT 462 | SOMMER TEMPERATUR SELTEN 463 | SONNTAG NORD ALPEN IX SONNE WOLKE SCHAUER SONST REGION FREUNDLICH 464 | TAG GANZTAGS MEHR STARK WOLKE ODER NEBEL SONNE KAUM 465 | SONNTAG AB MEER KOMMEN BISSCHEN MEHR MILD KOMMEN 466 | DIENSTAG SUED SCHAUER TEIL AUCH GEWITTER NORD FREUNDLICH 467 | MORGEN GEWITTER TEIL HAGEL STURM NACHT KOMMEN NORD LANG REGEN 468 | WEST SCHNEE REGEN GLATT 469 | IN-KOMMEND DANN WECHSELHAFT STARK MILD 470 | WEHEN SCHWACH REGION FRISCH 471 | HEUTE NACHT ZWOELF GRAD REGION EINS GRAD BAYERN WALD REGION 472 | HEISS ZWANZIG BIS ACHT ZWANZIG GRAD NORD WENIGER 473 | SO MANCHMAL ENORM SCHNELL OB SCHOEN SELBST LEUTE MUESSEN ENTSCHEIDUNG GEBEN 474 | SCHOEN GUT ABEND poss-EUCH 475 | BISSCHEN WARM KALT WARM KALT SO WETTER WECHSELHAFT neg-IN-KOMMEND WIE-IMMER WIE-IMMER 476 | JETZT WETTER WIE-AUSSEHEN MORGEN SAMSTAG EINS ZWANZIG NOVEMBER 477 | TIEF WIE-AUSSEHEN KOMMEN NORD HEUTE NACHT BISSCHEN REGEN DEUTSCH LAND 478 | SONST HOCH DRUCK TROCKEN TEIL FREUNDLICH MORGEN 479 | TAL NEBEL 480 | MANCHMAL MORGEN LANG DAUER NEBEL WOLKE ABER TROCKEN 481 | NACH MITTAG MEHR FREUNDLICH 482 | TEIL WIND MEHR KUEHL AUCH 483 | ABER HIER SO HIER HERBST MILD 484 | LIEB ZUSCHAUER BEGRUESSEN GUT ABEND 485 | OST SONNE MEHR 486 | MITTWOCH MEISTENS NACHMITTAG SCHAUER GEWITTER 487 | GLEICH WETTER AUCH DONNERSTAG 488 | MORGEN BIS NACH MITTAG OST SONNE 489 | DAZU WOLKE REGION KOMMEN 490 | MITTWOCH NUR REST SCHAUER GEWITTER REGION 491 | DONNERSTAG MITTAG FREUNDLICH NORD REGEN SUED REGEN 492 | WEST FUENF C+M NEU SCHNEE HOCH SCHON AUTOBAHN LAHM AUTO 493 | ABER FREUEN 494 | MORGEN SONNE 495 | SCHOTTLAND TIEF KOMMEN MORGEN REGION 496 | BAYERN SUED WARNUNG DEUTSCH IX WETTER DIENST NACHT SUED ENORM GEWITTER 497 | MORGEN WETTER WIE-AUSSEHEN FREITAG VIER ZWANZIG JULI 498 | HEUTE DRUCK ENORM MEER KOMMEN VERSCHWINDEN KOENNEN 499 | DABEI STURM GEWITTER 500 | AUCH DRESDEN REGION REGEN KOENNEN 501 | BESONDERS OST DEUTSCH LAND MEHR REGEN ODER SCHNEE 502 | HEUTE NACHT SUED ANFANG BISSCHEN GEWITTER IX SONST REGION REGEN IX KOENNEN AUCH NEBEL 503 | SPAETER BISSCHEN MEHR TROCKEN REGION 504 | ABEND LIEB ZUSCHAUER poss-EUCH 505 | EUROPA REGION WETTER UNTERSCHIED 506 | HEUTE ABEND OST REGION REGEN GEWITTER KOENNEN WIND REGEN 507 | ANKLICKEN TEXT ODER INTERNET ANSCHAUEN KOENNEN 508 | DANN BIS VIER ZWANZIG GRAD REGION 509 | SUED REGION BIS SIEBEN ZWANZIG GRAD 510 | E REGION IN-KOMMEND ZWEI-TAG WETTER STARK TIEF KOMMEN 511 | NORD HEUTE NACHT MINUS ZWEI BERG BIS MINUS FUENFZEHN GRAD 512 | FREITAG MEHR RUHIG 513 | REGION VIEL SONNE BISSCHEN WOLKE 514 | SUEDOST MORGEN BEWOELKT VIEL SCHNEE SCHNEIEN 515 | HEUTE WIEDER IN-KOMMEND SCHNEE UEBER DREIHUNDERT METER NACH MITTAG REGEN KOMMEN BERLIN IX 516 | JETZT WETTER VORAUS INFORMIEREN MORGEN MITTWOCH NEUNZEHN JANUAR 517 | SONNE SELTEN NUR WOLKE HAUPTSAECHLICH 518 | SUED AUCH VIEL WOLKE ODER NEBEL ABER REGEN SUED KAUM 519 | BODEN SEE MOEGLICH FLACH AUCH SCHNEE 520 | SUEDOST REGION NORD SEE NOCH TROCKEN 521 | MUESSEN AUSHALTEN REGEN GEWITTER BESONDERS SUEDOST STURM STARK KOENNEN 522 | DEUTSCH WETTER DIENST SCHON WARNUNG EINIGE GEWESEN 523 | HEUTE ABEND TEMPERATUR ZEHN REGION BIS ACHTZEHN REGION 524 | IX KOENNEN SONNE 525 | JETZT WETTER WIE-AUSSEHEN MORGEN DONNERSTAG EINS DREISSIG MAERZ 526 | TAG NORDOST ZWOELF SUED BAYERN IX MAXIMAL ZWANZIG GRAD 527 | MONTAG AUCH MEHR WOLKE ALS SONNE UEBERWIEGEND REGEN UEBERWIEGEND GEWITTER 528 | DAZWISCHEN FREUNDLICH 529 | WENN neg-HABEN GEWITTER SCHWACH WEHEN KUESTE WIND 530 | SAMSTAG SONNTAG GLEICH IX 531 | BISSCHEN SCHNEE IN-KOMMEND SACHSEN ODER BERG REGION BAYERN REGION MOEGLICH SCHNEE 532 | SAMSTAG KALT MINUS ZEHN TEMPERATUR 533 | NORD REGEN NACHT VERSCHWINDEN ALPEN REGEN KOENNEN IX NEBEL 534 | JETZT MORGEN WETTER WIE-AUSSEHEN FREITAG FUENF ZWANZIG JUNI 535 | MONTAG WOLKE MAL REGEN 536 | MEER SCHNEE SCHNEIEN DANN ALPEN REGEN SCHNEE SCHNEIEN 537 | DIENSTAG WECHSELHAFT 538 | SUEDWEST NEBEL NORDOST AUFLOESEN 539 | ALPEN SCHNEE 540 | WIND SCHWACH WEHEN 541 | MORGEN TEMPERATUR ZWEI ZWANZIG GRAD NORD SEE IX ZWEI DREISSIG GRAD FLUSS 542 | GUT ABEND LIEB ZUSCHAUER BEGRUESSEN 543 | SAMSTAG MEISTENS FREUNDLICH REGION TROCKEN 544 | BEWOELKT SCHAUER NUR NORDWEST 545 | AUCH REGEN KOENNEN 546 | TAG MEHR WOLKE ODER NEBEL 547 | HEUTE NACHT ELF GRAD SUED BAYERN EINS GRAD NORD 548 | DEUTSCH LAND IRLAND UND MITTE 549 | REGION HOCH SCHWUEL HEISS KOMMEN REGION MAESSIG WARM 550 | GRENZE TEILWEISE STARK GEWITTER REGEN 551 | HEUTE NACHT RHEINLAND-PFALZ IX BADEN WUERTTEMBERG BIS REGION THUERINGEN REGEN 552 | FREITAG NAH KUESTE SUED WAHRSCHEINLICH STARK WOLKE 553 | SONST REGION FREUNDLICH 554 | ABER REST REGION FREUNDLICH 555 | PLOETZLICH IX GEWITTER KOENNEN WIE UNWETTER 556 | HEUTE NACHT IX NORDWEST REGEN KOMMEN REGION 557 | JETZT MORGEN WETTER WIE-AUSSEHEN DONNERSTAG SECHS ZWANZIG NOVEMBER 558 | REGION KOMMEN BISSCHEN LUFT neg-HABEN MILD 559 | FREITAG REGEN WECHSELHAFT 560 | NORDWEST KOENNEN GEWITTER 561 | MORGEN SO NORD GUT SONNE VIEL BESONDERS KUESTE VIEL SONNE 562 | SUEDWEST ZUERST GUT REGION HAUPTSAECHLICH REGEN 563 | AB FREITAG MEHR SCHNEE 564 | WOCHENENDE AUCH IX SCHNEE KOENNEN 565 | BLEIBEN WIND 566 | WIND KALT DIENSTAG REGEN SCHNEE GRAUPEL 567 | IX REGEN LANG 568 | JETZT WIE-AUSSEHEN WETTER MORGEN SAMSTAG SECHS ZWANZIG JANUAR 569 | JETZT WETTER WIE-AUSSEHEN MORGEN MONTAG VIER ZWANZIG JANUAR ZWEITAUSEND ELF 570 | LIEB ZUSCHAUER GUT ABEND 571 | NORD FLUSS MINUS EINS FLUSS PLUS ACHT 572 | SONNE KOENNEN OST SUED BERG REGION SPAETER IX SUEDWEST 573 | NORD KOENNEN SONNE AB-SO AUFKOMMEN 574 | SAMSTAG NOCH SCHNEE 575 | NORD SCHNEE REGEN WECHSELHAFT 576 | LUFT DRUCK TIEF REGEN VERLAENGERN REGEN 577 | WEST REGEN KOMMEN OST REGION ANFANG SCHNEE MITTE BERG AUCH 578 | JETZT WIE-AUSSEHEN IX WETTER MORGEN MITTWOCH ZWOELFTE JANUAR 579 | NORDOST IX BAYERN OST SCHNEE SCHNEIEN UND REGEN MIT FROST BODEN 580 | SUED FREUNDLICH TEIL 581 | IM-VERLAUF AUCH WOLKE REGEN 582 | WIND SCHWACH MAESSIG WEHEN 583 | NORDOST WOLKE VIEL IX WENIG 584 | JETZT MORGEN WIE-AUSSEHEN WETTER MITTWOCH DREISSIG MAERZ 585 | MORGEN NORDOST FUENFZEHN GRAD FLUSS DREI ZWANZIG GRAD 586 | NORD MITTE REGION HEUTE NACHT KLAR STERN KOENNEN SEHEN SUED REGEN 587 | HOEHER 588 | HEUTE NACHT WAHRSCHEINLICH SCHAUER IX AUCH GEWITTER 589 | SUED MORGEN WOLKE TEIL SONNE 590 | NORD DEUTSCH LAND NORD SCHON HABEN IX SUED AUCH KOMMEN 591 | NORD REGION IX KOMMEN MEISTENS NORD DEUTSCH LAND HEUTE ABEND MEHR KOMMEN 592 | HIER NEU TIEF NORD SCHWER STURM TEIL 593 | NACHT BLEIBEN WARM 594 | NACHT UNTER ZWANZIG GRAD neg-WAHRSCHEINLICH KAUM 595 | TIEF KOMMEN IN-KOMMEND IN-KOMMEND REGEN STURM 596 | TAG WOLKE DANN REGEN NORDWEST MEER IX AUCH MEISTENS IX REGEN SCHNEE SCHNEIEN 597 | ABEND AUCH EBEN MOEGLICH REGEN 598 | GRAUPEL KURZ GEWITTER 599 | SONNTAG MEHR WIND NORDWEST WOLKE BISSCHEN REGEN 600 | MONTAG MEISTENS TROCKEN SONNE WOLKE MISCHUNG 601 | HALLO GUT ABEND 602 | BISHER TAG LETZTE DEUTSCHLAND SCHLECHT VIEL REGEN DARUM FLUSS OST AUCH HOCHWASSER MESSEN VORSICHT 603 | FLUSS UNGEFAEHR FUENFZEHN IX SIEBZEHN GRAD 604 | SONNTAG WECHSELHAFT TEIL UEBERWIEGEND REGEN AUCH DABEI GEWITTER 605 | REGEN GEWITTER MITBRINGEN 606 | IN-KOMMEND DANN NAEHERN KALT 607 | WECHSELHAFT 608 | TAG WEST FREUNDLICH SONST SONNE WOLKE WECHSELHAFT MAL SCHAUER 609 | OST REGION SUEDOST MOEGLICH GEWITTER 610 | SONNTAG WIEDER WECHSELHAFT SCHAUER GEWITTER ORT STARK 611 | MONTAG WECHSELHAFT BISSCHEN KUEHL 612 | WEST KOMMEN TIEF ENORM REGEN GEWITTER 613 | SUED REGION MORGEN SOLL HOCH DRUCK NOCH GUT WARM 614 | HEUTE NACHT WEST KOMMEN REGEN KOENNEN 615 | MORGEN IX DREISSIG GRAD NORD REGION SECHSZEHN GRAD 616 | MORGEN WETTER WIE-AUSSEHEN DIENSTAG FUENFTE JANUAR 617 | NORD WIND MAESSIG KUESTE KOENNEN FRISCH WIND 618 | SUED WIND SCHWACH 619 | HEUTE NACHT MINUS ZWEI MINUS ZWANZIG UNTEN ALPEN TAL 620 | IX REGION ZWISCHEN ACHTZEHN ZWISCHEN DREI ZWANZIG IX OST NUR ZWOELF ZWISCHEN SIEBZEHN GRAD 621 | WIND WEHEN SCHWACH MAESSIG WEHEN KOENNEN STARK 622 | IM-VERLAUF REGEN KOMMEN DANN WEST MEHR FREUNDLICH 623 | NORDWEST WIND KOMMEN 624 | NOCH SONNE VOR MITTAG NOCH 625 | DANN IM-VERLAUF NACH MITTAG BAYERN REGION GEWITTER 626 | JETZT WETTER MORGEN MONTAG ZWOELF APRIL ZEIGEN-BILDSCHIRM 627 | SCHNEE BIS SECHSHUNDERT BIS DREIHUNDERT METER BERG 628 | MITTWOCH poss-SEIN GLEICH MINUS NEUN BIS MINUS EINS GRAD 629 | MORGEN UNGEFAEHR MITTE EUROPA ACHTZEHN BIS SECHS ZWANZIG GRAD 630 | OST EUROPA HEISS BIS FUENF ZWANZIG GRAD 631 | JETZT WETTER WIE-AUSSEHEN MORGEN MONTAG FUENF ZWANZIG JANUAR 632 | DIENSTAG NORDOST WIND DAZU REGEN KURZ REGEN KOENNEN 633 | SUEDWEST REGEN ORT REGION FREUNDLICH 634 | WOCHENENDE IM-VERLAUF MEHR TROCKEN ABER BLEIBEN KALT 635 | JETZT WETTER MORGEN SAMSTAG ZWOELF SEPTEMBER 636 | DEUTSCH LAND KOMMEN KUEHL WEHEN 637 | TIEF KOMMEN NUR SCHWACH 638 | SONST WECHSELHAFT SONNE WOLKE 639 | WIND SCHWACH MAESSIG KUESTE MEER AUCH FRISCH WEHEN 640 | HEUTE NACHT VIERZEHN ZWISCHEN SIEBEN 641 | SONNTAG SPEZIELL REGION GEWITTER NORD MEHR SONNE 642 | HEUTE NACHT ZWISCHEN NEUNZEHN ZWISCHEN FUENFZEHN SUEDOST MAXIMAL ZWOELF 643 | -------------------------------------------------------------------------------- /data/baselines/phoenix_preprocessed/phoenix_test_glosses_lowercased.txt: -------------------------------------------------------------------------------- 1 | regen schnee region verschwinden nord regen koennen region stern koennen sehen 2 | donnerstag nordwest regen region sonne wolke wechselhaft dann freitag aehnlich wetter 3 | kraeftig ab morgen frueh meistens schnee schneien kalt regen 4 | wochenende sonne samstag schoen temperatur bis siebzehn grad region 5 | deutsch land morgen hoch druck kommen wolke aufloesen 6 | sonntag naechste nordwest wolke sonne wolke gewitter regen dabei 7 | wahrscheinlich schauer gewitter stark 8 | im-verlauf bleiben kalt enorm schnee koennen 9 | wochenende ix mehr kalt 10 | morgen dann herbst mischung hoch nebel wolke sonne 11 | aber im-verlauf nebel hoch nebel ix 12 | morgen lang bleiben 13 | deutsch land schwach druck unterschied 14 | region feucht region ix gewitter region 15 | aehnlich wie heute sechs zwischen elf grad 16 | nord nacht anfang enorm schauer gewitter dann wolke verschwinden 17 | bis abend in-kommend dann kommen niederung 18 | jetzt wetter voraussage fuer morgen freitag fuenfzehn oktober 19 | nord see mehr wolke nord meistens regen 20 | heute abend sued bisschen klar himmel bisschen nebel auch dabei 21 | nord nordwest meistens regen auch moeglich bisschen gewitter 22 | morgen ueberwiegend sonne 23 | samstag suedost regen nord dann wind stark sonst regen ix teilweise auch sonne dabei 24 | donnerstag suedost weiter wechselhaft nordwest mehr freundlich sonne 25 | west nordwest verschwinden 26 | morgen ost suedost mischung sonne wolke teilweise regen gewitter 27 | temperatur null grad kalt nord minus fuenf grad 28 | naechste woche luft kommen mehr kuehl 29 | dienstag hauptsaechlich sonne aber wolke auch haben2 wechselhaft moeglich regen oder gewitter 30 | sonntag nord mitte region regen nord sturm 31 | sued region besser 32 | donnerstag extrem wetter region temperatur unterschied sechs bis zwanzig grad 33 | auch samstag regen schnee schneien im-verlauf west nordwest mehr freundlich 34 | suedwest null ost minus sieben moeglich 35 | sued region koennen nacht frost boden 36 | tag berg sechs grad ix region dreizehn grad region 37 | jetzt morgen wetter wie-aussehen morgen fuenfzehn oktober 38 | heute nacht plus vier ost minus vier region 39 | jetzt morgen wetter wie-aussehen dreizehn oktober 40 | west freundlich 41 | auch donnerstag 42 | freitag viel wolke bewoelkt 43 | suedost schnee koennen 44 | tag ost viel sonne west regen fluss region 45 | zuerst gewitter nur west risiko jeden-tag ost mehr ost koennen gewitter west 46 | morgen vor mittag nord stark wind wehen schwach 47 | obwohl plus sonst region frost 48 | besonders kalt sued suedost 49 | morgen wetter wie-aussehen sonntag zwoelf juli 50 | heute nacht sinken vierzehn bis sieben grad 51 | morgen koennen siebzehn region fuenf zwanzig region 52 | dienstag mittwoch sonne wolke wechselhaft schauer typisch region regen gewitter koennen 53 | jetzt wetter voraus informieren morgen dienstag erste februar 54 | ost region anfang freundlich spaeter nordwest auch sonne sonst region wolke 55 | schauer gewitter stark kuehl 56 | region tagsueber dann wolke dann suedwest gewitter koennen 57 | wind schwach 58 | gut schoen abend mitteilen 59 | west nordwest ix schauer ix 60 | wehen region frisch wind schauer ix 61 | morgen samstag fuenfte dezember wie-aussehen wetter 62 | wetter bisschen ruhig dann morgen ix region tief kommen 63 | wolke regen wenn berg ix auch schnee schneien 64 | sonntag mehr mild viel wolke regen nordwest wind 65 | montag dienstag wechselhaft mal auch sonne 66 | heute nacht mehr locker wolke oder klar stern sehen nordwest wolke 67 | morgen tatsaechlich regen gewitter koennen 68 | samstag mehr freundlich trocken mehr warm 69 | sonntag region regen gewitter kommen 70 | ix meer schwer sturm 71 | wolke das-ist-es nacht zwei bis acht neg-haben frost 72 | morgen wetter wie-aussehen erste april donnerstag 73 | heute nacht tief kommen auch kuehl aufziehen morgen wechselhaft wetter 74 | freitag sonne wolke wechselhaft schauer koennen ix aber sonne lang 75 | mischung nebel aufloesen dann wolke sonne 76 | montag anfang wechselhaft mehr kuehl 77 | schon morgen dreissig grad sued frankreich auch warm hier deutsch land schon suedwest fuenf zwanzig grad 78 | donnerstag mehr schoen mehr warm 79 | nach mittag abend bisschen regen nord west 80 | schwach nord sturm wehen nord sued schwer wehen sturm 81 | donnerstag wechselhaft freitag west kommen freundlich 82 | schwach wehen berg wehen nord wehen ix wehen 83 | wind schwach verschieden wehen 84 | montag wechselhaft mal sonne wolke besonders region schauer gewitter 85 | wind schwach sued wind zeigen-bildschirm 86 | suedwest kommen mehr trocken 87 | morgen achtzehn nord dann sechs zwanzig region 88 | wind region 89 | naechste sonntag wieder schlechter wechselhaft 90 | dann regen ost region mild fuenfzehn sechszehn 91 | jetzt wetter voraus informieren morgen dienstag eins zwanzig juni 92 | fluss mild sechszehn grad fluss nur acht grad 93 | hoch fluss warm dreissig grad ix nord frisch achtzehn grad 94 | normal kuehl angenehm ja dann donnerstag nord regen sturm wehen koennen 95 | mild wehen ich 96 | morgen wetter wie-aussehen dienstag neunzehn april 97 | morgen ort schauer besonders suedost tatsaechlich gewitter hauptsaechlich regen unwetter moeglich 98 | heute nacht ueberwiegend region ort regen 99 | nordost mehr wolke regen 100 | freitag wenn neben aufloesen sonne 101 | nordwest morgen zwanzig bis drei zwanzig grad region fuenf zwanzig bis neun zwanzig grad 102 | tief kommen mild 103 | boden gefrieren fluss ix beruhigen plus steigen 104 | trueb diese bild 105 | west kaum schnee auftauchen aber ausnahme achtung meer 106 | west mehr mild minus vier bis minus sieben 107 | hallo gut abend lieb ix zuschauer begruessen 108 | morgen suedost wirklich wie heute ungefaehr nordwest wolke mehr ix 109 | im-verlauf umstellen reduzieren kuehl besonders samstag sonntag 110 | kommen tief druck deshalb deutschland regen kuehl regen 111 | alpen sued nacht sechs maximal fuenfzehn fluss 112 | aehnlich wetter donnerstag 113 | freitag suedwest sonne im-verlauf 114 | sonst regen 115 | region mehr freundlich hoch druck kommen bis region 116 | dienstag west freundlich ix schauer gewitter 117 | hoch wasser gefahr wetter dienst warnung unwetter 118 | suedost region verschwinden langsam im-verlauf 119 | u ix morgen drei fluss bis drei grad 120 | freitag sonne wolke sued anfang regen 121 | auch bisschen sonne morgen meistens regen tag im-verlauf kommen 122 | fluss region schauer nordwest warm kommen 123 | ix nachmittag kommen regen vierhundert achthundert meter ueber schnee 124 | sued ost noch regen berg schnee nord region nach mittag anfang regen 125 | jetzt wetter wie-aussehen morgen mittwoch achte september 126 | nord frisch ix wehen ix wehen im-verlauf spaeter nord stark wehen 127 | donnerstag besonders sued suedost regen ix 128 | sonntag ueberwiegend ost sued schauer gewitter region freundlich 129 | naechste woche kuehl abwechseln wetter 130 | morgen kueste region zehn grad bayern region zwei grad 131 | dann neu wolke kommen stroemen nach mittag koennen regen schon wind kommen 132 | deutsch land tief druck kommen im-verlauf tag bewoelkt bisschen regen schnee schneien 133 | heute nacht oder fluss noch schnee schneien 134 | nordost mit schnee schneien 135 | wind schwach maessig unten kommen ix kommen 136 | morgen sieben fluss nur teil minus eins 137 | kalt luft bleiben bis freitag minus 138 | nord wind schwach unterschied sonst maessig 139 | wenn berg unten berg frisch wind 140 | naechste anfang woche wie-immer so 141 | wetter wie-aussehen morgen montag achtzehn april 142 | sonne bisschen wolke nordwest nachmittag bisschen schauer 143 | heute nacht kueste regen sued auch ix langsam aufloesen 144 | nord bisschen regen schnee hagel 145 | wochenende bleiben tauen dazu regen bleiben 146 | heute wetter morgen samstag eins zwanzig oktober 147 | ost nebel neg-haben sonne region 148 | west region im-verlauf morgen wolke aber bleiben trocken regen neg-haben 149 | sued wolke kommen bisschen regen koennen region klar locker wolke 150 | nordwest zone nebel 151 | zone aufloesen morgen meistens sonne 152 | region hoch druck kommen skandinavien kommen darum kommen freundlich 153 | ost sieben grad fuenfzehn fluss 154 | samstag viel sonne besonders alpen kueste wolke koennen 155 | sued bisschen schauer moeglich 156 | wenn nebel tag aufloesen sonne 157 | sued region regen ix bisschen wolke 158 | nord wind schwach maessig ix wehen sonst region verschieden wehen 159 | auch dabei schnee regen 160 | nord trocken ix 161 | morgen ix schnee regen schnee regen 162 | samstag besser 163 | und dann sonntag ix region kommen kalt 164 | schoen abend ausrichten 165 | teil auch klar 166 | sued tatsaechlich ueberwiegend gewitter 167 | heute nacht dreizehn zwischen achtzehn grad schwuel warm 168 | region besonders sued berg warm gewitter 169 | schnee auch frost 170 | fuer heute wetter besser ruhig 171 | samstag teil schnee bisschen nord region klar himmel 172 | heute nacht besonders region baden w bis sachsen ix sonst region ix schnee schneien schauer 173 | vorsicht poss-sein achtung strasse glatt 174 | heute nacht noch kalt hauptsaechlich mitte berg region 175 | morgen frueh wahrscheinlich sued region moeglich schnee 176 | freitag langsam sinken temperatur sinken west ost regen 177 | samstag sonntag kuehl herbst so in-kommend 178 | schoen abend tschuess 179 | nord see hoch deutsch land kommen 180 | auch samstag sonntag viel sonne dann temperatur steigen 181 | tag ost sechszehn maximal sieben zwanzig grad fluss 182 | wind schwach unterschied kommen 183 | ix auch frisch ix kommen 184 | morgen spanien kommen dann freitag hauptsaechlich schnee 185 | besonders nord suedwest heute nacht koennen schnee 186 | schoen abend poss-euch machen gut 187 | nacht zwoelf koeln region eins region ix 188 | am-tag elf vogel land 189 | heute nacht besonders region kommen regen region regen 190 | tag sauer land vier region zwoelf grad 191 | neunzehn grad nord sechs zwanzig thueringen sachsen tag klar 192 | heute wetter morgen mittwoch sieben zwanzig januar 193 | morgen erwarten nocheinmal ruhig wetter ix trocken winter 194 | wenn nebel verschwinden sued morgen sonne wolke kommen aber wolke bewegen 195 | deutsch hier land suedost hoch druck freundlich 196 | nord ost deutschland morgen diese los kommen deshalb sonne 197 | hier nacht hauptsaechlich nordwest schauer gewitter heftig regen moeglich 198 | gut abend lieb du zuschauer 199 | ein-paar stunde noch fuenf zentimeter hoehe schnee 200 | ost sued bisschen schauer bis zwischen-mitte schnee teil nebel wolke oder sonne 201 | mittwoch kommen regen region 202 | kommen mischung nebel wolke sonne 203 | fluss west und nord mehr trocken 204 | aber stark wolke himmel koennen nebel teilweise soll sonne dabei 205 | mehr freundlich mehr 206 | heute nacht wahrscheinlich regen nord 207 | sued wind schwach maessig wehen frisch stark boee 208 | freitag ruhig wetter besonders nord freundlich gleich samstag auch nur nord bisschen schnee schneien und nieselregen frost 209 | lieb zuschauer gut abend 210 | wetter veraendern enorm gestern orkan sturm orkan 211 | naechste regen ab donnerstag wahrscheinlich 212 | region heute nacht sturm 213 | morgen leicht maessig wind nordwest frisch wehen 214 | schoen abend noch ihr 215 | auch tag viel sonne spaeter ix quell wolke 216 | mittwoch donnerstag nord wind bleiben teil regen 217 | von-unten nach-nord mehr freundlich 218 | gut abend begruessen 219 | jetzt nacht kommen frost 220 | jetzt wetter wie-aussehen morgen dienstag fuenf zwanzig mai 221 | morgen wetter wie-aussehen donnerstag sieben zwanzig august 222 | samstag kuehl weniger nord stark wind 223 | ab sonntag temperatur steigen sonne lang 224 | morgen koennen regen gewitter unwetter koennen 225 | ost suedost nacht anfang noch regen hagel 226 | nordost heute nacht trocken in-kommend regen nordwest regen 227 | nord ix schnee koennen 228 | heute nacht mehr klar stern koennen sehen leicht wolke besonders nah fluss mitte sued region nebel quell wolke 229 | morgen wetter wie-aussehen freitag acht zwanzig august 230 | schottland wolke tief norwegen 231 | wolke naehern deutsch land kuehl kommen 232 | skandinavien ix hoch mehr kommen 233 | fluss bis l region wolke sonst klar locker region 234 | aber nacht mehr wolke 235 | mitte meer tief kommen nord kommen morgen fast region wolke himmel 236 | nord morgen muessen trocken dann region regen viel 237 | bayern sachsen ix schauer gewitter auch ein-paar ix koennen sehen himmel 238 | nord regen 239 | wochenende mehr warm wetter wechselhaft gewitter und sonne dabei 240 | morgen regen kommen west kommen speziell baden wuerttemberg bayern region 241 | jetzt wetter wie-aussehen morgen samstag zweite april 242 | fluss nordost heute abend noch wolke koennen regen suedost 243 | montag ueberall wechselhaft aber kuehl 244 | ab dienstag in-kommend langsam wieder zurueck freundlich warm 245 | a region wetter bis sued deutschland kommen 246 | gut freundlich sonne gut 247 | samstag hauptsaechlich mehr wolke sonne wenig ix suedost regen koennen suedwest bisschen schauer 248 | wind maessig frisch stark sturm berg schwer sturm suedost schwach wind 249 | montag heftig regen nordost regen auch dazu wind region 250 | wetter wie-aussehen poss-mein samstag zwoelf dezember 251 | teilweise regen kommen ix 252 | nordwest verschwinden nord koennen bisschen gewitter 253 | wind heute nacht wehen nord sturm koennen sturm berg sturm orkan 254 | ost see tief druck zone nord noch schnee schneien 255 | wochenende hauptsaechlich sonne himmel schoen mehr warm 256 | montag moeglich regen gewitter mehr wolke region aber bleiben warm sonne gut 257 | dazu ix wind wehen leicht 258 | jetzt wie-aussehen wetter morgen freitag zwanzig november 259 | sued wind nur schwach nord wehen bisschen wehen kueste stark sturm wehen das-war-es 260 | aber region wechselhaft suedost wechselhaft grund ix ungarn ix wechselhaft tief kommen 261 | luft kalt feucht darum kommen deutschland einfluss 262 | kommen kraeftig was wochenende viel sonne temperatur steigen 263 | auch abend zwischen nacht im-verlauf dann regen region regen verschwinden 264 | dann region wolke klar ix nebel 265 | morgen region sonne ix wolke bewoelkt 266 | sued region besonders bayern wald bis alpen dann regen nach mittag koennen 267 | auch deutsch wetter dienst schon warnung unwetter koennen 268 | montag abend bewoelkt hier 269 | nacht himmel klar 270 | dienstag besonders ost mehr freundlich lang aber auch dabei schauer gewitter 271 | nacht nord nordost wolke ost region moeglich ix regen 272 | sonst region wolke locker 273 | doch wolke aber regen wenig 274 | morgen neun grad ix maximal siebzehn grad region 275 | montag anfang ab los wechselhaft kuehl 276 | tag region sonne suedwest bisschen wolke 277 | ix schlecht boden frost moeglich 278 | sued wind maessig nord wind stark ein-paar wind nord meer wie orkan moeglich 279 | sehen kreisen regen kommen neg-haben neg-haben neg-haben 280 | morgen schauer nicht viel sonne meistens menschen froh 281 | region sechs grad region minus eins bis fuenf grad 282 | jetzt wetter wie-aussehen morgen donnerstag dritte dezember 283 | region suedost hauptsaechlich bewoelkt trocken sonne wolke 284 | suedost locker nacht koennen gewitter 285 | nacht sturm 286 | nah tief luft druck stark unterschied deshalb teil wind 287 | hoch kommen dann in-kommend einfluss hier wetter 288 | darunter nebel lang in-kommend daneben sonne berg oben dann durchgehend sonne 289 | jetzt wetter wie-aussehen morgen freitag achte oktober 290 | besonders ix nord heute nacht meistens wolke wahrscheinlich regen 291 | sued viel nebel hoch nebel morgen stark nebel 292 | heute nacht allgaeu ix nord vier grad fluss dann nord dreizehn 293 | ruhig trocken freundlich naechste bleiben 294 | freitag suedwest schnee regen tief west auch haben2 regen 295 | gut abend lieb zuschauer begruessen 296 | morgen tag trueb 297 | wind zeigen-bildschirm schwach maessig 298 | nord wind koennen 299 | morgen ost zehn bis dreizehn west bis siebzehn grad 300 | samstag wechselhaft 301 | besonders freundlich nordost bisschen bereich 302 | sonntag regen teil gewitter 303 | suedost durch regen 304 | in-kommend tief aufziehen wetter wechselhaft temperatur reduzieren 305 | bereich sued mehr freundlich 306 | sonst viel wolke nord kommen schauer gewitter koennen 307 | heute region schwach maessig wind zeigen-bildschirm 308 | zehn elf zwischen sonst region zwei zwischen neun 309 | sued sonntag oft sonne sonst region viel wolke ort regen 310 | deutsch land kommen kuehl heiss getrennt warmfront 311 | deutsch land morgen hoch druck kommen sonne trocken 312 | region ix kuehl fuenfzehn sechszehn drei zwanzig bis sechs zwanzig grad 313 | nordost bleiben trocken 314 | samstag schnee wenig region manchmal ja 315 | auch sonne moeglich 316 | samstag nord wind 317 | naechste woche gleich weiter so 318 | nord tatsaechlich wolke morgen bisschen regen 319 | heute nacht nord nordost ix regen 320 | morgen ueberwiegend bewoelkt nebel auch sued ix sonne 321 | nordost bewoelkt ix regen 322 | region sicher gefrieren lage 323 | morgen nord acht suedwest siebzehn maximal 324 | dienstag hauptsaechlich sonne nordost wolke moeglich regen 325 | wetter morgen sie dienstag vierzehn september 326 | wochenende viel regen negalp-auch negalp-auch 327 | gut abend lieb zuschauer 328 | wie-aussehen in-kommend 329 | mittwoch nord regen sued mehr freundlich 330 | region kommen stark dann viel sonne 331 | jetzt morgen wetter wie-aussehen zeigen-bildschirm donnerstag dritte maerz 332 | heute nacht vierzehn region ost nur sechs grad 333 | morgen dreizehn region sonst fuenfzehn bis zwei zwanzig grad 334 | nacht schnee leicht kueste tief sued regen dabei 335 | sonntag viel wolke ix regen ix und schnee berg koennen schnee 336 | jetzt wie-aussehen wetter morgen sonntag fuenfte dezember 337 | heute nacht stern sehen meistens nebel auch 338 | nordwest schauer sturm kommen 339 | abend sturm berg orkan moeglich 340 | temperatur wie-immer 341 | nordwest freundlich 342 | wind zeigen-bildschirm wind wehen wind koennen ost region hoch sturm koennen 343 | heute nacht selten tatsaechlich kommen kueste 344 | sued wahrscheinlich wolke klar 345 | morgen frueh ix moeglich nebel 346 | morgen ix nordost wolke ueberwiegend schauer 347 | heute abend sued region noch regen gewitter region klar himmel bisschen wolke 348 | morgen nord wolke sonne wechselhaft moeglich schauer gewitter 349 | es-bedeutet wind wehen aber hauptsaechlich schwach maessig wehen 350 | morgen nord fuenfzehn grad region fluss vier zwanzig grad moeglich 351 | sonntag bleiben so 352 | in-kommend wetter wie-aussehen morgen samstag achtzehn juli 353 | kommen kalt luft so deshalb wetter wechselhaft 354 | ost sued heute abend ueberwiegend regen stark gewitter 355 | deutsch wetter dienst sagen warnung 356 | besonders suedwest wehen 357 | jetzt informieren wetter morgen montag acht zwanzig november 358 | morgen sued dauer nebel nur zwei maximal elf 359 | sonntag montag bleiben so mehr kuehl auch wechselhaft 360 | heute nacht sieben maximal vierzehn tag sued zwei zwanzig grad region zwei zwanzig grad 361 | samstag sued freundlich nord einige schauer 362 | in-kommend region tief druck enorm luft bleiben 363 | s+h vor pommern und brand burg morgen durchgehend regen 364 | samstag ix noch bisschen regen sonst region freundlich trocken 365 | kueste ix dreissig grad 366 | morgen wind wehen schwach nord ueberwiegend wind 367 | heute nacht vierzehn ix unten alpen vier dann 368 | auch so weiter mittwoch 369 | aber donnerstag heiss zurueck sued darum nord regen kuehl 370 | morgen wetter wie-aussehen freitag neun oktober 371 | nord heute nacht wind 372 | morgen schwach maessig wehen 373 | samstag dann regen kommen 374 | ost erstmal freundlich 375 | west kommen loch sonne da 376 | mitte berg vier nordwest zwoelf grad wolke 377 | ost meistens sonne 378 | montag in-kommend auch sonne aber schwer gewitter dabei 379 | sonst nur bisschen regen aber region rechnen neg-haben 380 | ihr schoen abend 381 | morgen ix meistens wolke 382 | region berg ix bisschen schnee schneien moeglich 383 | morgen temperatur vogel land maximal neun grad 384 | suedost deutsch land bleiben lang im-verlauf gut im-verlauf moeglich gewitter 385 | nordwest morgen wechsel sonne wolke dazu stark regen nach mittag gewitter 386 | donnerstag freitag wetter bleiben 387 | heute feucht warm heiss enorm moeglich gewitter auch stark 388 | tief o+p+h+e+l+i+a kalt kommen mitte europa 389 | berg schon schnee 390 | kuehl naechste besser sonne kommen dann warm 391 | jetzt schoen abend mitteilen 392 | jetzt wie-aussehen wetter morgen donnerstag neunzehn november 393 | bisschen wehen temperatur alpen ix koennen bis zehn grad 394 | viel wasser stroemen koennen ueberschwemmung 395 | morgen suedost wolke hauptsaechlich alpen moeglich regen 396 | heute nacht acht bis zwei grad klar himmel moeglich boden frost 397 | heute-nacht stern haben bisschen frost moeglich sonst null bis vier grad 398 | mittwoch donnerstag wechselhaft bisschen regen schnee mehr tief schnee haben 399 | schottland region und sued europa sued region dazwischen morgen luft mild kommen 400 | ix enorm warm in-kommend 401 | aber bisschen kuehl reduzieren 402 | heute nacht besonders nord tag nordwest wind 403 | nord auch schwer wind 404 | berg orkan moeglich 405 | heute nacht nord region elf grad alpen eins grad 406 | nachmittag mitte region zehn grad sued sechszehn grad 407 | donnerstag besonders nordwest regen sturm koennen 408 | ix auch gewitter 409 | suedost sonne dabei 410 | west region regen berg schnee schauer dabei 411 | heute nacht nord meistens wolke besonders region ix u ix schauer 412 | nordwest hauptsaechlich trocken manchmal wolke sonne teil nebel 413 | morgen suedost teil regen moeglich schnee 414 | nord mehr gut manchmal wolke trocken 415 | wind schwach maessig wehen 416 | mittwoch mischung wolke nebel nordwest bisschen schauer region trocken 417 | west himmel stern koennen sehen aber negalp-stimmt morgen wieder regen 418 | aber west wolke dick ix anfang regen 419 | berg anfang ix schnee auch 420 | nordwest regen kommen 421 | montag fast ueberall sonne meer berg ix mehr wolke aber nur bisschen ort regen 422 | jetzt schoen abend tschuess 423 | wind maessig ix stark ix wehen 424 | ix auch sturm 425 | ix morgen zwei zwanzig grad 426 | nord nur sechszehn grad 427 | sonntag nord wolke ix schauer 428 | sonst region viel sonne 429 | dienstag abend ix wolke schauer gewitter 430 | russland ix trocken heiss scheinen fuenf dreissig bis vierzig grad 431 | diese bleiben brand weiter 432 | hier heute nacht suedost frisch zehn elf grad 433 | jetzt wetter morgen donnerstag siebzehn dezember 434 | tag auch scheinen 435 | ix west ix schnee scheinen moeglich glatt 436 | mitte mal klar himmel 437 | temperatur regen mehr kuehl sonst gut 438 | dazu luft enorm warm feucht koennen gewitter 439 | deutsch wetter dienst bekanntgeben moeglich gewitter kommen 440 | morgen vor mittag regen ost region regen brand burg regen vor pommern ost 441 | zwanzig grad in-kommend 442 | grund hoch tief wieder und sued region luft feucht warm sued region sonne 443 | abend gewitter koennen 444 | jetzt wie-aussehen morgen donnerstag achte april wetter 445 | schoen abend poss-euch 446 | fluss a sued sonne strahlen auch sued 447 | hier auch ich hier schau-mal zeigen-bildschirm 448 | aber samstag sonntag 449 | in-kommend hier nacht bayern hier wald bisschen regen 450 | sonst himmel sehen stern nebel 451 | temperatur dreizehn zwischen fuenf grad 452 | morgen ix siebzehn grad 453 | neu woche wechselhaft 454 | schoen abend mitteilen 455 | jetzt wetter wie-aussehen morgen sonntag neunzehnte dezember 456 | ix teil regen gefrieren 457 | zuerst schwach wehen ix wehen ix wehen 458 | ix schon warnung deutsch wetter dienst sturm koennen 459 | morgen nord neun grad sued achtzehn grad 460 | mittwoch nordwest kommen regen schauer teil gewitter 461 | ein-paar-tage bleiben so wechselhaft 462 | sommer temperatur selten 463 | sonntag nord alpen ix sonne wolke schauer sonst region freundlich 464 | tag ganztags mehr stark wolke oder nebel sonne kaum 465 | sonntag ab meer kommen bisschen mehr mild kommen 466 | dienstag sued schauer teil auch gewitter nord freundlich 467 | morgen gewitter teil hagel sturm nacht kommen nord lang regen 468 | west schnee regen glatt 469 | in-kommend dann wechselhaft stark mild 470 | wehen schwach region frisch 471 | heute nacht zwoelf grad region eins grad bayern wald region 472 | heiss zwanzig bis acht zwanzig grad nord weniger 473 | so manchmal enorm schnell ob schoen selbst leute muessen entscheidung geben 474 | schoen gut abend poss-euch 475 | bisschen warm kalt warm kalt so wetter wechselhaft neg-in-kommend wie-immer wie-immer 476 | jetzt wetter wie-aussehen morgen samstag eins zwanzig november 477 | tief wie-aussehen kommen nord heute nacht bisschen regen deutsch land 478 | sonst hoch druck trocken teil freundlich morgen 479 | tal nebel 480 | manchmal morgen lang dauer nebel wolke aber trocken 481 | nach mittag mehr freundlich 482 | teil wind mehr kuehl auch 483 | aber hier so hier herbst mild 484 | lieb zuschauer begruessen gut abend 485 | ost sonne mehr 486 | mittwoch meistens nachmittag schauer gewitter 487 | gleich wetter auch donnerstag 488 | morgen bis nach mittag ost sonne 489 | dazu wolke region kommen 490 | mittwoch nur rest schauer gewitter region 491 | donnerstag mittag freundlich nord regen sued regen 492 | west fuenf c+m neu schnee hoch schon autobahn lahm auto 493 | aber freuen 494 | morgen sonne 495 | schottland tief kommen morgen region 496 | bayern sued warnung deutsch ix wetter dienst nacht sued enorm gewitter 497 | morgen wetter wie-aussehen freitag vier zwanzig juli 498 | heute druck enorm meer kommen verschwinden koennen 499 | dabei sturm gewitter 500 | auch dresden region regen koennen 501 | besonders ost deutsch land mehr regen oder schnee 502 | heute nacht sued anfang bisschen gewitter ix sonst region regen ix koennen auch nebel 503 | spaeter bisschen mehr trocken region 504 | abend lieb zuschauer poss-euch 505 | europa region wetter unterschied 506 | heute abend ost region regen gewitter koennen wind regen 507 | anklicken text oder internet anschauen koennen 508 | dann bis vier zwanzig grad region 509 | sued region bis sieben zwanzig grad 510 | e region in-kommend zwei-tag wetter stark tief kommen 511 | nord heute nacht minus zwei berg bis minus fuenfzehn grad 512 | freitag mehr ruhig 513 | region viel sonne bisschen wolke 514 | suedost morgen bewoelkt viel schnee schneien 515 | heute wieder in-kommend schnee ueber dreihundert meter nach mittag regen kommen berlin ix 516 | jetzt wetter voraus informieren morgen mittwoch neunzehn januar 517 | sonne selten nur wolke hauptsaechlich 518 | sued auch viel wolke oder nebel aber regen sued kaum 519 | boden see moeglich flach auch schnee 520 | suedost region nord see noch trocken 521 | muessen aushalten regen gewitter besonders suedost sturm stark koennen 522 | deutsch wetter dienst schon warnung einige gewesen 523 | heute abend temperatur zehn region bis achtzehn region 524 | ix koennen sonne 525 | jetzt wetter wie-aussehen morgen donnerstag eins dreissig maerz 526 | tag nordost zwoelf sued bayern ix maximal zwanzig grad 527 | montag auch mehr wolke als sonne ueberwiegend regen ueberwiegend gewitter 528 | dazwischen freundlich 529 | wenn neg-haben gewitter schwach wehen kueste wind 530 | samstag sonntag gleich ix 531 | bisschen schnee in-kommend sachsen oder berg region bayern region moeglich schnee 532 | samstag kalt minus zehn temperatur 533 | nord regen nacht verschwinden alpen regen koennen ix nebel 534 | jetzt morgen wetter wie-aussehen freitag fuenf zwanzig juni 535 | montag wolke mal regen 536 | meer schnee schneien dann alpen regen schnee schneien 537 | dienstag wechselhaft 538 | suedwest nebel nordost aufloesen 539 | alpen schnee 540 | wind schwach wehen 541 | morgen temperatur zwei zwanzig grad nord see ix zwei dreissig grad fluss 542 | gut abend lieb zuschauer begruessen 543 | samstag meistens freundlich region trocken 544 | bewoelkt schauer nur nordwest 545 | auch regen koennen 546 | tag mehr wolke oder nebel 547 | heute nacht elf grad sued bayern eins grad nord 548 | deutsch land irland und mitte 549 | region hoch schwuel heiss kommen region maessig warm 550 | grenze teilweise stark gewitter regen 551 | heute nacht rheinland-pfalz ix baden wuerttemberg bis region thueringen regen 552 | freitag nah kueste sued wahrscheinlich stark wolke 553 | sonst region freundlich 554 | aber rest region freundlich 555 | ploetzlich ix gewitter koennen wie unwetter 556 | heute nacht ix nordwest regen kommen region 557 | jetzt morgen wetter wie-aussehen donnerstag sechs zwanzig november 558 | region kommen bisschen luft neg-haben mild 559 | freitag regen wechselhaft 560 | nordwest koennen gewitter 561 | morgen so nord gut sonne viel besonders kueste viel sonne 562 | suedwest zuerst gut region hauptsaechlich regen 563 | ab freitag mehr schnee 564 | wochenende auch ix schnee koennen 565 | bleiben wind 566 | wind kalt dienstag regen schnee graupel 567 | ix regen lang 568 | jetzt wie-aussehen wetter morgen samstag sechs zwanzig januar 569 | jetzt wetter wie-aussehen morgen montag vier zwanzig januar zweitausend elf 570 | lieb zuschauer gut abend 571 | nord fluss minus eins fluss plus acht 572 | sonne koennen ost sued berg region spaeter ix suedwest 573 | nord koennen sonne ab-so aufkommen 574 | samstag noch schnee 575 | nord schnee regen wechselhaft 576 | luft druck tief regen verlaengern regen 577 | west regen kommen ost region anfang schnee mitte berg auch 578 | jetzt wie-aussehen ix wetter morgen mittwoch zwoelfte januar 579 | nordost ix bayern ost schnee schneien und regen mit frost boden 580 | sued freundlich teil 581 | im-verlauf auch wolke regen 582 | wind schwach maessig wehen 583 | nordost wolke viel ix wenig 584 | jetzt morgen wie-aussehen wetter mittwoch dreissig maerz 585 | morgen nordost fuenfzehn grad fluss drei zwanzig grad 586 | nord mitte region heute nacht klar stern koennen sehen sued regen 587 | hoeher 588 | heute nacht wahrscheinlich schauer ix auch gewitter 589 | sued morgen wolke teil sonne 590 | nord deutsch land nord schon haben ix sued auch kommen 591 | nord region ix kommen meistens nord deutsch land heute abend mehr kommen 592 | hier neu tief nord schwer sturm teil 593 | nacht bleiben warm 594 | nacht unter zwanzig grad neg-wahrscheinlich kaum 595 | tief kommen in-kommend in-kommend regen sturm 596 | tag wolke dann regen nordwest meer ix auch meistens ix regen schnee schneien 597 | abend auch eben moeglich regen 598 | graupel kurz gewitter 599 | sonntag mehr wind nordwest wolke bisschen regen 600 | montag meistens trocken sonne wolke mischung 601 | hallo gut abend 602 | bisher tag letzte deutschland schlecht viel regen darum fluss ost auch hochwasser messen vorsicht 603 | fluss ungefaehr fuenfzehn ix siebzehn grad 604 | sonntag wechselhaft teil ueberwiegend regen auch dabei gewitter 605 | regen gewitter mitbringen 606 | in-kommend dann naehern kalt 607 | wechselhaft 608 | tag west freundlich sonst sonne wolke wechselhaft mal schauer 609 | ost region suedost moeglich gewitter 610 | sonntag wieder wechselhaft schauer gewitter ort stark 611 | montag wechselhaft bisschen kuehl 612 | west kommen tief enorm regen gewitter 613 | sued region morgen soll hoch druck noch gut warm 614 | heute nacht west kommen regen koennen 615 | morgen ix dreissig grad nord region sechszehn grad 616 | morgen wetter wie-aussehen dienstag fuenfte januar 617 | nord wind maessig kueste koennen frisch wind 618 | sued wind schwach 619 | heute nacht minus zwei minus zwanzig unten alpen tal 620 | ix region zwischen achtzehn zwischen drei zwanzig ix ost nur zwoelf zwischen siebzehn grad 621 | wind wehen schwach maessig wehen koennen stark 622 | im-verlauf regen kommen dann west mehr freundlich 623 | nordwest wind kommen 624 | noch sonne vor mittag noch 625 | dann im-verlauf nach mittag bayern region gewitter 626 | jetzt wetter morgen montag zwoelf april zeigen-bildschirm 627 | schnee bis sechshundert bis dreihundert meter berg 628 | mittwoch poss-sein gleich minus neun bis minus eins grad 629 | morgen ungefaehr mitte europa achtzehn bis sechs zwanzig grad 630 | ost europa heiss bis fuenf zwanzig grad 631 | jetzt wetter wie-aussehen morgen montag fuenf zwanzig januar 632 | dienstag nordost wind dazu regen kurz regen koennen 633 | suedwest regen ort region freundlich 634 | wochenende im-verlauf mehr trocken aber bleiben kalt 635 | jetzt wetter morgen samstag zwoelf september 636 | deutsch land kommen kuehl wehen 637 | tief kommen nur schwach 638 | sonst wechselhaft sonne wolke 639 | wind schwach maessig kueste meer auch frisch wehen 640 | heute nacht vierzehn zwischen sieben 641 | sonntag speziell region gewitter nord mehr sonne 642 | heute nacht zwischen neunzehn zwischen fuenfzehn suedost maximal zwoelf 643 | -------------------------------------------------------------------------------- /notebooks/create-train-set.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "cells": [ 3 | { 4 | "cell_type": "code", 5 | "execution_count": 1, 6 | "metadata": {}, 7 | "outputs": [], 8 | "source": [ 9 | "#imports \n", 10 | "import pandas as pd \n", 11 | "import re \n", 12 | "from pathlib import Path \n", 13 | "import csv \n", 14 | "\n", 15 | "from tqdm import tqdm " 16 | ] 17 | }, 18 | { 19 | "cell_type": "markdown", 20 | "metadata": {}, 21 | "source": [ 22 | "### Define in/out files" 23 | ] 24 | }, 25 | { 26 | "cell_type": "code", 27 | "execution_count": 2, 28 | "metadata": {}, 29 | "outputs": [], 30 | "source": [] 31 | }, 32 | { 33 | "cell_type": "markdown", 34 | "metadata": {}, 35 | "source": [ 36 | "---\n", 37 | "#### Set sizes \n", 38 | " - training data: 54325 \n", 39 | " - test data: 5113 [54325:59438] \n", 40 | " - dev data: 4470 [59438:63908] \n", 41 | "---" 42 | ] 43 | }, 44 | { 45 | "cell_type": "markdown", 46 | "metadata": {}, 47 | "source": [ 48 | "### Generate training data " 49 | ] 50 | }, 51 | { 52 | "cell_type": "code", 53 | "execution_count": 3, 54 | "metadata": {}, 55 | "outputs": [], 56 | "source": [ 57 | "def generate_train(in_csv, out_txt, n=54325):\n", 58 | " df = pd.read_csv(in_csv, header=None) \n", 59 | " out_lines = df[0].tolist()[:4470] \n", 60 | "\n", 61 | " with open(out_txt, 'w', encoding='utf-8') as f:\n", 62 | " for line in tqdm(out_lines):\n", 63 | " if (type(line) == float):\n", 64 | " f.write(str(line)) \n", 65 | " else:\n", 66 | " f.write(line)\n", 67 | " f.write('\\n') " 68 | ] 69 | }, 70 | { 71 | "cell_type": "markdown", 72 | "metadata": {}, 73 | "source": [ 74 | "### Generate test data " 75 | ] 76 | }, 77 | { 78 | "cell_type": "code", 79 | "execution_count": 5, 80 | "metadata": {}, 81 | "outputs": [], 82 | "source": [ 83 | "def generate_test(in_csv, out_txt, n=5113):\n", 84 | " df = pd.read_csv(in_csv, header=None)\n", 85 | " out_lines = df[0].tolist()[54325:59438]\n", 86 | " \n", 87 | " with open(out_txt, 'w', encoding='utf-8') as f:\n", 88 | " for line in tqdm(out_lines):\n", 89 | " if (type(line) == float):\n", 90 | " f.write(str(line)) \n", 91 | " else:\n", 92 | " f.write(line)\n", 93 | " f.write('\\n') " 94 | ] 95 | }, 96 | { 97 | "cell_type": "markdown", 98 | "metadata": {}, 99 | "source": [ 100 | "### Generate dev data " 101 | ] 102 | }, 103 | { 104 | "cell_type": "code", 105 | "execution_count": 6, 106 | "metadata": {}, 107 | "outputs": [], 108 | "source": [ 109 | "def generate_dev(in_csv, out_txt, n=4470):\n", 110 | " df = pd.read_csv(in_csv, header=None) \n", 111 | " out_lines = df[0].tolist()[59438:63908]\n", 112 | " \n", 113 | " with open(out_txt, 'w', encoding='utf-8') as f:\n", 114 | " for line in tqdm(out_lines):\n", 115 | " if (type(line) == float):\n", 116 | " f.write(str(line)) \n", 117 | " else:\n", 118 | " f.write(line) \n", 119 | " f.write('\\n') " 120 | ] 121 | } 122 | ], 123 | "metadata": { 124 | "kernelspec": { 125 | "display_name": "Python 3", 126 | "language": "python", 127 | "name": "python3" 128 | }, 129 | "language_info": { 130 | "codemirror_mode": { 131 | "name": "ipython", 132 | "version": 3 133 | }, 134 | "file_extension": ".py", 135 | "mimetype": "text/x-python", 136 | "name": "python", 137 | "nbconvert_exporter": "python", 138 | "pygments_lexer": "ipython3", 139 | "version": "3.7.6" 140 | } 141 | }, 142 | "nbformat": 4, 143 | "nbformat_minor": 4 144 | } 145 | -------------------------------------------------------------------------------- /notebooks/german-sentences-extraction.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "cells": [ 3 | { 4 | "cell_type": "markdown", 5 | "metadata": {}, 6 | "source": [ 7 | "#
Script for extracting the german sentences
\n", 8 | "##
from the EAF transcripts A and B of the annotated DGS Corpus
" 9 | ] 10 | }, 11 | { 12 | "cell_type": "markdown", 13 | "metadata": {}, 14 | "source": [ 15 | "--- " 16 | ] 17 | }, 18 | { 19 | "cell_type": "code", 20 | "execution_count": 1, 21 | "metadata": {}, 22 | "outputs": [], 23 | "source": [ 24 | "#imports \n", 25 | "from bs4 import BeautifulSoup \n", 26 | "import requests \n", 27 | "from urllib.parse import urljoin \n", 28 | "import urllib.request \n", 29 | "import pandas as pd \n", 30 | "import pickle " 31 | ] 32 | }, 33 | { 34 | "cell_type": "code", 35 | "execution_count": 2, 36 | "metadata": {}, 37 | "outputs": [], 38 | "source": [ 39 | "#url of the DGS Corpus \n", 40 | "url_dgs_corpus = \"https://www.sign-lang.uni-hamburg.de/meinedgs/ling/start-name_en.html\" \n", 41 | "\n", 42 | "#request the dgs corpus page \n", 43 | "r = requests.get(url_dgs_corpus) \n", 44 | "\n", 45 | "#get the html contennt of the dgs corpus page \n", 46 | "html = r.text " 47 | ] 48 | }, 49 | { 50 | "cell_type": "code", 51 | "execution_count": 3, 52 | "metadata": {}, 53 | "outputs": [], 54 | "source": [ 55 | "#create a content soup from the html content of the dgs corpus page with BeautifulSoup\n", 56 | "content_soup = BeautifulSoup(html, 'html.parser') " 57 | ] 58 | }, 59 | { 60 | "cell_type": "code", 61 | "execution_count": 4, 62 | "metadata": {}, 63 | "outputs": [], 64 | "source": [ 65 | "#rows with all types of files - ILEX, EAF, MP4... \n", 66 | "rows_with_transcripts = content_soup.find('table', {'class': 'transcripts'}).find_all('tr') " 67 | ] 68 | }, 69 | { 70 | "cell_type": "code", 71 | "execution_count": 5, 72 | "metadata": {}, 73 | "outputs": [], 74 | "source": [ 75 | "#list with all hrefs of the EAF files \n", 76 | "list_eaf_files = [] " 77 | ] 78 | }, 79 | { 80 | "cell_type": "code", 81 | "execution_count": 6, 82 | "metadata": {}, 83 | "outputs": [], 84 | "source": [ 85 | "#get all the cells with transcripts data \n", 86 | "for r in rows_with_transcripts[1:]: \n", 87 | " cells_with_transcripts = r.find_all('td') \n", 88 | " \n", 89 | " #cells with the EAF transcript files \n", 90 | " eaf_files = cells_with_transcripts[5] \n", 91 | " \n", 92 | " #add the href of each EAF transcript file to a list \n", 93 | " if(eaf_files.find('a')) != None:\n", 94 | " list_eaf_files.append(eaf_files.find('a').attrs['href']) \n", 95 | " \n", 96 | " " 97 | ] 98 | }, 99 | { 100 | "cell_type": "code", 101 | "execution_count": 7, 102 | "metadata": {}, 103 | "outputs": [], 104 | "source": [ 105 | "#list with the absolute urls of each EAF transcript \n", 106 | "absolute_paths_eaf_transcripts = [] " 107 | ] 108 | }, 109 | { 110 | "cell_type": "code", 111 | "execution_count": 8, 112 | "metadata": {}, 113 | "outputs": [], 114 | "source": [ 115 | "#create an absolute path for each EAF transcript with \n", 116 | "#taking the base url of the DGS Corpus and \n", 117 | "#the href of each EAF transcript from the list_eaf_files \n", 118 | "\n", 119 | "for single_eaf in list_eaf_files: \n", 120 | " absolute_url = urljoin(url_dgs_corpus, single_eaf) \n", 121 | " absolute_paths_eaf_transcripts.append(absolute_url) " 122 | ] 123 | }, 124 | { 125 | "cell_type": "code", 126 | "execution_count": 9, 127 | "metadata": {}, 128 | "outputs": [ 129 | { 130 | "data": { 131 | "text/plain": [ 132 | "'https://www.sign-lang.uni-hamburg.de/meinedgs/eaf/1413451-11105600-11163240.eaf'" 133 | ] 134 | }, 135 | "execution_count": 9, 136 | "metadata": {}, 137 | "output_type": "execute_result" 138 | } 139 | ], 140 | "source": [ 141 | "#this is how an element from the list looks like: \n", 142 | "absolute_paths_eaf_transcripts[0]" 143 | ] 144 | }, 145 | { 146 | "cell_type": "markdown", 147 | "metadata": {}, 148 | "source": [ 149 | "
\n", 150 | "\n", 151 | "#### Speakers A: \n", 152 | "\n", 153 | " - *german sentences:* \n", 154 | " - TIER_ID=\"Deutsche_Übersetzung_A\" \n", 155 | " - *german gloss sentences:* \n", 156 | " - TIER_ID=\"Lexem_Gebärde_r_A\" \n", 157 | " - LINGUISTIC_TYPE_REF=\"L_tokens_right_left__finer_granularity\" \n", 158 | "\n", 159 | "
\n", 160 | "\n", 161 | "#### Speakers B: \n", 162 | " - *german sentences:* \n", 163 | " - TIER_ID=\"Deutsche_Übersetzung_B\" \n", 164 | " - *german gloss sentences:*\n", 165 | " - TIER_ID=\"Lexem_Gebärde_r_B\" \n", 166 | " - LINGUISTIC_TYPE_REF=\"L_tokens_right_left__finer_granularity\" \n", 167 | "\n", 168 | "
" 169 | ] 170 | }, 171 | { 172 | "cell_type": "markdown", 173 | "metadata": {}, 174 | "source": [ 175 | "###
Extract the german sentences from speakers A
" 176 | ] 177 | }, 178 | { 179 | "cell_type": "code", 180 | "execution_count": 10, 181 | "metadata": {}, 182 | "outputs": [], 183 | "source": [ 184 | "#this is a list with the content of all tags that have the attribute \"ANNOTATION_VALUE\" (they include german glosses, german sentences, \n", 185 | "#english glosses, english sentences, etc.) \n", 186 | "\n", 187 | "#from this content *only* the tags with german sentences from speakers A must be extracted \n", 188 | "transcript_content_a = [] \n", 189 | "\n", 190 | "#this is a list for the specific time encoding of each sentence \n", 191 | "time_encodings_a = [] \n", 192 | "\n", 193 | "#this is a list of the german sentences \n", 194 | "german_sentences_a = [] " 195 | ] 196 | }, 197 | { 198 | "cell_type": "code", 199 | "execution_count": 11, 200 | "metadata": {}, 201 | "outputs": [ 202 | { 203 | "name": "stdout", 204 | "output_type": "stream", 205 | "text": [ 206 | "Wall time: 9min 38s\n" 207 | ] 208 | } 209 | ], 210 | "source": [ 211 | "%%time \n", 212 | "#take each transcript from the list with all EAF transcripts and read its content to extract \n", 213 | "#in a data frame all german sentences *only* for speakers A \n", 214 | "for transcript in absolute_paths_eaf_transcripts: \n", 215 | " with urllib.request.urlopen(transcript) as f:\n", 216 | " content = f.read().decode('utf-8') \n", 217 | " transcript_content_a = BeautifulSoup(content, 'xml').find_all(name=\"ANNOTATION_VALUE\") \n", 218 | " time_encodings_a = BeautifulSoup(content, 'xml').find_all(name=\"TIME_SLOT\") \n", 219 | " for value in range(0, len(transcript_content_a)): \n", 220 | " #if the value of the tags attribute TIER_ID is a german sentence from speaker A, extract it \n", 221 | " if transcript_content_a[value].parent.parent.parent.attrs['TIER_ID'] == \"Deutsche_Übersetzung_A\": \n", 222 | " #this is the time encoding for the sentence (both starting and ending) \n", 223 | " time = transcript_content_a[value].parent.attrs \n", 224 | " #this is the starting time of the sentence \n", 225 | " start = time['TIME_SLOT_REF1'] \n", 226 | " #this is the ending time of the sentencec \n", 227 | " end = time['TIME_SLOT_REF2'] \n", 228 | " #the sentence itself \n", 229 | " sentence_a = transcript_content_a[value].text \n", 230 | " #group the sentence + its start + its end \n", 231 | " sentence_group_a = [sentence_a, start, end] \n", 232 | " #add the german sentence to the list of german sentences \n", 233 | " german_sentences_a.append(sentence_group_a) " 234 | ] 235 | }, 236 | { 237 | "cell_type": "markdown", 238 | "metadata": {}, 239 | "source": [ 240 | "#### Save the list with german sentences A using pickle " 241 | ] 242 | }, 243 | { 244 | "cell_type": "code", 245 | "execution_count": 12, 246 | "metadata": {}, 247 | "outputs": [], 248 | "source": [ 249 | "#save the list using pickle where each element is: sentence A + start + end \n", 250 | "#to be used later without extracting it again \n", 251 | "\n", 252 | "with open(\"path\", \"wb\") as fp: \n", 253 | " pickle.dump(german_sentences_a, fp) " 254 | ] 255 | }, 256 | { 257 | "cell_type": "markdown", 258 | "metadata": {}, 259 | "source": [ 260 | "#### Create a data frame for the sentences A " 261 | ] 262 | }, 263 | { 264 | "cell_type": "code", 265 | "execution_count": 13, 266 | "metadata": {}, 267 | "outputs": [], 268 | "source": [ 269 | "#list with only the sentence (no timestamps included) \n", 270 | "data_a = [] \n", 271 | "\n", 272 | "for s in range(0, len(german_sentences_a)): \n", 273 | " data_a.append(german_sentences_a[s][0]) " 274 | ] 275 | }, 276 | { 277 | "cell_type": "code", 278 | "execution_count": 14, 279 | "metadata": {}, 280 | "outputs": [ 281 | { 282 | "data": { 283 | "text/html": [ 284 | "
\n", 285 | "\n", 298 | "\n", 299 | " \n", 300 | " \n", 301 | " \n", 302 | " \n", 303 | " \n", 304 | " \n", 305 | " \n", 306 | " \n", 307 | " \n", 308 | " \n", 309 | " \n", 310 | " \n", 311 | " \n", 312 | " \n", 313 | " \n", 314 | " \n", 315 | " \n", 316 | " \n", 317 | " \n", 318 | " \n", 319 | " \n", 320 | " \n", 321 | " \n", 322 | " \n", 323 | " \n", 324 | " \n", 325 | " \n", 326 | " \n", 327 | " \n", 328 | " \n", 329 | " \n", 330 | " \n", 331 | " \n", 332 | " \n", 333 | " \n", 334 | " \n", 335 | " \n", 336 | " \n", 337 | " \n", 338 | " \n", 339 | " \n", 340 | " \n", 341 | " \n", 342 | " \n", 343 | " \n", 344 | " \n", 345 | " \n", 346 | " \n", 347 | " \n", 348 | " \n", 349 | " \n", 350 | " \n", 351 | "
German Sentence
0Wie mein Leben aussieht?
1Na ja, ich bin als Gehörloser aufgewachsen.
2Ich habe eher das Gefühl, wenn ich mir vorstel...
3Da treffe ich lieber viele Gehörlose und mache...
4Aber das ist ja klar.
......
31537Nach der Pause.
31538Wenn die Schule vorbei war, wie sah es dann au...
31539Aber es war auch möglich, dass du beispielswei...
31540Hast du dir das dann von einem Nachbarn geben ...
31541Ja, ja.
\n", 352 | "

31542 rows × 1 columns

\n", 353 | "
" 354 | ], 355 | "text/plain": [ 356 | " German Sentence\n", 357 | "0 Wie mein Leben aussieht?\n", 358 | "1 Na ja, ich bin als Gehörloser aufgewachsen.\n", 359 | "2 Ich habe eher das Gefühl, wenn ich mir vorstel...\n", 360 | "3 Da treffe ich lieber viele Gehörlose und mache...\n", 361 | "4 Aber das ist ja klar.\n", 362 | "... ...\n", 363 | "31537 Nach der Pause.\n", 364 | "31538 Wenn die Schule vorbei war, wie sah es dann au...\n", 365 | "31539 Aber es war auch möglich, dass du beispielswei...\n", 366 | "31540 Hast du dir das dann von einem Nachbarn geben ...\n", 367 | "31541 Ja, ja.\n", 368 | "\n", 369 | "[31542 rows x 1 columns]" 370 | ] 371 | }, 372 | "execution_count": 14, 373 | "metadata": {}, 374 | "output_type": "execute_result" 375 | } 376 | ], 377 | "source": [ 378 | "#create a data frame from the list \n", 379 | "df_a = pd.DataFrame(data_a, columns=[\"German Sentence\"]) \n", 380 | "\n", 381 | "df_a " 382 | ] 383 | }, 384 | { 385 | "cell_type": "code", 386 | "execution_count": 15, 387 | "metadata": {}, 388 | "outputs": [], 389 | "source": [ 390 | "#save it as a file where each sentence is on a new line \n", 391 | "df_a.to_csv(f\"path\", encoding=\"utf-8-sig\", index=False, header=False) " 392 | ] 393 | }, 394 | { 395 | "cell_type": "markdown", 396 | "metadata": {}, 397 | "source": [ 398 | "
\n", 399 | " \n", 400 | "###
Extract the german sentences from the transcripts B
" 401 | ] 402 | }, 403 | { 404 | "cell_type": "code", 405 | "execution_count": 16, 406 | "metadata": {}, 407 | "outputs": [], 408 | "source": [ 409 | "#this is a list with the content of all tags that have the attribute \"ANNOTATION_VALUE\" (they include german glosses, german sentences, \n", 410 | "#english glosses, english sentences, etc.) \n", 411 | "\n", 412 | "#from this content *only* the tags with german sentences from speakers B must be extracted \n", 413 | "transcript_content_b = [] \n", 414 | "\n", 415 | "#this is a list for the specific time encoding of each sentence \n", 416 | "time_encodings_b = [] \n", 417 | "\n", 418 | "#this is a list of the german sentences \n", 419 | "german_sentences_b = [] " 420 | ] 421 | }, 422 | { 423 | "cell_type": "code", 424 | "execution_count": 17, 425 | "metadata": {}, 426 | "outputs": [ 427 | { 428 | "name": "stdout", 429 | "output_type": "stream", 430 | "text": [ 431 | "Wall time: 9min 47s\n" 432 | ] 433 | } 434 | ], 435 | "source": [ 436 | "%%time \n", 437 | "#take each transcript from the list with all EAF transcripts and read its content to extract \n", 438 | "#in a data frame all german sentences *only* for speakers B \n", 439 | "for transcript in absolute_paths_eaf_transcripts: \n", 440 | " with urllib.request.urlopen(transcript) as f:\n", 441 | " content = f.read().decode('utf-8') \n", 442 | " transcript_content_b = BeautifulSoup(content, 'xml').find_all(name=\"ANNOTATION_VALUE\") \n", 443 | " time_encodings_b = BeautifulSoup(content, 'xml').find_all(name=\"TIME_SLOT\") \n", 444 | " for value in range(0, len(transcript_content_b)): \n", 445 | " #if the value of the tags attribute TIER_ID is a german sentence from speaker B, extract it \n", 446 | " if transcript_content_b[value].parent.parent.parent.attrs['TIER_ID'] == \"Deutsche_Übersetzung_B\": \n", 447 | " #this is the time encoding for the sentence (both starting and ending) \n", 448 | " time = transcript_content_b[value].parent.attrs \n", 449 | " #this is the starting time of the sentence \n", 450 | " start = time['TIME_SLOT_REF1'] \n", 451 | " #this is the ending time of the sentencec \n", 452 | " end = time['TIME_SLOT_REF2'] \n", 453 | " #the sentence itself \n", 454 | " sentence_b = transcript_content_b[value].text \n", 455 | " #group the sentence + its start + its end \n", 456 | " sentence_group_b = [sentence_b, start, end] \n", 457 | " #add the german sentence to the list of german sentences \n", 458 | " german_sentences_b.append(sentence_group_b) " 459 | ] 460 | }, 461 | { 462 | "cell_type": "markdown", 463 | "metadata": {}, 464 | "source": [ 465 | "#### Save the list with german sentences B using pickle " 466 | ] 467 | }, 468 | { 469 | "cell_type": "code", 470 | "execution_count": 18, 471 | "metadata": {}, 472 | "outputs": [], 473 | "source": [ 474 | "#save the list using pickle where each element is: sentence + start + time \n", 475 | "#to use it for extracting the gloss sentences later \n", 476 | "\n", 477 | "with open(\"path\", \"wb\") as fp: \n", 478 | " pickle.dump(german_sentences_b, fp) " 479 | ] 480 | }, 481 | { 482 | "cell_type": "markdown", 483 | "metadata": {}, 484 | "source": [ 485 | "#### Create a data frame for the sentences B " 486 | ] 487 | }, 488 | { 489 | "cell_type": "code", 490 | "execution_count": 20, 491 | "metadata": {}, 492 | "outputs": [], 493 | "source": [ 494 | "#list with only the sentence from the list with sentences B (no timestamps included) \n", 495 | "data_b = [] \n", 496 | "\n", 497 | "for s in range(0, len(german_sentences_b)): \n", 498 | " data_b.append(german_sentences_b[s][0]) " 499 | ] 500 | }, 501 | { 502 | "cell_type": "code", 503 | "execution_count": 21, 504 | "metadata": {}, 505 | "outputs": [ 506 | { 507 | "data": { 508 | "text/html": [ 509 | "
\n", 510 | "\n", 523 | "\n", 524 | " \n", 525 | " \n", 526 | " \n", 527 | " \n", 528 | " \n", 529 | " \n", 530 | " \n", 531 | " \n", 532 | " \n", 533 | " \n", 534 | " \n", 535 | " \n", 536 | " \n", 537 | " \n", 538 | " \n", 539 | " \n", 540 | " \n", 541 | " \n", 542 | " \n", 543 | " \n", 544 | " \n", 545 | " \n", 546 | " \n", 547 | " \n", 548 | " \n", 549 | " \n", 550 | " \n", 551 | " \n", 552 | " \n", 553 | " \n", 554 | " \n", 555 | " \n", 556 | " \n", 557 | " \n", 558 | " \n", 559 | " \n", 560 | " \n", 561 | " \n", 562 | " \n", 563 | " \n", 564 | " \n", 565 | " \n", 566 | " \n", 567 | " \n", 568 | " \n", 569 | " \n", 570 | " \n", 571 | " \n", 572 | " \n", 573 | " \n", 574 | " \n", 575 | " \n", 576 | "
German Sentence
0Ich war traurig, als ich von Dianas tödlichem ...
1Denn als sie noch am Leben war, hat sie der We...
2Sie war die beste und netteste Königin von Eng...
3Darum war ich schockiert und traurig über den ...
4Weil es sie nicht mehr geben würde.
......
32375Hausaufgaben? In Mathematik, Deutsch.
32376Wenn ich zum Beispiel im Unterricht nicht fert...
32377Wenn man die Aufgaben vergaß, gab es eine Strafe.
32378Wenn der fertig war?
32379Dann hat er sie mir gegeben, selbstverständlich.
\n", 577 | "

32380 rows × 1 columns

\n", 578 | "
" 579 | ], 580 | "text/plain": [ 581 | " German Sentence\n", 582 | "0 Ich war traurig, als ich von Dianas tödlichem ...\n", 583 | "1 Denn als sie noch am Leben war, hat sie der We...\n", 584 | "2 Sie war die beste und netteste Königin von Eng...\n", 585 | "3 Darum war ich schockiert und traurig über den ...\n", 586 | "4 Weil es sie nicht mehr geben würde.\n", 587 | "... ...\n", 588 | "32375 Hausaufgaben? In Mathematik, Deutsch.\n", 589 | "32376 Wenn ich zum Beispiel im Unterricht nicht fert...\n", 590 | "32377 Wenn man die Aufgaben vergaß, gab es eine Strafe.\n", 591 | "32378 Wenn der fertig war?\n", 592 | "32379 Dann hat er sie mir gegeben, selbstverständlich.\n", 593 | "\n", 594 | "[32380 rows x 1 columns]" 595 | ] 596 | }, 597 | "execution_count": 21, 598 | "metadata": {}, 599 | "output_type": "execute_result" 600 | } 601 | ], 602 | "source": [ 603 | "#create a data frame from the list with sentences B \n", 604 | "df_b = pd.DataFrame(data_b, columns=[\"German Sentence\"]) \n", 605 | "\n", 606 | "df_b " 607 | ] 608 | }, 609 | { 610 | "cell_type": "code", 611 | "execution_count": 22, 612 | "metadata": {}, 613 | "outputs": [], 614 | "source": [ 615 | "#save it as a file where each sentence is on a new line \n", 616 | "df_b.to_csv(f\"path\", encoding=\"utf-8-sig\", index=False, header=False) " 617 | ] 618 | }, 619 | { 620 | "cell_type": "markdown", 621 | "metadata": {}, 622 | "source": [ 623 | "
" 624 | ] 625 | }, 626 | { 627 | "cell_type": "markdown", 628 | "metadata": {}, 629 | "source": [ 630 | "#### Concatenating df_a and df_b gives a total of 63922 sentences " 631 | ] 632 | }, 633 | { 634 | "cell_type": "code", 635 | "execution_count": 23, 636 | "metadata": {}, 637 | "outputs": [], 638 | "source": [ 639 | "frames = [df_a, df_b] \n", 640 | "\n", 641 | "result = pd.concat(frames) " 642 | ] 643 | }, 644 | { 645 | "cell_type": "code", 646 | "execution_count": 24, 647 | "metadata": {}, 648 | "outputs": [], 649 | "source": [ 650 | "#save the data frame with the concatenated data frames for sentences a and sentences b \n", 651 | "result.to_csv(f\"path\", encoding=\"utf-8-sig\", index=False, header=False) \n" 652 | ] 653 | }, 654 | { 655 | "cell_type": "code", 656 | "execution_count": null, 657 | "metadata": {}, 658 | "outputs": [], 659 | "source": [] 660 | } 661 | ], 662 | "metadata": { 663 | "kernelspec": { 664 | "display_name": "Python 3", 665 | "language": "python", 666 | "name": "python3" 667 | }, 668 | "language_info": { 669 | "codemirror_mode": { 670 | "name": "ipython", 671 | "version": 3 672 | }, 673 | "file_extension": ".py", 674 | "mimetype": "text/x-python", 675 | "name": "python", 676 | "nbconvert_exporter": "python", 677 | "pygments_lexer": "ipython3", 678 | "version": "3.7.6" 679 | } 680 | }, 681 | "nbformat": 4, 682 | "nbformat_minor": 4 683 | } 684 | -------------------------------------------------------------------------------- /notebooks/training-data-dev-data-similarity.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "cells": [ 3 | { 4 | "cell_type": "markdown", 5 | "metadata": {}, 6 | "source": [ 7 | "#### This is a script to check how similar are the training and the dev sets" 8 | ] 9 | }, 10 | { 11 | "cell_type": "code", 12 | "execution_count": 1, 13 | "metadata": {}, 14 | "outputs": [], 15 | "source": [ 16 | "#imports \n", 17 | "import pandas as pd \n", 18 | "import csv \n", 19 | "import re \n", 20 | "from pathlib import Path \n", 21 | "from tqdm import tqdm " 22 | ] 23 | }, 24 | { 25 | "cell_type": "markdown", 26 | "metadata": {}, 27 | "source": [ 28 | "
\n", 29 | "\n", 30 | "#### Define in/out files \n", 31 | " \n", 32 | "
" 33 | ] 34 | }, 35 | { 36 | "cell_type": "code", 37 | "execution_count": 19, 38 | "metadata": {}, 39 | "outputs": [], 40 | "source": [ 41 | "dgs_dir = Path('path')\n", 42 | "\n", 43 | "glosses_stem_train = dgs_dir / 'glosses_stem_train.txt'\n", 44 | "glosses_stem_dev = dgs_dir / 'glosses_stem_dev.txt'\n", 45 | "\n", 46 | "glosses_train = dgs_dir / 'glosses_train.txt'\n", 47 | "glosses_dev = dgs_dir / 'glosses_dev.txt' \n", 48 | "\n", 49 | "dgs_stripped_train = dgs_dir / 'german_stripped_train.txt' \n", 50 | "dgs_stripped_dev = dgs_dir / 'german_stripped_dev.txt'\n", 51 | "\n", 52 | "###############################################################\n", 53 | "\n", 54 | "phoenix_dir = Path('path')\n", 55 | "\n", 56 | "phoenix_train = phoenix_dir / 'phoenix_train_glosses.txt'\n", 57 | "phoenix_dev = phoenix_dir / 'phoenix_dev_glosses.txt' \n", 58 | "\n", 59 | "phoenix_sentences_train = phoenix_dir / 'phoenix_train_sentences.txt' \n", 60 | "phoenix_sentences_dev = phoenix_dir / 'phoenix_dev_sentences.txt' \n", 61 | "\n", 62 | "###############################################################\n", 63 | "\n", 64 | "assert glosses_stem_train.exists(), 'dgs training set not found'\n", 65 | "assert glosses_stem_dev.exists(), 'dgs dev set not found'\n", 66 | "assert phoenix_train.exists(), 'phoenix training set not found'\n", 67 | "assert phoenix_dev.exists(), 'phoenix dev set not found' " 68 | ] 69 | }, 70 | { 71 | "cell_type": "code", 72 | "execution_count": 6, 73 | "metadata": {}, 74 | "outputs": [], 75 | "source": [ 76 | "line = \"This is a sentence\"" 77 | ] 78 | }, 79 | { 80 | "cell_type": "code", 81 | "execution_count": 7, 82 | "metadata": {}, 83 | "outputs": [ 84 | { 85 | "data": { 86 | "text/plain": [ 87 | "['This', 'is', 'a', 'sentence']" 88 | ] 89 | }, 90 | "execution_count": 7, 91 | "metadata": {}, 92 | "output_type": "execute_result" 93 | } 94 | ], 95 | "source": [ 96 | "line.split()" 97 | ] 98 | }, 99 | { 100 | "cell_type": "code", 101 | "execution_count": 9, 102 | "metadata": {}, 103 | "outputs": [], 104 | "source": [ 105 | "def make_gloss_set(in_txt):\n", 106 | " glosses_df = pd.read_csv(in_txt, header=None)\n", 107 | " list_of_gloss_sentences = glosses_df[0].tolist()\n", 108 | " \n", 109 | " list_of_glosses = []\n", 110 | " \n", 111 | " for sentence in list_of_gloss_sentences:\n", 112 | " for gloss in str(sentence).split():\n", 113 | " list_of_glosses.append(gloss)\n", 114 | " \n", 115 | " len_list = len(list_of_glosses)\n", 116 | " set_of_glosses = set(list_of_glosses)\n", 117 | " len_set = len(set_of_glosses)\n", 118 | " return(set_of_glosses, len_list, len_set) " 119 | ] 120 | }, 121 | { 122 | "cell_type": "markdown", 123 | "metadata": {}, 124 | "source": [ 125 | "#### Phoenix training set has 55 247 glosses and 1085 of them are unique. " 126 | ] 127 | }, 128 | { 129 | "cell_type": "markdown", 130 | "metadata": {}, 131 | "source": [ 132 | "#### Phoenix dev set has 3 748 glosses and 393 of them are unique." 133 | ] 134 | }, 135 | { 136 | "cell_type": "markdown", 137 | "metadata": {}, 138 | "source": [ 139 | "#### Overlap of the training and dev set of Phoenix is 381 glosses." 140 | ] 141 | }, 142 | { 143 | "cell_type": "markdown", 144 | "metadata": {}, 145 | "source": [ 146 | "---" 147 | ] 148 | }, 149 | { 150 | "cell_type": "markdown", 151 | "metadata": {}, 152 | "source": [ 153 | "#### DGS training set has 301 772 glosses and 4 559 of them are unique." 154 | ] 155 | }, 156 | { 157 | "cell_type": "markdown", 158 | "metadata": {}, 159 | "source": [ 160 | "#### DGS dev set has 21 715 glosses and 1909 of them are unique." 161 | ] 162 | }, 163 | { 164 | "cell_type": "markdown", 165 | "metadata": {}, 166 | "source": [ 167 | "#### Overlap of training and dev set of the stemmed DGS glosses is 1845 glosses." 168 | ] 169 | }, 170 | { 171 | "cell_type": "markdown", 172 | "metadata": {}, 173 | "source": [ 174 | "---" 175 | ] 176 | }, 177 | { 178 | "cell_type": "markdown", 179 | "metadata": {}, 180 | "source": [ 181 | "#### DGS original training set has 301 772 glosses and 19 521 of them are unique." 182 | ] 183 | }, 184 | { 185 | "cell_type": "markdown", 186 | "metadata": {}, 187 | "source": [ 188 | "#### DGS original dev set has 21 715 glosses and 4 891 of them are unique." 189 | ] 190 | }, 191 | { 192 | "cell_type": "code", 193 | "execution_count": 52, 194 | "metadata": {}, 195 | "outputs": [], 196 | "source": [ 197 | "dgs_original_overlap = list(make_gloss_set(glosses_train)[0] & make_gloss_set(glosses_dev)[0]) " 198 | ] 199 | }, 200 | { 201 | "cell_type": "code", 202 | "execution_count": 54, 203 | "metadata": {}, 204 | "outputs": [ 205 | { 206 | "data": { 207 | "text/plain": [ 208 | "4418" 209 | ] 210 | }, 211 | "execution_count": 54, 212 | "metadata": {}, 213 | "output_type": "execute_result" 214 | } 215 | ], 216 | "source": [ 217 | "len(dgs_original_overlap)" 218 | ] 219 | }, 220 | { 221 | "cell_type": "markdown", 222 | "metadata": {}, 223 | "source": [ 224 | "#### Overlap of original training and dev set of DGS is 4418 glosses." 225 | ] 226 | }, 227 | { 228 | "cell_type": "code", 229 | "execution_count": null, 230 | "metadata": {}, 231 | "outputs": [], 232 | "source": [] 233 | } 234 | ], 235 | "metadata": { 236 | "kernelspec": { 237 | "display_name": "Python 3", 238 | "language": "python", 239 | "name": "python3" 240 | }, 241 | "language_info": { 242 | "codemirror_mode": { 243 | "name": "ipython", 244 | "version": 3 245 | }, 246 | "file_extension": ".py", 247 | "mimetype": "text/x-python", 248 | "name": "python", 249 | "nbconvert_exporter": "python", 250 | "pygments_lexer": "ipython3", 251 | "version": "3.7.6" 252 | } 253 | }, 254 | "nbformat": 4, 255 | "nbformat_minor": 4 256 | } 257 | -------------------------------------------------------------------------------- /training-scripts/dgs-baseline-rnn: -------------------------------------------------------------------------------- 1 | #!/bin/sh 2 | srun \ 3 | -K \ 4 | --container-mounts=/netscratch:/netscratch,/ds:/ds,$HOME:$HOME \ 5 | --container-workdir=/netscratch/angelova/experiments/sl-translation \ 6 | --container-image=/netscratch/avramidis/containers/lefterav+marian-nmt+1.10.0_sentencepiece_cuda-11.3.0_1.sqsh \ 7 | --ntasks=1 \ 8 | --nodes=1 \ 9 | --gpus=4 \ 10 | -p V100-16GB \ 11 | /marian/build/marian train \ 12 | --devices 0 1 2 3 \ 13 | --model /netscratch/angelova/experiments/sl-translation/model/dgs_baseline/dgs_baseline.npz \ 14 | --type s2s \ 15 | --dim-rnn 1024 \ 16 | --dim-emb 512 \ 17 | --layer-normalization \ 18 | --mini-batch 64 \ 19 | --learn-rate 0.0005 \ 20 | --optimizer adam \ 21 | --early-stopping 10 \ 22 | --cost-type=ce-mean-words \ 23 | --valid-metrics bleu-detok perplexity ce-mean-words translation \ 24 | --dim-vocabs 3000 3000 \ 25 | --sentencepiece-options '--model_type=word --vocab_size=3000 --hard_vocab_limit=true' \ 26 | --train-sets /netscratch/angelova/data/sl-translation/glosses_train.txt /netscratch/angelova/data/sl-translation/german_train.txt \ 27 | --vocabs /netscratch/angelova/experiments/sl-translation/model/dgs_baseline/vocab.gl_baseline.spm /netscratch/angelova/experiments/sl-translation/model/dgs_baseline/vocab.de_baseline.spm \ 28 | --valid-sets /netscratch/angelova/experiments/sl-translation/glosses_dev.txt /netscratch/angelova/experiments/sl-translation/german_dev.txt \ 29 | --log /netscratch/angelova/experiments/sl-translation/model/dgs_baseline/valid_dgs_baseline.log \ 30 | --lr-warmup 16000 \ 31 | --keep-best \ 32 | --valid-freq 400 \ 33 | --disp-freq 1000 \ 34 | --optimizer-params 0.9 0.98 1e-09 \ 35 | -------------------------------------------------------------------------------- /training-scripts/dgs-baseline-rnn-improved: -------------------------------------------------------------------------------- 1 | #!/bin/sh 2 | srun \ 3 | -K \ 4 | --container-mounts=/netscratch:/netscratch,/ds:/ds,$HOME:$HOME \ 5 | --container-workdir=/netscratch/angelova/experiments/sl-translation \ 6 | --container-image=/netscratch/avramidis/containers/lefterav+marian-nmt+1.10.0_sentencepiece_cuda-11.3.0_1.sqsh \ 7 | --ntasks=1 \ 8 | --nodes=1 \ 9 | --gpus=4 \ 10 | -p RTXA6000 \ 11 | /marian/build/marian train \ 12 | --devices 0 1 2 3 \ 13 | --model /netscratch/angelova/experiments/sl-translation/model/dgs_nem_4/dgs_nem_4.npz \ 14 | --type s2s \ 15 | --dim-rnn 1024 \ 16 | --dim-emb 512 \ 17 | --enc-depth 1 \ 18 | --dec-depth 2 \ 19 | --enc-cell lstm \ 20 | --enc-cell-depth 2 \ 21 | --dec-cell-base-depth 2 \ 22 | --dec-cell lstm \ 23 | --layer-normalization \ 24 | --dropout-rnn 0.5 \ 25 | --dropout-src 0.4 \ 26 | --dropout-trg 0.4 \ 27 | --label-smoothing 0.2 \ 28 | --max-length 200 \ 29 | --mini-batch 32 \ 30 | --learn-rate 0.0005 \ 31 | --lr-report \ 32 | --optimizer adam \ 33 | --early-stopping 10 \ 34 | --beam-size 5 \ 35 | --cost-type=ce-mean-words \ 36 | --valid-metrics bleu-detok perplexity ce-mean-words \ 37 | --dim-vocabs 2600 2600 \ 38 | --sentencepiece-options '--model_type=word --vocab_size=2600 --hard_vocab_limit=true' \ 39 | --train-sets /netscratch/angelova/data/sl-translation/glosses_train.txt /netscratch/angelova/data/sl-translation/german_train.txt \ 40 | --vocabs /netscratch/angelova/experiments/sl-translation/model/dgs_nem_4/vocab.gl_dgs_nem_4.spm /netscratch/angelova/experiments/sl-translation/model/dgs_nem_4/vocab.de_dgs_nem_4.spm \ 41 | --valid-sets /netscratch/angelova/experiments/sl-translation/glosses_dev.txt /netscratch/angelova/experiments/sl-translation/german_dev.txt \ 42 | --log /netscratch/angelova/experiments/sl-translation/model/dgs_nem_4/valid_dgs_nem_4.log \ 43 | --lr-warmup 16000 \ 44 | --keep-best \ 45 | --valid-freq 500 \ 46 | --disp-freq 1000 \ 47 | --optimizer-params 0.9 0.98 1e-09 \ 48 | -------------------------------------------------------------------------------- /training-scripts/dgs-baseline-transformer: -------------------------------------------------------------------------------- 1 | #!/bin/sh 2 | srun \ 3 | -K \ 4 | --container-mounts=/netscratch:/netscratch,/ds:/ds,$HOME:$HOME \ 5 | --container-workdir=/netscratch/angelova/experiments/sl-translation \ 6 | --container-image=/netscratch/avramidis/containers/lefterav+marian-nmt+1.10.0_sentencepiece_cuda-11.3.0_1.sqsh \ 7 | --ntasks=1 \ 8 | --nodes=1 \ 9 | --gpus=4 \ 10 | -p RTX2080Ti \ 11 | /marian/build/marian train \ 12 | --devices 0 1 2 3 \ 13 | --model /netscratch/angelova/experiments/sl-translation/model/dgs_baseline_transf/dgs_baseline_transf.npz \ 14 | --type transformer \ 15 | --dim-emb 512 \ 16 | --layer-normalization \ 17 | --mini-batch 64 \ 18 | --learn-rate 0.0005 \ 19 | --optimizer adam \ 20 | --early-stopping 10 \ 21 | --cost-type=ce-mean-words \ 22 | --valid-metrics bleu-detok perplexity ce-mean-words translation \ 23 | --dim-vocabs 3000 3000 \ 24 | --sentencepiece-options '--model_type=word --vocab_size=3000 --hard_vocab_limit=true' \ 25 | --train-sets /netscratch/angelova/data/sl-translation/glosses_train.txt /netscratch/angelova/data/sl-translation/german_train.txt \ 26 | --vocabs /netscratch/angelova/experiments/sl-translation/model/dgs_baseline_transf/vocab.gl_baseline_transf.spm /netscratch/angelova/experiments/sl-translation/model/dgs_baseline_transf/vocab.de_baseline_transf.spm \ 27 | --valid-sets /netscratch/angelova/experiments/sl-translation/glosses_dev.txt /netscratch/angelova/experiments/sl-translation/german_dev.txt \ 28 | --log /netscratch/angelova/experiments/sl-translation/model/dgs_baseline_transf/valid_dgs_baseline_transf.log \ 29 | --lr-warmup 16000 \ 30 | --keep-best \ 31 | --valid-freq 400 \ 32 | --disp-freq 1000 \ 33 | --optimizer-params 0.9 0.98 1e-09 \ 34 | -------------------------------------------------------------------------------- /training-scripts/dgs-baseline-transformer-improved: -------------------------------------------------------------------------------- 1 | #!/bin/sh 2 | srun \ 3 | -K \ 4 | --container-mounts=/netscratch:/netscratch,/ds:/ds,$HOME:$HOME \ 5 | --container-workdir=/netscratch/angelova/experiments/sl-translation \ 6 | --container-image=/netscratch/avramidis/containers/lefterav+marian-nmt+1.10.0_sentencepiece_cuda-11.3.0_1.sqsh \ 7 | --ntasks=1 \ 8 | --nodes=1 \ 9 | --gpus=4 \ 10 | -p RTX6000 \ 11 | /marian/build/marian train \ 12 | --devices 0 1 2 3 \ 13 | --model /netscratch/angelova/experiments/sl-translation/model/dgs_transf_improved/dgs_transf_improved.npz \ 14 | --type transformer \ 15 | --dim-emb 512 \ 16 | --enc-depth 1 \ 17 | --dec-depth 2 \ 18 | --layer-normalization \ 19 | --dropout-rnn 0.5 \ 20 | --dropout-src 0.4 \ 21 | --dropout-trg 0.4 \ 22 | --label-smoothing 0.2 \ 23 | --max-length 200 \ 24 | --mini-batch 32 \ 25 | --learn-rate 0.0005 \ 26 | --lr-report \ 27 | --optimizer adam \ 28 | --early-stopping 10 \ 29 | --beam-size 5 \ 30 | --cost-type=ce-mean-words \ 31 | --valid-metrics bleu-detok perplexity ce-mean-words \ 32 | --dim-vocabs 2600 2600 \ 33 | --sentencepiece-options '--model_type=word --vocab_size=2600 --hard_vocab_limit=true' \ 34 | --train-sets /netscratch/angelova/data/sl-translation/glosses_train.txt /netscratch/angelova/data/sl-translation/german_train.txt \ 35 | --vocabs /netscratch/angelova/experiments/sl-translation/model/dgs_nem_4/vocab.gl_dgs_transf_improved.spm /netscratch/angelova/experiments/sl-translation/model/dgs_nem_4/vocab.de_dgs_transf_improved.spm \ 36 | --valid-sets /netscratch/angelova/experiments/sl-translation/glosses_dev.txt /netscratch/angelova/experiments/sl-translation/german_dev.txt \ 37 | --log /netscratch/angelova/experiments/sl-translation/model/dgs_transf_improved/valid_dgs_transf_improved.log \ 38 | --lr-warmup 16000 \ 39 | --keep-best \ 40 | --valid-freq 500 \ 41 | --disp-freq 1000 \ 42 | --optimizer-params 0.9 0.98 1e-09 \ 43 | -------------------------------------------------------------------------------- /training-scripts/dgs-bpe-tok: -------------------------------------------------------------------------------- 1 | #!/bin/sh 2 | srun \ 3 | -K \ 4 | --container-mounts=/netscratch:/netscratch,/ds:/ds,$HOME:$HOME \ 5 | --container-workdir=/netscratch/angelova/experiments/sl-translation \ 6 | --container-image=/netscratch/avramidis/containers/lefterav+marian-nmt+1.10.0_sentencepiece_cuda-11.3.0_1.sqsh \ 7 | --ntasks=1 \ 8 | --nodes=1 \ 9 | --gpus=4 \ 10 | -p RTX6000 \ 11 | /marian/build/marian train \ 12 | --devices 0 1 2 3 \ 13 | --model /netscratch/angelova/experiments/sl-translation/model/model_nematus_bpe_7.npz \ 14 | --type s2s \ 15 | --dim-rnn 1024 \ 16 | --dim-emb 512 \ 17 | --enc-depth 1 \ 18 | --dec-depth 2 \ 19 | --enc-cell lstm \ 20 | --enc-cell-depth 2 \ 21 | --dec-cell-base-depth 2 \ 22 | --dec-cell lstm \ 23 | --layer-normalization \ 24 | --dropout-rnn 0.5 \ 25 | --dropout-src 0.4 \ 26 | --dropout-trg 0.4 \ 27 | --label-smoothing 0.2 \ 28 | --max-length 200 \ 29 | --mini-batch 32 \ 30 | --learn-rate 0.0005 \ 31 | --optimizer adam \ 32 | --early-stopping 10 \ 33 | --beam-size 5 \ 34 | --cost-type=ce-mean-words \ 35 | --valid-metrics ce-mean-words perplexity translation bleu-detok \ 36 | --dim-vocabs 2600 2600 \ 37 | --sentencepiece-options '--model_type=bpe --vocab_size=2600 --hard_vocab_limit=true' \ 38 | --train-sets /netscratch/angelova/data/sl-translation/glosses_train.txt /netscratch/angelova/data/sl-translation/sentences_train.txt \ 39 | --vocabs /netscratch/angelova/experiments/sl-translation/model/vocab.gl_nem_bpe_7.spm /netscratch/angelova/experiments/sl-translation/model/vocab.de_nem_bpe_7.spm \ 40 | --valid-sets /netscratch/angelova/experiments/sl-translation/glosses_dev.txt /netscratch/angelova/experiments/sl-translation/sentences_dev.txt \ 41 | --log /netscratch/angelova/experiments/sl-translation/model/valid_nem_bpe_7.log \ 42 | --lr-warmup 16000 \ 43 | --keep-best \ 44 | --valid-freq 500 \ 45 | --disp-freq 1000 \ 46 | --optimizer-params 0.9 0.98 1e-09 \ 47 | -------------------------------------------------------------------------------- /training-scripts/dgs-bpe-tok-stemmed: -------------------------------------------------------------------------------- 1 | #!/bin/sh 2 | srun \ 3 | -K \ 4 | --container-mounts=/netscratch:/netscratch,/ds:/ds,$HOME:$HOME \ 5 | --container-workdir=/netscratch/angelova/experiments/sl-translation \ 6 | --container-image=/netscratch/avramidis/containers/lefterav+marian-nmt+1.10.0_sentencepiece_cuda-11.3.0_1.sqsh \ 7 | --ntasks=1 \ 8 | --nodes=1 \ 9 | --gpus=4 \ 10 | -p RTX6000 \ 11 | /marian/build/marian train \ 12 | --devices 0 1 2 3 \ 13 | --model /netscratch/angelova/experiments/sl-translation/model/dgs_nem_1.npz \ 14 | --type s2s \ 15 | --dim-rnn 1024 \ 16 | --dim-emb 512 \ 17 | --enc-depth 1 \ 18 | --dec-depth 2 \ 19 | --enc-cell lstm \ 20 | --enc-cell-depth 2 \ 21 | --dec-cell-base-depth 2 \ 22 | --dec-cell lstm \ 23 | --layer-normalization \ 24 | --dropout-rnn 0.5 \ 25 | --dropout-src 0.4 \ 26 | --dropout-trg 0.4 \ 27 | --label-smoothing 0.2 \ 28 | --max-length 200 \ 29 | --mini-batch 32 \ 30 | --learn-rate 0.0005 \ 31 | --optimizer adam \ 32 | --early-stopping 10 \ 33 | --beam-size 5 \ 34 | --cost-type=ce-mean-words \ 35 | --valid-metrics ce-mean-words perplexity translation bleu-detok \ 36 | --dim-vocabs 2600 2600 \ 37 | --sentencepiece-options '--model_type=bpe --vocab_size=2600 --hard_vocab_limit=true' \ 38 | --train-sets /netscratch/angelova/data/sl-translation/glosses_stem_train.txt /netscratch/angelova/data/sl-translation/german_stripped_train.txt \ 39 | --vocabs /netscratch/angelova/experiments/sl-translation/model/vocab.gl_dgs_nem_1.spm /netscratch/angelova/experiments/sl-translation/model/vocab.de_dgs_nem_1.spm \ 40 | --valid-sets /netscratch/angelova/experiments/sl-translation/glosses_stem_dev.txt /netscratch/angelova/experiments/sl-translation/german_stripped_dev.txt \ 41 | --log /netscratch/angelova/experiments/sl-translation/model/valid_dgs_nem_1.log \ 42 | --lr-warmup 16000 \ 43 | --keep-best \ 44 | --valid-freq 400 \ 45 | --disp-freq 1000 \ 46 | --optimizer-params 0.9 0.98 1e-09 \ 47 | -------------------------------------------------------------------------------- /training-scripts/dgs-custom-tok: -------------------------------------------------------------------------------- 1 | #!/bin/sh 2 | srun \ 3 | -K \ 4 | --container-mounts=/netscratch:/netscratch,/ds:/ds,$HOME:$HOME \ 5 | --container-workdir=/netscratch/angelova/experiments/sl-translation \ 6 | --container-image=/netscratch/avramidis/containers/lefterav+marian-nmt+1.10.0_sentencepiece_cuda-11.3.0_1.sqsh \ 7 | --ntasks=1 \ 8 | --nodes=1 \ 9 | --gpus=4 \ 10 | -p V100-16GB \ 11 | /marian/build/marian train \ 12 | --devices 0 1 2 3 \ 13 | --model /netscratch/angelova/experiments/sl-translation/model/dgs_nem_5/dgs_nem_5.npz \ 14 | --type s2s \ 15 | --dim-rnn 1024 \ 16 | --dim-emb 512 \ 17 | --enc-depth 1 \ 18 | --dec-depth 2 \ 19 | --enc-cell lstm \ 20 | --enc-cell-depth 2 \ 21 | --dec-cell-base-depth 2 \ 22 | --dec-cell lstm \ 23 | --layer-normalization \ 24 | --dropout-rnn 0.5 \ 25 | --dropout-src 0.4 \ 26 | --dropout-trg 0.4 \ 27 | --label-smoothing 0.2 \ 28 | --max-length 200 \ 29 | --mini-batch 32 \ 30 | --learn-rate 0.0005 \ 31 | --lr-report \ 32 | --optimizer adam \ 33 | --early-stopping 10 \ 34 | --beam-size 5 \ 35 | --cost-type=ce-mean-words \ 36 | --valid-metrics bleu-detok perplexity ce-mean-words \ 37 | --dim-vocabs 2600 2600 \ 38 | --sentencepiece-options '--model_type=word --vocab_size=2600 --hard_vocab_limit=true' \ 39 | --train-sets /netscratch/angelova/data/sl-translation/glosses_tok_train.txt /netscratch/angelova/data/sl-translation/german_train.txt \ 40 | --vocabs /netscratch/angelova/experiments/sl-translation/model/dgs_nem_5/vocab.gl_dgs_nem_5.spm /netscratch/angelova/experiments/sl-translation/model/dgs_nem_5/vocab.de_dgs_nem_5.spm \ 41 | --valid-sets /netscratch/angelova/experiments/sl-translation/glosses_tok_dev.txt /netscratch/angelova/experiments/sl-translation/german_dev.txt \ 42 | --log /netscratch/angelova/experiments/sl-translation/model/dgs_nem_5/valid_dgs_nem_5.log \ 43 | --lr-warmup 16000 \ 44 | --keep-best \ 45 | --valid-freq 400 \ 46 | --disp-freq 1000 \ 47 | --optimizer-params 0.9 0.98 1e-09 \ 48 | -------------------------------------------------------------------------------- /training-scripts/dgs-unigram-tok: -------------------------------------------------------------------------------- 1 | #!/bin/sh 2 | srun \ 3 | -K \ 4 | --container-mounts=/netscratch:/netscratch,/ds:/ds,$HOME:$HOME \ 5 | --container-workdir=/netscratch/angelova/experiments/sl-translation \ 6 | --container-image=/netscratch/avramidis/containers/lefterav+marian-nmt+1.10.0_sentencepiece_cuda-11.3.0_1.sqsh \ 7 | --ntasks=1 \ 8 | --nodes=1 \ 9 | --gpus=4 \ 10 | -p RTX6000 \ 11 | /marian/build/marian train \ 12 | --devices 0 1 2 3 \ 13 | --model /netscratch/angelova/experiments/sl-translation/model/model_nematus_unigram_1.npz \ 14 | --type s2s \ 15 | --dim-rnn 1024 \ 16 | --dim-emb 512 \ 17 | --enc-depth 1 \ 18 | --dec-depth 2 \ 19 | --enc-cell lstm \ 20 | --enc-cell-depth 2 \ 21 | --dec-cell-base-depth 2 \ 22 | --dec-cell lstm \ 23 | --layer-normalization \ 24 | --dropout-rnn 0.5 \ 25 | --dropout-src 0.4 \ 26 | --dropout-trg 0.4 \ 27 | --label-smoothing 0.2 \ 28 | --max-length 200 \ 29 | --mini-batch 32 \ 30 | --learn-rate 0.0005 \ 31 | --optimizer adam \ 32 | --early-stopping 10 \ 33 | --beam-size 5 \ 34 | --cost-type=ce-mean-words \ 35 | --valid-metrics ce-mean-words perplexity translation bleu-detok \ 36 | --dim-vocabs 2600 2600 \ 37 | --sentencepiece-options '--model_type=unigram --vocab_size=2600 --hard_vocab_limit=true' \ 38 | --train-sets /netscratch/angelova/data/sl-translation/glosses_train.txt /netscratch/angelova/data/sl-translation/sentences_train.txt \ 39 | --vocabs /netscratch/angelova/experiments/sl-translation/model/vocab.gl_nem_unigram_1.spm /netscratch/angelova/experiments/sl-translation/model/vocab.de_nem_unigram_1.spm \ 40 | --valid-sets /netscratch/angelova/experiments/sl-translation/glosses_dev.txt /netscratch/angelova/experiments/sl-translation/sentences_dev.txt \ 41 | --log /netscratch/angelova/experiments/sl-translation/model/valid_nem_unigram_1.log \ 42 | --lr-warmup 16000 \ 43 | --keep-best \ 44 | --valid-freq 500 \ 45 | --disp-freq 1000 \ 46 | --optimizer-params 0.9 0.98 1e-09 \ 47 | -------------------------------------------------------------------------------- /training-scripts/phoenix-baseline-rnn: -------------------------------------------------------------------------------- 1 | #!/bin/sh 2 | srun \ 3 | -K \ 4 | --container-mounts=/netscratch:/netscratch,/ds:/ds,$HOME:$HOME \ 5 | --container-workdir=/netscratch/angelova/experiments/sl-translation \ 6 | --container-image=/netscratch/avramidis/containers/lefterav+marian-nmt+1.10.0_sentencepiece_cuda-11.3.0_1.sqsh \ 7 | --ntasks=1 \ 8 | --nodes=1 \ 9 | --gpus=4 \ 10 | -p RTX2080Ti \ 11 | /marian/build/marian train \ 12 | --devices 0 1 2 3 \ 13 | --model /netscratch/angelova/experiments/sl-translation/model/phoenix_baseline/phoenix_baseline.npz \ 14 | --type s2s \ 15 | --dim-rnn 1024 \ 16 | --dim-emb 512 \ 17 | --layer-normalization \ 18 | --mini-batch 64 \ 19 | --learn-rate 0.0005 \ 20 | --optimizer adam \ 21 | --early-stopping 10 \ 22 | --cost-type=ce-mean-words \ 23 | --valid-metrics bleu-detok perplexity ce-mean-words translation \ 24 | --dim-vocabs 1000 1000 \ 25 | --sentencepiece-options '--model_type=word --vocab_size=1000 --hard_vocab_limit=true' \ 26 | --train-sets /netscratch/angelova/data/sl-translation/phoenix_train_glosses.txt /netscratch/angelova/data/sl-translation/phoenix_train_sentences.txt \ 27 | --vocabs /netscratch/angelova/experiments/sl-translation/model/phoenix_baseline/vocab.ph_gl_baseline.spm /netscratch/angelova/experiments/sl-translation/model/phoenix_baseline/vocab.ph_de_baseline.spm \ 28 | --valid-sets /netscratch/angelova/experiments/sl-translation/phoenix_dev_glosses.txt /netscratch/angelova/experiments/sl-translation/phoenix_dev_sentences.txt \ 29 | --log /netscratch/angelova/experiments/sl-translation/model/phoenix_baseline/valid_ph_baseline.log \ 30 | --lr-warmup 16000 \ 31 | --keep-best \ 32 | --valid-freq 400 \ 33 | --disp-freq 1000 \ 34 | --optimizer-params 0.9 0.98 1e-09 \ 35 | -------------------------------------------------------------------------------- /training-scripts/phoenix-baseline-rnn-improved: -------------------------------------------------------------------------------- 1 | #!/bin/sh 2 | srun \ 3 | -K \ 4 | --container-mounts=/netscratch:/netscratch,/ds:/ds,$HOME:$HOME \ 5 | --container-workdir=/netscratch/angelova/experiments/sl-translation \ 6 | --container-image=/netscratch/avramidis/containers/lefterav+marian-nmt+1.10.0_sentencepiece_cuda-11.3.0_1.sqsh \ 7 | --ntasks=1 \ 8 | --nodes=1 \ 9 | --gpus=4 \ 10 | -p RTX6000 \ 11 | /marian/build/marian train \ 12 | --devices 0 1 2 3 \ 13 | --model /netscratch/angelova/experiments/sl-translation/model/phoenix_nem_8/phoenix_nem_8.npz \ 14 | --type s2s \ 15 | --dim-rnn 1024 \ 16 | --dim-emb 512 \ 17 | --enc-depth 1 \ 18 | --dec-depth 2 \ 19 | --enc-cell lstm \ 20 | --enc-cell-depth 2 \ 21 | --dec-cell-base-depth 2 \ 22 | --dec-cell lstm \ 23 | --layer-normalization \ 24 | --dropout-rnn 0.5 \ 25 | --dropout-src 0.4 \ 26 | --dropout-trg 0.4 \ 27 | --label-smoothing 0.2 \ 28 | --max-length 200 \ 29 | --mini-batch 32 \ 30 | --learn-rate 0.0005 \ 31 | --lr-report \ 32 | --optimizer adam \ 33 | --early-stopping 10 \ 34 | --beam-size 5 \ 35 | --cost-type=ce-mean-words \ 36 | --valid-metrics ce-mean-words perplexity translation bleu-detok \ 37 | --dim-vocabs 1010 1010 \ 38 | --sentencepiece-options '--model_type=word --vocab_size=1010 --hard_vocab_limit=true' \ 39 | --train-sets /netscratch/angelova/data/sl-translation/phoenix_train_glosses.txt /netscratch/angelova/data/sl-translation/phoenix_train_sentences.txt \ 40 | --vocabs /netscratch/angelova/experiments/sl-translation/model/phoenix_nem_8/vocab.ph_gl_nem_8.spm /netscratch/angelova/experiments/sl-translation/model/phoenix_nem_8/vocab.ph_de_nem_8.spm \ 41 | --valid-sets /netscratch/angelova/experiments/sl-translation/phoenix_dev_glosses.txt /netscratch/angelova/experiments/sl-translation/phoenix_dev_sentences.txt \ 42 | --log /netscratch/angelova/experiments/sl-translation/model/phoenix_nem_8/valid_ph_nem_8.log \ 43 | --lr-warmup 16000 \ 44 | --keep-best \ 45 | --valid-freq 400 \ 46 | --disp-freq 1000 \ 47 | --optimizer-params 0.9 0.98 1e-09 \ 48 | -------------------------------------------------------------------------------- /training-scripts/phoenix-baseline-transformer: -------------------------------------------------------------------------------- 1 | #!/bin/sh 2 | srun \ 3 | -K \ 4 | --container-mounts=/netscratch:/netscratch,/ds:/ds,$HOME:$HOME \ 5 | --container-workdir=/netscratch/angelova/experiments/sl-translation \ 6 | --container-image=/netscratch/avramidis/containers/lefterav+marian-nmt+1.10.0_sentencepiece_cuda-11.3.0_1.sqsh \ 7 | --ntasks=1 \ 8 | --nodes=1 \ 9 | --gpus=4 \ 10 | -p RTX2080Ti \ 11 | /marian/build/marian train \ 12 | --devices 0 1 2 3 \ 13 | --model /netscratch/angelova/experiments/sl-translation/model/phoenix_baseline_transf/phoenix_baseline_transf.npz \ 14 | --type transformer \ 15 | --dim-emb 512 \ 16 | --layer-normalization \ 17 | --mini-batch 64 \ 18 | --learn-rate 0.0005 \ 19 | --optimizer adam \ 20 | --early-stopping 10 \ 21 | --cost-type=ce-mean-words \ 22 | --valid-metrics bleu-detok perplexity ce-mean-words translation \ 23 | --dim-vocabs 1000 1000 \ 24 | --sentencepiece-options '--model_type=word --vocab_size=1000 --hard_vocab_limit=true' \ 25 | --train-sets /netscratch/angelova/data/sl-translation/phoenix_train_glosses.txt /netscratch/angelova/data/sl-translation/phoenix_train_sentences.txt \ 26 | --vocabs /netscratch/angelova/experiments/sl-translation/model/phoenix_baseline_transf/vocab.ph_gl_baseline_transf.spm /netscratch/angelova/experiments/sl-translation/model/phoenix_baseline_transf/vocab.ph_de_baseline_transf.spm \ 27 | --valid-sets /netscratch/angelova/experiments/sl-translation/phoenix_dev_glosses.txt /netscratch/angelova/experiments/sl-translation/phoenix_dev_sentences.txt \ 28 | --log /netscratch/angelova/experiments/sl-translation/model/phoenix_baseline_transf/valid_ph_baseline_transf.log \ 29 | --lr-warmup 16000 \ 30 | --keep-best \ 31 | --valid-freq 400 \ 32 | --disp-freq 1000 \ 33 | --optimizer-params 0.9 0.98 1e-09 \ 34 | -------------------------------------------------------------------------------- /training-scripts/phoenix-baseline-transformer-improved: -------------------------------------------------------------------------------- 1 | #!/bin/sh 2 | srun \ 3 | -K \ 4 | --container-mounts=/netscratch:/netscratch,/ds:/ds,$HOME:$HOME \ 5 | --container-workdir=/netscratch/angelova/experiments/sl-translation \ 6 | --container-image=/netscratch/avramidis/containers/lefterav+marian-nmt+1.10.0_sentencepiece_cuda-11.3.0_1.sqsh \ 7 | --ntasks=1 \ 8 | --nodes=1 \ 9 | --gpus=4 \ 10 | -p RTX6000 \ 11 | /marian/build/marian train \ 12 | --devices 0 1 2 3 \ 13 | --model /netscratch/angelova/experiments/sl-translation/model/phoenix_transf_improved/phoenix_transf_imrpoved.npz \ 14 | --type transformer \ 15 | --dim-emb 512 \ 16 | --enc-depth 1 \ 17 | --dec-depth 2 \ 18 | --layer-normalization \ 19 | --dropout-rnn 0.5 \ 20 | --dropout-src 0.4 \ 21 | --dropout-trg 0.4 \ 22 | --label-smoothing 0.2 \ 23 | --max-length 200 \ 24 | --mini-batch 32 \ 25 | --learn-rate 0.0005 \ 26 | --lr-report \ 27 | --optimizer adam \ 28 | --early-stopping 10 \ 29 | --beam-size 5 \ 30 | --cost-type=ce-mean-words \ 31 | --valid-metrics ce-mean-words perplexity translation bleu-detok \ 32 | --dim-vocabs 1010 1010 \ 33 | --sentencepiece-options '--model_type=word --vocab_size=1010 --hard_vocab_limit=true' \ 34 | --train-sets /netscratch/angelova/data/sl-translation/phoenix_train_glosses.txt /netscratch/angelova/data/sl-translation/phoenix_train_sentences.txt \ 35 | --vocabs /netscratch/angelova/experiments/sl-translation/model/phoenix_transf_improved/vocab.ph_gl_transf_improved.spm /netscratch/angelova/experiments/sl-translation/model/phoenix_transf_improved/vocab.ph_transf_improved.spm \ 36 | --valid-sets /netscratch/angelova/experiments/sl-translation/phoenix_dev_glosses.txt /netscratch/angelova/experiments/sl-translation/phoenix_dev_sentences.txt \ 37 | --log /netscratch/angelova/experiments/sl-translation/model/phoenix_transf_improved/valid_ph_transf_improved.log \ 38 | --lr-warmup 16000 \ 39 | --keep-best \ 40 | --valid-freq 400 \ 41 | --disp-freq 1000 \ 42 | --optimizer-params 0.9 0.98 1e-09 \ 43 | -------------------------------------------------------------------------------- /training-scripts/phoenix-bpe-tok: -------------------------------------------------------------------------------- 1 | #!/bin/sh 2 | srun \ 3 | -K \ 4 | --container-mounts=/netscratch:/netscratch,/ds:/ds,$HOME:$HOME \ 5 | --container-workdir=/netscratch/angelova/experiments/sl-translation \ 6 | --container-image=/netscratch/avramidis/containers/lefterav+marian-nmt+1.10.0_sentencepiece_cuda-11.3.0_1.sqsh \ 7 | --ntasks=1 \ 8 | --nodes=1 \ 9 | --gpus=4 \ 10 | -p RTX6000 \ 11 | /marian/build/marian train \ 12 | --devices 0 1 2 3 \ 13 | --model /netscratch/angelova/experiments/sl-translation/model/phoenix_nem_1.npz \ 14 | --type s2s \ 15 | --dim-rnn 1024 \ 16 | --dim-emb 512 \ 17 | --enc-depth 1 \ 18 | --dec-depth 2 \ 19 | --enc-cell lstm \ 20 | --enc-cell-depth 2 \ 21 | --dec-cell-base-depth 2 \ 22 | --dec-cell lstm \ 23 | --layer-normalization \ 24 | --dropout-rnn 0.5 \ 25 | --dropout-src 0.4 \ 26 | --dropout-trg 0.4 \ 27 | --label-smoothing 0.2 \ 28 | --max-length 200 \ 29 | --mini-batch 32 \ 30 | --learn-rate 0.0005 \ 31 | --optimizer adam \ 32 | --early-stopping 10 \ 33 | --beam-size 5 \ 34 | --cost-type=ce-mean-words \ 35 | --valid-metrics ce-mean-words perplexity translation bleu-detok bleu \ 36 | --dim-vocabs 2600 2600 \ 37 | --sentencepiece-options '--model_type=bpe --vocab_size=2600 --hard_vocab_limit=true' \ 38 | --train-sets /netscratch/angelova/data/sl-translation/phoenix_train_glosses.txt /netscratch/angelova/data/sl-translation/phoenix_train_sentences.txt \ 39 | --vocabs /netscratch/angelova/experiments/sl-translation/model/vocab.ph_gl_nem_1.spm /netscratch/angelova/experiments/sl-translation/model/vocab.ph_de_nem_1.spm \ 40 | --valid-sets /netscratch/angelova/experiments/sl-translation/phoenix_dev_glosses.txt /netscratch/angelova/experiments/sl-translation/phoenix_dev_sentences.txt \ 41 | --log /netscratch/angelova/experiments/sl-translation/model/valid_ph_nem_1.log \ 42 | --lr-warmup 16000 \ 43 | --keep-best \ 44 | --valid-freq 400 \ 45 | --disp-freq 1000 \ 46 | --optimizer-params 0.9 0.98 1e-09 \ 47 | -------------------------------------------------------------------------------- /training-scripts/phoenix-bpe-tok-reduced: -------------------------------------------------------------------------------- 1 | #!/bin/sh 2 | srun \ 3 | -K \ 4 | --container-mounts=/netscratch:/netscratch,/ds:/ds,$HOME:$HOME \ 5 | --container-workdir=/netscratch/angelova/experiments/sl-translation \ 6 | --container-image=/netscratch/avramidis/containers/lefterav+marian-nmt+1.10.0_sentencepiece_cuda-11.3.0_1.sqsh \ 7 | --ntasks=1 \ 8 | --nodes=1 \ 9 | --gpus=4 \ 10 | -p GTX1080Ti \ 11 | /marian/build/marian train \ 12 | --devices 0 1 2 3 \ 13 | --model /netscratch/angelova/experiments/sl-translation/model/phoenix_nem_3/phoenix_nem_3.npz \ 14 | --type s2s \ 15 | --dim-rnn 1024 \ 16 | --dim-emb 512 \ 17 | --enc-depth 1 \ 18 | --dec-depth 2 \ 19 | --enc-cell lstm \ 20 | --enc-cell-depth 2 \ 21 | --dec-cell-base-depth 2 \ 22 | --dec-cell lstm \ 23 | --layer-normalization \ 24 | --dropout-rnn 0.5 \ 25 | --dropout-src 0.4 \ 26 | --dropout-trg 0.4 \ 27 | --label-smoothing 0.2 \ 28 | --max-length 200 \ 29 | --mini-batch 16 \ 30 | --learn-rate 0.0001 \ 31 | --lr-report 32 | --optimizer adam \ 33 | --early-stopping 10 \ 34 | --beam-size 2 \ 35 | --cost-type=ce-mean-words \ 36 | --valid-metrics bleu-detok perplexity ce-mean-words translation \ 37 | --dim-vocabs 2000 2000 \ 38 | --sentencepiece-options '--model_type=bpe --vocab_size=2000 --hard_vocab_limit=true' \ 39 | --train-sets /netscratch/angelova/data/sl-translation/phoenix_train_glosses.txt /netscratch/angelova/data/sl-translation/phoenix_train_sentences.txt \ 40 | --vocabs /netscratch/angelova/experiments/sl-translation/model/phoenix_nem_3/vocab.ph_gl_nem_3.spm /netscratch/angelova/experiments/sl-translation/model/phoenix_nem_3/vocab.ph_de_nem_3.spm \ 41 | --valid-sets /netscratch/angelova/experiments/sl-translation/phoenix_dev_glosses.txt /netscratch/angelova/experiments/sl-translation/phoenix_dev_sentences.txt \ 42 | --log /netscratch/angelova/experiments/sl-translation/model/phoenix_nem_3/valid_ph_nem_3.log \ 43 | --lr-warmup 16000 \ 44 | --keep-best \ 45 | --valid-freq 400 \ 46 | --disp-freq 1000 \ 47 | --optimizer-params 0.9 0.98 1e-09 \ 48 | -------------------------------------------------------------------------------- /training-scripts/phoenix-unigram-tok: -------------------------------------------------------------------------------- 1 | #!/bin/sh 2 | srun \ 3 | -K \ 4 | --container-mounts=/netscratch:/netscratch,/ds:/ds,$HOME:$HOME \ 5 | --container-workdir=/netscratch/angelova/experiments/sl-translation \ 6 | --container-image=/netscratch/avramidis/containers/lefterav+marian-nmt+1.10.0_sentencepiece_cuda-11.3.0_1.sqsh \ 7 | --ntasks=1 \ 8 | --nodes=1 \ 9 | --gpus=4 \ 10 | -p RTX6000 \ 11 | /marian/build/marian train \ 12 | --devices 0 1 2 3 \ 13 | --model /netscratch/angelova/experiments/sl-translation/model/phoenix_nem_2.npz \ 14 | --type s2s \ 15 | --dim-rnn 1024 \ 16 | --dim-emb 512 \ 17 | --enc-depth 1 \ 18 | --dec-depth 2 \ 19 | --enc-cell lstm \ 20 | --enc-cell-depth 2 \ 21 | --dec-cell-base-depth 2 \ 22 | --dec-cell lstm \ 23 | --layer-normalization \ 24 | --dropout-rnn 0.5 \ 25 | --dropout-src 0.4 \ 26 | --dropout-trg 0.4 \ 27 | --label-smoothing 0.2 \ 28 | --max-length 200 \ 29 | --mini-batch 32 \ 30 | --learn-rate 0.0005 \ 31 | --optimizer adam \ 32 | --early-stopping 10 \ 33 | --beam-size 5 \ 34 | --cost-type=ce-mean-words \ 35 | --valid-metrics ce-mean-words perplexity translation bleu-detok bleu \ 36 | --dim-vocabs 1010 1010 \ 37 | --sentencepiece-options '--model_type=unigram --vocab_size=1010 --hard_vocab_limit=true' \ 38 | --train-sets /netscratch/angelova/data/sl-translation/phoenix_train_glosses.txt /netscratch/angelova/data/sl-translation/phoenix_train_sentences.txt \ 39 | --vocabs /netscratch/angelova/experiments/sl-translation/model/vocab.ph_gl_nem_2.spm /netscratch/angelova/experiments/sl-translation/model/vocab.ph_de_nem_2.spm \ 40 | --valid-sets /netscratch/angelova/experiments/sl-translation/phoenix_dev_glosses.txt /netscratch/angelova/experiments/sl-translation/phoenix_dev_sentences.txt \ 41 | --log /netscratch/angelova/experiments/sl-translation/model/valid_ph_nem_2.log \ 42 | --lr-warmup 16000 \ 43 | --keep-best \ 44 | --valid-freq 400 \ 45 | --disp-freq 1000 \ 46 | --optimizer-params 0.9 0.98 1e-09 \ 47 | --------------------------------------------------------------------------------