showing top-{{MAX_SUBMISSION_DISPLAY_COUNT}} only, total number of submissions:
102 | {{submissions|length}}
103 |
104 | {% endif %}
105 |
106 |
107 | BLEU and ChrF are sacreBLEU scores.
108 | Systems in bold face are your submissions. We
109 | only display the top-{{MAX_SUBMISSION_DISPLAY_COUNT}}
110 | submissions per language pair. Submission validation errors
111 | denoted by -1.0 score.
112 |
113 | Click on the column header to sort the table. Hold down the
114 | Shift key and select a second column to sort by
115 | multiple criteria.
116 |
10 | OCELoT stands for Open, Competitive
11 | Evaluation Leaderboard
12 | of Translations.
13 | This project started as part of the
14 | Fifth Machine Translation Marathon in the Americas.
15 | Project OCELoT aims to create an open platform for competitive evaluation of machine
16 | translation output, based on both automatic metrics and human evalation. It has been used for
17 | several shared tasks, including the WMT General MT Task since 2020 as well as IWSLT shared tasks.
18 | Code is available from GitHub and shared
19 | under an open license.
20 |
5/7/2024: The submission deadline for the General MT task is extended by +12h.
34 |
4/7/2024: Submissions to the Low-Resource Languages of Spain task are open now.
35 |
2/7/2024: Submissions to the Biomedical Translation task are open now.
36 |
28/6/2024: Blind testset for WMT24 General MT task available from the Download page.
37 |
20/6/2024: OCELoT for WMT24 is live.
38 |
39 |
40 |
41 |
Competition rules
42 |
43 | The following rules apply to this year's shared task:
44 |
45 |
We only accept submissions from verified teams — participants of the tasks will have to contact us (maja.popovic.166@gmail.com) to verify their team account;
46 |
Each team may upload up to {{ MAX_SUBMISSION_LIMIT }} submissions per language pair, without any time contraints between such uploads;
47 |
We request that you do not create multiple teams to game these submission rules — we trust and thank you!
28 | Important: please note this down as you will need this information for sign-in later. Upon first registration, your team will be automatically signed into the current browser session. On your personal computer, you can stay signed in. Otherwise, on a public or shared machine, please sign out when leaving.
29 |
39 | {% endblock %}
40 |
--------------------------------------------------------------------------------
/leaderboard/testdata/newstest2019-ende-ref.de.txt:
--------------------------------------------------------------------------------
1 | Walisische Ageordnete sorgen sich "wie Dödel auszusehen"
2 | Es herrscht Bestürzung unter einigen Mitgliedern der Versammlung über einen Vorschlag, der ihren Titel zu MWPs (Mitglied der walisischen Parlament) ändern soll.
3 | Der Grund dafür waren Pläne, den Namen der Nationalversammlung in Walisisches Parlament zu ändern.
4 | Mitglieder aller Parteien der Nationalversammlung haben Bedenken, dass sie sich dadurch Spott aussetzen könnten.
5 | Ein Labour-Abgeordneter sagte, dass seine Gruppe "sich mit Twp und Pwp reimt".
6 | Hinweis für den Leser: „twp“ im Walisischen bedeutet „bescheuert“ und „pwp“ bedeutet „Kacke“.
7 | Ein Versammlungsmitglied von Plaid Cymru sagte, die Gruppe als Ganzes sei "nicht glücklich" und hat Alternativen vorgeschlagen.
8 | Ein walisischer Konservativer sagte, seine Gruppe wäre „offen“ für eine Namensänderung, wies aber darauf hin, dass es von „MWP“ (Mitglied des Walisischen Parlaments) nur ein kurzer verbaler Sprung zu „Muppet“ ist.
9 | Hinweis: Der walisische Buchstabe W wird ähnlich ausgesprochen wie das U im Englischen.
10 | Die Kommission der Nationalversammlung, die gerade an einem Gesetzentwurf für die Namensänderungen arbeitet, sagte: „Die finale Entscheidung über die Bezeichnung der Mitglieder der Nationalversammlung liegt natürlich bei den Mitgliedern selbst.“
11 | Mit dem Government of Wales Act 2017 erhielt das walisische Parlament die Möglichkeit, seinen Namen zu ändern.
12 | Im Juni vergangenen Jahres hat die Kommission die Ergebnisse einer öffentlichen Anhörung zu den Vorschlägen veröffentlicht, wonach die Namensänderung in Walisisches Parlament breite Zustimmung findet.
13 | Bei der Frage um den Titel der Versammlungsmitglieder bevorzugte die Kommission walisischen Parlamentsmitglieder oder WMPs, jedoch bekam die MWP-Option die meiste Unterstützung in einer öffentlichen Befragung.
14 | Mitglieder des walisischen Parlaments schlagen offenbar alternative Optionen vor, aber der Kampf zu einem Konsens zu gelangen, könnte der Vorsitzenden Elin JONES Kopfschmerzen bereiten. Von ihr wird erwartet, dass sie einen Gesetzesentwurf für diese Änderungen in den nächsten Wochen vorlegt.
15 | Die Rechtsvorschriften über die Reformen wird Änderungen in der Arbeitsweise der Versammlung beinhalten, einschließlich der Vorschriften für die Disqualifikation von Mitgliedern des walisischen Parlaments und die Gestaltung des Auschusssystems.
16 | Die Mitglieder der Nationalversammlung können bei der Debatte um das Gesetz entscheiden, wie sie genannt werden sollen.
17 | Mazedonier halten über die Änderung des Landesnamens ein Referendum ab.
18 | Am Sonntag stimmen die Wahlberechtigten über die Änderung des Landesnamens zu „Republik Nordmazedonien“ ab.
19 | Die Volksabstimmung wird abgehalten, um einen jahrzehntelangen Streit mit dem benachbarten Griechenland beizulegen, in dem eine Provinz den Namen Mazedonien trägt.
20 | Athen beharrt seit langem darauf, dass der Name seines nördlichen Nachbarn einen Anspruch auf sein Territorium darstellt und hat wiederholt Einspruch gegen seinen Aufnahmeantrag für die EU und die NATO erhoben.
21 | Der mazedonische Präsident Gjorge Ivanov, ein Gegner des Referendums bezüglich der Namensänderung, hat gesagt, er werde die Abstimmung ignorieren.
22 | Die Befürworter des Referendums, einschließlich des Premierministers Zoran Zaev, argumentieren jedoch, dass die Namensänderung ganz einfach der Preis ist, den man für den Beitritt zur EU und zur NATO zahlen muss.
23 | Die Glocken von St. Martin verstummenn, da Kirchen in Harlem Probleme haben
24 | "Historisch gesehen haben die alten Leute, mit denen ich gesprochen habe, gesagt, dass es an jeder Ecke eine Bar und eine Kirche gab", sagte Herr Adams.
25 | „Heute gibt es weder noch."
26 | Er sagte, das Verschwinden von Kneipen sei verständlich.
27 | "Menschen knüpfen Komtakte auf eine andere Art und Weise", heutzutage sagte er.
28 | "Kneipen sind keine Wohnzimmer mehr in der Nachbarschaft, in denen man sich regelmäßig trifft."
29 | Was Kirchen angeht, fürchtet er, dass das Geld aus dem Verkauf von Vermögenswerten nicht so lange Bestand haben wird, wie die Anführer es erwarten.
30 | Kirchen könnten durch Mehrfamilienhäuser mit Eigentumswohnungen ersetzt werden, die mit der Art von Menschen gefüllt sind, die den verbleibenden Zufluchtsstätten des Stadtteils nicht helfen werden.
31 | Die überwältigende Mehrheit der Menschen, die Eigentumswohnungen in diesen Gebäuden kaufen, wird weiß sein, sagte er, "und wird daher den Tag, an dem diese Kirchen ganz geschlossen werden, beschleunigen, da es unwahrscheinlich ist, dass die meisten dieser Personen, die in diese Eigentumswohnungen einziehen, Mitglieder dieser Kirchen werden."
32 | Beide Kirchen wurden von weißen Gemeinden gebaut, bevor Harlem 1870 zur schwarzen Metropole wurde – Metropolitan Community, St. Martin's ein Jahrzehnt später.
33 | Die ursprüngliche weiße methodistische Gemeinde zog in den 1930er Jahren aus.
34 | Eine schwarze Gemeinde, die in der Nähe eine Religion ausübten, erwarb das Gebäude.
35 | St. Martin's wurde von einer schwarzen Gemeinde unter dem Pfarrer John Howard Johnson übernommen, der einen Boykott der Einzelhändler in der 125. Straße, einer Hauptstraße zum Einkaufen in Harlem, anführte, die sich der Einstellung oder Förderung von Schwarzen widersetzte.
36 | Ein Brand im Jahr 1939 hinterließ das Gebäude schwer beschädigt, aber als die Gemeindemitglieder von Pater Johnson Pläne zum Wiederaufbau machten, beauftragten sie das Glockenspiel.
37 | Pfarrer David Johnson, Sohn von Pater Johnson und Nachfolger in St. Martin's, nannte das Glockenspiel stolz „die Glocken der Armen."
38 | Der Experte, der im Juli das Glockenspiel spielte, nannte es noch etwas anderes: "Ein Kulturschatz" und "ein unersetzliches historisches Instrument".
39 | Der Experte, Tiffany Ng von der University of Michigan, stellte auch fest, dass es das erste Glockenspiel der Welt war, das von einem schwarzen Musiker, Dionisio A. Lind, gespielt wurde, der vor 18 Jahren in das größere Glockenspiel an der Riverside Church wechselte.
40 | Herr Merriweather sagte, dass St. Martin's ihn nicht ersetzt hat.
41 | Was sich in den letzten Monaten bei St. Martin abgespielt hat, war eine komplizierte Geschichte von Architekten und Bauunternehmern, einige wurden von den Laienführern der Kirche, andere von der Bischofsdiözese eingebracht.
42 | Die Sakristei – das Leitungsorgan der Pfarrei, das sich aus Laienführern zusammensetzt – schrieb im Juli an die Diözese mit der Sorge, dass die Diözese "versuchen würde, die Kosten an die Sakristei weiterzugeben", obwohl die Sakristei nicht an der Beauftragung der Architekten und Auftragnehmer der Diözese beteiligt war.
43 | Einige Gemeindemitglieder beklagten einen Mangel an Transparenz seitens der Diözese.
44 | Hai verletzt 13-jährigen Jungen beim Hummertauchen in Kalifornien
45 | Am Samstag griff ein Hai einen 13-jährigen Jungen an und verletzte ihn, während er in Kalifornien am Eröffnungstag der Hummersaison nach Hummern tauchte, sagten Beamte.
46 | Der Angriff fand kurz vor sieben Uhr morgens nahe dem Strand von Beacon in Encinitas statt.
47 | Chad Hammel sagte KSWB-TV in San Diego, er habe mit Freunden für eine halbe Stunde am Samstagmorgen getaucht, als er den Jungen um Hilfe schreien hörte. Er sei dann mit den anderen rübergepaddelt, um ihn aus dem Wasser zu retten.
48 | „Zuerst dachte ich, jemand freut sich, weil er einen Hummer gefangen hat“, sagte Hammel. Aber dann bemerkte ich, dass jemand schrie: „Ich wurde gebissen!“
49 | Ich wurde gebissen!
50 | Sein ganzes Schlüsselbein wurde aufgerissen, sagte Hammel, er stellte dies fest als er zu dem Jungen kam.
51 | Ich schrie alle an, damit sie aus dem Wasser herauskommen: "Da ist ein Hai im Wasser!" sagte Hammel.
52 | Der Junge wurde ins Rady Children's Hospital in San Diego gebracht, wo sein Zustand als kritisch dokumentiert wurde.
53 | Die für den Angriff verantwortliche Haiart ist unbekannt.
54 | Rettungsschwimmer Kapitän Larry Giles sagte bei einer Medienbesprechung, dass ein Hai einige Wochen zuvor in der Gegend gesichtet worden war, aber es wurde festgestellt, dass es sich nicht um eine gefährliche Haiart handelt.
55 | Giles fügte im Oberkörperbereich seines Opfers traumatische Verletzungen hinzu.
56 | Beamte schlossen den Zugang zum Strand von Ponto Beach in Casablad zu Swami's in Ecinitas für 48 Stunden aus Sicherheitsgründen.
57 | Giles stellte fest, dass es mehr als 135 Haiarten in der Gegend gibt, aber die meisten gelten nicht als gefährlich.
58 | Sainsbury plant, den britischen Beauty-Markt zu erobern
59 | Sainsbury's übernimmt Boots, Superdrug und Debenhams mit Regalen mit Schönheitsprodukten im Kaufhausstil, die mit Fachassistenten besetzt sind.
60 | Im Rahmen eines umfangreichen Pushs in den britische Schönheitsmarkt in Großbritannien, der weiter wächst und £2.8bn wert ist, werden Mode-und Homeware-Verkäufe zurückfallen. Die größeren 11 Filialen, die das Land getestet und im nächsten Jahr wieder in mehr Läden gebracht hat, um Erfolg zu zeigen.
61 | Die Idee, in den Beauty-Markt zu investieren, ist daraus entstanden, dass Supermärkte nach Möglichkeiten suchen, den Regalplatz, der früher für Fernseher, Mikrowellen und Haushaltswaren verwendet wurde, für neue Produkte zu nutzen.
62 | Sainsbury teilte mit, dass das Angebot an Beauty-Produkten auf 3000 Produkte verdoppelt werde, indem erstmals auch Marken wie Revlon, Essie, Tweezerman und Dr. PawPaw in das Produktportfolio aufgenommen werden.
63 | Auch bestehende Sortimente von L'Oreal, Maybelline und Burt's Bees werden mehr Platz in Markenbereichen erhalten, ähnlich wie sie in Geschäften wie Boots zu finden sind.
64 | Die Supermarktkette belebt auch ihre hauseigene Makeup-Marke „Boutique“ neu, die zahlreiche bei jungen Käufern beliebte vegane Produkte im Angebot hat.
65 | Darüber hinaus testet der Parfümhändler Fragrance Shop Konzessionen in zwei Sainsburys Geschäften, von denen das erste letzte Woche in Croydon, Süd-London, eröffnet wurde, während ein zweites Ende dieses Jahres in Selly Oak, Birmingham, eröffnet wird.
66 | Online-Shopping und eine Verlagerung hin zum täglichen Einkauf kleiner Mengen Lebensmittel in Nachbarschaftsläden haben zur Folge, dass Supermärkte mehr tun müssen, um die Menschen zum Besuch zu bewegen.
67 | Mike Coupe, der Chef von Sainsbury's, hat gesagt, dass die Verkaufsstellen in zunehmendem Maße wie Warenhäuser aussehen werden, da die Supermarktkette versucht Discounter wie Aldi und Lidl mit mehr Dienstleistungen und Non-Food zu bekämpfen.
68 | Sainsbury's hat Argos-Outlets in Hunderten von Geschäften platziert und auch eine Reihe von Habitats eingeführt, seit es beide Ketten vor zwei Jahren gekauft hat, was angeblich den Lebensmittelverkauf gestärkt und die Akquisitionen profitabler gemacht hat.
69 | Der frühere Versuch des Supermarktes, seine Schönheits- und Apothekenabteilungen zu überarbeiten, endete mit einem Misserfolg.
70 | Sainsbury hat ein Joint Venture mit Boots in den frühen 2000er Jahren getestet, aber es endete unetschieden, und die Einnahmen aus den Geschäften der Apotheken konnten nicht geteilt werden.
71 | Die neue Strategie kommt, nachdem Sainsbury's sein 281-Filialen-Apothekengeschäft vor drei Jahren für 125 Millionen Pfund an Celesio, den Eigentümer der Lloyds Pharmacy Kette, verkauft hat.
72 | Laut Angaben soll Lloyds ebenfalls beteiligt sein. In vier Lloyds-Stores soll das Angebot an Luxus-Hautpflegeprodukten von Marken wie La Roche-Posay und Vichy stark erweitert werden.
73 | Paul Mills-Hicks, Werbechef von Sainsbury, sagte: „Wir haben das Erscheinungsbild unserer Regale für Schönheitsprodukte verändert, um die Ausstattung für unsere Kunden zu verbessern.
74 | Zusätzlich haben wir in die Schulung von Mitarbeitern investiert, die dem Kunden beratend zur Seite stehen sollen.
75 | Unser Markenportfolio lässt keine Wünsche offen. Das elegante Ambiente, die günstige Innenstadtlage und ein revolutioniertes Kauferlebnis machen uns zu einem beliebten Anlaufziel in Beauty-Fragen.
76 |
--------------------------------------------------------------------------------
/leaderboard/testdata/newstest2019-ende-src.en.txt:
--------------------------------------------------------------------------------
1 | Welsh AMs worried about 'looking like muppets'
2 | There is consternation among some AMs at a suggestion their title should change to MWPs (Member of the Welsh Parliament).
3 | It has arisen because of plans to change the name of the assembly to the Welsh Parliament.
4 | AMs across the political spectrum are worried it could invite ridicule.
5 | One Labour AM said his group was concerned "it rhymes with Twp and Pwp."
6 | For readers outside of Wales: In Welsh twp means daft and pwp means poo.
7 | A Plaid AM said the group as a whole was "not happy" and has suggested alternatives.
8 | A Welsh Conservative said his group was "open minded" about the name change, but noted it was a short verbal hop from MWP to Muppet.
9 | In this context The Welsh letter w is pronounced similarly to the Yorkshire English pronunciation of the letter u.
10 | The Assembly Commission, which is currently drafting legislation to introduce the name changes, said: "The final decision on any descriptors of what Assembly Members are called will of course be a matter for the members themselves."
11 | The Government of Wales Act 2017 gave the Welsh assembly the power to change its name.
12 | In June, the Commission published the results of a public consultation on the proposals which found broad support for calling the assembly a Welsh Parliament.
13 | On the matter of the AMs' title, the Commission favoured Welsh Parliament Members or WMPs, but the MWP option received the most support in a public consultation.
14 | AMs are apparently suggesting alternative options, but the struggle to reach consensus could be a headache for the Presiding Officer, Elin Jones, who is expected to submit draft legislation on the changes within weeks.
15 | The legislation on the reforms will include other changes to the way the assembly works, including rules on disqualification of AMs and the design of the committee system.
16 | AMs will get the final vote on the question of what they should be called when they debate the legislation.
17 | Macedonians go to polls in referendum on changing country's name
18 | Voters will vote Sunday on whether to change their country's name to the "Republic of North Macedonia."
19 | The popular vote was set up in a bid to resolve a decades-long dispute with neighboring Greece, which has its own province called Macedonia.
20 | Athens has long insisted that its northern neighbor's name represents a claim on its territory and has repeatedly objected to its membership bids for the EU and NATO.
21 | Macedonian President Gjorge Ivanov, an opponent of the plebiscite on the name change, has said he will disregard the vote.
22 | However, supporters of the referendum, including Prime Minister Zoran Zaev, argue that the name change is simply the price to pay to join the EU and NATO.
23 | The Bells of St. Martin's Fall Silent as Churches in Harlem Struggle
24 | "Historically, the old people I've talked to say there was a bar and a church on every corner," Mr. Adams said.
25 | "Today, there's neither."
26 | He said the disappearance of bars was understandable.
27 | "People socialize in a different way" nowadays, he said.
28 | "Bars are no longer neighborhood living rooms where people go on a regular basis."
29 | As for churches, he worries that the money from selling assets will not last as long as leaders expect it to, "and sooner or later they'll be right back where they started."
30 | Churches, he added, could be replaced by apartment buildings with condominiums filled with the kind of people who will not help the neighborhood's remaining sanctuaries.
31 | "The overwhelming majority of people who buy condominiums in these buildings will be white," he said, "and therefore will hasten the day that these churches close altogether because it is unlikely that most of these people who move into these condominiums will become members of these churches."
32 | Both churches were built by white congregations before Harlem became a black metropolis - Metropolitan Community in 1870, St. Martin's a decade later.
33 | The original white Methodist congregation moved out in the 1930s.
34 | A black congregation that had been worshiping nearby took title to the building.
35 | St. Martin's was taken over by a black congregation under the Rev. John Howard Johnson, who led a boycott of retailers on 125th Street, a main street for shopping in Harlem, who resisted hiring or promoting blacks.
36 | A fire in 1939 left the building badly damaged, but as Father Johnson's parishioners made plans to rebuild, they commissioned the carillon.
37 | The Rev. David Johnson, Father Johnson's son and successor at St. Martin's, proudly called the carillon "the poor people's bells."
38 | The expert who played the carillon in July called it something else: "A cultural treasure" and "an irreplaceable historical instrument."
39 | The expert, Tiffany Ng of the University of Michigan, also noted that it was the first carillon in the world to be played by a black musician, Dionisio A. Lind, who moved to the larger carillon at the Riverside Church 18 years ago.
40 | Mr. Merriweather said that St. Martin's did not replace him.
41 | What has played out at St. Martin's over the last few months has been a complicated tale of architects and contractors, some brought in by the lay leaders of the church, others by the Episcopal diocese.
42 | The vestry - the parish's governing body, made up of lay leaders - wrote the diocese in July with concerns that the diocese "would seek to pass along the costs" to the vestry, even though the vestry had not been involved in hiring the architects and contractors the diocese sent in.
43 | Some parishioners complained of a lack of transparency on the diocese's part.
44 | Shark injures 13-year-old on lobster dive in California
45 | A shark attacked and injured a 13-year-old boy Saturday while he was diving for lobster in California on the opening day of lobster season, officials said.
46 | The attack occurred just before 7 a.m. near Beacon's Beach in Encinitas.
47 | Chad Hammel told KSWB-TV in San Diego he had been diving with friends for about half an hour Saturday morning when he heard the boy screaming for help and then paddled over with a group to help pull him out of the water.
48 | Hammel said at first he thought it was just excitement of catching a lobster, but then he "realized that he was yelling, 'I got bit!
49 | I got bit!'
50 | His whole clavicle was ripped open," Hammel said he noticed once he got to the boy.
51 | "I yelled at everyone to get out of the water: 'There's a shark in the water!'" Hammel added.
52 | The boy was airlifted to Rady Children's Hospital in San Diego where he is listed in critical condition.
53 | The species of shark responsible for the attack was unknown.
54 | Lifeguard Capt. Larry Giles said at a media briefing that a shark had been spotted in the area a few weeks earlier, but it was determined not to be a dangerous species of shark.
55 | Giles added the victim sustained traumatic injuries to his upper torso area.
56 | Officials shut down beach access from Ponto Beach in Casablad to Swami's in Ecinitas for 48 hours for investigation and safety purposes.
57 | Giles noted that there are more than 135 shark species in the area, but most are not considered dangerous.
58 | Sainsbury's plans push into UK beauty market
59 | Sainsbury's is taking on Boots, Superdrug and Debenhams with department store-style beauty aisles staffed with specialist assistants.
60 | As part of a substantial push into the UK's £2.8bn beauty market, which is continuing to grow while fashion and homeware sales fall back, the larger beauty aisles will be tested out in 11 stores around the country and taken to more stores next year if it proves a success.
61 | The investment in beauty comes as supermarkets hunt for ways to use up shelf space once sued for TVs, microwaves and homeware.
62 | Sainsbury's said it would be doubling the size of its beauty offering to up to 3,000 products, including brands such as Revlon, Essie, Tweezerman and Dr. PawPaw for the first time.
63 | Existing ranges from L'Oreal, Maybelline and Burt's Bees will also get more space with branded areas similar to those found in shops like Boots.
64 | The supermarket is also relaunching its Boutique makeup range so that the majority of products are vegan-friendly - something increasingly demanded by younger shoppers.
65 | In addition, perfume retailer the Fragrance Shop will be testing out concessions in two Sainsbury's stores, the first of which opened in Croydon, south London, last week while a second opens in Selly Oak, Birmingham, later this year.
66 | Online shopping and a shift towards buying small amounts of food daily at local convenience stores means supermarkets are having to do more to persuade people to visit.
67 | Mike Coupe, the chief executive of Sainsbury's, has said the outlets will look increasingly like department stores as the supermarket chain tries to fight back against the discounters Aldi and Lidl with more services and non-food.
68 | Sainsbury's has been putting Argos outlets in hundreds of stores and has also introduced a number of Habitats since it bought both chains two years ago, which it says has bolstered grocery sales and made the acquisitions more profitable.
69 | The supermarket's previous attempt to revamp its beauty and pharmacy departments ended in failure.
70 | Sainsbury's tested a joint venture with Boots in the early 2000s, but the tie-up ended after a row over how to split the revenues from the chemist's stores in its supermarkets.
71 | The new strategy comes after Sainsbury's sold its 281-store pharmacy business to Celesio, the owner of the Lloyds Pharmacy chain, for £125m, three years ago.
72 | It said Lloyds would play a role in the plan, by adding an extended range of luxury skincare brands including La Roche-Posay and Vichy in four stores.
73 | Paul Mills-Hicks, Sainsbury's commercial director, said: "We've transformed the look and feel of our beauty aisles to enhance the environment for our customers.
74 | We've also invested in specially trained colleagues who will be on hand to offer advice.
75 | Our range of brands is designed to suit every need and the alluring environment and convenient locations mean we're now a compelling beauty destination which challenges the old way of shopping."
76 |
--------------------------------------------------------------------------------
/leaderboard/testdata/newstest2019.msft-WMT19-document-level.6808.en-de.txt:
--------------------------------------------------------------------------------
1 | Walisische AMs besorgt darüber, dass sie „wie Muppets aussehen“
2 | Einige AMs sind bestürzt über den Vorschlag, ihren Titel in MWPs (Mitglied des Walisischen Parlaments) zu ändern.
3 | Der Grund dafür sind Pläne, den Namen der Versammlung in das Walisische Parlament zu ändern.
4 | AMs aus dem gesamten politischen Spektrum sind besorgt, dass dies zu Spott führen könnte.
5 | Ein Labour-AM sagte, seine Fraktion sei besorgt darüber, dass „es sich mit Twp und Pwp reimt“.
6 | Für Leser außerhalb von Wales: Auf Walisisch bedeutet twp daft und pwp bedeutet poo.
7 | Ein Plaid-AM sagte, die Gruppe als Ganzes sei „nicht glücklich“ und habe Alternativen vorgeschlagen.
8 | Ein walisischer Konservativer sagte, seine Fraktion sei „aufgeschlossen“ gegenüber der Namensänderung, merkte jedoch an, dass es sich um einen kurzen verbalen Sprung von MWP zu Muppet handelte.
9 | In diesem Zusammenhang wird der walisische Buchstabe w ähnlich wie die Yorkshire-Englische Aussprache des Buchstabens u ausgesprochen.
10 | Die Versammlungskommission, die derzeit Rechtsvorschriften zur Einführung der Namensänderung ausarbeitet, sagte: „Die endgültige Entscheidung über die Bezeichnung der Mitglieder der Versammlung wird natürlich Sache der Mitglieder selbst sein“.
11 | Der Government of Wales Act 2017 gab der walisischen Versammlung die Befugnis, ihren Namen zu ändern.
12 | Im Juni veröffentlichte die Kommission die Ergebnisse einer öffentlichen Konsultation zu den Vorschlägen, die breite Unterstützung für die Bezeichnung der Versammlung als walisisches Parlament fand.
13 | In der Frage des Titels der AMs favorisierte die Kommission walisische Parlamentsmitglieder oder WMPs, aber die MWP-Option erhielt in einer öffentlichen Konsultation die meiste Unterstützung.
14 | Die AMs schlagen offenbar alternative Optionen vor, aber das Ringen um einen Konsens könnte dem Vorsitzenden, Elin Jones, Kopfzerbrechen bereiten, von dem erwartet wird, dass er innerhalb von Wochen einen Gesetzesentwurf zu den Änderungen vorlegt.
15 | Die Rechtsvorschriften zu den Reformen werden weitere Änderungen an der Arbeitsweise der Versammlung beinhalten, darunter Vorschriften über den Ausschluss von AMs und die Gestaltung des Ausschusssystems.
16 | Die AMs werden die Schlussabstimmung über die Frage erhalten, wie sie bei der Debatte über die Rechtsvorschriften genannt werden sollten.
17 | Mazedonier gehen bei Referendum über Namensänderung an die Urnen
18 | Die Wähler werden am Sonntag darüber abstimmen, ob sie den Namen ihres Landes in „Republik Nordmakedonien“ ändern wollen.
19 | Die Volksabstimmung wurde mit dem Ziel durchgeführt, einen jahrzehntelangen Streit mit dem Nachbarland Griechenland zu lösen, das eine eigene Provinz namens Mazedonien hat.
20 | Athen besteht seit langem darauf, dass der Name seines nördlichen Nachbarn einen Anspruch auf sein Territorium darstellt, und hat wiederholt Einspruch gegen seine Beitrittsgesuche für die EU und die NATO erhoben.
21 | Der mazedonische Präsident Gjorge Ivanov, ein Gegner der Volksabstimmung über die Namensänderung, hat erklärt, er werde die Abstimmung missachten.
22 | Die Befürworter des Referendums, darunter Ministerpräsident Zoran Zaev, argumentieren jedoch, dass die Namensänderung einfach der Preis sei, den man zahlen müsse, um der EU und der NATO beizutreten.
23 | Die Glocken von St. Martin verstummen, während die Kirchen in Harlem kämpfen
24 | „Historisch gesehen sagen die alten Leute, mit denen ich gesprochen habe, dass es an jeder Ecke eine Bar und eine Kirche gab“, sagte Mr. Adams.
25 | „Heute gibt es weder das eine noch das andere“.
26 | Er sagte, das Verschwinden der Bars sei verständlich.
27 | „Die Menschen sozialisieren sich heute auf eine andere Weise“, sagte er.
28 | „Bars sind keine Nachbarschaftswohnzimmer mehr, in die die Menschen regelmäßig gehen“.
29 | Was die Kirchen angeht, so sorgt er sich, dass das Geld aus dem Verkauf von Vermögenswerten nicht so lange halten wird, wie die Politiker es erwarten, „und früher oder später werden sie wieder da sein, wo sie angefangen haben“.
30 | Kirchen, fügte er hinzu, könnten durch Mehrfamilienhäuser mit Eigentumswohnungen ersetzt werden, die mit der Art von Menschen gefüllt sind, die den verbliebenen Heiligtümern der Nachbarschaft nicht helfen werden.
31 | „Die überwältigende Mehrheit der Menschen, die Eigentumswohnungen in diesen Gebäuden kaufen, werden weiß sein“, sagte er, „und werden daher den Tag beschleunigen, an dem diese Kirchen ganz geschlossen werden, weil es unwahrscheinlich ist, dass die meisten dieser Menschen, die in diese Eigentumswohnungen ziehen, Mitglieder dieser Kirchen werden“.
32 | Beide Kirchen wurden von weißen Gemeinden gebaut, bevor Harlem eine schwarze Metropole wurde – Metropolitan Community 1870, St. Martin's ein Jahrzehnt später.
33 | Die ursprüngliche weiße methodistische Gemeinde zog in den 1930er Jahren aus.
34 | Eine schwarze Gemeinde, die in der Nähe angebetet hatte, übernahm den Titel des Gebäudes.
35 | St. Martin's wurde von einer schwarzen Gemeinde unter Rev. John Howard Johnson übernommen, der einen Boykott von Einzelhändlern in der 125th Street, einer Haupteinkaufsstraße in Harlem, anführte, die sich weigerten, Schwarze einzustellen oder zu fördern.
36 | Ein Brand im Jahr 1939 hat das Gebäude schwer beschädigt, aber als die Gemeindemitglieder von Pater Johnson Pläne zum Wiederaufbau machten, beauftragten sie das Glockenspiel.
37 | Rev. David Johnson, Pater Johnsons Sohn und Nachfolger bei St. Martin's, nannte das Glockenspiel stolz „die Glocken der Armen“.
38 | Der Experte, der das Glockenspiel im Juli spielte, nannte es etwas anderes: „Ein kultureller Schatz“ und „ein unersetzliches historisches Instrument“.
39 | Der Experte, Tiffany Ng von der University of Michigan, merkte auch an, dass es das erste Glockenspiel der Welt war, das von einem schwarzen Musiker gespielt wurde, Dionisio A. Lind, der vor 18 Jahren in das größere Glockenspiel in der Riverside Church umzog.
40 | Mr. Merriweather sagte, dass St. Martin's ihn nicht ersetzte.
41 | Was sich in St. Martin's in den letzten Monaten abgespielt hat, war eine komplizierte Geschichte von Architekten und Auftragnehmern, einige von den Laienführern der Kirche, andere von der Bischofsdiözese.
42 | Die Sakristei – das Leitungsgremium der Pfarrei, das aus Laienführern besteht – schrieb die Diözese im Juli mit der Sorge, dass die Diözese versuchen würde, „die Kosten“ an die Sakristei weiterzugeben, obwohl die Sakristei nicht an der Einstellung der Architekten und Auftragnehmer beteiligt war, die von der Diözese entsandt wurden.
43 | Einige Gemeindemitglieder beschwerten sich über einen Mangel an Transparenz auf Seiten der Diözese.
44 | Hai verletzt 13-Jährigen beim Hummertauchen in Kalifornien
45 | Ein Hai hat am Samstag einen 13-jährigen Jungen beim Hummertauchen in Kalifornien am Eröffnungstag der Hummersaison angegriffen und verletzt, sagten Beamte.
46 | Der Angriff ereignete sich kurz vor 7 Uhr morgens in der Nähe von Beacon's Beach in Encinitas.
47 | Chad Hammel erzählte KSWB-TV in San Diego, dass er am Samstagmorgen etwa eine halbe Stunde lang mit Freunden getaucht sei, als er den Jungen um Hilfe schreien hörte und dann mit einer Gruppe paddelte, um ihn aus dem Wasser zu ziehen.
48 | Hammel sagte zunächst, dass er dachte, es sei nur Aufregung, einen Hummer zu fangen, aber dann „erkennte er, dass er schrie: 'Ich habe Biss!
49 | Ich habe Biss!'
50 | Sein ganzes Schlüsselbein wurde aufgerissen“, sagte Hammel, als er zu dem Jungen kam.
51 | „Ich schrie alle an, um aus dem Wasser zu kommen: 'Da ist ein Hai im Wasser!'“ fügte Hammel hinzu.
52 | Der Junge wurde in das Rady Children's Hospital in San Diego gebracht, wo er in einem kritischen Zustand ist.
53 | Die für den Angriff verantwortliche Haiart war unbekannt.
54 | Rettungsschwimmer Capt. Larry Giles sagte bei einem Medienbriefing, dass ein Hai in dem Gebiet einige Wochen zuvor gesichtet worden war, aber es wurde festgestellt, dass es sich nicht um eine gefährliche Haiart handelt.
55 | Giles fügte hinzu, dass das Opfer traumatische Verletzungen an seinem Oberkörperbereich erlitt.
56 | Die Beamten sperrten den Zugang zum Strand von Ponto Beach in Casablad nach Swami's in Ecinitas für 48 Stunden zu Untersuchungs- und Sicherheitszwecken.
57 | Giles stellte fest, dass es mehr als 135 Haiarten in dem Gebiet gibt, aber die meisten gelten nicht als gefährlich.
58 | Sainsbury's plant Vorstoß in den britischen Beauty-Markt
59 | Sainsbury's übernimmt Boots, Superdrug und Debenhams mit Beauty-Gängen im Kaufhausstil, die mit spezialisierten Assistenten besetzt sind.
60 | Als Teil eines erheblichen Vorstoßes in den britischen Beauty-Markt im Wert von 2,8 Mrd. GBP, der weiter wächst, während die Mode- und Haushaltswarenverkäufe zurückgehen, werden die größeren Beauty-Gänge in 11 Geschäften im ganzen Land getestet und im nächsten Jahr in weitere Läden gebracht, wenn sich dies als Erfolg erweist.
61 | Die Investition in Beauty kommt, während Supermärkte nach Möglichkeiten suchen, Regalflächen aufzubrauchen, die einst für Fernseher, Mikrowellen und Haushaltswaren verklagt wurden.
62 | Sainsbury's erklärte, es werde die Größe seines Beauty-Angebots auf bis zu 3.000 Produkte verdoppeln, darunter zum ersten Mal Marken wie Revlon, Essie, Tweezerman und Dr. PawPaw.
63 | Bestehende Sortimente von L'Oreal, Maybelline und Burt's Bees werden auch mehr Platz mit Markenbereichen erhalten, die denen in Geschäften wie Boots ähneln.
64 | Der Supermarkt bringt auch sein Boutique-Make-up-Sortiment neu auf den Markt, so dass die Mehrheit der Produkte vegan-freundlich ist – etwas, das von jüngeren Käufern zunehmend verlangt wird.
65 | Darüber hinaus wird der Parfümhändler Fragrance Shop Konzessionen in zwei Sainsbury's-Geschäften testen, von denen das erste letzte Woche in Croydon, Südlondon, eröffnet wurde, während ein zweites Ende dieses Jahres in Selly Oak, Birmingham, eröffnet wird.
66 | Online-Shopping und eine Verlagerung hin zum täglichen Einkauf kleiner Mengen von Lebensmitteln in lokalen Convenience-Stores bedeutet, dass Supermärkte mehr tun müssen, um die Menschen zum Besuch zu bewegen.
67 | Mike Coupe, der Geschäftsführer von Sainsbury's, sagte, dass die Verkaufsstellen zunehmend wie Kaufhäuser aussehen werden, da die Supermarktkette versucht, sich gegen die Discounter Aldi und Lidl mit mehr Dienstleistungen und Non-Food zu wehren.
68 | Sainsbury's hat Argos-Geschäfte in hunderten von Geschäften eingerichtet und auch eine Reihe von Habitats eingeführt, seit es vor zwei Jahren beide Ketten gekauft hat, was, wie es heißt, die Lebensmittelverkäufe gestärkt und die Akquisitionen profitabler gemacht hat.
69 | Der frühere Versuch des Supermarktes, seine Beauty- und Apothekenabteilungen umzugestalten, scheiterte.
70 | Sainsbury's testete Anfang der 2000er Jahre ein Joint Venture mit Boots, aber die Bindung endete nach einem Streit darüber, wie die Einnahmen aus den Apothekengeschäften in seinen Supermärkten aufgeteilt werden sollten.
71 | Die neue Strategie kommt, nachdem Sainsbury's vor drei Jahren sein 281-Store-Apothekengeschäft an Celesio, den Eigentümer der Lloyds Pharmacy-Kette, für 125 Mio. GBP verkaufte.
72 | Es hieß, dass Lloyds eine Rolle in dem Plan spielen würde, indem es eine erweiterte Palette von Luxus-Hautpflegemarken einschließlich La Roche-Posay und Vichy in vier Geschäften hinzufügte.
73 | Paul Mills-Hicks, der kaufmännische Direktor von Sainsbury's, sagte: „Wir haben das Aussehen und das Gefühl unserer Beauty-Gänge verändert, um das Umfeld für unsere Kunden zu verbessern.
74 | Wir haben auch in speziell ausgebildete Kollegen investiert, die zur Verfügung stehen werden, um Ratschläge zu erteilen.
75 | Unsere Markenpalette ist für jeden Bedarf ausgelegt, und die verlockende Umgebung und die günstigen Lagen bedeuten, dass wir jetzt ein überzeugendes Beauty-Reiseziel sind, das die alte Art des Einkaufens herausfordert“.
76 |
--------------------------------------------------------------------------------
/leaderboard/testdata/newstest2019.msft-WMT19-sentence-level.6785.en-de.txt:
--------------------------------------------------------------------------------
1 | Welsh AMs besorgt über 'aussehen wie Muppets'
2 | Es gibt Bestürzung unter einigen AMs über einen Vorschlag, ihren Titel in MWPs (Mitglied des walisischen Parlaments) zu ändern.
3 | Es ist aufgrund von Plänen entstanden, den Namen der Versammlung in das walisische Parlament zu ändern.
4 | AMs aus dem gesamten politischen Spektrum sind besorgt, dass es zum Spott einladen könnte.
5 | Ein Labour AM sagte, seine Gruppe sei besorgt, „es reimt sich mit Twp und Pwp“.
6 | Für Leser außerhalb von Wales: In Walisisch bedeutet twp daft und pwp poo.
7 | Ein Plaid AM sagte, die Gruppe als Ganzes sei „nicht glücklich“ und habe Alternativen vorgeschlagen.
8 | Ein walisischer Konservativer sagte, seine Fraktion sei „offen“ über die Namensänderung, merkte aber an, dass es ein kurzer verbaler Sprung von MWP zu Muppet war.
9 | In diesem Zusammenhang wird der walisische Buchstabe w ähnlich wie die Yorkshire-englische Aussprache des Buchstabens u ausgesprochen.
10 | Die Vollversammlungskommission, die derzeit ein Gesetz zur Einführung der Namensänderungen ausarbeitet, sagte: „Die endgültige Entscheidung über alle Deskriptoren dessen, was Vollversammlungsmitglieder genannt werden, wird selbstverständlich eine Angelegenheit der Mitglieder selbst sein“.
11 | Der Government of Wales Act 2017 gab der walisischen Versammlung die Befugnis, ihren Namen zu ändern.
12 | Im Juni veröffentlichte die Kommission die Ergebnisse einer öffentlichen Konsultation zu den Vorschlägen, die breite Unterstützung für die Einberufung der Versammlung in ein walisisches Parlament fanden.
13 | Was den Titel der AM betrifft, so bevorzugte die Kommission walisische Parlamentsabgeordnete oder WMPs, aber die MWP-Option erhielt in einer öffentlichen Konsultation die größte Unterstützung.
14 | AMs schlagen anscheinend alternative Optionen vor, aber das Ringen um einen Konsens könnte dem Vorsitzenden Elin Jones Kopfzerbrechen bereiten, der innerhalb von Wochen Gesetzesentwürfe zu den Änderungen vorlegen soll.
15 | Die Rechtsvorschriften zu den Reformen werden weitere Änderungen an der Arbeitsweise der Versammlung beinhalten, darunter Vorschriften über den Ausschluss von AMs und die Ausgestaltung des Ausschusssystems.
16 | AMs werden die Schlussabstimmung über die Frage erhalten, wie sie genannt werden sollten, wenn sie über die Rechtsvorschriften debattieren.
17 | Mazedonier gehen an die Urnen in Referendum über die Änderung des Namens des Landes
18 | Die Wähler werden am Sonntag darüber abstimmen, ob sie den Namen ihres Landes in „Republik Nordmakedonien“ ändern wollen.
19 | Die Volksabstimmung wurde ins Leben gerufen, um einen jahrzehntelangen Streit mit dem benachbarten Griechenland zu lösen, das eine eigene Provinz namens Mazedonien hat.
20 | Athen besteht seit langem darauf, dass der Name seines nördlichen Nachbarn einen Anspruch auf sein Territorium darstellt, und hat wiederholt Einwände gegen seine Beitrittsgesuche für die EU und die NATO erhoben.
21 | Der mazedonische Präsident Gjorge Ivanov, ein Gegner der Volksabstimmung über die Namensänderung, hat erklärt, er werde die Abstimmung missachten.
22 | Die Befürworter des Referendums, darunter Premierminister Zoran Zaev, argumentieren jedoch, dass die Namensänderung lediglich der Preis sei, den man für den Beitritt zur EU und zur NATO zahlen müsse.
23 | Die Glocken von St. Martins Fall schweigen als Kirchen in Harlem Kampf
24 | „Historisch gesehen haben die alten Leute, mit denen ich gesprochen habe, gesagt, dass es an jeder Ecke eine Bar und eine Kirche gab“, sagte Herr Adams.
25 | „Heute gibt es weder das eine noch das andere“.
26 | Er sagte, das Verschwinden von Bars sei verständlich.
27 | „Die Menschen sozialisieren sich heute auf eine andere Weise“, sagte er.
28 | „Bars sind keine Nachbarschafts-Wohnzimmer mehr, in die die Leute regelmäßig gehen“.
29 | Was die Kirchen angeht, so befürchtet er, dass das Geld aus dem Verkauf von Vermögenswerten nicht so lange reichen wird, wie die Führer es erwarten, „und früher oder später werden sie wieder da sein, wo sie angefangen haben“.
30 | Kirchen, fügte er hinzu, könnten durch Mehrfamilienhäuser mit Eigentumswohnungen ersetzt werden, die mit der Art von Menschen gefüllt sind, die den verbleibenden Heiligtümern des Viertels nicht helfen werden.
31 | „Die überwältigende Mehrheit der Menschen, die Eigentumswohnungen in diesen Gebäuden kaufen, wird weiß sein“, sagte er, „und wird daher den Tag beschleunigen, an dem diese Kirchen ganz schließen, weil es unwahrscheinlich ist, dass die meisten dieser Menschen, die in diese Eigentumswohnungen einziehen, Mitglieder dieser Kirchen werden“.
32 | Beide Kirchen wurden von weißen Gemeinden gebaut, bevor Harlem eine schwarze Metropole wurde – Metropolitan Community 1870, St. Martin's ein Jahrzehnt später.
33 | Die ursprüngliche weiße Methodisten-Gemeinde zog in den 1930er Jahren aus.
34 | Eine schwarze Gemeinde, die in der Nähe angebetet hatte, übernahm den Titel des Gebäudes.
35 | St. Martin's wurde von einer schwarzen Gemeinde unter Rev. John Howard Johnson übernommen, der einen Boykott von Einzelhändlern auf der 125th Street, einer Hauptstraße zum Einkaufen in Harlem, führte, die sich der Einstellung oder Förderung von Schwarzen widersetzten.
36 | Ein Brand im Jahre 1939 hinterließ das Gebäude schwer beschädigt, aber als Pfarrangehörige von Pater Johnson Pläne zum Wiederaufbau machten, gaben sie das Glockenspiel in Auftrag.
37 | Rev. David Johnson, Vater Johnsons Sohn und Nachfolger bei St. Martin, nannte das Glockenspiel stolz „die Glocken der armen Leute“.
38 | Der Experte, der das Carillon im Juli spielte, nannte es etwas anderes: „Ein Kulturschatz“ und „ein unersetzliches historisches Instrument“.
39 | Der Experte, Tiffany Ng von der University of Michigan, bemerkte auch, dass es das erste Carillon der Welt war, das von einem schwarzen Musiker, Dionisio A. Lind, gespielt wurde, der vor 18 Jahren in das größere Carillon an der Riverside Church umzog.
40 | Herr Merriweather sagte, dass St. Martin's ihn nicht ersetzt habe.
41 | Was sich in den letzten Monaten in St. Martin abgespielt hat, war eine komplizierte Geschichte von Architekten und Bauunternehmern, von denen einige von den Laienführern der Kirche, andere von der Bischofsdiözese eingebracht wurden.
42 | Die Sakristei – das Leitungsgremium der Pfarrei, das sich aus Laienführern zusammensetzt – schrieb der Diözese im Juli mit der Befürchtung, dass die Diözese versuchen würde, die Kosten auf die Sakristei abzuwälzen, obwohl die Sakristei nicht an der Einstellung der von der Diözese entsandten Architekten und Bauunternehmer beteiligt gewesen sei.
43 | Einige Gemeindemitglieder beklagten sich über mangelnde Transparenz seitens der Diözese.
44 | Hai verletzt 13-Jährigen bei Hummer-Tauchgang in Kalifornien
45 | Ein Hai angegriffen und verletzt einen 13-jährigen Jungen Samstag, während er für Hummer in Kalifornien am Eröffnungstag der Hummersaison tauchen, sagten Beamte.
46 | Der Angriff ereignete sich kurz vor 7 Uhr morgens in der Nähe von Beacon's Beach in Encinitas.
47 | Chad Hammel erzählte KSWB-TV in San Diego, dass er am Samstagmorgen etwa eine halbe Stunde mit Freunden getaucht war, als er den Jungen um Hilfe schreien hörte und dann mit einer Gruppe hinüberpaddelte, um ihn aus dem Wasser zu ziehen.
48 | Hammel sagte zunächst, er dachte, es sei nur Aufregung, einen Hummer zu fangen, aber dann „erkannte er, dass er schrie: 'Ich habe gebissen!
49 | Ich habe gebissen!'
50 | Sein ganzes Schlüsselbein war aufgerissen“, sagte Hammel, als er zu dem Jungen kam.
51 | „Ich schrie alle an, um aus dem Wasser zu kommen: 'Da ist ein Hai im Wasser!'“, fügte Hammel hinzu.
52 | Der Junge wurde ins Rady Children's Hospital in San Diego geflogen, wo er in kritischem Zustand gelistet ist.
53 | Die Haiart, die für den Angriff verantwortlich war, war unbekannt.
54 | Rettungsschwimmer Capt. Larry Giles sagte bei einem Medienbriefing, dass ein Hai in der Gegend ein paar Wochen zuvor gesichtet worden war, aber es wurde festgestellt, nicht eine gefährliche Haiart zu sein.
55 | Giles fügte hinzu, das Opfer erlitt traumatische Verletzungen an seinem oberen Oberkörperbereich.
56 | Beamte sperrten den Strandzugang von Ponto Beach in Casablad zu Swami's in Ecinitas für 48 Stunden für Ermittlungs- und Sicherheitszwecke.
57 | Giles darauf hingewiesen, dass es mehr als 135 Haiarten in der Gegend, aber die meisten sind nicht als gefährlich.
58 | Sainsburys Pläne drängen in den britischen Schönheitsmarkt
59 | Sainsbury's nimmt Boots, Superdrug und Debenhams mit Kaufhaus-Stil Schönheit Gänge mit spezialisierten Assistenten besetzt.
60 | Als Teil eines erheblichen Vorstoßes in den britischen Schönheitsmarkt mit einem Volumen von 2,8 Mrd. Pfund, der weiter wächst, während die Verkäufe von Mode und Haushaltswaren zurückgehen, werden die größeren Beauty-Gänge in 11 Geschäften im ganzen Land getestet und im nächsten Jahr in weitere Läden gebracht, wenn sich dies als Erfolg erweist.
61 | Die Investition in Schönheit kommt als Supermärkte Jagd nach Möglichkeiten, um bis Regalplatz einmal verklagt für TVs, Mikrowellen und Haushaltswaren zu verwenden.
62 | Sainsbury's sagte, es wäre die Verdoppelung der Größe seines Beauty-Angebot auf bis zu 3.000 Produkte, darunter Marken wie Revlon, Essie, Tweezerman und Dr. PawPaw zum ersten Mal.
63 | Bestehende Sortimente von L'Oreal, Maybelline und Burt's Bees erhalten ebenfalls mehr Platz mit Markenbereichen, die denen in Geschäften wie Boots ähneln.
64 | Zudem bringt der Supermarkt sein Boutique-Make-up-Sortiment neu auf den Markt, so dass die meisten Produkte vegan-freundlich sind – was zunehmend von jüngeren Käufern nachgefragt wird.
65 | Darüber hinaus wird der Parfümhändler Fragrance Shop Konzessionen in zwei Sainsbury's Stores testen, von denen der erste letzte Woche in Croydon, Süd-London, eröffnete, während ein zweiter in Selly Oak, Birmingham, später in diesem Jahr eröffnet.
66 | Online-Shopping und eine Verschiebung hin zum Kauf kleiner Mengen von Lebensmitteln täglich in lokalen Convenience-Stores bedeutet, Supermärkte müssen mehr tun, um die Menschen zu überzeugen, zu besuchen.
67 | Mike Coupe, der Vorstandsvorsitzende von Sainsbury's, hat gesagt, dass die Verkaufsstellen zunehmend wie Kaufhäuser aussehen werden, da die Supermarktkette versucht, sich mit mehr Dienstleistungen und Non-Food gegen die Discounter Aldi und Lidl zu wehren.
68 | Sainsbury's hat Argos-Filialen in Hunderten von Geschäften platziert und auch eine Reihe von Habitats eingeführt, seit es beide Ketten vor zwei Jahren gekauft hat, was, wie es sagt, die Lebensmittelverkäufe gestärkt und die Akquisitionen profitabler gemacht hat.
69 | Der frühere Versuch des Supermarktes, seine Schönheits- und Apothekenabteilungen umzugestalten, scheiterte.
70 | Sainsbury's testete ein Joint Venture mit Boots in den frühen 2000er Jahren, aber die Krawatte endete nach einem Streit darüber, wie man die Einnahmen aus den Apotheken in seinen Supermärkten zu teilen.
71 | Die neue Strategie kommt, nachdem Sainsbury's vor drei Jahren sein 281-Store-Apothekengeschäft für 125 Millionen Pfund an Celesio, den Eigentümer der Lloyds-Apothekenkette, verkauft hatte.
72 | Lloyds werde eine Rolle in dem Plan spielen, indem es eine erweiterte Palette von Luxus-Hautpflege-Marken wie La Roche-Posay und Vichy in vier Filialen hinzufüge.
73 | Paul Mills-Hicks, kaufmännischer Direktor von Sainsbury, sagte: „Wir haben das Aussehen und die Haptik unserer Beauty-Gänge verändert, um die Umwelt für unsere Kunden zu verbessern.
74 | Wir haben auch in speziell geschulte Kollegen investiert, die mit Rat und Tat zur Seite stehen.
75 | Unsere Markenpalette ist auf jeden Bedarf zugeschnitten und die verführerische Umgebung und die günstigen Lagen machen uns zu einem attraktiven Beauty-Destination, die die alte Art des Einkaufens herausfordert“.
76 |
--------------------------------------------------------------------------------
/leaderboard/testdata/xml/sample-hyp.ha.txt:
--------------------------------------------------------------------------------
1 | Jeetandra, Ekata Shobha da kuma Tusshar Kapoor sun tuna kasaita ciki
2 | Jarumin Tusshar fina-finai Kapoor a ranar Lahadi ya yada wasu hotuna kuciyarsa cikin kasaita don murnar bikin zagayowar ranara duniya. ta
3 | Jarumin yada ya wasu jerin hotuna da suka kunshi hotunansa yana yaro shi da mahaifinsa Jeetendra da babansa Shobha da kuma kuna kaawarsa Ekta Kapoor da kuma wani na baya-bayannan da ke dauke da dansa. da
4 | A hoton tsohon maras launi, an ga jarumi Jeetendra ya yi tsayuwar daukar hoto yana rike dan jariri Tusshar da Ekta hannunsa. a
5 | Ana ganin iya matar Jeetendra a tsaye kusa da mutanen uku hoton. cikin
6 | A na hoto biyu Tusshar Kappor da dansa Laksshya na tsaye cikin fara'a da annashuwa Kamara. kallon
7 | A da rubutun ya saka a jikin hoton da ya yada, ya rubuta "Ina taya ku murnar zagayowar ranar iyaye" da
8 | Tusshar yana Kapoor zaune da 'ya'yansa uwa. ba
9 | An Lakshiya haifi ne ta hanyar daukar cikinta a wajen mahaifa 2016. shakarar
10 | Wadansu jarimin lokutan na yada hotunan da bidiyon karamin dan na sa a shafukan sada Instagram. na
11 | A aiki bangaren kuwa, ganin karshe da aka yiwa Tusshar Kapoor shine Phategi. Sabki
12 | Ana ran sa sake ganinsa ne a fim din 'Laxmmi Bomb' wanda Raghava Lawarence ya umarni. da
13 | A fin cikin din da akwai kuma Akshay Kumar Advani. Kiara
14 | A bangaren daya kuma Ekita Kapoor ya shirya wasu shirya-shiryen Talbijin da kuma Fim kamar su Dream Girl da Hum Paanch da Dolly Kitty aur Chamakte Sitare, da Ye Hai Mohabbatein, da Kahaani Ghar Ghar Kii da kuma sauransu. da
15 | An gada gina ta farko a aikin jirgi mai tafiya a kasrkashin kasa na Delhi a kashin 4 na
16 | Aikin jirgi gina mai tafiya a karkashin kasa na birni Delhi ya cimma wani mataki mai muhimmanci yayin da ya shiga wani kashi a aikin-4 yayin da a ka gina gada ta farko a kan mashigar yamma na Janakpurita R K Ashram Marg, A cewar wasu jami'ai Lahadi. ranar
17 | An aikln yi gadar ne a Keshopur a kan wani tudu da ke tsaknin Keshpur da Mukaba Chowks Asabar. daren
18 | "Hukumar Jirgin kula karkashin kasa ta birnin Delhi ta sake samun kai wa ga wani babban mataki na 4 aikin da ta ke yi na fadada layin dogo na karkashin kasa da samun nasarar ginin karfe na wata gada a wata mashiga hanyar jirgin karakashin kasa ta yamma a Janakpuri RK Astta Marg," a cewar wata sanarawa da Hukumar fitar. ta
19 | Wannan nasara "babban da aka samu a wannan aikin ginin layin dogo" an same ta ne duk da karancin ma'aikata da kuma wasu matsalolin jigila da kai-kawo saboda annobar cuta da ake fama da ita, a jami'i. wani
20 | Matsakaicin wannan tsayin gada ta wannan mashiga 10. mita
21 | Sai sauran daia gadojin zasu zama masu tsawon mita 20 a Madhun Chowk (wurin tsallakawa n a 1)da kuma mita 25 a Haderpur Badli Mor a inda wannan layin dogo zai tsallaka wani layin 2. na
22 | A pur Haider, Mor, gadar da za ta dauki layin dogon da zai wuce ta wurin zai kasance mita 28, wanna shine mafi girma a tarihin layin dogo na birni Delhi, sanarwar. cewar
23 | A dai yanzu wuri ma fi tsawo shine wanda ya ke Dhaula Kuan, a inda layin dogo na 7 da ke kan gada ya wuce har 23.6. mita
24 | A kimiyyar tsarin gine-gine ana yin ginshikin gine-gine ne a tsatstsaye domin su tallafin nauyin ginin da ke zama kamar gada a kan ginshikan biyu na gefe. da
25 | Wadannan suka su zama kamar ginshikan da suka tallafi tudun da aka dora layin dogon mai kai. a
26 | Gadojin a da ka dora layin dogo na jirgin karkashi kasa da dora su a tsakiyar hanyoyin mota a birnin Delhi ta kan su ne aka giggina mashigar kasa. karkshin
27 | Yawanci gadojin wadannan sun sa sun zama fittatun kuma ababen kwantace a wajen bayar da adireshi Delhi. birnin
28 | Mashigar dogo layin ta Janakpurin yamma - RK Ahsram ita ce ma fi tsawo da tsawon kilomita 28.92, ita ce karin layin dogo na MAgenta za ta kuma 22. tashohi
29 | Yayin kilolmita da 21.18 na wannan mashigar za a daga shi, yayin da 7.74 kilomita na wannan layi zai kasance kasa. karkashin
30 | An aikin soma ginin wannan sashi a watan Disambar shekarar wuce. ta
31 | A 17 ranar ga watan Yuli, a ka soma aikin ginin sashen karkashin kasa na mashigar wanda aka fara da gina bangon D a tashar jirgin karkashin kasa na Krishna. shakatawar
32 | A 24 ranar ga watan Yuli, Hukumar ta DMRC ta soma kakkafa karafunan zuba kankaren durakai da kuma ginshikai don daga layin dogon wannan bangare na dogon. layin
33 | A wanna karkashin rukunin aiki na 4, kilomita 61. 679 na sabbin layukan dogo za a giggina a kan mashigai daban-daban guda uku da za su kunsh tasoshi 45 na kasa. kakshin
34 | Wannan sashi sabon zai samar da wata babbar mahada a tsakanin shiyoyin daban-daban na jiragen karkashin kasa na Delhi. na
35 | A wannan cikin adadi, Kilomita 22.35 duk za su kasance a karkashin kasa ne yayin da sauran za su kasance gadoji. kan
36 | Fiye cutar da Koronabirus dubu 13.85 ne a Indiya har zuwa yanzu, mutane 32,063 suka mutu, kashi 63.91% warke suka
37 | Adadin 8,85,577 mutane ne suka warke kuma adadin kaso da suka warke ya kai kashi dari. cikin
38 | Garin Delhi: New Indiya ta ba da rahoton wadanda suka kamu da kwayar cutar ta coronabirus 48,661 a cikin awanni 24 da suka gabata, suna ɗaukar jimillar zuwa 13,85,522, kamar yadda bayanan nuna. sun
39 | Adadin suka wadanda mutu ya haura 32,063, a inda mutane 705 suka mutu a cikin awanni 24 gabata. suka
40 | Adadin suka wadanda kamu da kwayar cutar coronabirus ya ninka sau biyu a kusan makonni uku tun daga ranar 2 ga watan Yulin, a lokacin da kasar ta tsallake matakin shida. dari
41 | Yawan na adadi wadanda suka kamu da cutar Covid-19 na kasar ya kai makin dubu dari a ranar Juma'ar gabata. ta
42 | Tun wannan daga lokacin, an sami rahoton sabbin kamuwa da ya kai dubu uku. Wannan ita ce rana ta huɗu a jere lokacin da masu kamuwa da cutar COVID-19 suka ƙaru da 45,000. da
43 | Maharashtra ranar a Asabar ta ba da rahoton sabbin kamuwa da cutar 9,251 wadanda suka kamu da cutar ta COVID-19, inda suka dauki adadin a jihar zuwa 3,66,368 yayin da wadanda suka mutu suka kai 257, ciki har da 116 a yankin Mumbai yakin tsakiyar birni (MMR), zuwa 13,389, in ji Ma'aikatar Kiwon jihar. ta
44 | An adadin sallami marasa lafiya 7,227 a rana, inda aka dauki adadin wadanda suka 2,07,194. zuwa
45 | Kimanin lafiya marasa dubu 8.85 ne suka warke ya zuwa yanzu; darajar farfadowa ya tsaya a kashi 63.91 bisa dari yau. safiyar
46 | Kaso yawan na wadanda suka kamu da cutar - yawan marasa lafiya waɗanda aka gwada aka kuma tabbatar sun kamu da kwayar cutar - shine kashi ɗari. cikin
47 | A wannan farkon makon ne, gwamnati ta ce tana da niyyar saukar da adadin wadanda suka kamu da ƙimar zuwa kashi 100. cikin
48 | Jihar a Karnataka ranar Asabar ya yi rajistar a sabbin wadanda suka kamu da cutar ta Koronavirus 5,000 a rana ta uku a jere, wanda hakan ya kai adadin ya haura daya. baki
49 | A kadai Bengaluru an bayar da rahoton sabbin mutanen da suka kamu da cutar zuwa 2,036 da suka kai jimillar 43,503. zuwa
50 | Matsayin Delhi birnin ya haura a cikin yawan wadanda aka samu da cutar COVID-19 kuma a halin yanzu birnin na matsayi na takwas tsakanin jihohi da yankuna da ke karkashin ikon gwmanatin tarayya a kasar, Babban Ministan Arvind Kejriwal ne ya faɗa Asabar. ranar
51 | A wani cikin karuwar adadi da aka taba samu a rana daya har zuwa yanzu, Kerala a ranar Asabar ta ba da rahoton mutane 1,103 sabbbi da suka kamu da COVID-19, wanada hakan ya daga adadin masu dauke da cutar zuwa 18,098, yayin da sama da dubban mutane 1.5 ake su. da
52 | Kimanin 9,420 mutane ne ke karbar Koronabirus. cutar
53 | Yawan suka wadanda kanu da cutar Coronavirus a Tamil Nadu ya tsallake makin dubu dari tare da sabbin wadanda suka kamuwa da cutar 6,989 da aka rawaito a cikin awanni 24 da suka gabata, wanda kuma shi ne mafi girma a rana guda, kamar yadda bayanan nuna. ya
54 | Mutane da tamanin tara sun mutu kuma 7,758 sun warke a cikin awanni 24 gabata. suka
55 | Yawana wadanda adadin suka kamu a yanzu 2,06,737. kai
56 | Gujarat ranar a Asabar ta shigar da bayanai mafi yawaa rana guda na adadin wadanda suka kamu da cutar Koronavirus da 1,081 na sabbin wadanda suka kamu da cutar, wanda hakan ya kai jimlar zuwa 54,712 yayin da marasa lafiya 22 suka mutu, ciki har da aka samu 11 a cikin Surat, a cewar ma'aikatar kiwon jihar. ta
57 | Babban Maharashtra Ministan Uddhav Thackeray zai ƙaddamar da shirin bayar da gudummawar plasma a ranar 27 ga watan Yuli, bayan "Plasma Daan Sankalp Abhiyan" don binciken farko na marasa lafiyar COVID-19 da suka warke a yankin Mumbai. na
58 | Indiya ta ce uku a cikin kasashe masu fama da cutar Koronavirus a duniya bayan Amurka da Brazil, a hankali ta kara karfin gwajin cutar ta COVID-19 kuma ta gudanar da gwaje-gwaje sama da dubu dari 4.2 a cikin yini daya, Ma'aikatar Lafiya ta Tarayyar ta ce a ranar Asabar, tana mai yaba karuwar tare da danganaa samun wannan nasara ga yawan dakunan gawaje-gwaje samu. aka
59 | Annobar hallaka ta sama da mutane 6,33,000 a fadin duniya tun lokacin da cutar da bayyana a kasar Chima a shekarar da ta wuce, da samun yawan mutane sama da miliyan 15.5 wadanda suka kamu dac cutar, a cewar kamfanin dillancin AFP. na
60 |
--------------------------------------------------------------------------------
/leaderboard/testdata/xml/sample-src.xml:
--------------------------------------------------------------------------------
1 |
2 |
3 |
4 |
5 |
6 | Jeetendra, Shobha, Ekta And Tusshar Kapoor In A Major Blast From The Past
7 | Actor Tusshar Kapoor, on Sunday, shared a special blast from the past to celebrate Parents' Day.
8 | The actor shared an album, comprising a throwback picture of himself, his father Jeetendra, mother Shobha and sister Ekta Kapoor, and a recent one featuring his son.
9 | In the old black and white photograph, actor Jeetendra can be seen posing for the camera while holding tiny Tusshar and Ekta Kapoor in his arms.
10 | Jeetendra's wife can be seen standing near the trio in the picture.
11 | In the second photo, Tusshar Kapoor and his son Laksshya can be seen smiling with all their heart for the camera.
12 | Sharing the photos, Tusshar Kapoor captioned it: "Happy Parents' Day."
13 | Tusshar Kapoor is a single parent.
14 | Laksshya was born via surrogacy in the year 2016.
15 | The actor often shares pictures and videos of his little son on Instagram.
16 | In terms of work, Tusshar Kapoor was last seen in Booo Sabki Phategi.
17 | He will be next seen in Laxmmi Bomb, which has been directed by Raghava Lawrence.
18 | The film also features Akshay Kumar and Kiara Advani.
19 | Ekta Kapoor, on the other hand, has produced several television shows and films such as Dream Girl, Hum Paanch, Dolly Kitty Aur Woh Chamakte Sitare, Ye Hai Mohabbatein, Kahaani Ghar Ghar Kii and Kasturi among others.
20 |
21 |
22 |
23 |
24 |
25 |
26 | Delhi Metro Casts First Pier Under Phase-4 Work
27 | The Delhi Metro has reached a major milestone in the Phase-4 work as it cast its first pier on the under-construction Janakpuri West-R K Ashram Marg corridor, officials said on Sunday.
28 | The pier was cast at Keshopur on the elevated stretch between Keshopur and Mukarba Chowk on Saturday night.
29 | "The Delhi Metro Rail Corporation took another important step forward in its Phase 4 construction work as the first pier of this phase of Metro expansion was cast on the Janakpuri West-R K Ashram Marg Metro corridor," the DMRC said in a statement.
30 | This "major construction milestone" has been achieved, despite severe shortage of manpower and other logistical challenges because of the pandemic, officials said.
31 | The average height of piers on this corridor is 10m.
32 | However, piers will be 20m high at Madhuban Chowk (crossing with Line 1) and 25m at Haiderpur Badli Mor where this line will cross Line 2.
33 | At Haiderpur Badli Mor, the viaduct level is going to be at 28m, the highest in the history of Delhi Metro, the statement said.
34 | Presently, the highest point is at Dhaula Kuan, where the Line 7 viaduct passes at a height of 23.6m.
35 | Piers, in terms of civil engineering are vertical loadbearing structures which act as intermediate support for adjacent ends of two spans.
36 | They form the vertical support structures on which the elevated metro viaducts stand.
37 | Metro piers today dot innumerable road medians in Delhi through which elevated Metro corridors run.
38 | Pier numbers are now important landmarks for addresses across the Delhi-NCR.
39 | The 28.92-km-long Janakpuri West-R K Ahsram Marg corridor is an extension of Magenta Line and will come up with 22 stations.
40 | While 21.18 km of this corridor will be elevated, 7.74 km will be underground.
41 | Construction work on this particular section had started in December last year.
42 | On July 17, the work on the underground section of this corridor was commenced with the beginning of D Wall construction work at the Krishna Park Extension Metro station.
43 | On 24th June, DMRC had started the casting work of u-girders which would be installed on the elevated section of this corridor.
44 | Under Phase-4, 61.679 km of new metro lines shall be constructed across three different corridors comprising 45 metro stations.
45 | These new sections shall provide interconnectivity among the already operational sections of Delhi Metro.
46 | Out of this, 22.35 km will be underground while rest will be elevated.
47 |
48 |
49 |
50 |
51 |
52 |
53 | Over 13.85 lakh coronavirus cases in India so far, 32,063 deaths, 63.91% recovery rate
54 | A total of 8,85,577 have recovered and the recovery rate is 63.91 per cent.
55 | New Delhi: India reported 48,661 coronavirus cases in the last 24 hours, taking the total so far to 13,85,522, government data shows.
56 | The number of death have risen to 32,063, with 705 deaths in the last 24 hours.
57 | The number of coronavirus cases have doubled in nearly three weeks since July 2, when the country crossed the six lakh-mark.
58 | The country's Covid tally touched the 10 lakh-mark last Friday.
59 | Since then, around three lakh new infections have been reported.This is the fourth consecutive day when COVID-19 cases increased by more than 45,000.
60 | Maharashtra on Saturday reported 9,251 new COVID-19 cases, taking the cumulative count in the state to 3,66,368 while fatalities mounted by 257, including 116 in Mumbai Metropolitan Region (MMR), to 13,389, the state Health department said.
61 | A record number of 7,227 patients were discharged in the day, taking the count of recovered cases to 2,07,194.
62 | Around 8.85 lakh patients have recovered so far; the recovery rate stood at 63.91 per cent this morning.
63 | The positivity rate - percentage of patients who have tested positive for coronavirus - is 11 per cent.
64 | Earlier this week, the government had said that it aims to bring down the positivity rate to 5 per cent.
65 | Karnataka on Saturday registered over 5,000 new coronavirus cases for the third day in a row, taking its total past 90,000.
66 | Bengaluru alone reported 2,036 new cases taking its overall tally to 43,503.
67 | Delhi has improved its position in the number of active COVID-19 cases and is currently at the eighth spot among states and union territories in the country, Chief Minister Arvind Kejriwal said on Saturday.
68 | In the highest single-day spike till now, Kerala on Saturday reported 1,103 fresh COVID-19 cases taking the infection count to 18,098, while over 1.5 lakh persons are under observation.
69 | As many as 9,420 persons are under treatment for coronavirus.
70 | Coronavirus cases in Tamil Nadu have crossed the two lakh-mark with 6,989 new cases reported in the last 24 hours, which is also the biggest single-day spike, government data shows.
71 | Eighty-nine have died and 7,758 have recovered in the last 24 hours.
72 | The total cases in the state is now 2,06,737.
73 | Gujarat on Saturday logged the highest single-day spike in coronavirus cases with 1,081 new infections, taking the total count to 54,712 while 22 patients died, including 11 in Surat, the state health department said.
74 | Maharashtra Chief Minister Uddhav Thackeray will launch a plasma donation program on July 27, following the "Plasma Daan Sankalp Abhiyan" for primary screening of recovered COVID-19 patients in Dharavi area of Mumbai.
75 | India, the third worst-hit country in the global coronavirus tally after US and Brazil, has gradually ramped-up its COVID-19 testing capacity and has conducted over 4.2 lakh tests in a day, the Union Health Ministry said Saturday, crediting the increase to the number of labs for the achievement.
76 | The pandemic has killed more than 6,33,000 people worldwide since it surfaced in China late last year, with more than 15.5 million people infected, according to news agency AFP.
77 |
78 |
79 |
80 |
81 |
--------------------------------------------------------------------------------
/leaderboard/utils.py:
--------------------------------------------------------------------------------
1 | """
2 | Project OCELoT: Open, Competitive Evaluation Leaderboard of Translations
3 | """
4 | import os.path
5 | import re
6 | from typing import Optional
7 |
8 | import lxml.etree as ET
9 | from sacrebleu.utils import smart_open
10 |
11 |
12 | MISSING_TRANSLATION_MESSAGE = "NO TRANSLATION AVAILABLE"
13 |
14 |
15 | def analyze_xml_file(xml_path):
16 | """
17 | Return all collection names, source languages, reference languages,
18 | translators, and systems found in the XML file. Code extracted from
19 | https://github.com/wmt-conference/wmt-format-tools/blob/main/wmtformat/unwrap.py
20 | """
21 | collections, src_langs, ref_langs, translators, systems = (
22 | set(),
23 | set(),
24 | set(),
25 | set(),
26 | set(),
27 | )
28 | tree = ET.parse(xml_path)
29 |
30 | for collection in tree.getroot().findall(".//collection"):
31 | collections.add(collection.get("id"))
32 |
33 | for src_doc in tree.getroot().findall(".//src"):
34 | src_langs.add(src_doc.get("lang"))
35 |
36 | for ref_doc in tree.getroot().findall(".//ref"):
37 | ref_langs.add(ref_doc.get("lang"))
38 | translator = ref_doc.get("translator")
39 | if translator:
40 | translators.add(translator)
41 |
42 | for hyp_doc in tree.getroot().findall(".//hyp"):
43 | # hyp_langs.add(hyp_doc.get("lang")) # Not used in the XML format?
44 | system = hyp_doc.get("system")
45 | if system:
46 | systems.add(system)
47 |
48 | return collections, src_langs, ref_langs, translators, systems
49 |
50 |
51 | # Taken from sacrebleu which removed this with v2.2
52 | #
53 | # https://github.com/mjpost/sacrebleu/blob/65a8a9eeccd8c0c7875e875e12edf10db33ab0ba/sacrebleu/utils.py#L277
54 | def process_to_text(rawfile, txtfile, field: Optional[int] = None):
55 | """Processes raw files to plain text files. Can handle SGML, XML, TSV files, and plain text.
56 | Called after downloading datasets.
57 | :param rawfile: the input file (possibly SGML)
58 | :param txtfile: the plaintext file
59 | :param field: For TSV files, which field to extract.
60 | """
61 |
62 | def _clean(s):
63 | """
64 | Removes trailing and leading spaces and collapses multiple consecutive internal spaces to a single one.
65 | :param s: The string.
66 | :return: A cleaned-up string.
67 | """
68 | return re.sub(r'\s+', ' ', s.strip())
69 |
70 | if not os.path.exists(txtfile) or os.path.getsize(txtfile) == 0:
71 | if rawfile.endswith('.sgm') or rawfile.endswith('.sgml'):
72 | with smart_open(rawfile) as fin, smart_open(
73 | txtfile, 'wt'
74 | ) as fout:
75 | for line in fin:
76 | if line.startswith('(.*).*?', '\\1', line
81 | )
82 | ),
83 | file=fout,
84 | )
85 | # IWSLT
86 | elif rawfile.endswith('.xml'):
87 | with smart_open(rawfile) as fin, smart_open(
88 | txtfile, 'wt'
89 | ) as fout:
90 | for line in fin:
91 | if line.startswith('(.*).*?', '\\1', line
96 | )
97 | ),
98 | file=fout,
99 | )
100 | # MTNT
101 | elif rawfile.endswith('.tsv'):
102 | with smart_open(rawfile) as fin, smart_open(
103 | txtfile, 'wt'
104 | ) as fout:
105 | for line in fin:
106 | print(line.rstrip().split('\t')[field], file=fout)
107 | # PLAIN TEXT
108 | else:
109 | with smart_open(rawfile) as fin, smart_open(
110 | txtfile, 'wt'
111 | ) as fout:
112 | for line in fin:
113 | print(line.rstrip(), file=fout)
114 |
115 |
116 | def process_xml_to_text(
117 | xml_path,
118 | txt_path,
119 | source=None,
120 | reference=None,
121 | system=None,
122 | collection=None,
123 | ):
124 | """
125 | Extract source, reference(s) or system texts from the XML file.
126 | Segments from test suites are ignored.
127 | Multiple references are not supported.
128 | """
129 |
130 | if [source, reference, system].count(None) != 2:
131 | raise ValueError(
132 | 'Exactly one of source, reference or system must be provided'
133 | )
134 |
135 | tree = ET.parse(xml_path)
136 | src_sents, ref_sents = [], []
137 | out_sents = []
138 |
139 | root = tree.getroot()
140 | if collection: # Restrict to the given collection if requested
141 | root = root.find(f".//collection[@id='{collection}']")
142 | if root is None:
143 | # Create an empty hypothesis file as this case is catched later
144 | with open(txt_path, 'w') as txt_file:
145 | pass
146 | return False
147 |
148 | for doc in root.findall(".//doc"):
149 | if 'testsuite' in doc.attrib: # Skip testsuites
150 | continue
151 |
152 | src_sents = {
153 | int(seg.get("id")): seg.text
154 | for seg in doc.findall(".//src//seg")
155 | }
156 |
157 | if reference:
158 | ref_docs = doc.findall(".//ref")
159 | trans_to_ref = {ref.get("translator"): ref for ref in ref_docs}
160 | ref_doc = trans_to_ref.get(reference, None)
161 | ref_sents = (
162 | {
163 | int(seg.get("id")): seg.text
164 | for seg in ref_doc.findall(".//seg")
165 | }
166 | if ref_doc is not None
167 | else {}
168 | )
169 |
170 | if system:
171 | hyp_docs = doc.findall(".//hyp")
172 | sys_to_hyp = {hyp.get("system"): hyp for hyp in hyp_docs}
173 | hyp_doc = sys_to_hyp.get(system, None)
174 | hyp_sents = (
175 | {
176 | int(seg.get("id")): seg.text
177 | for seg in hyp_doc.findall(".//seg")
178 | }
179 | if hyp_doc is not None
180 | else {}
181 | )
182 |
183 | for seg_id in sorted(src_sents.keys()):
184 | if source:
185 | out_sents.append(src_sents[seg_id])
186 | elif reference:
187 | ref_sent = ref_sents.get(
188 | seg_id, MISSING_TRANSLATION_MESSAGE
189 | )
190 | out_sents.append(ref_sent)
191 | elif system:
192 | hyp_sent = hyp_sents.get(
193 | seg_id, MISSING_TRANSLATION_MESSAGE
194 | )
195 | out_sents.append(hyp_sent)
196 |
197 | with open(txt_path, 'w') as txt_file:
198 | for sent in out_sents:
199 | txt_file.write("{}\n".format(sent))
200 | return True
201 |
--------------------------------------------------------------------------------
/manage.py:
--------------------------------------------------------------------------------
1 | #!/usr/bin/env python
2 | """Django's command-line utility for administrative tasks."""
3 | import os
4 | import sys
5 |
6 |
7 | def main():
8 | """Django's command-line utility for administrative tasks."""
9 | os.environ.setdefault('DJANGO_SETTINGS_MODULE', 'ocelot.settings')
10 | try:
11 | from django.core.management import execute_from_command_line
12 | except ImportError as exc:
13 | raise ImportError(
14 | "Couldn't import Django. Are you sure it's installed and "
15 | "available on your PYTHONPATH environment variable? Did you "
16 | "forget to activate a virtual environment?"
17 | ) from exc
18 | execute_from_command_line(sys.argv)
19 |
20 |
21 | if __name__ == '__main__':
22 | main()
23 |
--------------------------------------------------------------------------------
/ocelot/__init__.py:
--------------------------------------------------------------------------------
1 | """
2 | Project OCELoT: Open, Competitive Evaluation Leaderboard of Translations
3 | """
4 |
--------------------------------------------------------------------------------
/ocelot/context_processors.py:
--------------------------------------------------------------------------------
1 | """
2 | Project OCELoT: Open, Competitive Evaluation Leaderboard of Translations
3 | """
4 | from django.conf import settings
5 |
6 |
7 | def project_version(request):
8 | return {"project_version": settings.VERSION}
9 |
--------------------------------------------------------------------------------
/ocelot/settings.py:
--------------------------------------------------------------------------------
1 | """
2 | Django settings for ocelot project.
3 |
4 | Generated by 'django-admin startproject' using Django 2.2.1.
5 |
6 | For more information on this file, see
7 | https://docs.djangoproject.com/en/2.2/topics/settings/
8 |
9 | For the full list of settings and their values, see
10 | https://docs.djangoproject.com/en/2.2/ref/settings/
11 | """
12 | import logging
13 | import os
14 | from logging.handlers import ( # pylint: disable=ungrouped-imports
15 | RotatingFileHandler,
16 | )
17 |
18 |
19 | # Build paths inside the project like this: os.path.join(BASE_DIR, ...)
20 | BASE_DIR = os.path.dirname(os.path.dirname(os.path.abspath(__file__)))
21 |
22 | # Quick-start development settings - unsuitable for production
23 | # See https://docs.djangoproject.com/en/2.2/howto/deployment/checklist/
24 |
25 | DEBUG = os.environ.get('OCELOT_DEBUG', True)
26 |
27 | ADMINS = os.environ.get('OCELOT_ADMINS', ())
28 | MANAGERS = ADMINS
29 |
30 | SECRET_KEY = os.environ.get('OCELOT_SECRET_KEY') # Throw if no SECRET_KEY set!
31 | ALLOWED_HOSTS = os.environ.get('OCELOT_ALLOWED_HOSTS', '127.0.0.1').split(
32 | ','
33 | )
34 |
35 | CSRF_TRUSTED_ORIGINS = ['https://{0}'.format(x) for x in ALLOWED_HOSTS]
36 |
37 | WSGI_APPLICATION = os.environ.get(
38 | 'OCELOT_WSGI_APPLICATION', 'ocelot.wsgi.application'
39 | )
40 |
41 | # Try to load database settings, otherwise use defaults.
42 | DB_ENGINE = os.environ.get('OCELOT_DB_ENGINE')
43 | DB_NAME = os.environ.get('OCELOT_DB_NAME')
44 | DB_USER = os.environ.get('OCELOT_DB_USER')
45 | DB_PASSWORD = os.environ.get('OCELOT_DB_PASSWORD')
46 | DB_HOST = os.environ.get('OCELOT_DB_HOST')
47 | DB_PORT = os.environ.get('OCELOT_DB_PORT')
48 |
49 | if all((DB_ENGINE, DB_NAME, DB_USER, DB_PASSWORD, DB_HOST, DB_PORT)):
50 | DATABASES = {
51 | 'default': {
52 | 'ENGINE': DB_ENGINE,
53 | 'NAME': DB_NAME,
54 | 'USER': DB_USER,
55 | 'PASSWORD': DB_PASSWORD,
56 | 'HOST': DB_HOST,
57 | 'PORT': DB_PORT,
58 | 'OPTIONS': {'sslmode': 'require'},
59 | }
60 | }
61 |
62 | else:
63 | # Database
64 | # https://docs.djangoproject.com/en/2.2/ref/settings/#databases
65 |
66 | DB_SQLITE3 = os.environ.get('OCELOT_DB_SQLITE3',
67 | os.path.join(BASE_DIR, 'db.sqlite3'))
68 | DATABASES = {
69 | 'default': {
70 | 'ENGINE': 'django.db.backends.sqlite3',
71 | 'NAME': DB_SQLITE3,
72 | }
73 | }
74 |
75 | FILE_UPLOAD_PERMISSIONS = 0o644
76 |
77 | # Logging settings for this Django project.
78 | LOG_LEVEL = logging.DEBUG
79 | LOG_FILENAME = os.path.join(BASE_DIR, 'ocelot.log')
80 | LOG_FORMAT = "[%(asctime)s] %(name)s::%(levelname)s %(message)s"
81 | LOG_DATE = "%m/%d/%Y @ %H:%M:%S"
82 | LOG_FORMATTER = logging.Formatter(LOG_FORMAT, LOG_DATE)
83 | LOG_HANDLER = RotatingFileHandler(
84 | filename=LOG_FILENAME,
85 | mode="a",
86 | maxBytes=50 * 1024 * 1024,
87 | backupCount=5,
88 | encoding="utf-8",
89 | )
90 | LOG_HANDLER.setLevel(level=LOG_LEVEL)
91 | LOG_HANDLER.setFormatter(LOG_FORMATTER)
92 |
93 |
94 | # Application definition
95 |
96 | INSTALLED_APPS = [
97 | 'django.contrib.admin',
98 | 'django.contrib.auth',
99 | 'django.contrib.contenttypes',
100 | 'django.contrib.sessions',
101 | 'django.contrib.messages',
102 | 'django.contrib.staticfiles',
103 | 'leaderboard',
104 | 'evaluation',
105 | ]
106 |
107 | MIDDLEWARE = [
108 | 'django.middleware.security.SecurityMiddleware',
109 | 'django.contrib.sessions.middleware.SessionMiddleware',
110 | 'django.middleware.common.CommonMiddleware',
111 | 'django.middleware.csrf.CsrfViewMiddleware',
112 | 'django.contrib.auth.middleware.AuthenticationMiddleware',
113 | 'django.contrib.messages.middleware.MessageMiddleware',
114 | 'django.middleware.clickjacking.XFrameOptionsMiddleware',
115 | ]
116 |
117 | ROOT_URLCONF = 'ocelot.urls'
118 |
119 | TEMPLATES = [
120 | {
121 | 'BACKEND': 'django.template.backends.django.DjangoTemplates',
122 | 'DIRS': [],
123 | 'APP_DIRS': True,
124 | 'OPTIONS': {
125 | 'context_processors': [
126 | 'django.template.context_processors.debug',
127 | 'django.template.context_processors.request',
128 | 'django.contrib.auth.context_processors.auth',
129 | 'django.contrib.messages.context_processors.messages',
130 | 'ocelot.context_processors.project_version',
131 | ]
132 | },
133 | }
134 | ]
135 |
136 |
137 | # Password validation
138 | # https://docs.djangoproject.com/en/2.2/ref/settings/#auth-password-validators
139 |
140 | AUTH_PASSWORD_VALIDATORS = [
141 | {
142 | 'NAME': 'django.contrib.auth.password_validation.UserAttributeSimilarityValidator'
143 | },
144 | {
145 | 'NAME': 'django.contrib.auth.password_validation.MinimumLengthValidator'
146 | },
147 | {
148 | 'NAME': 'django.contrib.auth.password_validation.CommonPasswordValidator'
149 | },
150 | {
151 | 'NAME': 'django.contrib.auth.password_validation.NumericPasswordValidator'
152 | },
153 | ]
154 |
155 |
156 | # Internationalization
157 | # https://docs.djangoproject.com/en/2.2/topics/i18n/
158 |
159 | LANGUAGE_CODE = 'en-us'
160 |
161 | TIME_ZONE = 'UTC'
162 |
163 | USE_I18N = True
164 |
165 | USE_L10N = True
166 |
167 | USE_TZ = True
168 |
169 |
170 | # Static files (CSS, JavaScript, Images)
171 | # https://docs.djangoproject.com/en/2.2/howto/static-files/
172 |
173 | STATIC_URL = '/static/'
174 | STATIC_ROOT = os.path.join(BASE_DIR, 'static')
175 |
176 | # Static files that are not tied to a particular app should be put there
177 | STATICFILES_DIRS = [
178 | os.path.join(BASE_DIR, 'assets'),
179 | ]
180 |
181 | # Allow to specify absolute filesystem path to the directory that will hold user-uploaded files.
182 | MEDIA_ROOT = os.environ.get('OCELOT_MEDIA_ROOT', '')
183 |
184 | # Project version
185 | # See point 4 from https://packaging.python.org/guides/single-sourcing-package-version/
186 |
187 | with open(os.path.join(BASE_DIR, 'VERSION')) as version_file:
188 | VERSION = version_file.read().strip()
189 |
--------------------------------------------------------------------------------
/ocelot/urls.py:
--------------------------------------------------------------------------------
1 | """ocelot URL Configuration
2 |
3 | The `urlpatterns` list routes URLs to views. For more information please see:
4 | https://docs.djangoproject.com/en/2.2/topics/http/urls/
5 | Examples:
6 | Function views
7 | 1. Add an import: from my_app import views
8 | 2. Add a URL to urlpatterns: path('', views.home, name='home')
9 | Class-based views
10 | 1. Add an import: from other_app.views import Home
11 | 2. Add a URL to urlpatterns: path('', Home.as_view(), name='home')
12 | Including another URLconf
13 | 1. Import the include() function: from django.urls import include, path
14 | 2. Add a URL to urlpatterns: path('blog/', include('blog.urls'))
15 | """
16 | from django.conf.urls.static import static
17 | from django.contrib import admin
18 | from django.urls import path
19 |
20 | from evaluation.views import compare_submissions
21 | from evaluation.views import submission
22 | from leaderboard.views import download
23 | from leaderboard.views import frontpage
24 | from leaderboard.views import leaderboard
25 | from leaderboard.views import signin
26 | from leaderboard.views import signout
27 | from leaderboard.views import signup
28 | from leaderboard.views import submit
29 | from leaderboard.views import teampage
30 | from leaderboard.views import updates
31 | from leaderboard.views import welcome
32 | from ocelot.settings import DEBUG
33 | from ocelot.settings import STATIC_ROOT
34 | from ocelot.settings import STATIC_URL
35 |
36 | # pylint: disable-msg=invalid-name
37 | urlpatterns = [
38 | # django.contrib.admin app
39 | path('admin/', admin.site.urls),
40 | # leaderboard app
41 | path('', frontpage, name='frontpage-view'),
42 | path(
43 | 'leaderboard/',
44 | leaderboard,
45 | name='leaderboard-view',
46 | ),
47 | path('sign-in', signin, name='signin-view'),
48 | path('sign-out', signout, name='signout-view'),
49 | path('signup', signup, name='signup-view'),
50 | path('submit', submit, name='submit-view'),
51 | path('teampage', teampage, name='teampage-view'),
52 | path('updates', updates, name='updates-view'),
53 | path('download', download, name='download-view'),
54 | path('welcome', welcome, name='welcome-view'),
55 | # evaluation app
56 | path('submission/', submission, name='submission-view'),
57 | path(
58 | 'submission//',
59 | compare_submissions,
60 | name='compare-submissions-view',
61 | ),
62 | ]
63 |
64 | if DEBUG:
65 | urlpatterns += static(STATIC_URL, document_root=STATIC_ROOT)
66 |
--------------------------------------------------------------------------------
/ocelot/wsgi.py:
--------------------------------------------------------------------------------
1 | """
2 | WSGI config for ocelot project.
3 |
4 | It exposes the WSGI callable as a module-level variable named ``application``.
5 |
6 | For more information on this file, see
7 | https://docs.djangoproject.com/en/2.2/howto/deployment/wsgi/
8 | """
9 | import os
10 |
11 | from django.core.wsgi import get_wsgi_application
12 |
13 | os.environ.setdefault('DJANGO_SETTINGS_MODULE', 'ocelot.settings')
14 |
15 | # pylint: disable-msg=invalid-name
16 | application = get_wsgi_application()
17 |
--------------------------------------------------------------------------------
/requirements-dev.txt:
--------------------------------------------------------------------------------
1 | -r requirements.txt
2 | black
3 | lxml-stubs
4 | mypy
5 | pylint
6 | pylint-django
7 | reorder-python-imports==2.6.0
8 | safety
9 | rnc2rng
10 |
--------------------------------------------------------------------------------
/requirements.txt:
--------------------------------------------------------------------------------
1 | beautifulsoup4
2 | Django==4.1.13
3 | django-stubs
4 | lxml>=3.6
5 | psycopg2
6 | sacrebleu
7 | sqlparse
8 | xmlschema
9 |
--------------------------------------------------------------------------------
/setup.cfg:
--------------------------------------------------------------------------------
1 | [mypy]
2 | plugins =
3 | mypy_django_plugin.main
4 |
5 | strict_optional = True
6 |
7 | [mypy.plugins.django-stubs]
8 | django_settings_module = ocelot.settings
9 |
10 | [mypy-bs4]
11 | ignore_missing_imports = True
12 |
13 | [mypy-xmlschema]
14 | ignore_missing_imports = True
15 |
16 | [pylint.master]
17 | load-plugins = pylint_django
18 | django-settings-module = ocelot.settings
19 |
--------------------------------------------------------------------------------
/uwsgi_params:
--------------------------------------------------------------------------------
1 |
2 | uwsgi_param QUERY_STRING $query_string;
3 | uwsgi_param REQUEST_METHOD $request_method;
4 | uwsgi_param CONTENT_TYPE $content_type;
5 | uwsgi_param CONTENT_LENGTH $content_length;
6 |
7 | uwsgi_param REQUEST_URI $request_uri;
8 | uwsgi_param PATH_INFO $document_uri;
9 | uwsgi_param DOCUMENT_ROOT $document_root;
10 | uwsgi_param SERVER_PROTOCOL $server_protocol;
11 | uwsgi_param REQUEST_SCHEME $scheme;
12 | uwsgi_param HTTPS $https if_not_empty;
13 |
14 | uwsgi_param REMOTE_ADDR $remote_addr;
15 | uwsgi_param REMOTE_PORT $remote_port;
16 | uwsgi_param SERVER_PORT $server_port;
17 | uwsgi_param SERVER_NAME $server_name;
18 |
--------------------------------------------------------------------------------