• Sonderzeichen
     
  • Lautschrift
     
 
leo-ende
Werbung
Betrifft

Neuer maschineller Übersetzer

34 Antworten   
Kommentar
Ich las gerade bei heise.de (https://www.heise.de/newsticker/meldung/Masch...), daß deepL (vormals Linguee) einen neuen Übrsetzer hat (https://www.deepl.com/translate).
Hat den schon mal jemand ausprobiert?
Verfasserkehd (353378) 30 Aug 17, 11:11
Kommentar
Just tried a page. It's not at all bad, but needs close attention. For example it left out four or five lines while still managing to produce a coherent text. Precisely the fact that the text was coherent is the problem here. And to translate 'kostbare privat editierte Drucke' as 'costume prints' shows a degree of creativity that one doesn't usually find in machine translation.
#1Verfasserescoville (237761) 30 Aug 17, 11:35
Kommentar
My first impression is that it's considerably better than Google's automaton.
I wouldn't be surprised if they bought up the deepL company soon.
#2Verfassercodero (790632) 30 Aug 17, 11:37
Kommentar
Ich hatte ihn gerade mit einem kurzen Auszug aus einem Spiegel-Text ausprobiert und war beeindruckt: Die grammatische Verknäuelung des Satzes hat das Programm erkannt und aufgelöst!
#3Verfasserwienergriessler (925617) 30 Aug 17, 11:39
Kommentar
I have just done a page of actual work with this programme. It saves some time, but most particularly for clumsy typists like me, a lot of energy. The main problem, it seems to me, is that much of the time it is 'good enough'. Whether one accepts this depends of course to a certain extent on the quality of the source text, but on a lazy day it might have a corrupting effect.
#4Verfasserescoville (237761) 30 Aug 17, 12:27
Kommentar
Ich habe ein bisschen getestet, die Probleme scheinen die gleichen wie bei anderen Maschinenübersetzungen: neben gut klingenden Sätzen produziert es auch andere, wo die logische Struktur einfach nicht wiedergegeben wird. Kann helfen, um einen Text in einer Sprache die man wenig beherrscht ansatzweise zu verstehen, für eine richtige Übersetzung wird aber viel Nacharbeit bleiben.
#5Verfasserunnaix (769252) 30 Aug 17, 12:41
Kommentar
Wow! It's light years better than G**gle Translate.
#6Verfassercovellite (520987) 30 Aug 17, 12:42
Kommentar
I find its main problem lies in its very plausibility. You need to look carefully. I have just had it translate 'überliefert' for me as 'traditional'. This appears to make sense, but it isn't what it means (in the context, it means 'surviving'). In the past, machine translations produced pleasant absurdities. This one generates un-obvious errors that could easily be overlooked.

#7Verfasserescoville (237761) 30 Aug 17, 12:55
Kommentar
Wow. Beunruhigend.
Und Zustimmung zu #7.
#8VerfasserMattes (236368) 30 Aug 17, 13:09
Kommentar
#1: Ich habe gerade eine Seite probiert. Es ist gar nicht schlecht, aber es braucht viel Aufmerksamkeit. Zum Beispiel hat es vier oder fünf Zeilen ausgelassen, während es noch zu einem kohärenten Text führt. Gerade die Tatsache, dass der Text kohärent ist, ist das Problem hier. Und um "kostbare privat editierte Drucke" zu übersetzen, wie "Kostümdrucke" zeigt ein gewisses Maß an Kreativität, die man normalerweise nicht in der maschinellen Übersetzung findet.

Na ja, so schlecht ist der Guckel-Translator doch auch nicht.
#9VerfasserHarri Beau (812872) 30 Aug 17, 13:20
Kommentar
Ich habe es gerade versucht. Es ist überhaupt nicht schlecht, aber es braucht Aufmerksamkeit. So wurden beispielsweise vier oder fünf Zeilen weggelassen, ohne dass ein zusammenhängender Text erstellt wurde. Genau die Tatsache, dass der Text kohärent war, ist hier das Problem. Und kostbare private editierte Drucke "als Kostümabzüge" zu übersetzen, zeugt von einer Kreativität, die man sonst in der maschinellen Übersetzung nicht findet.

Das macht DeepL draus. Interessante Unterschiede, finde ich. Wie kommt man darauf, "eine Seite" in "es" umzuwandeln?
#10Verfassercodero (790632) 30 Aug 17, 13:39
Kommentar
Re#9, 10: Der größte Unterschied ist doch:
it left out four or five lines while still managing to produce a coherent text.
-hat es vier oder fünf Zeilen ausgelassen, während es noch zu einem kohärenten Text führt.
-vier oder fünf Zeilen weggelassen, ohne dass ein zusammenhängender Text erstellt wurde.

DeepL sieht besser aus, hat sich aber einen Riesenschnitzer geleistet. Das bestätigt wieder escovilles Einschätzung.
#11VerfasserMattes (236368) 30 Aug 17, 13:44
Kommentar
o:
Das stimmt allerdings, hatte ich glatt überlesen, weil's so glatt formuliert wurde.
#12Verfassercodero (790632) 30 Aug 17, 14:23
Kommentar
Hab's auch grad ausprobiert mit einem Absatz aus dem englischen Wiki-Eintrag für Eye color.
Gar nicht schlecht, auch wenn ein paar Klopper dabei waren, wie z.B. Haselaugen für hazel eyes und ein falscher Bezug im folgenden Satz:
"Die Erscheinung von Blau und Grün sowie der Haselaugen resultiert aus der Tyndall-Streuung des Lichts im Stroma, einem Phänomen, das derjenigen ähnelt, die für die Blaustreuung des Himmels, Rayleigh-Streuung genannt, verantwortlich ist."

Generell fände ich es ja gar nicht unpraktisch, wenn man sich die Vorarbeit von so einem Programm machen lassen könnte und dann "nur noch nachfeilt", aber ich persönlich tu mich sehr schwer, von der vorgegebenen Struktur wegzukommen und einen wirklich schönen deutschen Satz (oder auch mal zwei oder drei Sätze) draus zu machen ...
#13Verfasserilex (764482) 30 Aug 17, 14:49
Kommentar
Sehr cool. Hab gerade Italienisch geprüft, anlässlich dieses Bildes hier: Siehe auch: Zählfaden #3692 – Tutel der Welt - #2

Das ist, was rauskommt (das Italienische Original habe ich abgetippt):

Ai sensi della convenzione concernente la tutela del patrimonio mondiale culturale e naturale. L’area archeologica della valle dei templi di Agrigento figura nell’ elenco del patrimonio mondiale.
L’ iscrizione in tale elenco consacra il valore universale eccezionale di un bene culturale o naturale al fine di garantirne la tutela a beneficio dell’ umanita.
 
Gemäß dem Übereinkommen zum Schutz des Kultur- und Naturerbes der Welt. Die archäologische Stätte des Agrigentempeltals steht auf der Liste des Weltkulturerbes.
Die Aufnahme in diese Liste weiht den außergewöhnlichen universellen Wert eines Kultur- oder Naturgutes ein, um seinen Schutz zum Wohle der Menschheit zu gewährleisten.

Das ist doch um Welten besser als das auf der Originaltafel!


#14Verfasservirus (343741) 30 Aug 17, 16:23
Kommentar
Der neue maschinelle Übersetzer ist wirklich um Klassen besser als die mir bisher bekannten. Aber auch hier geht es nicht ohne Feinarbeit.

Vergleich von drei maschinellen Übersetzern

Original:

Tropical storm Harvey is set to make landfall again on Wednesday, with Louisiana this time forecast to bear the brunt of its massive downpours. Flash flood warnings are in place across the entire state, as its neighbour Texas still reels from the devastating rains of the last five days.
 
google übersetzer :

Tropischer Sturm Harvey soll am Mittwoch wieder Landungsplatz machen, mit Louisiana diesmal prognostizieren, um die Hauptlast seiner massiven Regenfälle zu tragen. Flash Flut Warnungen sind über dem gesamten Staat, da seine Nachbar Texas immer noch von den verheerenden Regen der letzten fünf Tage.
 
Pons Textübersetzung:
 
Tropischer Sturm Harvey wird veranlasst, Landkennung wieder am Mittwoch, mit Louisiana dieses Mal Prognose zu machen, die Hauptlast seiner massiven Platzregen zu tragen. Warnungen der plötzlichen Überschwemmung sind im Platz über den kompletten Staat, weil sein Nachbartexas noch von den verheerenden Regen der letzten fünf Tage taumelt.

Deepl.com/translate:

Der tropische Sturm Harvey wird am Mittwoch wieder auf das Festland fallen, und Louisiana wird die Hauptlast seiner massiven Regenfälle tragen. Überall im gesamten Bundesstaat sind Warnungen vor Überschwemmungen vorhanden, da der Nachbarstaat Texas noch immer von den verheerenden Regenfällen der letzten fünf Tage betroffen ist.
#15Verfassershake_speare (841024) 30 Aug 17, 17:25
Kommentar
Eine wesentliche Neuerung scheint mir hier aber auch die Erleichterung der Überarbeitung zu sein. Ich habe gerade den deepL-Eigentext eingegeben (das unterstrichene "in" ist idiomatisch fragwürdig im Original, aber das wirkt sich nicht aus):

"Die Tech-Giganten Google, Microsoft und Facebook setzen allesamt die Erkenntnisse des maschinellen Lernens beim Übersetzen um, aber eine kleine Firma namens DeepL hat sie alle übertroffen und die Messlatte in diesem Gebiet höher gelegt.
Ihr Übersetzungstool ist genauso schnell wie die der übergroßen Konkurrenz, aber präziser und nuancierter als alles, was wir bisher ausprobiert haben."

The tech giants Google, Microsoft and Facebook are all implementing the knowledge of machine learning in translation, but a small company called DeepL has surpassed them all and raised the bar in this area.
Your translation tool is as fast as that of the oversized competition, but more precise and nuanced than anything we've tried before.

Recht beachtlich, oder? Klickt man jetzt auf die fett gekennzeichneten falsch übersetzten Wörter, so bietet das Programm Alternativen an, die sich per Klick auswählen lassen. Der Text wird sofort entsprechend verändert (escoville, hast du das mal mit dem Problem "überliefert" versucht?):

...Their translation tool is as fast as that of the overwhelming competition, but more precise and nuanced than anything we've tried before.

Will man jetzt noch das "that" ins richtige "those" ändern, gibt es Probleme. Automatisch wird jetzt der bestimmte Artikel vor der "competition" weggelassen (die auch gleich wieder "oversized" ist). Das lässt sich dann ohne Neuschreiben des Satzes offenbar nicht mehr beheben.

(... PS: Doch, man muss nur strikt von vorn nach hinten vorgehen. Etwas gewöhnungsbedürftig, aber scheint zu funktionieren.)
#16VerfassersebastianW (382026) 30 Aug 17, 18:02
Kommentar
Die Probleme sind freilich die üblichen: Auch dieser Übersetzer ist nicht in der Lage, rückbezügliche Pronomen richtig zuzuordnen und übersetzt "ihr" willkürlich als "her" oder als "their", "er" als "he", auch wenn das Subjekt ein Gegenstand ist, und ein "it" macht er vorzugsweise zu einem "sie". Außerdem machte DeepL "a rider with a plait" zu einer Reiterin (weil Männer keine Zöpfe tragen?). Da muss eine Genderisierspezialistin in der IT-Abteilung gesessen haben.

Und die folgende Stilblüte stammt auch von DeepL:

daran scheiden sich die Geister - that's where the ghosts divide.
#17VerfasserCuauhtlehuanitzin (1009442) 30 Aug 17, 19:48
Kommentar
By the time you've performed all the operations suggested in #16, you might just as well have done it yourself.

I would not use this except for shortish texts where I have a good overview. The main problem, as I said earlier, is that the style is quite good and things look right even if they're not. Indeed, when they say the diametric opposite (see #11). At least google's errors can hardly be overlooked.
#18Verfasserescoville (237761) 30 Aug 17, 19:56
Kommentar
Noch ein DeepL-Test, diesmal beim Spiegel : Siehe auch: Spiegel-Artikel "DeepL"
#19Verfasserno me bré (700807) 17 Sep 17, 12:04
Kommentar
At least google's errors can hardly be overlooked.

I wrote this in August, but it's not true. I pointed out somewhere that machine translation depends on probabilities where the translation is context sensitive. But google translate has come up with two things for me where the probability is actually zero, but the mistake 'overlookable'. First by translating 'halb acht' as 'half past eight', and then by translating 'ehrenrührig' as 'authoritative'. The first made perfect sense in my context, the second looked slightly odd. But although neither could ever be correct, neither was absurd (not like: 'the ghosts separated' for 'die Geister schieden sich', i.e. 'opinions differed'). This confirms what I said above: the more plausible the error, the more dangerous the translation. Still, I'm prepared to let the machine do the leg-work.
#20Verfasserescoville (237761) 12 Jan 18, 16:01
Kommentar
Ich habe in den letzten Monaten immer mal wieder mit DeepL herumgespielt. Für mich ist das mit Abstand die beste "Übersetzungsmaschine", die ich bisher erlebt habe.

Das gilt nicht so sehr für die Sprachrichtung Englisch - Deutsch, aber umso mehr für die Sprachrichtung Deutsch - Englisch – und insbesondere bei allgemeinsprachlichen Texten, beispielsweise Nachrichtentexten.

Wie oben schon ausgeführt, muss man extrem aufpassen. Für professionelle Übersetzungen ist DeepL alleine noch nicht zu gebrauchen. Man muss immer "post-editen", und der Aufwand dafür ist letztlich meistens höher, als würde man einfach von vornherein einen Menschen übersetzen lassen.

Aber zum allgemeinen Verständnis eines Textes ist DeepL schon jetzt zu gebrauchen. Ich bin gespannt, wie sich das in den nächsten 10 Jahren entwickelt.

Ach ja:

Die sich scheidenden Geister *kann* DeepL übrigens auch richtig übersetzen, ist wohl Glückssache. Ich habe gerade diesen Satz übersetzen lassen:

Ob das allerdings eine gangbare Alternative ist, daran scheiden sich die Geister.

Daraus macht DeepL:

Whether this is a viable alternative, however, is a matter of disagreement.

#21VerfasserJalapeño (236154) 12 Jan 18, 17:37
Kommentar
My impression is that these machines have bad hair days like the rest of us.
#22Verfasserescoville (237761) 12 Jan 18, 18:05
Kommentar
Ich habe letztens auch einen Text durch DeepL gejagt und fand das als Arbeitsbasis durchaus brauchbar. Wie schon gesagt, muss man halt sehr aufpassen, aber es erspart einfach jede Menge tippen. Selbst wenn ich ein Viertel nachgebessert/anders formuliert habe, habe ich immer noch drei Viertel des reinen Schreibens gespart. Das fand ich schon angenehm.
#23VerfasserGibson (418762) 12 Jan 18, 18:47
Kommentar
Für "repair" hat mir DeepL gestern allen Ernstes Reperatur angeboten!
#24VerfasserCuauhtlehuanitzin (1009442) 13 Jan 18, 21:01
Kommentar
Selbst wenn ich ein Viertel nachgebessert/anders formuliert habe

That surprises me. I would put it at more like a half. And of course you have to look carefully at the other half too, even if you leave it. Still, as you say, it still saves a lot of typing.

As I said somewhere above, DeepL generates less gibberish than Google, but that can be pernicious, because it lulls you into a sense of false security. Yesterday it gave me 'arguments between the married couples' when what was meant (and what Google also suggested, as it happened) was 'arguments between the spouses'.

Incidentally in a different thread, I noted how Google had translated 'Im Inland' as 'in Germany' (it was Austria). DeepL makes the same assumption: it has just translated 'hierzulande' as 'in Germany' (we're still in Austria).

And both programs have just told me that 'unverbildet' means 'uneducated'. (In the context, 'undistorted')
#25Verfasserescoville (237761) 14 Jan 18, 15:38
Kommentar
Das hängt natürlich vom Text ab. Bei deinen Kunsttexten käme ich mit einem Viertel auch nicht hin. Aber das war ein relativ einfacher Rundbrief an die Mitarbeiter, der selbst ohne Korrekturen in weiten Teilen nicht falsch gewesen wäre, nur nicht sonderlich idiomatisch.
#26VerfasserGibson (418762) 14 Jan 18, 16:33
Kommentar
@26
True. And with some texts (say, Terms and Conditions) it's probably more like 90%

@24
That is trivial. You copy it into your text, and Word will put a squiggly red line under it.
#27Verfasserescoville (237761) 14 Jan 18, 19:23
Kommentar
Can someone who knows about these things tell me why both Google and DeepL have, when fed with the same paragraph in which the word Vorpommern occurs twice, both translated it once (as Western Pomerania) and left it in German once. I cannot see what sort of programming would produce this result. (It smacks of collusion. If this happened in an exam, I'd be suspicious.)

(Incidentally, google thinks 'Fassmalerei' means 'barrel painting'. DeepL is a bit posher, and suggests 'cask painting'. Needless to say, both are miles out.)
#28Verfasserescoville (237761) 15 Jan 18, 12:56
Kommentar
Ich hab gerade mal ein Experiment aus dem Jahr 2005 wiederholt. Hier das Ergebnis:

Original:
Alice was beginning to get very tired of sitting by her sister on the bank, and of having nothing to do: once or twice she had peeped into the book her sister was reading, but it had no pictures or conversations in it, `and what is the use of a book,’ thought Alice `without pictures or conversation?’
So she was considering in her own mind (as well as she could, for the hot day made her feel very sleepy and stupid), whether the pleasure of making a daisy-chain would be worth the trouble of getting up and picking the daisies, when suddenly a White Rabbit with pink eyes ran close by her.

Yahoo(?), 2005:
Alice fing an, von an sitzen durch ihre Schwester sehr müde zu erhalten die Bank und des Habens nichts zu tun: sobald oder zweimal sie gelugt hatte in das Buch las ihre Schwester, aber es hatte keine Abbildungen oder Gespräche in ihm, "und was der Gebrauch eines Buches ist," Gedanke Alice "ohne Abbildungen oder Gespräch?" So betrachtete sie in ihrem eigenen Verstand (sowie könnte sie, für den heißen Tag gebildet ihr Gefühl sehr schläfrig und dumm), ob Vergnügen des Bildens ein verkettetes würde die Mühe von wert sein die Gänseblümchen aufstehen und auswählend, wenn plötzlich ein weißes Kaninchen mit rosafarbene Augen liefen nahe durch sie.

Google, 2018:
Alice wurde langsam müde, neben ihrer Schwester am Ufer zu sitzen und nichts zu tun zu haben: ein- oder zweimal hatte sie in das Buch geblickt, in dem ihre Schwester las, aber darin waren weder Bilder noch Gesprächeist der Gebrauch eines Buches, 'dachte Alice' ohne Bilder oder Konversation?'
So überlegte sie in Gedanken (so gut sie konnte, denn der heiße Tag ließ sie sehr schläfrig und dämlich werden), ob das Vergnügen, eine Daisy-Chain zu machen, die Mühe wert wäre, aufzustehen und die Gänseblümchen zu pflücken,als plötzlich ein Weißes Kaninchen mit rosa Augen dicht an ihr vorbei lief.

DeepL, 2018:
Alice wurde langsam sehr müde, von ihrer Schwester auf der Bank zu sitzen und nichts zu tun zu haben: ein- oder zweimal hatte sie in das Buch geguckt, das ihre Schwester las, aber es hatte keine Bilder oder Gespräche darin, `und was ist der Nutzen eines Buches,' dachte Alice`ohne Bilder oder Konversation?
So überlegte sie in ihrem eigenen Kopf (so gut sie konnte, denn der heiße Tag machte sie sehr schläfrig und dumm), ob das Vergnügen, eine Gänseblümchenkette zu machen, die Mühe wert wäre, aufzustehen und die Gänseblümchen zu pflücken, als plötzlich ein weißes Kaninchen mit rosa Augen neben ihr herlief.

Ich muss zugeben, ich bin einigermaßen beeindruckt.
#29Verfasserdirk (236321) 15 Jan 18, 13:47
Kommentar
Von wem, also von welcher Maschine?


#30VerfasserFragezeichen (240970) 15 Jan 18, 14:12
Kommentar
Von der Entwicklung in den letzten zwölf Jahren.
Wenn das so weitergeht, sind die Programme bald absolut alltagstauglich. Klar, für gute literarische oder Fachübersetzungen wird der menschliche Übersetzer sicher noch lange benötigt.
#31Verfasserdirk (236321) 15 Jan 18, 14:22
Kommentar
Das will ich doch stark hoffen! :)

Aber du hast schon recht - ein Fortschritt ist durchaus zu sehen, und im nicht-literarischen Bereich mögen solche Übersetzungen sicher bereits jetzt schon für einige eine große Hilfe sein. Aber nur, wenn der Nutzer viel genug von der Materie versteht, um entsprechend beurteilen zu können, was gut ist und wo es noch gewaltig hakt!

Für gute literarische Übersetzungen sehe ich da in naher Zukunft keine Chancen - aber dieser Meinung muss ich bei meinem Beruf wohl auch sein! ;)


#32VerfasserFragezeichen (240970) 15 Jan 18, 14:36
Kommentar
Im Vergleich zu dem verqueren Kauderwelsch von 2005 produzieren beide modernen Maschinen zwar kein ganz fehlerfreies, aber doch recht gut verständliches Deutsch, das den Inhalt des Originals einigermaßen korrekt wiedergibt (warum Google einen Teil des Textes komplett unterschlägt, weiß ich nicht, das mag mit falsch interpretierten Anführungszeichen zu tun haben) und lösen auch kompliziertere Satzkonstruktionen richtig auf. Nochmal eine Dekade Weiterentwicklung, und für "Gebrauchs"-Übersetzungen im Alltag reicht das aus.
#33Verfasserdirk (236321) 15 Jan 18, 14:52
Kommentar
#28: Der Grundansatz dieser Systeme ist heute statistisch: Das System bekommt Millionen an Übersetzungen und soll daraus selbst die besten Entsprechungen ermitteln.

Den unterschiedlichen Übersetzungen von "Vorpommern" liegen dann wohl bei beiden Systemen mehr oder weniger die gleichen unterschiedlich übersetzten Paralleltexte zugrunde.
#34Verfasserweirdo (236636) 15 Jan 18, 15:01
i Nur registrierte Benutzer können in diesem Forum posten
 
LEO benutzt Cookies, um das schnellste Webseiten-Erlebnis mit den meisten Funktionen zu ermöglichen. Es werden teilweise auch Cookies von Diensten Dritter gesetzt. Weiterführende Informationen erhalten Sie in den Hinweisen zu den Nutzungsbedingungen / Datenschutz (Cookies) von LEO.