Vom Torus zum Stier.
R.J.Lipton hat auf seinem Blog einen Artikel über den Google Translator und wie man die Leistungsfähigkeit von Maschinellen Übersetzungsprogrammen messen soll. Das ist bei Spachübersetzern nicht so einfach wie bei Schachprogrammen, die man ja einfach gegeneinander spielen lassen kann. Die Methode, die er vorschlägt:
man nehme einen englischen Satz s, übersetze ihn mit dem Programm erst ins Deutsche und dann wieder zurück ins Englische, bilde also s1=E(D(s)), und schaue ob s=s1. Wenn nicht, dann wiederhole man den Vorgang bis man irgendwann bei einem Fixpunkt sn=sn+1 landet.
Je weniger Schritte man braucht, um zu einem Fixpunkt zu kommen, desto besser ist der Algorithmus.
Ein “Fixpunkt” des Algorithmus ist ein Satz s mit s=E(D(s)), d.h. nach Rückübersetzung des übersetzten Textes bekommt man wieder den ursprünglichen Text.
Über Fixpunkte in der Mathematik hatten wir z.B. hier (Banachscher Fixpunktsatz und Iterationsverfahren) und hier (Anwendung auf Differentialgleichungen) geschrieben.
Im Zusammenhang mit Computeralgorithmen sind natürlich vor allem die in Liptons Artikel erwähnten Fixpunktsätze aus der Berechenbarkeits- und Rekursionstheorie von Interesse.
In den meisten seiner Beispiele landet man schon beim zweiten Schritt in einem Fixpunkt, eine Ausnahme ist
Today I would like to discuss one of the shortest proofs of a hard theorem.
Today I want to be one of the shortest proof of a hard set to be discussed.
Today I want to be discussing one of the shortest proof of a harsh sentence.
Today I would like to discuss one of the shortest proof of a severe punishment.
Man muß natürlich nicht immer in einem Fixpunkt landen. Beispiele von Zykeln der Länge 2 könnte die im Spanischen übliche doppelte Verneinung liefern, wobei zumindest Google Translate sich hier keine Blösse gibt und korrekt übersetzt: “no he visto nada” –> “ich habe nichts gesehen” –> “no he visto nada”.
Man kann sich ja sicher darüber streiten, ob gerade die Anzahl der Schritte bis zum Erreichen des Fixpunktes das richtige Maß für die Qualität des Übersetzungsprogramms ist. Immerhin ist es eine Zahl, die sich eindeutig bestimmen läßt.
Die Abweichung zwischen s und E(D(s)) wäre sicher ein plausibleres Maß für die Qualität, aber da stellt sich dann natürlich die Frage, wie man den Unterschied zwischen s und E(D(s)) quantitativ bewerten will.
Jedenfalls habe ich auch mal versucht, einen Satz aus dem letzten TvF-Beitrag hin und her übersetzen zu lassen:
Natürlich kann man einen Torus in den 3-dimensionalen euklidischen Raum einbetten.
Por supuesto, usted puede incrustar un toro en el espacio euclidiano de 3 dimensiones.
Natürlich kann man einen Stier in der 3-dimensionalen euklidischen Raum einbetten.
Por supuesto, usted puede incorporar a un toro en el espacio euclidiano de 3 dimensiones.
Natürlich kann man einen Stier in der 3-dimensionalen euklidischen Raum geben.
Por supuesto, usted puede ser un toro en el espacio euclidiano de 3 dimensiones.
Natürlich können Sie ein Stier in der 3-dimensionalen euklidischen Raum sein.
und ab da ändert es sich dann nicht mehr, oder
Natürlich kann man einen Torus in den 3-dimensionalen euklidischen Raum einbetten.
물론 3 차원 유클리드 공간에서 큰 쇠시리를 추가할 수 있습니다.
Natürlich können drei-dimensionalen euklidischen Raum fügen Sie eine große soesirireul.
물론, 3 차원 유클리드 공간 그리고 대형 soesirireul 추가.
Natürlich, fügen die drei-dimensionalen euklidischen Raum und eine große soesirireul.
물론, 3 차원의 유클리드 공간과 넓은 soesirireul 추가.
Natürlich, fügen die drei-dimensionalen euklidischen Raum und eine breite soesirireul.
und dann ändert es sich auch nicht mehr. Schneller geht es im Russichen:
Natürlich kann man einen Torus in den 3-dimensionalen euklidischen Raum einbetten.
Конечно, вы можете вставлять тор в 3-мерном евклидовом пространстве.
Natürlich können Sie einen Torus im dreidimensionalen euklidischen Raum einbetten.
und schon ist man in einem Fixpunkt.
Kommentare (22)