Diese Website wird mit einer von Kohei Koyanagi entwickelten Software automatisch in mehrere Sprachen übersetzt. Bitte beachten Sie das ursprüngliche Englisch für Genauigkeit.

Wie dieser Blog in 42 Sprachen übersetzt wird

Splync Blog hat 42 Sprachen

Dies ist der 23. Artikel in meinem Blog für Splync, einen gemeinsamen Budget-Tracker für Paare, Freunde und Familien. Sie fragen sich vielleicht, wie ich jeden Beitrag in 42 Sprachen veröffentliche, obwohl ich ein Einzelentwickler bin. Wie der Hinweis oben in jedem Artikel besagt, wird diese Website automatisch in mehrere Sprachen übersetzt, mit einer Software, die ich selbst entwickelt habe. Um klarzustellen: Ich schreibe keinen einzigen Satz manuell in einer anderen Sprache als Englisch. Deshalb bitte ich die Leser, auf die englische Originalversion zurückzugreifen, wenn es um die Genauigkeit der Bedeutung geht. Dennoch glaube ich, dass die Übersetzungsqualität nach vielen Verbesserungsrunden der Übersetzungspipeline insgesamt recht gut ist. In diesem Artikel werde ich erläutern, wie meine Software den Splync-Blog mehrsprachig macht.

Python und OpenAI API arbeiten zusammen

Ich beginne immer damit, jeden Artikel in einfachem Englisch zu schreiben, einschließlich der SEO-relevanten Metadaten. Danach sendet mein Python-Skript den englischen Text zusammen mit einer Aufforderung und einer kleinen Referenzdatei an die OpenAI API. Auf den Servern von OpenAI liest ChatGPT-4o die Anfrage und gibt den übersetzten Artikel – zum Beispiel die arabische Version – im JSON-Format zurück. Sobald mein MacBook diese Übersetzung erhält, sendet das Skript sofort eine weitere Anfrage, diesmal für Bengalisch. Das Skript durchläuft automatisch alle 42 Zielsprachen. Am Ende hat mein Computer 42 übersetzte JSON-Dateien. Ein weiteres Python-Skript bettet dann jede Übersetzung in eine HTML-Vorlage ein und generiert in weniger als einer Sekunde 42 HTML-Dateien. Alle Dateien werden auf den Server hochgeladen, auf dem dieser Blog gehostet wird, und jede Sprachversion wird in ein eigenes Verzeichnis gestellt. Schließlich aktualisiert ein serverseitiges Python-Skript den Artikelindex und die „Nächster Beitrag“-Links, sodass die Navigation in jeder Sprache konsistent bleibt. Mit dem ursprünglichen englischen Artikel in einfachem Text dauert der gesamte Prozess in der Regel 5 Minuten oder weniger. Wenn ich Änderungen vornehmen muss, aktualisiere ich mehrere HTML-Dateien gleichzeitig mit serverseitigen Python-Skripten.

Was ist eine API

Falls Sie mit technischen Begriffen nicht vertraut sind, fragen Sie sich vielleicht, wie mein Computer überhaupt mit dem Server von OpenAI 'kommuniziert'. Die Antwort ist etwas, das API, Application Programming Interface, genannt wird. Man kann sich eine API wie ein Nachrichtenfenster zwischen zwei Programmen vorstellen: Ein Programm sendet eine Anfrage, und das andere sendet eine Antwort zurück. Zum Beispiel sendet mein Python-Skript eine Nachricht wie: "Bitte übersetze diesen Artikel ins Deutsche." OpenAI erhält diese Nachricht über die API, bereitet die Übersetzung vor und sendet das Ergebnis zurück. Es funktioniert wie eine Bestellung im Restaurant: Sie sagen dem Kellner, was Sie möchten, die Küche bereitet es zu, und der Kellner bringt es Ihnen an den Tisch. Und warum braucht man überhaupt einen Kellner? Weil man nicht in die Küche geht oder direkt mit dem Koch spricht – man weiß nicht, wie die Küche funktioniert, und muss es auch nicht. Sie könnten dem Kellner sagen: "Kann ich einen Cheeseburger haben?", und der Kellner könnte rufen: "Bestellung fertig! T21, Chihuahua!" in einem völlig anderen Format. Eine API spielt die gleiche Rolle. Sie verbindet zwei verschiedene Systeme, ohne dass sie die interne Sprache oder Arbeitsweise des anderen verstehen müssen.

Warum brauche ich die OpenAI API

Nachdem wir jetzt wissen, was eine API ist, hier der Grund, warum ich sie für diesen Blog tatsächlich nutze. Praktisch gesprochen, ich weiß, wie ich selbst mit ChatGPT kommunizieren kann – aber ich habe 42 Sprachen zu verarbeiten. Einen Kellner 42 Mal zu rufen, wäre mühsam (das Programm überspringt die Übersetzung von Englisch in Englisch, konvertiert den Text aber trotzdem in JSON). Die Verwendung der OpenAI API ermöglicht es, dass mein Python-Skript all diese Anfragen automatisch sendet und mir so die sich wiederholende Arbeit erspart, sodass ich mich auf andere Dinge konzentrieren kann. Da ich ein Einzelentwickler bin, muss ich meine Zeit so effizient wie möglich nutzen. Immer wenn ich eine Aufgabe sehe, die sich wiederholt und klare Regeln hat, automatisiere ich sie. Das Ergebnis ist normalerweise ein Prozess, der millionenfach schneller und völlig fehlerfrei ist. Deshalb ist die Automatisierung über die API unerlässlich – sie ermöglicht es meinem Skript, alle 42 "Bestellungen" sofort und zuverlässig aufzugeben.

Warum 42 Sprachen

Technisch gesehen könnte ich viele weitere Sprachen hinzufügen; es würde nur ein paar Minuten länger dauern, während ich den Abwasch mache. Aber ich mag persönlich die Zahl 42, die "Antwort auf die ultimative Frage nach dem Leben, dem Universum und dem ganzen Rest" aus dem Buch von Douglas Adams. Abgesehen von meiner Vorliebe für die Zahl 42 kann das Hinzufügen sehr kleiner Sprachen riskant sein, weil die KI-Übersetzung für Sprachen mit begrenzten Trainingsdaten weniger zuverlässig werden kann.

Temperatur von ChatGPT 4o

Als ich zum ersten Mal mit diesem mehrsprachigen Übersetzungsansatz experimentierte, waren die Ergebnisse anständig, aber nicht perfekt. Einige Sätze wurden falsch übersetzt, zu wörtlich oder in bestimmten Sprachen subtil irreführend. Ich war auch besorgt, unbeabsichtigt Ausdrücke zu erzeugen, die in bestimmten kulturellen Kontexten unangemessen oder unsensibel sein könnten. Und natürlich wollte ich nicht, dass meine Übersetzungen sich mechanisch anhören. Einer der Schlüsselfaktoren für die Übersetzungsqualität ist die Temperatureinstellung – ein Parameter, der steuert, wie "kreativ" oder "streng" die KI sein soll. Eine hohe Temperatur macht die KI fantasievoller, aber auch unvorhersehbarer. Eine niedrige Temperatur lässt sie nah am ursprünglichen Sinn bleiben, kann aber manchmal starr wirken. Es brauchte viele Versuche, um das richtige Gleichgewicht zu finden: niedrig genug, um Genauigkeit zu gewährleisten, aber nicht so niedrig, dass der Text leblos wird. Nach vielen Experimenten fand ich, dass eine Temperatur von 0,8 am besten zu den Bedürfnissen dieses Blogs passt: genau genug, um dem englischen Original treu zu bleiben, aber flexibel genug, um in anderen Sprachen natürlich zu klingen.

ChatGPT 5.x unterstützt keine Temperatur

Neuere Modelle wie ChatGPT 5 und 5.1 unterstützen überhaupt keine Temperatureinstellungen mehr – der Parameter wurde entfernt und durch Konzepte wie Logik und Aufwand ersetzt, die beeinflussen, wie das Modell denkt, anstatt wie "kreativ" es wird. Mit anderen Worten, ChatGPT 4o gab mir einen physischen Regler, mit dem ich den Übersetzungsstil feinjustieren konnte, aber die 5.x-Familie folgt einer völlig anderen Philosophie. Wenn Sie das neueste Modell beiläufig bitten, "übersetze dies mit Temperatur = 0,8", könnte es versuchen, sich so zu verhalten, als ob eine solche Einstellung noch existiert, aber intern ist der Parameter verschwunden. Das Modell approximiert einfach die Absicht. Während OpenAI ihre Modelle weiter aktualisiert, werde ich möglicherweise eines Tages meine Übersetzungspipeline anpassen. Vorerst bleibt ChatGPT 4o meine Wahl für mehrsprachige Übersetzungen – nicht nur, weil es den Kontext in vielen Sprachen gut versteht, sondern auch, weil sein API-Preis für einen Einzelentwickler wie mich angemessen ist. Tatsächlich könnte 4o als eines der beliebtesten Modelle in die Geschichte von OpenAI eingehen.

Arbeiter der OpenAI API

Eine erstaunliche Sache an der OpenAI API – im Vergleich zur direkten Nutzung von ChatGPT im Browser – ist, dass Sie mehr als einen ChatGPT "Arbeiter" gleichzeitig nutzen können. Wenn ich Übersetzungsanfragen für 42 Sprachen sende, schicke ich sie nicht nacheinander in einer langsamen Reihe. Stattdessen kann die API viele Anfragen parallel verarbeiten, als hätte ich plötzlich einen Raum voller Übersetzer eingestellt, die alle gleichzeitig zu arbeiten beginnen. Mein Python-Skript behandelt den Arbeitsablauf wie eine kleine Produktionslinie: Es bereitet den englischen Artikel vor, sendet die Anfragen, wartet auf die Antworten und verarbeitet die Ergebnisse in JSON-Dateien. In der Zwischenzeit führen die OpenAI-Server mehrere Modellinstanzen gleichzeitig aus, wobei jede eine andere Sprache parallel übersetzt. Das ist etwas, was die ChatGPT-Website oder App nicht kann – diese Schnittstellen bieten Ihnen ein Modell, eine Konversation, eine Aufgabe auf einmal. Aber mit der API können Sie Ihre Arbeitslast so breit skalieren, wie es Ihr Skript erlaubt. Für einen Einzelentwickler wie mich fühlt sich das an, als hätte ich ein winziges Team der klügsten und ego-freien Assistenten. Es hängt teilweise von der Internetgeschwindigkeit ab, aber ich setze normalerweise workers = 12.

Wie ich meinen Blog mehrsprachig mache, indem ich den Abwasch mache

Früher habe ich während meines Mathematikstudiums an der Kyoto-Universität als Tellerwäscher in der Mensa gearbeitet. Obwohl ich etwa 5 USD pro Stunde verdiente, hat mir manuelle, sich wiederholende Arbeit immer gefallen, nachdem ich mehrere Stunden – oder manchmal mehrere Tage – in tiefer intellektueller Konzentration verbracht hatte. Später, als ich in einer Knoblauchfabrik in Hokkaido arbeitete, bestand meine Aufgabe einfach darin, Tausende von weißen Knoblauchknollen zu polieren, damit sie auf dem Förderband heller aussehen. Acht Stunden am Tag – voller Fokus, gleichmäßiger Rhythmus. Es war seltsam befriedigend. Jetzt, zurück aus diesen Erinnerungen, mache ich derzeit intellektuelle Arbeit – schreibe Software, entwerfe Systeme, verfasse diese Artikel. Aber das Gleichgewicht hat sich nicht geändert. Wenn Sie mich fragen, wie ich es schaffe, einen Blogartikel in 42 Sprachen selbst zu veröffentlichen, lautet die ehrliche Antwort: Ich mache es, indem ich den Abwasch mache.