Ezt a webhelyet Kohei Koyanagi által fejlesztett szoftver fordítja automatikusan több nyelvre. A legpontosabb információért lásd az eredetit angol nyelven.

Hogyan fordítják le ezt a blogot 42 nyelvre

A Splync blognak 42 nyelve van

Ez a 23. cikk a Splync blogomon, amely egy megosztott költségkövető párok, barátok és családok számára. Lehet, hogy kíváncsi vagy, hogyan tudok minden bejegyzést 42 nyelven megjelentetni, miközben egyedül dolgozom mérnökként. Ahogy a cikkek elején található nyilatkozat is mondja, ez a weboldal automatikusan több nyelvre van lefordítva egy saját fejlesztésű szoftver segítségével. Hogy tiszta legyen: egyetlen mondatot sem írok manuálisan más nyelven, mint angolul. Emiatt kérném az olvasókat, hogy a jelentés pontossága érdekében mindig az eredeti angol verziót vegyék alapul. Ennek ellenére, sok próbálkozás és hibajavítás után a fordítási folyamatban úgy érzem, a fordítási minőség elég jó. Ebben a cikkben megosztom, hogyan teszi a szoftverem a Splync blogot többnyelvűvé.

Python és OpenAI API együtt dolgoznak

Mindig angolul írom meg a cikkeket, beleértve a SEO-val kapcsolatos adatokat is. Ezután a Python szkriptem elküldi az angol szöveget az OpenAI API-nak, egy kérdéssel és egy kis hivatkozási fájllal együtt. Az OpenAI szerverein a ChatGPT-4o feldolgozza a kérést és visszaküldi a lefordított cikket — például az arab verziót — JSON formátumban. Amint a MacBook-om megkapja a fordítást, a szkript azonnal elküldi a következő kérést, ezúttal bengáli nyelven. A szkript automatikusan átfut mind a 42 célnyelven. A folyamat végére a számítógépemnek 42 lefordított JSON fájlja van. Egy másik Python szkript beágyazza minden fordítást egy HTML sablonba és kevesebb mint egy másodperc alatt létrehoz 42 HTML fájlt. Az összes fájlt feltöltöm a szerverre, ahol a blogom található, és minden nyelvi verzió saját könyvtárba kerül. Végül egy szerveroldali Python szkript frissíti a cikkindexet és a "Következő bejegyzés" linkeket, hogy minden nyelv navigációja következetes maradjon. Az eredeti angol cikk sima szövegként van megírva, az egész folyamat általában 5 percet vagy kevesebbet vesz igénybe. Ha változtatni kell, egyszerre frissítek több HTML fájlt szerveroldali Python szkriptek segítségével.

Mi az az API

Ha nem vagy jártas a technikai kifejezésekben, talán kíváncsi vagy, hogyan "beszél" a számítógépem az OpenAI szerverével. A válasz az API, azaz az Alkalmazásprogramozási felület. Egy API olyan, mint egy üzenőablak két program között: az egyik program kér egy választ, a másik válaszol. Például a Python szkriptem küld egy üzenetet, például: "Kérlek, fordítsd le ezt a cikket németre." Az OpenAI megkapja ezt az üzenetet az API-n keresztül, elkészíti a fordítást és visszaküldi az eredményt. Ez olyan, mint egy rendelés leadása egy étteremben: megmondod a pincérnek, mit szeretnél, a konyha elkészíti, és a pincér visszahozza az asztalodhoz. És miért van szükséged pincérre? Mert nem sétálsz be a konyhába, és nem beszélsz közvetlenül a szakáccsal — nem tudod, hogyan működik a konyha, és nincs is rá szükséged. Lehet, hogy azt mondod a pincérnek: "Kérhetek egy sajtburgert?", és a pincér azt kiáltja: "Rendelés kész! T21, Chihuahua!" egy teljesen más formátumban. Az API ugyanilyen szerepet játszik. Két különböző rendszert köt össze anélkül, hogy megkövetelné, hogy megértsék egymás belső nyelvét vagy munkafolyamatát.

Miért van szükségem az OpenAI API-ra

Most, hogy láttuk, mi az az API, itt van, miért támaszkodom rá valójában a blogomhoz. Gyakorlatilag tudok "beszélni" a ChatGPT-vel magam is — de 42 nyelvet kell feldolgoznom. 42-szer hívni egy pincért fárasztó lenne (a program kihagyja az angol fordítást angolra, de a szöveget így is JSON formátumba konvertálja). Az OpenAI API használatával a Python szkriptem automatikusan elküldi az összes kérést, így megkímél a monoton munkától, és más dolgokra koncentrálhatok. Egyedüli fejlesztő vagyok, ezért minél hatékonyabban kell használnom az időmet. Amikor látom, hogy egy feladat ismétlődő és világos szabályai vannak, automatizálom. Az eredmény általában egy folyamat, ami milliószor gyorsabb és teljesen hibátlan. Ezért lényeges az automatizálás az API-n keresztül — lehetővé teszi, hogy a szkriptem az összes 42 "rendelést" azonnal és megbízhatóan leadja.

Miért 42 nyelv

Technikailag sokkal több nyelvet is hozzáadhatnék; csak néhány percet venne igénybe, amíg mosogatok. De személyesen szeretem a 42-es számot, az "Élet, a Világmindenség meg Minden" kérdésére adott választ Douglas Adams könyvéből. A 42-es számhoz való kötődésem mellett a nagyon kisebb nyelvek hozzáadása kockázatos lehet, mert az AI-fordítás kevésbé megbízható lehet a korlátozott tanulási adatokkal rendelkező nyelvek esetében.

A ChatGPT 4o hőmérséklete

Amikor először kísérleteztem ezzel a többnyelvű fordítási módszerrel, az eredmények jók voltak, de nem tökéletesek. Néhány mondat félrefordítódott, túlságosan szó szerinti volt, vagy finoman félrevezető bizonyos nyelveken. Aggódtam amiatt is, hogy esetleg véletlenül nem helyénvaló vagy érzéketlen kifejezéseket generálok bizonyos kulturális kontextusokban. És persze nem akartam, hogy a fordítások robotikusak vagy mechanikusak legyenek. A fordítási minőség egyik kulcsfontosságú tényezője a hőmérséklet beállítása — egy paraméter, amely irányítja, hogy az AI mennyire legyen "kreatív" vagy "szigorú". A magas hőmérséklet kreatívabbá teszi az AI-t, de kiszámíthatatlanabbá is. Az alacsony hőmérséklet közelebb tartja az eredeti jelentéshez, de néha merevnek érezhető. Sok próbálkozás és hiba után megtaláltam az egyensúlyt: elég alacsony ahhoz, hogy pontos legyen, de nem annyira, hogy a szöveg élettelenné váljon. Sok kísérlet után úgy éreztem, hogy a 0,8-as hőmérséklet a legmegfelelőbb ennek a blognak: elég pontos ahhoz, hogy hű maradjon az angol eredetihez, de elég rugalmas ahhoz, hogy természetes hangzású legyen más nyelveken.

A ChatGPT 5.x nem támogatja a hőmérsékletet

Az újabb modellek, mint például a ChatGPT 5 és 5.1, már egyáltalán nem támogatják a hőmérséklet beállításokat — a paramétert eltávolították, és olyan fogalmakkal helyettesítették, mint az érvelés és az erőfeszítés, amelyek befolyásolják, hogy a modell hogyan gondolkodik, nem pedig, hogy mennyire "kreatív" legyen. Más szavakkal, a ChatGPT 4o egy fizikai tárcsát adott nekem, amivel finomhangolhattam a fordítási stílust, de az 5.x család teljesen más filozófiát követ. Ha szimplán megkéred az újabb modellt, hogy "fordítsd le ezt 0,8-as hőmérséklettel", megpróbálhat úgy viselkedni, mintha még létezne ilyen beállítás, de belsőleg a paraméter eltűnt. A modell egyszerűen megközelíti a szándékot. Ahogy az OpenAI folyamatosan frissíti modelljeit, lehet, hogy valamikor módosítom a fordítási folyamatomat. Jelenleg a ChatGPT 4o az én választásom a többnyelvű fordításokhoz — nemcsak azért, mert jól érti a kontextust sok nyelven, hanem mert az API ára is kedvező egyedüli fejlesztőként. Valójában a 4o talán az OpenAI történetének egyik legkedveltebb modelljeként fog elhíresülni.

Az OpenAI API munkásai

Az OpenAI API egyik csodálatos tulajdonsága — összehasonlítva a ChatGPT közvetlen használatával a böngészőben — hogy egyszerre több ChatGPT "munkást" is használhatsz. Amikor fordítási kérelmeket küldök 42 nyelvre, nem egy lassú sorban küldöm őket egyenként. Ehelyett az API képes egyszerre több kérés feldolgozására, mintha hirtelen felbéreltem volna egy szobányi fordítót, akik egyszerre kezdik a munkát. A Python szkriptem úgy kezeli a munkamenetet, mint egy kis gyártósor: előkészíti az angol cikket, elküldi a kéréseket, vár a válaszokra, és a eredményeket JSON fájlokba dolgozza fel. Közben az OpenAI szerverek egyszerre több modellpéldányt futtatnak, mindegyik más nyelvet fordít párhuzamosan. Ez olyasmi, amit a ChatGPT weboldala vagy alkalmazása nem tud megtenni — azok az interfészek egy modellt, egy beszélgetést, egy feladatot adnak egyszerre. Az API-val azonban olyan szélesre bővítheted a munkaterhelést, amennyire a szkripted engedi. Egyedüli fejlesztőként ez olyan, mintha egy kis csapatnyi legokosabb és legego nélküli asszisztensem lenne. Ez részben az internethálózat sebességétől függ, de általában 12 munkást állítok be.

A többnyelvű blogom titka a mosogatás

Amikor a Kiotói Egyetemen tanultam matematikát, mosogatóként dolgoztam az egyetemi menzán. Bár az órabér körülbelül 5 USD volt, mindig is szerettem az ismétlődő kézi munkát, miután több órát — vagy néha napokat — töltöttem mély intellektuális koncentrációval. Később, amikor egy fokhagymagyárban dolgoztam Hokkaidóban, a munkám egyszerűen az volt, hogy több ezer fehér fokhagymagumót polírozzak, hogy fényesebbek legyenek a futószalagon. Nyolc óra naponta — teljes koncentráció, egyenletes ritmus. Furcsán kielégítő volt. Most, visszatérve ezekből az emlékekből, jelenleg szellemi munkát végzek — szoftvereket írok, rendszereket tervezek, cikkeket írok. De az egyensúly nem változott. Ha megkérdezed, hogyan tudok magam 42 nyelven megjelentetni egy blogcikket, az őszinte válaszom: úgy, hogy mosogatok.