Táto stránka je automaticky prekladaná do viacerých jazykov pomocou softvéru od Kohei Koyanagi. Pre čo najväčšiu presnosť si pozrite originál v angličtine .

Ako je tento blog preložený do 42 jazykov

Splync blog má 42 jazykov

Toto je 23. článok na mojom blogu pre Splync, zdieľaný rozpočtový nástroj pre páry, priateľov a rodiny. Možno vás zaujíma, ako publikujem každý príspevok v 42 jazykoch, aj keď som samostatný vývojár. Ako sa uvádza v upozornení na začiatku každého článku, táto webová stránka je automaticky prekladaná do viacerých jazykov pomocou softvéru, ktorý som sám vyvinul. Aby to bolo jasné: v žiadnom inom jazyku ako angličtine nepisujem ani jednu vetu manuálne. Preto čitateľov prosím, aby sa v prípade potreby presnosti významu obrátili na pôvodnú anglickú verziu. Napriek tomu, po mnohých pokusoch a omyloch pri zlepšovaní prekladového procesu, verím, že celková kvalita prekladu je pomerne dobrá. V tomto článku sa podelím o to, čo môj softvér robí, aby sa blog Splync stal viacjazyčným.

Python a OpenAI API to robia spolu

Vždy začínam písaním každého článku v jednoduchej angličtine, vrátane metadát súvisiacich so SEO. Potom môj Python skript pošle anglický text na OpenAI API spolu s promptom a malým referenčným súborom. Na serveroch OpenAI ChatGPT-4o spracuje požiadavku a vráti preložený článok — napríklad do arabčiny — vo formáte JSON. Keď môj MacBook prijme tento preklad, skript okamžite pošle ďalšiu požiadavku, tentoraz na bengálčinu. Skript automaticky prechádza všetkými 42 cieľovými jazykmi. Na konci procesu má môj počítač 42 preložených JSON súborov. Ďalší Python skript potom vloží každý preklad do HTML šablóny a vygeneruje 42 HTML súborov za menej ako sekundu. Všetky súbory sú nahrané na server, kde je tento blog hostovaný, a každá jazyková verzia je umiestnená do vlastného adresára. Nakoniec serverový Python skript aktualizuje index článkov a odkazy „Nasledujúci príspevok“, aby navigácia v každom jazyku zostala konzistentná. S pôvodným anglickým článkom napísaným v jednoduchej texte celý proces zvyčajne trvá 5 minút alebo menej. Keď potrebujem urobiť zmeny, zároveň aktualizujem viacero HTML súborov pomocou serverových Python skriptov.

Čo je API

Ak nie ste oboznámení s technickými pojmami, možno sa pýtate, ako môj počítač vôbec „komunikuje“ so serverom OpenAI. Odpoveďou je niečo, čo sa nazýva API, rozhranie pre programovanie aplikácií. Môžete si predstaviť API ako okienko pre posla medzi dvoma programami: jeden program pošle požiadavku a druhý vráti odpoveď. Napríklad môj Python skript pošle správu, ako je „Prosím, preložte tento článok do nemčiny“. OpenAI prijme túto správu cez API, pripraví preklad a pošle výsledok späť. Funguje to rovnako ako objednávanie v reštaurácii: poviete čašníkovi, čo chcete, kuchyňa to pripraví a čašník to prinesie späť k vášmu stolu. A prečo vôbec potrebujete čašníka? Pretože nevstupujete do kuchyne ani nehovoríte priamo s kuchárom — neviete, ako kuchyňa funguje, a ani to nepotrebujete. Môžete povedať čašníkovi: „Môžem si dať cheeseburger?“ a čašník môže zakričať: „Objednávka! T21, Chihuahua!“ v úplne inom formáte. API hrá rovnakú úlohu. Spojuje dva rôzne systémy bez toho, aby sa museli navzájom chápať vnútorný jazyk alebo pracovný postup.

Prečo potrebujem OpenAI API

Teraz, keď vieme, čo je API, tu je dôvod, prečo sa naň v skutočnosti spolieham pre tento blog. Prakticky povedané, viem, ako „komunikovať“ s ChatGPT sám — ale mám na spracovanie 42 jazykov. Volanie čašníka 42-krát by bolo únavné (program preskočí preklad angličtiny do angličtiny, ale stále prevádza text do JSON). Použitie OpenAI API umožňuje môjmu Python skriptu poslať všetky tieto požiadavky automaticky, čím sa ušetrím od opakujúcej sa práce a môžem sa sústrediť na iné veci. Som samostatný vývojár, takže musím využiť svoj čas čo najefektívnejšie. Kedykoľvek vidím úlohu, ktorá je opakujúca sa a má jasné pravidlá, automatizujem ju. Výsledkom je zvyčajne proces, ktorý je miliónkrát rýchlejší a úplne bez chýb. Preto je automatizácia cez API kľúčová — umožňuje môjmu skriptu umiestniť všetkých 42 „objednávok“ okamžite a spoľahlivo.

Prečo 42 jazykov

Technicky by som mohol pridať oveľa viac jazykov; bolo by to jednoducho trvalo o niekoľko minút dlhšie, kým by som umýval riady. Ale mne osobne sa páči číslo 42, „Odpoveď na konečnú otázku života, vesmíru a všetkého“ z knihy Douglasa Adamsa. Okrem mojej náklonnosti k číslu 42 môže pridanie veľmi malých jazykov byť rizikové, pretože AI preklad môže byť menej spoľahlivý pre jazyky s obmedzenými tréningovými údajmi.

Teplota ChatGPT 4o

Keď som prvýkrát experimentoval s touto viacjazyčnou prekladovou metódou, výsledky boli slušné, ale nie dokonalé. Niektoré vety boli preložené nesprávne, príliš doslovne alebo v určitých jazykoch jemne zavádzajúce. Tiež som sa obával, že neúmyselne vytvorím výrazy, ktoré môžu byť v konkrétnych kultúrnych kontextoch nevhodné alebo citlivé. A samozrejme som nechcel, aby moje preklady znieľi roboticky alebo mechanicky. Jeden z kľúčových faktorov kvality prekladu je nastavenie teploty — parameter, ktorý riadi, ako „kreatívna“ alebo „prísna“ by mala byť AI. Vysoká teplota robí AI viac nápaditou, ale aj nepredvídateľnou. Nízka teplota udržiava blízkosť k pôvodnému významu, ale môže niekedy pôsobiť rigidne. Trvalo to veľa pokusov a omylov, kým som našiel správnu rovnováhu: dostatočne nízku na zabezpečenie presnosti, ale nie tak nízku, že by text stratil život. Po mnohých experimentoch som cítil, že teplota = 0,8 najlepšie vyhovuje potrebám tohto blogu: dostatočne presná, aby zostala verná anglickému originálu, ale flexibilná, aby znela prirodzene v iných jazykoch.

ChatGPT 5.x nepodporuje teplotu

Novšie modely ako ChatGPT 5 a 5.1 už vôbec nepodporujú nastavenie teploty — parameter bol odstránený a nahradený konceptmi ako rozumovanie a úsilie, ktoré ovplyvňujú, ako model premýšľa, skôr než ako „kreatívne“ sa stáva. Inými slovami, ChatGPT 4o mi poskytoval fyzický ovládací prvok, ktorý som mohol otáčať na jemné doladenie štýlu prekladu, ale rodina 5.x sa riadi úplne inou filozofiou. Ak náhodne požiadate najnovší model „preložiť toto s teplotou = 0,8“, môže sa snažiť správať, akoby také nastavenie ešte existovalo, ale vnútorne je parameter preč. Model jednoducho približuje zámer. Ako OpenAI naďalej aktualizuje svoje modely, možno niekedy upravím svoj prekladový proces. Momentálne je však ChatGPT 4o mojím výberom pre viacjazyčné preklady — nielen preto, že dobre rozumie kontextu v mnohých jazykoch, ale aj preto, že jeho API ceny sú pre samostatného vývojára ako ja rozumné. V skutočnosti sa 4o môže zapísať ako jeden z najobľúbenejších modelov v histórii OpenAI.

Pracovníci OpenAI API

Jedným úžasným aspektom OpenAI API — v porovnaní s používaním ChatGPT priamo v prehliadači — je, že môžete použiť viac ako jedného „pracovníka“ ChatGPT naraz. Keď posielam požiadavky na preklad do 42 jazykov, neposielam ich postupne. API dokáže spracovať mnohé požiadavky súčasne, akoby som zrazu najal miestnosť plnú prekladateľov, ktorí všetci začnú pracovať naraz. Môj Python skript riadi pracovný postup ako malú výrobnú linku: pripraví anglický článok, pošle požiadavky, čaká na odpovede a spracuje výsledky do JSON súborov. Medzitým servery OpenAI spúšťajú viacero modelových inštancií súčasne, pričom každá prekladá iný jazyk paralelne. Toto webové rozhranie alebo aplikácia ChatGPT urobiť nedokáže — poskytuje vám jeden model, jednu konverzáciu, jednu úlohu naraz. Ale s API môžete rozšíriť svoju pracovnú záťaž tak široko, ako váš skript umožňuje. Pre samostatného vývojára ako som ja to pôsobí ako mať malý tím najinteligentnejších a bezegoistických asistentov. Závisí to čiastočne na rýchlosti internetu, ale zvyčajne nastavujem pracovníkov = 12.

Čo robím, aby som viacjazyčnil svoj blog, je umývanie riadov

Keď som študoval matematiku na Kjótskej univerzite, pracoval som ako umývač riadov v študentskej jedálni. Aj keď plat bol asi 5 USD za hodinu, vždy som mal rád opakujúcu sa manuálnu prácu po tom, čo som strávil niekoľko hodín — alebo niekedy aj dní — v hlbokej intelektuálnej koncentrácii. Neskôr, keď som pracoval v cesnakovej továrni na Hokkaide, moja práca spočívala len v leštení tisícov bielych cesnakových hlavičiek, aby na dopravnom páse vyzerali jasnejšie. Osem hodín denne — plná sústredenosť, stály rytmus. Bolo to zvláštne uspokojujúce. Teraz, späť od týchto spomienok, aktuálne vykonávam intelektuálnu prácu — písanie softvéru, navrhovanie systémov, komponovanie týchto článkov. Ale rovnováha sa nezmenila. Ak sa ma spýtate, ako dokážem sám publikovať blogový článok v 42 jazykoch, úprimná odpoveď je: robím to tým, že umývam riady.