Ang website na ito ay awtomatikong isinalin sa iba’t ibang wika gamit ang software na binuo ni Kohei Koyanagi. Para sa mas eksaktong impormasyon, tingnan ang orihinal sa Ingles .

Paano Isinasalin ang Blog na Ito sa 42 Wika

May 42 Wika ang Splync Blog

Ito ang ika-23 na artikulo sa aking blog para sa Splync, isang shared budget tracker para sa magkasintahan, kaibigan, at pamilya. Maaring nagtatanong ka kung paano ko nailalathala ang bawat post sa 42 wika kahit solo engineer lang ako. Ayon sa disclaimer sa itaas ng bawat artikulo, awtomatikong isinasalin ang website na ito sa iba't ibang wika gamit ang software na ako mismo ang gumawa. Upang maging malinaw: Hindi ko mano-manong sinusulat kahit isang pangungusap sa anumang wika maliban sa Ingles. Dahil dito, hinihiling ko sa mga mambabasa na tingnan ang orihinal na bersyon sa Ingles kapag napakahalaga ng katumpakan ng kahulugan. Gayunpaman, pagkatapos ng maraming pagsubok at pagkakamali sa pagpapabuti ng translation pipeline, naniniwala ako na ang kabuuang kalidad ng pagsasalin ay sapat na maganda. Sa artikulong ito, ibabahagi ko kung paano ginagawa ng aking software na multilingual ang Splync blog.

Sabay na Ginagawa ng Python at OpenAI API

Nagsisimula ako sa pamamagitan ng pagsusulat sa bawat artikulo sa plain na Ingles, kasama ang metadata na may kinalaman sa SEO. Pagkatapos nito, ipinapadala ng aking Python script ang Ingles na teksto sa OpenAI API, kasama ang isang prompt at maliit na reference file. Sa mga server ng OpenAI, binabasa ng ChatGPT-4o ang request at ibinabalik ang isinaling artikulo — halimbawa, ang bersyong Arabic — sa format na JSON. Kapag natanggap na ng aking MacBook ang pagsasaling iyon, agad na nagpapadala ang script ng isa pang request, sa pagkakataong ito para sa Bengali. Awtomatikong inuulit ng script ang proseso sa lahat ng 42 target na wika. Sa dulo ng proseso, mayroon na ang aking computer ng 42 isinaling JSON files. Ang isa pang Python script ay nagpapaloob ng bawat pagsasalin sa isang HTML template at bumubuo ng 42 HTML files sa loob ng wala pang isang segundo. Ang lahat ng files ay ina-upload sa server kung saan naka-host ang blog na ito, at ang bawat bersyon ng wika ay inilalagay sa sariling directory. Sa huli, ina-update ng isang server-side na Python script ang index ng artikulo at ang mga link na “Next post” upang manatiling consistent ang bawat wika sa pag-navigate. Sa orihinal na Ingles na artikulong nakasulat sa plain text, karaniwang inaabot ng 5 minuto o mas mababa pa ang buong proseso. Kapag kailangan kong gumawa ng pagbabago, sabay-sabay kong ina-update ang maramihang HTML files gamit ang server-side na mga Python script.

Ano ang API

Kung hindi mo pamilyar ang mga teknikal na termino, maaring nagtataka ka kung paano “nakikipag-usap” ang aking computer sa server ng OpenAI sa unang pagkakataon. Ang sagot ay isang bagay na tinatawag na API, Application Programming Interface. Maari mong isipin ang API bilang isang bintana ng mensahero sa pagitan ng dalawang programa: ang isang programa ay nagpapadala ng request, at ang isa pa ay nagbibigay ng tugon. Halimbawa, ang aking Python script ay nagpapadala ng mensahe tulad ng, “Paki-translate ang artikulong ito sa German.” Tinatanggap ng OpenAI ang mensaheng iyon sa pamamagitan ng API, inihahanda ang pagsasalin, at ibinabalik ang resulta. Para itong pag-oorder sa isang restaurant: sinasabi mo sa waiter ang gusto mo, inihahanda ng kusina ito, at ibinabalik ito ng waiter sa iyong mesa. At bakit kailangan mo ng waiter sa unang pagkakataon? Dahil hindi ka pumapasok sa kusina o nakikipag-usap direkta sa chef — hindi mo alam kung paano gumagana ang kusina, at hindi mo kailangan. Maaring sabihin mo, “Pwede bang makakuha ng cheeseburger?” sa waiter, at maaring sigaw ng waiter, “Order up! T21, Chihuahua!” sa isang ganap na naiibang formato. Ang API ay gumaganap ng parehong papel. Ikonekta nito ang dalawang magkaibang sistema nang hindi kinakailangan silang maintindihan ang isa't isa ng mga panloob na wika o daloy ng trabaho.

Bakit Kailangan Ko ang OpenAI API

Ngayon na nakita natin kung ano ang API, narito kung bakit talaga ako umaasa rito para sa blog na ito. Praktikal na nagsasalita, alam ko kung paano “magsalita” sa ChatGPT nang mag-isa — ngunit may 42 wika akong kailangang iproseso. Ang pagtawag sa waiter ng 42 beses ay magiging masalimuot (ang programa ay hindi na isinasalin ang Ingles sa Ingles, ngunit binabago pa rin ang teksto sa JSON). Ang paggamit ng OpenAI API ay nagpapahintulot sa aking Python script na awtomatikong magpadala ng lahat ng mga request, ini-save ako mula sa paulit-ulit na gawain kaya maaari kong ituon ang pansin sa ibang bagay. Solo developer ako, kaya kailangan kong gamitin ang oras ko nang pinakamabisa hangga't maaari. Sa tuwing makakakita ako ng gawain na paulit-ulit at may malinaw na patakaran, ina-automate ko ito. Ang resulta ay karaniwang isang proseso na isang milyon na beses na mas mabilis at ganap na walang pagkakamali. Kaya't ang automation sa pamamagitan ng API ay mahalaga — pinapayagan nito ang aking script na maglagay ng lahat ng 42 “order” agad-agad at maaasahan.

Bakit 42 Wika

Teknikal na nagsasalita, maaari akong magdagdag ng mas maraming wika; tatagal lang ito ng ilang minuto habang naghuhugas ako ng pinggan. Pero personal kong gusto ang numero 42, ang "Sagot sa Ultimate Question of Life, the Universe, and Everything" mula sa libro ni Douglas Adams. Bukod sa pagkaka-attach ko sa numero 42, ang pagdaragdag ng masyadong maliit na wika ay maaaring maging mapanganib, dahil ang AI translation ay maaaring hindi gaanong maaasahan para sa mga wika na may limitadong training data.

Temperatura ng ChatGPT 4o

Noong una akong nag-eksperimento sa multilingual na paraan ng pagsasalin, ang mga resulta ay maayos ngunit hindi perpekto. Ang ilang mga pangungusap ay maling naisalin, masyadong literal, o bahagyang nakaliligaw sa ilang wika. Nag-aalala rin ako tungkol sa hindi sinasadyang pagbuo ng mga ekspresyon na maaaring hindi angkop o sensitibo sa tiyak na mga konteksto ng kultura. At siyempre, ayaw kong magmukhang robotic o mechanical ang aking mga pagsasalin. Isa sa mga pangunahing salik sa likod ng kalidad ng pagsasalin ay ang temperature setting — isang parameter na kumokontrol sa kung gaano ka “malikhain” o “mahigpit” ang AI. Ang mataas na temperatura ay nagpapalikhain sa AI, ngunit nagiging hindi mahulaan. Ang mababang temperatura ay pinananatiling malapit sa orihinal na kahulugan, ngunit minsan ay maaaring maramdaman na matigas. Inabot ng maraming pagsubok at pagkakamali upang mahanap ang tamang balanse: sapat na mababa upang matiyak ang katumpakan, ngunit hindi sobrang baba na naging lifeless ang teksto. Matapos ang maraming eksperimento, naramdaman kong ang temperatura = 0.8 ang pinakamahusay na angkop para sa mga pangangailangan ng blog na ito: sapat na tumpak upang manatiling tapat sa orihinal na Ingles, ngunit sapat na flexible upang magmukhang natural sa ibang mga wika.

Ang ChatGPT 5.x ay Hindi Sumusuporta sa Temperatura

Ang mga mas bagong modelo tulad ng ChatGPT 5 at 5.1 ay hindi na sumusuporta sa temperatura settings — tinanggal na ang parameter at pinalitan ng mga konsepto tulad ng reasoning at effort, na nakakaapekto sa kung paano nag-iisip ang modelo sa halip na kung gaano ito “malikhain.” Sa madaling salita, ang ChatGPT 4o ay nagbigay sa akin ng pisikal na dial na maaari kong i-turn para i-fine-tune ang istilo ng pagsasalin, ngunit ang pamilya ng 5.x ay sumusunod sa ibang pilosopiya. Kung casual mong tanungin ang pinakabagong modelo na “isalin ito gamit ang temperatura = 0.8,” maaring subukan nitong kumilos na parang may ganoong setting pa rin, ngunit sa loob, wala na ang parameter. Ang modelo ay simpleng tinatantya ang hangarin. Habang patuloy na ina-update ng OpenAI ang kanilang mga modelo, maaring i-adjust ko ang aking translation pipeline balang araw. Sa ngayon, nananatiling aking pagpili ang ChatGPT 4o para sa mga multilingual na pagsasalin — hindi lamang dahil mahusay itong nakakaunawa ng konteksto sa maraming wika, kundi pati na rin dahil ang API pricing nito ay makatwiran para sa isang solo developer tulad ko. Sa katunayan, ang 4o ay maaaring maging isa sa mga pinaka-minamahal na modelo sa kasaysayan ng OpenAI.

Mga Manggagawa ng OpenAI API

Isa sa mga kamangha-manghang bagay tungkol sa OpenAI API — kumpara sa paggamit ng ChatGPT direkta sa isang browser — ay maaari mong gamitin ang higit sa isang ChatGPT “worker” nang sabay-sabay. Kapag nagpapadala ako ng mga kahilingan sa pagsasalin para sa 42 wika, hindi ko ipinapadala ang mga ito nang paisa-isa sa isang mabagal na linya. Sa halip, ang API ay kayang iproseso ang maraming kahilingan nang sabay-sabay, para bang bigla akong kumuha ng isang silid ng mga tagapagsalin na sabay-sabay na nagtatrabaho. Hinahawakan ng aking Python script ang workflow na parang isang maliit na production line: inihahanda nito ang Ingles na artikulo, ipinapadala ang mga kahilingan, hinihintay ang mga tugon, at pinoproseso ang mga resulta sa mga JSON file. Samantala, ang mga server ng OpenAI ay nagpapatakbo ng maraming model instances sabay-sabay, bawat isa ay isinasalin sa ibang wika nang parallel. Ito ay isang bagay na hindi kayang gawin ng ChatGPT website o app — ang mga interfase na iyon ay nagbibigay sa iyo ng isang modelo, isang pag-uusap, isang gawain sa bawat pagkakataon. Ngunit sa API, maaari mong i-scale ang iyong workload kung gaano kalawak ang pinapayagan ng iyong script. Para sa isang solo developer tulad ko, ito ay parang pagkakaroon ng isang maliit na koponan ng pinakamatalino at walang egong asistente. Nakadepende ito bahagya sa bilis ng internet, ngunit karaniwan kong isina-set ang workers = 12.

Ang Ginagawa Ko para gawing Multilingual ang Blog ay Paghuhugas ng Pinggan

Dati akong nagtrabaho bilang dishwasher sa student cafeteria noong nag-aaral ako ng matematika sa Kyoto University. Habang ang bayad ay mga 5 USD kada oras, palagi kong nagugustuhan ang paulit-ulit na manual na trabaho pagkatapos ng ilang oras — o kung minsan ilang araw — sa malalim na intelektwal na konsentrasyon. Nang maglaon, nang nagtrabaho ako sa isang garlic factory sa Hokkaido, ang trabaho ko ay simpleng pagpakintab ng libu-libong puting bawang upang magmukhang mas maliwanag sa conveyor belt. Walong oras sa isang araw — buong pokus, palagiang ritmo. Ito ay kakaibang kasiya-siya. Ngayon, mula sa mga alaala na iyon, kasalukuyan akong gumagawa ng intelektwal na trabaho — pagsusulat ng software, pagdidisenyo ng mga sistema, paglikha ng mga artikulong ito. Ngunit hindi nagbago ang balanse. Kung tatanungin mo kung paano ko namamahala na maglathala ng blog article sa 42 wika mag-isa, ang tapat na sagot ay: ginagawa ko ito sa pamamagitan ng paghuhugas ng pinggan.