இந்த இணையதளம் Kohei Koyanagi உருவாக்கிய மென்பொருளால் பல மொழிகளுக்கு தானாக மொழிபெயர்க்கப்படுகிறது. துல்லியத்திற்காக அசல் ஆங்கிலம் பதிப்பைப் பார்க்கவும்.

இந்த வலைப்பதிவு 42 மொழிகளில் எப்படி மொழிபெயர்க்கப்படுகிறது

Splync வலைப்பதிவு 42 மொழிகளில் உள்ளது

இது Splync வலைப்பதிவில் நான் எழுதும் 23வது கட்டுரை, இது தம்பதிகள், நண்பர்கள், குடும்பங்களுக்கான பகிரப்பட்ட பட்ஜெட் டிராக்கர் ஆகும். நான் தனி பொறியாளர் ஆனாலும், ஒவ்வொரு பதிவு 42 மொழிகளில் எவ்வாறு வெளியிடுகிறேன் என ஆச்சரியப்படலாம். ஒவ்வொரு கட்டுரையின் மேல் Disclaimer-இல் சொல்வதைப் போல், இந்த இணையதளம் நான் உருவாக்கிய மென்பொருள் மூலம் பல மொழிகளில் தானாகவே மொழிபெயர்க்கப்படுகிறது. தெளிவாகச் சொல்ல வேண்டுமென்றால்: ஆங்கிலத்தைத் தவிர மற்ற எந்த மொழியிலும் நான் மெல்லிய வாக்கியம்கூட உருவாக்கவில்லை. அதனால், வாசகர்கள் உண்மை அர்த்தம் மிக முக்கியம் என்பதை உணரும்போது அசல் ஆங்கில பதிப்பைப் பார்க்குமாறு பணிவுடன் கேட்டுக்கொள்கிறேன். எனினும், மொழிபெயர்ப்பு செயல்முறையை மேம்படுத்த பல முறை முயற்சித்த பிறகு, முழுமையான மொழிபெயர்ப்பு தரம் நன்று என்று நான் நம்புகிறேன். இந்தக் கட்டுரையில், Splync வலைப்பதிவை எப்படி பல மொழிகளில் மொழிபெயர்க்க என் மென்பொருள் செய்கின்றது என்பதை பகிர்ந்துகொள்கிறேன்.

Python மற்றும் OpenAI API இணைந்து செய்கின்றன

ஆங்கிலத்தில் ஒவ்வொரு கட்டுரையையும் எழுதுவதிலிருந்து, SEO தொடர்பான மெட்டாடேட்டாவையும் சேர்க்கலாகவே தொடங்குகிறேன். அதன்பிறகு, என் Python ஸ்கிரிப்ட் ஆங்கில உரையை OpenAI API-க்கு அனுப்புகிறது, அதனுடன் ஒரு திட்டம் மற்றும் சிறிய குறிப்பு கோப்பை இணைக்கிறது. OpenAI-யின் சர்வர்களில், ChatGPT-4o கோரிக்கையை வாசித்து, JSON வடிவத்தில் மொழிபெயர்க்கப்பட்ட கட்டுரையை திரும்ப அனுப்புகிறது — உதாரணமாக, அரபு பதிப்பு. என் MacBook அந்த மொழிபெயர்ப்பைப் பெற்றவுடன், ஸ்கிரிப்ட் உடனடியாக மற்றொரு கோரிக்கையை அனுப்புகிறது, இந்த முறை பெங்காலி கேட்டுக்கொள்கிறது. ஸ்கிரிப்ட் தானாகவே அனைத்து 42 இலக்கு மொழிகளையும் மடக்குகிறது. செயல்முறையின் முடிவில், என் கம்ப்யூட்டரிடம் 42 மொழிபெயர்க்கப்பட்ட JSON கோப்புகள் உள்ளன. மற்றொரு Python ஸ்கிரிப்ட் ஒவ்வொரு மொழிபெயர்ப்பையும் HTML வார்ப்புருவில் இணைத்து, ஒரு வினாடிக்கு குறைவாக 42 HTML கோப்புகளை உருவாக்குகிறது. அனைத்து கோப்புகளும் இந்த வலைப்பதிவு இடம்பெற்றுள்ள சர்வருக்கு பதிவேற்றப்பட்டு, ஒவ்வொரு மொழியின் பதிப்பு தனித்தனியாக கோப்புறைவெளியிடப்படுகிறது. கடைசியாக, சர்வர்-பக்கம் Python ஸ்கிரிப்ட் கட்டுரை குறியீடு மற்றும் "அடுத்த பதிவு" இணைப்புகளைப் புதுப்பிக்கிறது, ஒவ்வொரு மொழியின் வழிநடத்தலும் இணைந்திருக்கின்றது. அசல் ஆங்கில கட்டுரை வெற்று உரையில் எழுதப்பட்டதால், முழு செயல்முறை பொதுவாக 5 நிமிடங்களுக்குள் அல்லது அதைவிட குறைவாக எடுத்துக்கொள்கிறது. மாற்றங்கள் செய்ய வேண்டியிருந்தால், சர்வர்-பக்கம் Python ஸ்கிரிப்ட்களைப் பயன்படுத்தி பல HTML கோப்புகளை ஒரே நேரத்தில் புதுப்பிக்கிறேன்.

API என்றால் என்ன

நீங்கள் தொழில்நுட்ப சொற்களுடன் பழக்கம் இல்லையென்றால், என் கம்ப்யூட்டர் OpenAI-யின் சர்வருடன் எப்படி "பேசுகிறது" என ஆச்சரியப்படலாம். பதில் API என்றால் Application Programming Interface ஆகும். API-ஐ இரண்டு நிரல்களுக்கிடையே ஒரு தூதர் சாளரம் போலக் கருதலாம்: ஒரு நிரல் கோரிக்கையை அனுப்புகிறது, மற்றது பதிலை அனுப்புகிறது. உதாரணமாக, என் Python ஸ்கிரிப்ட் "இந்தக் கட்டுரையை ஜெர்மன் மொழிக்கு மொழிபெயர்க்கவும்" என்று ஒரு செய்தியை அனுப்புகிறது. OpenAI அந்த செய்தியை API மூலம் பெறுகிறது, மொழிபெயர்ப்பை தயார் செய்கிறது, முடிவைத் திரும்ப அனுப்புகிறது. இது உணவகம் ஒன்றில் ஆர்டர் செய்யும் முறையைப் போலவே செயல்படுகிறது: நீங்கள் பரிமாறும் பணியாளரிடம் என்ன விரும்புகிறீர்கள் என்பதைச் சொல்லுகிறீர்கள், சமையலறை அதைத் தயார் செய்கிறது, பணியாளர் அதை மீண்டும் உங்கள் மேசையில் கொண்டுவருகிறார். இந்த சந்தர்ப்பத்தில், ஏன் பணியாளருக்குத் தேவை? ஏனெனில் நீங்கள் சமையலறையில் நுழையவில்லை அல்லது சமையல்காரரிடம் நேரடியாக பேசவில்லை — சமையலறை எப்படி செயல்படுகிறது என்பதை நீங்கள் அறியவில்லை, அவசியமும் இல்லை. நீங்கள் "ஒரு சீஸ்பர்கர் தரமுடியுமா?" என்று பணியாளரிடம் கேட்கலாம், பணியாளர், "ஆர்டர் ரெடியாகுது! T21, சிகுவாவா!" என்று முற்றிலும் மாறுபட்ட வடிவத்தில் கத்தலாம். API அதே வேலையை செய்கிறது. இது இரண்டு மாறுபட்ட அமைப்புகளுக்கு ஒருவருக்கொருவர் உள்ளக மொழியை அல்லது வினோதத்தை புரிந்துகொள்ளாமலேயே இணைக்கிறது.

OpenAI API ஏன் தேவைப்படுகிறது

API என்ன என்பதை நாங்கள் பார்த்துவிட்டோம், இதற்காக நான் உண்மையில் அவனை நம்புகிறேன். நடைமுறையில், நான் ChatGPT-க்கு "பேச" தெரியும் — ஆனால் 42 மொழிகளை செயலாக்க வேண்டியுள்ளது. ஒரு பணியாளரை 42 முறை அழைப்பது சலிப்பூட்டும் (திட்டம் ஆங்கிலத்துக்கு ஆங்கிலத்தில் மொழிபெயர்ப்பதை தவிர்க்கிறது, ஆனால் இன்னும் JSON-க்கு உரையை மாற்றுகிறது). OpenAI API-ஐப் பயன்படுத்துவதன் மூலம் என் Python ஸ்கிரிப்ட் அனைத்து கோரிக்கைகளையும் தானாகவே அனுப்புகிறது, எனவே நான் மீண்டும் மீண்டும் செய்யும் வேலையைத் தவிர்க்க முடிகிறது, எனவே நான் மற்ற விஷயங்களில் கவனம் செலுத்த முடிகிறது. நான் தனி டெவலப்பர் என்பதால், எனது நேரத்தை மிக திறமையாக பயன்படுத்த வேண்டும். எப்போது நான் மீண்டும் மீண்டும் தோன்றும் வேலைகளைப் பார்த்தால் அவற்றை தானாக செயல்படுத்துகிறேன். முடிவாக, ஒரு செயல்முறை ஒரு மில்லியன் மடங்கு வேகமாகவும், முழுமையான பிழையற்றதாகவும் இருக்கும். அதனால் API மூலம் தானியங்கு முக்கியமானது — இது என் ஸ்கிரிப்டிற்கு அனைத்து 42 "ஆர்டர்களையும்" உடனடியாகவும் நம்பகமாகவும் இடமிட முடிகிறது.

ஏன் 42 மொழிகள்

தொழில்நுட்ப ரீதியாக, நான் மேலும் பல மொழிகளைச் சேர்க்க முடியும்; நான் சலவைத்தொலிபொருந்தில் இருக்கும்போது இதைச் செய்ய சில நிமிடங்கள் கூட எடுத்துக்கொள்கிறது. ஆனால் 42 என்ற எண்ணை எனக்கு நன்றாக பிடிக்கும், இது டக்ளஸ் ஆடம்ஸ் புத்தகத்தில் இருந்து "உலக வாழ்க்கையின் இறுதி கேள்விக்கான பதில்" ஆகும். 42 என்ற எண்ணத்தில் எனக்கு தனிப்பட்ட ஈர்ப்பு இருந்தாலும், மிகச் சிறிய மொழிகளைச் சேர்ப்பது ஆபத்தானதாக இருக்க முடியும், ஏனெனில் குறைந்த பயிற்சித் தரவுகளுடன் AI மொழிபெயர்ப்பு நம்பகமற்றதாக இருக்க முடியும்.

ChatGPT 4o-இன் வெப்பநிலை

இந்த பன்மொழி மொழிபெயர்ப்பு அணுகுமுறையை முதன்முதலில் சோதித்தபோது, முடிவுகள் நல்ல நிலையில் இருந்தன ஆனால் சிறப்பாக இல்லை. சில வாக்கியங்கள் தவறாக மொழிபெயர்க்கப்பட்டன, மிக அதிகமாக சொற்களால் மொழிபெயர்க்கப்பட்டன அல்லது குறிப்பிட்ட மொழிகளில் சிக்கலான உணர்வுகளை ஏற்படுத்துவன. மேலும், குறிப்பிட்ட கலாச்சார சூழ்நிலைகளில் தகுந்ததல்லாத அல்லது உணர்ச்சிவசப்பட்ட வெளிப்பாடுகளை உருவாக்குவது பற்றி கவலைப்பட்டேன். மற்றும், எனது மொழிபெயர்ப்புகள் இயந்திரமாக அல்லது இயற்கையாக ஒலிக்காது என்று நான் விரும்பவில்லை. மொழிபெயர்ப்பு தரம் பின்னால் முக்கிய காரணிகளில் ஒன்று வெப்பநிலை அமைப்பாகும் — AI எவ்வளவு "செயலாற்றலை" அல்லது "கட்டுப்படுத்தப்பட்ட" இருக்க வேண்டும் என்பதை கட்டுப்படுத்தும் ஒரு அளவுரு. ஒரு உயர் வெப்பநிலை AI-ஐ மேலும் கற்பனைசெய்யும், ஆனால் மேலும் முன்னறிவிக்க முடியாததாகவும் மாற்றும். குறைந்த வெப்பநிலை அதை அசல் அர்த்தத்திற்கு அருகில் வைக்கிறது, ஆனால் சில நேரங்களில் கடினமாக உணரக்கூடும். சரியான சமநிலையை காண மிகவும் முயற்சிகள் எடுத்தேன்: துல்லியத்திற்குக் குறைவாக, ஆனால் உரையின் உயிரின்மையை உணரவில்லை. பல பரிசோதனைகளின் பிறகு, வெப்பநிலை = 0.8 என் வலைப்பதிவின் தேவைகளுக்கு ஏற்றதாக உள்ளது: ஆங்கில அசலுக்கு நம்பகமாக இருக்கும் அளவுக்கு துல்லியமாகவும், மற்ற மொழிகளில் இயற்கையாக ஒலிக்கவும் கூடியதாகவும் இருந்தது.

ChatGPT 5.x வெப்பநிலையைக் கொண்டிருக்கவில்லை

புதிய மாதிரியான ChatGPT 5 மற்றும் 5.1 வெப்பநிலை அமைப்புகளை முற்றிலும் கொண்டிருக்கவில்லை — அந்த அளவுரு நீக்கப்பட்டுள்ளது மற்றும் சிந்தனை மற்றும் முயற்சி போன்ற கருத்துகளால் மாற்றப்பட்டுள்ளது, இது மாதிரி எப்படி யோசிக்கிறது என்பதை மாற்றுகின்றன, அல்லாமல் அது எவ்வளவு "கற்பனைசெய்யாது" என்பதை மாற்றுகின்றன. மற்ற வார்த்தைகளில், ChatGPT 4o என்னை மொழிபெயர்ப்பு பாணியைச் சரிசெய்ய ஒரு உடல் டயாலை கொடுத்தது, ஆனால் 5.x குடும்பம் முற்றிலும் வேறுபட்ட தத்துவத்தைப் பின்பற்றுகிறது. நீங்கள் புதிய மாதிரியை "வெப்பநிலை = 0.8 உடன் மொழிபெயர்க்க" கேட்கலாம், ஆனால் உள்ளே அந்த அளவுரு போய்விட்டது. மாதிரி பொதுவாக நோக்கத்தை நெருங்குகிறது. OpenAI தொடர்ந்து மாதிரிகளை புதுப்பிக்கையில், நான் ஒருநாள் என் மொழிபெயர்ப்பு செயல்முறையை சரிசெய்யலாம். தற்போதைக்கு, ChatGPT 4o பன்மொழி மொழிபெயர்ப்புகளுக்கான என் தேர்வாகவே உள்ளது — பல மொழிகளில் சூழ்நிலையை நன்றாக புரிந்து கொள்ளும் மட்டுமல்லாமல், தனி டெவலப்பர் எனக்கான API விலை நியாயமானது. உண்மையில், 4o OpenAI-யின் வரலாற்றிலேயே மிகவும் பிரபலமான மாதிரியாக இருக்கலாம்.

OpenAI API-யின் பணியாளர்கள்

OpenAI API-யை உலாவியில் ChatGPT ஐ நேரடியாகப் பயன்படுத்துவதுடன் ஒப்பிடும்போது, மிகவும் ஆச்சரியமானது — நீங்கள் ஒரே நேரத்தில் ஒன்றுக்கு மேற்பட்ட ChatGPT "பணியாளரை" பயன்படுத்தலாம். 42 மொழிகளுக்கு மொழிபெயர்ப்பு கோரிக்கைகளை அனுப்பும்போது, அவற்றை மெதுவாக ஒரு வரிசையாக அனுப்பவில்லை. அதற்கு பதிலாக, API பல கோரிக்கைகளை ஒரே நேரத்தில் செயலாக்க முடியும், அப்படியாக நான் திடீரென மொழிபெயர்ப்பாளர்களின் அறையை நியமித்தேன் எனலாம். என் Python ஸ்கிரிப்ட் ஒரு சிறிய உற்பத்தி வரிசையாக வேலைநிறுத்தத்தை கையாள்கிறது: அது ஆங்கிலக் கட்டுரையைத் தயாரிக்கிறது, கோரிக்கைகளை அனுப்புகிறது, பதில்களை காத்திருக்கிறது, மற்றும் முடிவுகளை JSON கோப்புகளாக செயலாக்குகிறது. இதற்கிடையில், OpenAI சர்வர்கள் பல மாதிரி நிகழ்வுகளை ஒரே நேரத்தில் இயக்குகின்றன, ஒவ்வொன்றும் ஒரே நேரத்தில் வித்தியாசமான மொழியை மொழிபெயர்க்கின்றன. இது ChatGPT வலைத்தளம் அல்லது பயன்பாட்டு செய்ய முடியாது — அந்த இடைமுகங்கள் உங்களுக்கு ஒரு மாதிரி, ஒரு உரையாடல், ஒரே வேலை மட்டுமே அளிக்கின்றன. ஆனால் API உடன், உங்கள் ஸ்கிரிப்ட் அனுமதிக்கும் வரை உங்கள் வேலைச்சுமையை விரிவாக பரப்ப முடியும். எனக்கு போன்ற தனி டெவலப்பருக்கு இது சிறிய குழுவின் ஐக்கிய மற்றும் அகங்காரமில்லாத உதவிக்காரர்களைப் போலவே உணர்கிறது. இது பகுதி இணைய வேகத்தில் சார்ந்து இருக்கிறது, ஆனால் நான் பொதுவாக பணியாளர்களை = 12 அமைத்து வைக்கிறேன்.

என்னால் என் வலைப்பதிவை பன்மொழியாக்க முடியும் என்றால் அது பாத்திரம் கழுவுவதால் காரணம்

கியோட்டோ பல்கலைக்கழகத்தில் கணிதம் பயின்றபோது நான் மாணவர் உணவகத்தில் பாத்திரம் கழுவும் வேலை செய்தேன். அதற்கான சம்பளம் ஒரு மணி நேரத்திற்கு சுமார் 5 USD ஆக இருந்தாலும், நான் பெரும்பாலும் பல மணி நேரங்களுக்கு — அல்லது சில சமயங்களில் பல நாட்களுக்கு — ஆழ்ந்த புத்திசாலித்தனமான சிந்தனையில் முடிந்த பிறகு மீண்டும் மீண்டும் வேலை செய்ய விரும்பினேன். பின்னர், ஹொக்கைடோவில் ஒரு பூண்டு தொழிற்சாலையில் வேலை செய்தபோது, என் வேலை வெறும் வெள்ளை பூண்டு காய்களை துலக்குவதுதான், அவை மாற்று தடிப்பில் பிரகாசமாக தெரிய வேண்டும். எட்டு மணி நேரம் — முழு கவனம், மாறாத ரிதம். அது வினோதமாக திருப்திகரமாக இருந்தது. இப்போது, அந்த நினைவுகளிலிருந்து மீண்டும், நான் தற்போதைய புத்திசாலித்தனமான வேலை — மென்பொருள் எழுத, அமைப்புகளை வடிவமைக்க, இந்தக் கட்டுரைகளை உருவாக்க. ஆனால் சமநிலை மாறவில்லை. நான் தனியாக 42 மொழிகளில் வலைப்பதிவு கட்டுரையை எவ்வாறு வெளியிடுகிறேன் என்று கேட்கும்போது, நேர்மையான பதில்: நான் அதை பாத்திரம் கழுவுவதால் செய்கிறேன்.