Friday, June 8, 2012

இணையத்தை அலங்கரிக்கும் தமிழ் எழுத்துருக்கள் - யுனிக்கோட் என்றால் என்ன?


பல நண்பர்களுக்கு யுனிக்கோட் எழுத்துரு பற்றிய போதிய தெளிவு இல்லாமையை அவதானிக்கமுடிந்தது. யுனிக்கோட் என்பதை அறிந்திருக்கிறார்கள். யுனிக்கோட்டை உபயோகிக்கிறார்கள். ஆனால் யுனிக்கோட் என்றால் என்ன என்பதை பற்றி பூரணமாக அறிந்திருக்கவில்லை. ஆகவே இந்த பதிவு அவர்களுக்கு யுனிக்கோட் பற்றிய ஓரளவு தெளிவை ஏற்படுத்த உதவும் என நம்புகிறேன். பழைய விடயம் தான் எனினும் யுனிக்கோட் பற்றி அறியாதவர்களுக்காக இந்த பதிவு :)


இன்று இணையத்திலே எண்ணிலடங்காத தமிழ் இணையத்தளங்கள், வலைப்பூக்கள் பரந்து தமிழ் மொழியை அழகுபடுத்துகின்றன. இந்த தளங்களை நாம் எங்கிருந்தும் படிக்கமுடிகிறது என்பதோடு நாமும் தமிழ்மூலம் இணையத்தில் கருத்துக்களை பதிவேற்ற முடிகிறது. அதை அனைவராலும் படிக்கமுடிகிறது. இவை அனைத்தும் இன்றைய நாளில் இலகுவாகி இருப்பதற்கு காரணம் யுனிக்கோட் எழுத்துருதான். யுனிக்கோட் எழுத்துரு அறிமுகமாவதற்கு முன்னர் மேற்சொன்னவை எல்லாம் அவ்வளவு எளிதான காரியம் அன்று. பல தமிழ் இணையத்தளங்களை பார்க்கும்போது எழுத்துக்கள் எல்லாம் பெட்டி பெட்டியாக தோன்றும். காரணம் எழுத்துரு (Font) பிரச்சினை. எழுத்துரு எப்படி இயங்குகிறது என்பதை புரிந்துகொண்டால்தான் இந்த எழுத்துரு பிரச்சினை பற்றியும், யுனிக்கோட் என்றால் என்ன என்று புரிந்துகொள்ளமுடியும். ஆகவே முதலில் எழுத்துரு எப்படி இயங்குகிறது என்று பார்ப்போம்.


எழுத்துரு (Font) எப்படி இயங்குகிறது?

நாம் விசைப்பலகையில் (Keyboard) உள்ளிடும் எழுத்துக்கள் திரையில் காண்பிக்கப்படுகிறது. உதாரணமாக "A" என்று நீங்கள் ரைப் செய்தால் கணினி திரையிலும் “A" என்றே காண்பிக்கிறது. ஆனால் கணினியில் அவ்வாறுதான் உள்ளிடப்படுகிறதா என்றால் இல்லை. நீங்கள் "A" என்று ரைப் செய்யும்போது அது அச் சொல்லிற்குரிய ASCII இலக்கத்தை கணினியில் உள்ளிடுகிறது. அவ்வாறு உள்ளீடு ஆகும் ASCII இலக்கம் மறுபடியும் நீங்கள் ரைப் செய்த எழுத்தை கணினி திரையில் காண்பிக்கிறது. உதாரணமாக “A" என்ற எழுத்துக்குரிய ASCII இலக்கம் 97. ஆகவே நீங்கள் விசைப்பலகையில் "A" என்ற எழுத்தை அழுத்தும்போது அது 97 என்ற ASCII இலக்கத்தை கணினியில் உள்ளிடுகிறது. பின்னர் கணினி திரையில் "A" என காண்பிக்கிறது. அனைத்து எழுத்துக்களும் இதுபோன்ற முறையில் ASCII எழுத்துருவாக கணினியில் உள்ளீடு ஆகிறது.

அதுபோலவேதான் தமிழ் எழுத்துருவும். பாமினி என்ற எழுத்துருவை தெரிவு செய்து தட்டச்சிட்டால், “A" ஐ அழுத்தினால் அது கணினி திரையில் "ய” வாக தெரியும். இவ்வாறு விசைப்பலகையில் “A" ஐ அழுத்தினால் ஆங்கிலத்தில் "A" ஆகவும், பாமினியில் “ ய” வாகவும் கணினித்திரையில் தெரியுமே தவிர அவற்றின் உண்மையான பெறுமாணம் 97 ஆகும்.

ஆரம்பகாலங்களில் இணையத்தில் ஏற்பட்ட எழுத்துரு பிரச்சினையும் யுனிக்கோட் வரவும்

மேலே குறிப்பிட்டது போல ஒவ்வொரு எழுத்துரு வகைகளுக்கும் ஒவ்வொரு விதமான ASCII இலக்கம் இருக்கும். ஆகவே குறித்த ஒரு எழுத்துருவில் ரைப் பண்ணிய வசனம் ஒன்றை வேறு ஓர் எழுத்துருவில் பார்க்கும்போது அது மாறுபட்டுத்தான் தெரியும். உதாரணமாக “வணக்கம்” என்று பாமினியில் ரைப் பண்ணிவிட்டு அதை ஆங்கில எழுத்துருவில் பார்த்தால் “tzf;fl;" என தெரியும். அதே போல் ஒவ்வொரு எழுத்துருவுக்கும் அதன் ASCII பெறுமாணத்திற்கேற்ப மாற்றமடைந்து தெரியும். இந்த பிரச்சினைதான் ஆரம்பகால இணையத்தளங்களுக்கு ஏற்பட்டது. ஒவ்வொரு இணையத்தளமும் வெவ்வேறு எழுத்துருக்களை பாவிக்க, அந்த எழுத்துரு இருந்தால் மாத்திரமே குறிப்பிட்ட தளத்தை படிக்கமுடியும் என்ற நிலை இருந்தது. இதனால் பல இணையத்தளங்கள் தாம் பயன்படுத்தும் எழுத்துருவை தமது தளத்திலேயே தரவிறக்கக்கூடிய ஏற்பாடுகளை செய்திருந்தன. யுனிக்கோட் எழுத்துருவின் வரவுக்கு முன்னர் இந்த எழுத்துரு பிரச்சினை பெரிய தலையிடியாகவே இருந்தது.

இந்த பிரச்சினைக்கெல்லாம் முற்றுப்புள்ளி வைத்தது யுனிக்கோட் எழுத்துரு. மேலே குறிப்பிட்டதுபோல அதுவரை காலமும் A-Z, a-z ஆகிய எழுத்துக்களுக்கு மாத்திரமே ASCII இலக்கம் வழங்கப்பட்டிருந்தது. இதை அடிப்படையாக வைத்தே தமிழ் எழுத்துருக்களும் உருவாக்கப்பட்டன. உதாரணமாக A இற்குரிய 97 என்ற ASCII இலக்கம் தான் பாமினி எழுத்துருவில் "ய” விற்கும் பயன்படுத்தப்பட்டது. ஆனால் யுனிக்கோட்டில் அப்படி அல்ல.A-Z, a-z இற்கு தனித்தனியாக ASCII இலக்கம் வழங்கியது போன்றே ஒவ்வொரு மொழியில் உள்ள எழுத்துக்களுக்கும் தனித்தனியாக ASCII இலக்கம் வழங்கப்பட்டது.

தமிழுக்கு 2946 தொடக்கம் 3071 வரையான இலக்கங்கள் ஒதுக்கப்பட்டன. இங்கு தனித்தனியாக இலக்கம் ஒதுக்கப்பட்டதால் எழுத்துரு மாற்றத்தால் ஏற்படும் பிரச்சினைகள் இல்லை. உதாரணமாக 2949 என்ற இலக்கத்திற்குரிய எழுத்து “அ” ஆகும். இது எந்த எழுத்துருவிற்கு மாற்றினாலும் அதே இலக்கத்தில் தான் இருக்கப்போகிறது. எழுத்துரு மாற்றத்தால் எழுத்தின் வடிவம் (Style) மாற்றமடையுமே தவிர எழுத்து மாற்றமடையாது. ஒரு இணையத்தளத்தில் யுனிக்கோட் எழுத்துருவை பயன்படுத்தி எழுதியிருந்தால் அதை பார்ப்பவர்களிடத்தில் குறித்த எழுத்துரு இல்லாவிட்டாலும் வேறு ஓர் யுனிக்கோட் எழுத்துரு மூலம் படிக்கலாம்.

சரி.... ”அ” என்ற எழுத்தை பெற 2949 என்ற ASCII இலக்கத்தை உள்ளிடவேண்டும். ஆனால் சாதாரணமாக 105 விசைகளை கொண்ட விசைப்பலகையில் (Key Board) 2949 என்ற இலக்கத்தை எங்கே போய் தேடுவது? இதற்காகவே சில மென்பொருள்கள் உள்ளன. அவை விசைகளை (Key) குறித்த எண்களுக்கேற்ப மாற்றுகிறது. அதோடு நீங்கள் விரும்பிய எழுத்துருவில் (eg:- பாமினி, Tamil99) தட்டச்சு செய்ய அவற்றை யுனிக்கோட் எழுத்துருவாக திரையில் காண்பிக்கின்றன இத்தகைய மென்பொருட்கள். உதாரணம் NHM Writter.

கணினியில் யுனிகோட்

இணையத்தில் யுனிக்கோட் பாவனை பற்றி பார்த்தோம். இப்போது எமது கணினியில் யுனிக்கோட்டை எப்படி பயன்படுத்துவது என்று பார்ப்போம்.
Windows Xp க்கு பின்னர் வந்த இயங்குதளங்களில் யுனிக்கோட் பாவனைக்கு சிறப்பான ஒத்துழைப்பு உள்ளது. யுனிக்கோட் இற்காகவே லதா என்ற எழுத்துருவை சேர்த்துள்ளார்கள். Windows Vista, Windows 7 போன்றவற்றிற்கு நாம் மேலதிகமாக எந்த Settings உம் செய்ய தேவையில்லை எனினும் Windows Xp இல் சில மாற்றங்களை செய்தால்தான் அவற்றை யுனிக்கோட்டிற்கு ஒத்துழைக்க செய்யலாம்.

அதற்குரிய படிமுறைகளை தருகிறேன். இதற்கு நீங்கள் நிறுவிய Windows Xp இன் பிரதி தேவை.உங்கள் கணினியின் Control panel பகுதிக்கு சென்று Regional and Language என்பதை கிளிக் பண்ணுங்கள். அப்போது தோன்றும் விண்டோவில் Language என்ற Tab இற்கு செல்லுங்கள். அதில் Install files for Complex script and right-to-Left-Language (including Thai) என்ற Option ஐ தெரிவு செய்யுங்கள். அதன் பின்னர் Ok கொடுங்கள். ok கொடுத்ததும் windows CD இனை உள்ளிடும்படி கேட்கும். CD யினை உள்ளிட்டதும் தேவையான Files ஐ காப்பி செய்தவுடன் கணினி Restart ஆகும். அதன் பின்னர் உங்கள் Xp கணினியும் யுனிக்கோட்டிற்கு தயாராகிவிடும்.


பதிவுகளை மின்னஞ்சலில் பெற்றுக்கொள்ள

உங்கள் மின்னஞ்சல் முகவரி:

For Further Reading,
Compuer Tips, Internet Tips, Tamil fonts, Unicode

Post Comment

1 comments:

Anonymous said...

usefull Post