Wednesday, November 21, 2012

Malayalam Unicode

{ It is said that the ancient native Americans used smoke to communicate. The color size and shape of the smoke cloud having different meaning. The drums of Africa, Trumpet, Whistle are other examples. The Morse code used for communication is composed of 'dits' and 'dahs', a standardised sequence of which represents a letter each of the English Alphabet. A similar representation of English Alphabet can be seen in the Braille system of characters in rectangular blocks called cells with tiny palpable bumpy dots whose number and arrangement in the cell distinguish one character from another and represent a letter. }

What is Unicode?

A computer basically interprets only a combination of numbers composed of 16 bit, 32 bit and 64 bit ones and zeros, each representing a letter in the English Alphabet. Though there was a confusion in the beginning due to the variety of languages in computers, the system was standardized in the ASCII code's encoding System. But this was available only in the English language. With the formation of the Unicode Consortium a similar method of encoding for all languages of the World came into being. A unique number was allotted to every letter in all the languages around the World.

The code points from 128 x 9 = 1152 (2304 to 3455) is allotted to nine Indian languages  of which128 code points 3328 to 3455 has been allotted for the Malayalam Lipi. Based on this each Malayalam letter in the Aksharamala including swaras, swara-chihnams, vyanjanams etc were each allotted a number.

A logical question would be as to how the same keyboard used for the English language which had only 26 letters could accommodate the Malayalam Aksharamala with its 52 letters. One key in the English letter accommodated a small as well as the capital  for that letter, switching between the two being carried out with the use of Shift key. Based on this principle one swara and its swara-chihnam on the left-fingered side and one vyanjanam (Gharam) with its Athigharam  on the right-fingered keys was accommodated in one key, with it'd Mridu and Ghosham close to it on the upper row. Similarly, all letters. The principle of splitting koottaksharams and joining it with a chandrakkala in the typewriter puthiya-lipi came to the rescue in this aspect, but the difference between the letters joined by a chandrakkala in the type written document from the digital letters being that, such a procedure led to rendering of proper koottaksharam letters in the computer. That too, with no necessity to have additional keys on the keyboard. So also, the nta was obtained by joining vdJ (no additional keystroke when compared to transliteration). Chillaksharam are rendered here using a similar key combination consisting of the vynjanam+d+]. That covers all Malayalam letters of any number of combinations. In-script keyboard also incorporates Malayalam digits.

Let us not go into the drawbacks of the previous system of Malayalam typing, because the role they played in bringing about the usage of Malayalam in computer is what lead to the  demand for standardization of the system in In-script method and its implementation by the Unicode Consortium.

The transition - Old to New Lipi


Travelling back in time one remembers the first day at school with the tears on the breaking of one's framed kadappa stone slate leaving behind only the wooden frame to carry home as evidence to prove that the slate was not lost but broken by the child without a name on the same bench. No, that was not the stone age but the first half of the nineteen fiftees. The first letter that was taught was അ and then അമ്മ. The Paaddavali had no English letters, not even in the numbering of pages. It was all Malayalam.

As years went by the page numbering, Enchuvadi and Mathematics was replaced by English in the school text books, so much so that as time went by Malayalees forgot the use of the Malayalam digits. The mode of communication at the time being handwritten inland letters, Malayalees enjoyed  writing the rounded off letters not having to think twice about what letters to choose from.

The drastic changes in the usage of Malayalam script happened in the year 1971 with the arrival of the Malayalam typewriter and the usage of Malayalam as the administration language by the Kerala Government. The number of  letters had to be reduced to fit the few keys of the typewriter.

The Kerala Government Order G. O. (P) 37/71 Edn Dated Tvm 23rd March, 1971 was the last nail in the coffin for original script in Malayalam.

The order specifically said

"The question of reducing the unwieldy number of alphabets and signs in Malayalam which consume much time and labor in the process of printing and typewriting, has been the consideration of the  government for some time. In 1967 the Government appointed a committee with Shri Sooranad P. N. Kunjan Pillai, Editor  Malayalam Lexicon as convener to advice them on the question of reformation of Malayalam Script. The committee in its recommendations to reduce 75% of the total number of existing characters in printing and typewriting (Note this part. This reform was not meant for handwritten documents!). The reformed Malayalam script recommended by the above committee was revised with slight modification by another committee appointed in 1979 to expedite the adoption of the new script for use. The recommendations of the above two committees in the matter of reformation is as follows.

i) ഉ, ഊ, ഋ, റ എന്നിവയുടെ മാത്രകള്‍ വ്യഞ്ജനങ്ങളില്‍ നിന്നും വിടുവിക്കുക
ii) പ്രചാരം കുറഞ്ഞ കൂട്ടക്ഷരങ്ങള്‍ ചന്ദ്രക്കല ഉപയോഗിച്ചു് പിരിച്ചെഴുതുക"

The order continues

In January 1971 a conference of the Managing Directors of important newspapers in the state was convened to discuss the question of adoption of the new Malayalam Script for use. The conference has recommended that the reformed script as revised by the committee be adopted for use with effect from 15th, April 1971 (Vishu Day)." - This recommendation was approved in the GO with an appendix "ലിപി പരിഷ്ക്കരണം". The order went on "All newspapers and periodicals in Malayalam were requested to co-operate with the Government in the implementation of the scheme and adopt the new script from the stipulated date."

ലിപി പരിഷ്ക്കരണം (സത്തു്)

"മലയാള ഭാഷയുടെ ലിപി സമ്പ്രദായ സങ്കീര്‍ണ്ണമായ ഒന്നാണു്. വ്യഞ്ജനങ്ങളോടു സ്വരങ്ങള്‍ ചേര്‍ക്കുമ്പോഴും കൂട്ടക്ഷരങ്ങള്‍ സൃഷ്ടിക്കുമ്പോഴും മറ്റും പ്രത്യേക ലിപികള്‍ സൃഷ്ടിച്ചതാണു് ഈ സങ്കീര്‍ണ്ണതയ്ക്കു് കാരണം. മലയാള ലിപികളുടെ എണ്ണം ഇക്കാരണത്താല്‍ ക്രമാതീതമായി വര്‍ദ്ധിക്കുകയും ചെയ്തിരുന്നു. എല്ലാം കൈ കൊണ്ടു് എഴുതിവന്ന കാലത്തു് ഈ സങ്കീര്‍ണ്ണത കൊണ്ടുള്ള പ്രയാസം അത്രത്തോളം അനുഭവപ്പെട്ടിട്ടില്ല. എന്നാല്‍ അച്ചടിയന്ത്രത്തിന്റെയും ടൈപ്പു് റൈറ്ററിന്റെയും ആവിര്‍ഭാവത്തോടെ (!) ഈ ലിപിസമ്പ്രദായം കൊണ്ടുള്ള വിഷമതകള്‍ കൂടുതലായി അനുഭവപ്പെട്ടു. മലയാളത്തിനു് ഇന്നും വെടിപ്പായി ടൈപ്പു് ചെയ്യാന്‍ ഉതകുന്ന ഒരു കീബോര്‍ഡു് രൂപപ്പെടുത്താനായിട്ടില്ലെങ്കില്‍ അതിന്റെ മുഖ്യകാരണം ലിപി സമ്പ്രദായത്തിലെ ഈ സങ്കീര്‍ണ്ണത തന്നെയാണു് "

ലിപി പരിഷ്ക്കരണ സംരംഭങ്ങള്‍:

"മലായളം ലിപി പരിഷ്ക്കരണത്തിനുള്ള യത്നങ്ങള്‍ അങ്ങിങ്ങു് ആരംഭിച്ചിട്ടു് കുറേക്കാലമായി. സ്വന്തമായി ഇതിലേക്കു് ഉത്സാഹിക്കുകയും പരീക്ഷണങ്ങളും പ്രയത്നങ്ങളും നടത്തുകയും ചെയ്ത പത്രങ്ങള്‍ക്കും ടൈപ്പു് നിര്‍മ്മാതാക്കള്‍ക്കും സ്വാഭാവികമായും ഫലപ്രാപ്തിയിലെത്തിക്കാന്‍ കഴിഞ്ഞില്ല ഗവണ്മന്റു് മുന്‍കൈ എടുത്തു നടപ്പാക്കാത്ത പരിഷ്ക്കാരങ്ങള്‍ക്കു് സാര്‍വ്വത്രികമായ അംഗീകാരം നേടാന്‍ വിഷമമുണ്ടു് 1967 അവസാനത്തു് സംസ്ഥാന ഗവണ്‍മെന്റു് ലിപി പരിഷ്ക്കാരത്തിനാവശ്യമായ നടപടികള്‍ സ്വീകരിച്ചു തുടങ്ങിയതു്. ഇവയുടെ പ്രാരംഭം എന്ന നിലയില്‍ ലിപി പരിഷ്ക്കരണ വിഷയത്തില്‍ താല്പര്യവും അതിനാവശ്യമായി നിര്‍ദ്ദേശങ്ങള്‍ സമര്‍പ്പിക്കാന്‍ കഴിവും ഉള്ള ഏതാനം പ്രമുഖ ഉദ്യോഗാനുദ്യോഗസ്ഥന്മാരുടെ ഒരു സമ്മേളനം ചേര്‍ന്നു. പത്രാധിപന്മാര്‍ക്കും ടൈപ്പു്റൈറ്റിംഗു് അച്ചടി തുടങ്ങിയ രംഗങ്ങളിലെ വിദഗ്ദ്ധന്മാരും വിദ്യാഭ്യാസ പ്രവര്‍ത്തകരും മറ്റും പങ്കെടുത്ത പ്രസ്തുത യോഗത്തില്‍ വച്ചു് ലിപി പരിഷ്ക്കരണം സംബന്ധിച്ചു് ഒരു പദ്ധതി തയ്യാറാക്കി ഗമണ്‍മെന്റിലേക്കു് സമര്‍പ്പിക്കാന്‍ ഒരു കമ്മിറ്റി രൂപീകരിക്കണമെന്നു് തീരുമാനിച്ചു. അധികം താമസിയാതെ കമ്മിറ്റി രൂപീകരിക്കുകയും ചെയ്തു.

സംസ്ഥാനത്തു് മലയാളം ഭരണഭാഷയും ഉന്നത വിദ്യാഭ്യാസത്തിനുള്ള മാധ്യമവും ആയിക്കൊണ്ടിരിക്കുന്നതിനാല്‍ ഭാഷയുടെ വളര്‍ച്ചയ്ക്കും വികാസത്തിനും സഹായമാംവിധം ലിപികള്‍ പരിഷ്ക്കരിക്കണമെന്നായിരുന്നു തീരുമാനിക്കപ്പെട്ടതു്. മലയാളം അച്ചടിയും മലയാളം ടൈപ്പു്റൈറ്റിംഗും സമ്പ്രദായങ്ങള്‍ ലഘൂകരിക്കേണ്ടതിന്റെ ആവശ്യകതയും പ്രത്യേകം പരിഗണിക്കപ്പെട്ടു. എന്നാല്‍ നൂറ്റാണ്ടുകളായി (കയ്യെഴുത്തായി) ഉപയോഗിച്ചുവരുന്ന ഭാഷാ ലിപിയില്‍ പൊടുന്നനെ സമൂലമായ മാറ്റം വരുത്തുക ജനങ്ങള്‍ക്കു് പ്രയാസം സൃഷ്ടിക്കുമെന്ന വസ്തുത കണക്കിലെടുത്തു കൊണ്ടു് കഴിയുന്നത്ര കൂടുതല്‍ പ്രയോജനം സിദ്ധിക്കുന്ന ലഘുവായ ഭേദഗതികള്‍ മാത്രമേ വരുത്തേണ്ടതുള്ളു എന്ന അഭിപ്രായമാണു് ഗവണ്മെന്റു് പ്രകടിപ്പിച്ചതു്. ഈ ലക്ഷ്യങ്ങള്‍ മുന്‍നിര്‍ത്തി ആവശ്യമായ ചര്‍ച്ചകളും പഠനങ്ങളും നടത്തിയ ശേഷം ലിപി പരിഷ്ക്കരണ കമ്മിറ്റി ഗവണ്മെന്റിലേക്കു് യഥാകാലം റിപ്പോര്‍ട്ടു് സമര്‍പ്പിക്കുകയുണ്ടായി. ഗവണ്മെന്റു് കമ്മറ്റിയുടെ ശുപാര്‍ശകള്‍ പൊതുവില്‍ സ്വീകരിക്കുകയും അതനുസരിച്ചു് ആവശ്യമായ ഉത്തരവുകള്‍ പുറപ്പെടുവിക്കുകയും ചെയ്തു.

ഇപ്പോള്‍ മലയാളത്തില്‍ അഞ്ഞൂറിലധികം ലിപികള്‍ (അക്ഷരങ്ങള്‍) നിലവിലുണ്ടു്. ഇന്നത്തെ രീതിയ്ക്കു ഭാഷ കൈകാര്യം ചെയ്യുന്നതിനു് അത്രയും ലിപികള്‍ ആവശ്യവുമാണു്. ലീപികളുടെ ഈ ആധിക്യം അച്ചടിയിലും ടൈപ്പു്റൈറ്റിംഗിലും നിരവധി വിഷമതകള്‍ സൃഷ്ടിക്കുന്നുണ്ടു്. അതിനാല്‍ ലിപികളുടെ എണ്ണം പ്രായാഗികമാം വിധം എത്രത്തോളം കുറയ്ക്കാം എന്നതായിരുന്നു കമ്മിറ്റിയുടെ മുഖ്യ  ചിന്താവിഷയം. പുതിയ ലിപികള്‍ ആവിഷ്ക്കരിച്ചു് നടപ്പില്‍ വരുത്തുക ദുഷ്ക്കരമായതിനാല്‍ നിലവിലുള്ള ലിപി സമ്പ്രദായം തന്നെ പരിഷ്ക്കരിച്ചു് ലഘൂകരിക്കാനാണു് കമ്മിറ്റി നിര്‍ദ്ദേശിച്ചിരിക്കുന്നതു്. വ്യഞ്ജനങ്ങളോടു് സ്വരങ്ങള്‍ ചേര്‍ന്നുണ്ടാകുന്ന അക്ഷരങ്ങളുടേയും കൂട്ടക്ഷരങ്ങളുടേയും എണ്ണം കുറയ്ക്കുകയായിരുന്നു ഇതിലേക്കുള്ള പ്രായോഗിക മാര്‍ഗ്ഗം.

ലിപി പരിഷ്ക്കരണ സമിതിയുടെ നിര്‍ദ്ദേശങ്ങള്‍

1. ഉ, ഊ, ഋ എന്നീ സ്വരങ്ങള്‍ വ്യഞ്ജനങ്ങളോടു ചേരുമ്പോള്‍ പ്രത്യേക ലിപികള്‍ തന്നെ രൂപമെടുക്കുന്ന ഇന്നത്തെ രീതിക്കു പകരം അവയ്ക്കു് പ്രത്യേക ചിഹ്നങ്ങള്‍ ഏര്‍പ്പെടുത്തുക. അ, ആ, ഇ, ഈ, എ, ഏ, ഐ, ഒ, ഓ, ഔ എന്നീ സ്വരങ്ങള്‍ക്കു് ഏതു വ്യഞ്ജനത്തോടും ചേര്‍ക്കാവുന്ന പ്രത്യേക ചിഹ്നങ്ങള്‍ ഉണ്ടെന്ന വസ്തുത ഇവിടെ ഓര്‍മ്മിക്കേണ്ടതുണ്ടു്. ഉ, ഊ, ഋ എന്നീ സ്വരങ്ങളുടെ കാര്യത്തിലും ആ സമ്പ്രദായം ഏര്‍പ്പെടുത്തിയാല്‍ ഒട്ടധികം ലിപികള്‍ കുറയ്ക്കാന്‍ കഴിയും. ഇതിലേക്കു് ഉ എന്നതിനു് ു എന്ന ചിഹ്നവും ഊ വിനു് ൂ എന്ന ചിഹ്നവും ആണു് നിര്‍ദ്ദേശിക്കപ്പെട്ടിരിക്കുന്നതു്.  ഋകാരത്തിനു് ഇപ്പോള്‍ വ്യഞ്ജനത്തോടു ചേര്‍ന്നു വരുന്ന ചിഹ്നം തന്നെ വേര്‍പെടുത്തി കുറച്ചു് വ്യത്യസ്തതയോടെ ൃ എന്ന ചിഹ്നമാക്കിയാല്‍ മതിയാവും.

2. മുമ്പില്‍ രേഫം (ര്‍) ചേരുന്ന കൂട്ടക്ഷരങ്ങള്‍ ഇപ്പോള്‍ രണ്ടു തരത്തില്‍ എഴുതാറുണ്ടു്. ഉദാഃ അര്‍ക്കന്‍, പാര്‍ത്തലം, നേര്‍ച്ച. ഇതില്‍ ആദ്യത്തെ രീതി ( '.' ചിഹ്നം അക്ഷരത്തിനു മുകളില്‍ ഇടുന്ന രീതി ) ഉപേക്ഷിക്കാവുന്നതാണു്. അതിനു പകരം എല്ലായിടത്തും ര്‍ എന്ന ചില്ലു് മുന്‍പില്‍ എഴുതുക എന്നു വ്യവസ്ഥ ചെയ്താല്‍ മതിയാകും.

3. ഭാഷയിലെ കൂട്ടക്ഷരങ്ങളില്‍ ക്ക, ങ്ക, ങ്ങ, ച്ച, ഞ്ച, ഞ്ഞ, ട്ട, ണ്ട, ണ്ണ, ത്ത, ന്ത, ന്ന, പ്പ, മ്പ, മ്മ, യ്യ, ല്ല, വ്വ എന്നിവ തനി മലയാള പദങ്ങളില്‍ സാര്‍വ്വത്രികമായി വരുന്നതാണു്. ഇവ ഇപ്പോഴത്തെപ്പോലെ നില നിര്‍ത്താമെന്നു് കമ്മിറ്റി ശൂപാര്‍ശ ചെയ്തിരിക്കുന്നു. മറ്റുള്ള കൂട്ടക്ഷരങ്ങള്‍ ഏറിയ പങ്കും സംസ്കൃതത്തില്‍ നിന്നും സ്വീകരിച്ചിട്ടുള്ളവായാണു്. അവയെ ചന്ദ്രക്കലയിട്ടു് വേര്‍തിരിച്ചും അല്ലാതെ ഒന്നിച്ചു ചേര്‍ത്തും എഴുതുന്ന രീതികള്‍ ഇപ്പോള്‍ നിലവിലുണ്ടു്. ഉദാഃ ക്ത, ശ്ച. ഇവയില്‍ ചന്ദ്രക്കലയിട്ടു് വേര്‍തിരിച്ചെഴുതുന്ന രീതി മാത്രം നിലനിര്‍ത്തു എന്നാണു് കമ്മിറ്റിയുടെ ശുപാര്‍ശ.

4. യ്, ര്, ല്, വ് എന്നീ മധ്യമങ്ങള്‍ ചേര്‍ന്നു വരുന്ന കൂട്ടക്ഷരങ്ങള്‍ ഇപ്പോള്‍ പലപ്രകാരത്തില്‍ എഴുതുന്നുണ്ടു്. യ്, വ് എന്നിവ ചേരുമ്പോള്‍ പ്രത്യേക ചിഹ്നങ്ങള്‍ കൊടുത്തു് വേര്‍തിരിച്ചെഴുതുകയാണു് പതിവു്. ക്യ, ത്യ, ക്വ, ത്വ, എന്നിങ്ങനെ. ര് അധവാ റ് എന്ന വ്യഞ്ജനം ചേരുന്ന കൂട്ടക്ഷരത്തില്‍ ഉദാഃ പ്ര, ക്ര, ത്ര എന്നിവയ്ക്കു് അതു് വേര്‍തിരിച്ചു് വ്യഞ്ജനത്തിനു് തൊട്ടു് മുമ്പായി ഉപയോഗിക്കാം. ല് അഥവാ ള് ചേരുന്നിടത്തു് ചന്ദ്രക്കലയിട്ടു് വേര്‍തിരിച്ചോ ഇപ്പോഴത്തെ പോലെ പ്രത്യേക അക്ഷരമായോ ക്ല പ്ല എന്നിങ്ങനെ എഴുതാമെന്നാണു് കമ്മിറ്റിയുടെ ശുപാര്‍ശ.

ചില്ലുകള്‍ ണ്‍ ന്‍ ര്‍ ല്‍ ള്‍ എന്നിവ ഇപ്പോഴത്തെ പോലെ നിലനിര്‍ത്താമെന്നു് കമ്മിറ്റി ശുപാര്‍ശ ചെയ്തിരിക്കുന്നു.

എഴുതുന്നതിനു് (പ്രത്യേകം ശ്രദ്ധിക്കുക) ഇപ്പോഴത്തെ ലിപി സമ്പ്രദായം തന്നെ തുടര്‍ന്നുകൊണ്ടു് ടൈപ്പു്റൈറ്റിംഗിലും അച്ചടിയിലും പുതിയ സമ്പ്രദായം സീകരിച്ചാല്‍ മതിയാകുമെന്നു കമ്മിറ്റി ശുപാര്‍ശ ചെയ്തിട്ടുണ്ടു്.