Skip Ribbon Commands
Skip to main content

ಯುನಿಕೋಡ್ ಎಂಬ ವಿಶ್ವಸಂಕೇತ

ಅಂಗಡಿಗೆ ಹೋಗಿ ಒಂದು ಬಲ್ಬ್ ಬೇಕೆಂದು ಕೇಳಿ ನೋಡಿ. ಅಂಗಡಿಯಾತ ನಿಮ್ಮ ಮನೆಯಲ್ಲಿ ಯಾವ ಕಂಪೆನಿಯ ಹೋಲ್ಡರ್ ಇದೆ ಎಂದು ಕೇಳುವುದಿಲ್ಲ. ಯಾಕೆಂದರೆ ಯಾವ ಕಂಪೆನಿಯ ಹೋಲ್ಡರ್ ಆದರೇನು, ಎಲ್ಲ ಬಲ್ಬ್‌ಗಳು ಎಲ್ಲ ಹೋಲ್ಡರ್‍ಗಳಲ್ಲಿ ಕೆಲಸ ಮಾಡುತ್ತವೆ. ಈಗ ಕನ್ನಡ ಮತ್ತು ಗಣಕ ಕ್ಷೇತ್ರಕ್ಕೆ ಬನ್ನಿ. ನಿಮ್ಮ ಮನೆಯ ಗಣಕದಲ್ಲಿ ಕಡತವೊಂದನ್ನು ತಯಾರಿಸಿ ಫ್ಲಾಪಿಯಲ್ಲಿ ತುಂಬಿಸಿ ಅದರ ಲೇಸರ್ ಮುದ್ರಣಕ್ಕೆ ಯಾವುದಾದರು ಡಿ.ಟಿ.ಪಿ. ಕೇಂದ್ರಕ್ಕೆ ತೆಗೆದುಕೊಂದು ಹೋಗಿ. ಆತ ನಿಮ್ಮನ್ನು ಖಂಡಿತವಾಗಿ ಕೇಳುವ ಪ್ರಶ್ನೆಯೆಂದರೆ "ನೀವು ಯಾವ ತಂತ್ರಾಂಶ ತಯಾರಿಸಿ ಕಡತವನ್ನು ತಯಾರು ಮಾಡಿದ್ದೀರಾ?". ನೀವು ಬಳಸಿದ ತಂತ್ರಾಂಶ ಆತನ ಗಣಕದಲ್ಲಿ ಇಲ್ಲದಿರುವ ಸಂಭವವೇ ಹೆಚ್ಚು. ಕನ್ನಡದ ಯಾವುದೇ ತಂತ್ರಾಂಶವನ್ನು ಬಳಸಿ ತಯಾರಿಸಿದ ಕಡತವನ್ನು ಕನ್ನಡದ ಯಾವುದೇ ತಂತ್ರಾಂಶದಲ್ಲಿ ಓದಲು ಸಾಧ್ಯವಿರಬೇಕಲ್ಲವೇ, ಇಂಗ್ಲೀಷ್ ಭಾಷೆಯಲ್ಲಿದ್ದಂತೆ, ಎಂದು ನಿಮಗೆ ಅನ್ನಿಸಿರಬೇಕಲ್ಲವೇ? ಆದರೆ ನಿಜ ಪರಿಸ್ಥಿತಿ ಹಾಗೇನೂ ಇಲ್ಲ.

ಕನ್ನಡದಲ್ಲಿ ಕಡತವೊಂದನ್ನು ತಯಾರಿಸಿ ಜಪಾನಿಗೆ ಕಳುಹಿಸಿದರೆ ಅವರಿಗೆ ಇದು ಕನ್ನಡ ಭಾಷೆಯಲ್ಲಿದೆ ಎಂದು ತಿಳಿಯುವುದು ಹೇಗೆ? ವಿಶ್ವಕ್ಕೆಲ್ಲ ಒಂದೇ ಸಂಕೇತ ವಿಧಾನ ಇದ್ದರೆ ಒಳ್ಳೆಯದಲ್ಲವೇ? ಇದುವೇ ಯುನಿಕೋಡ್.

ನಾವು ಇಂಗ್ಲೀಷಿನಲ್ಲಿ ಮಾತನಾಡುವಾಗ ಕನ್ನಡದಲ್ಲಿ ಆಲೋಚಿಸಿ ಇಂಗ್ಲಿಗೆ ಅನುವಾದಿಸಿ ಮಾತನಾಡುತ್ತೇವಲ್ಲವೇ? ಗಣಕಗಳು ಕನ್ನಡದಲ್ಲಿ ವ್ಯವಹರಿಸುವುದು ಸುಮಾರಾಗಿ ಹಾಗೆಯೇ. ಮಾಹಿತಿಯ ಸಂಗ್ರಹಣೆಗೆ ಒಂದು ಸಂಕೇತ, ತೋರಿಸಲು ಇನ್ನೊಂದು ಸಂಕೇತ. ಮಾಹಿತಿಯ ಸಂಗ್ರಹಣೆಗೆ ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೆ ಬಳಸುತ್ತಿರುವುದು ಇಸ್ಕಿಯನ್ನು (ISCII = Indian Script Code for Information Interchange). ಇಸ್ಕಿಯು ಆಸ್ಕಿಯನ್ನು (ASCII = American Standards Code for Information Interchange) ಆಧರಿಸಿದೆ. ಇವುಗಳನ್ನು ಸ್ವಲ್ಪ ವಿಮರ್ಶಿಸೋಣ.

ಆಸ್ಕಿ ಮತ್ತು ಇಸ್ಕಿ
ಆಸ್ಕಿ 8 ಬಿಟ್‌ಗಳನ್ನು ಹೊಂದಿದೆ. ಗಣಕದಲ್ಲಿ ಮಾಹಿತಿಯ ಒಂದು ತುಣಕೇ ಬಿಟ್ (bit = binary digit). ವಿದ್ಯುತ್ತಿಗೆ ಎರಡೇ ಸಾಧ್ಯತೆಗಳಿರುವುದು -ಇದೆ ಅಥವಾ ಇಲ್ಲ. ವಿದ್ಯುತ್ ಇದೆ ಎಂದರೆ "ಒಂದು", ಇಲ್ಲ ಎಂದರೆ "ಸೊನ್ನೆ" ಎಂದು ತೆಗೆದುಕೊಂಡರೆ ಒಂದು ಬಿಟ್‌ನಲ್ಲಿ 0 ಅಥವಾ 1 ಅನ್ನು ಸೂಚಿಸಬಹದು. ಒಂದು ಅಕ್ಷರವನ್ನು ಶೇಖರಿಸಲು ಎರಡು ಬಿಟ್‌ಗಳನ್ನು ತೆಗೆದುಕೊಂಡರೆ ಒಟ್ಟು ನಾಲ್ಕು ಸಾಧ್ಯತೆಗಳಿವೆ -00, 01, 10 ಮತ್ತು 11 (ದ್ವಿಮಾನ). ಇವು ದಶಮಾನ ಪದ್ಧತಿಯಲ್ಲಿ 0, 1, 2, 3 ಆಗುತ್ತವೆ. ಆಸ್ಕಿ ಮತ್ತು ಇಸ್ಕಿಗಳು 8 ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುತ್ತವೆ. 8 ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುವ ಯಾವುದೇ ಸಂಕೇತೀಕರಣ ವಿಧಾನವು 256 (28 = 256) ಅಕ್ಷರಗಳನ್ನು ಮಾತ್ರವೇ ಹೊಂದಿರಬಲ್ಲುದು. ಕನ್ನಡ ಭಾಷೆಯಲ್ಲಿ 49 ಅಕ್ಷರಗಳಿವೆ. ಜೊತೆಗೆ ಸ್ವರ ಚಿಹ್ನೆಗಳಿವೆ. ಇಂಗ್ಲೀಷ್ ಭಾಷೆಯಲ್ಲಿ 26 (ಮತ್ತು 26) ಅಕ್ಷರಗಳಿವೆ. ಬರೆವಣಿಗೆಯ ಚಿಹ್ನೆ, ಅಂಕೆ, ಇತ್ಯಾದಿಗಳೆಲ್ಲ ಒಟ್ಟು ಸೇರಿದರೂ 256ಕ್ಕಿಂತ ಕಡಿಮೆಯೇ. ಹಾಗಿದ್ದಲ್ಲಿ 256 ಸಂಕೇತಗಳು ಸಾಕಲ್ಲವೇ? ಇಸ್ಕಿಯಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಸಂಗ್ರಹಿಸುವಾಗ ಇಂಗ್ಲೀಷ್ ಮತ್ತು ಒಂದು ಭಾರತೀಯ ಭಾಷೆಯನ್ನು ಬಳಸಬಹುದು. ಅಂದರೆ ಕನ್ನಡ, ಹಿಂದಿ, ತಮಿಳು, ತೆಲುಗು, ಹೀಗೆ ಹಲವು ಭಾಷೆಗಳನ್ನು ಒಂದೇ ಕಡತದಲ್ಲಿ ಸಂಗ್ರಹಿಸುವುದು ಅಸಾಧ್ಯ.

ಇಸ್ಕಿಯಲ್ಲಿ ಭಾರತದ ಎಲ್ಲ ಭಾಷೆಗಳಿಗೆ ಒಂದೇ ಸಂಕೇತ ನೀಡಲಾಗಿದೆ. ಅಂದರೆ ಕನ್ನಡದ "ಕ" ಮತ್ತು ಹಿಂದಿಯ "क" ಎರಡಕ್ಕೂ ಒಂದೇ ಸಂಕೇತ ಇದೆ. ಇದರಿಂದ ಕೆಲವೊಮ್ಮೆ ಲಾಭವೂ ಇದೆ. ಒಂದು ಟೆಲಿಫೋನ್ ಡೈರೆಕ್ಟರಿಯನ್ನು ಕನ್ನಡ ಮತ್ತು ಹಿಂದಿ ಭಾಷೆಯಲ್ಲಿ ತಯಾರಿಸಬೇಕಾದರೆ, ಕನ್ನಡದಲ್ಲಿ ಬೆರಳಚ್ಚು ಮಾಡಿ, ಇಸ್ಕಿಯಲ್ಲಿ ಶೇಖರಿಸಿ, ಅದನ್ನು ಹಿಂದಿಯ ಫಾಂಟ್‌ನ ಸಂಕೇತಗಳಿಗೆ ಪರಿವರ್ತಿಸಿದರೆ ಸಾಕು. ಆದರೆ ಸಮಸ್ಯೆ ಇರುವುದು ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯಲ್ಲಿ. ಕನ್ನಡ, ತೆಲುಗು, ಮರಾಠಿ, ಹಿಂದಿ, ಹೀಗೆ ಎಲ್ಲ ಭಾಷೆಗಳಿಗೂ ಒಂದೆ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಸೂತ್ರ ಕಲ್ಪಿಸಲಾಗಿದೆ. ಕನ್ನಡ ಮತ್ತು ಹಿಂದಿಯ ಸೂತ್ರ ಒಂದೇ ಆಗಿರಬೇಕಾಗಿಲ್ಲ. ಉದಾಹರಣೆಗೆ ಇಸ್ಕಿಯಲ್ಲಿರುವ ಅಕಾರಾದಿ ವಿಂಗಡಣೆ -"ಯ, ರ, ಲ, ಳ, ವ, ಶ, ಷ, ಸ, ಹ". ಕನ್ನಡದಲ್ಲಿ ಇದು "ಯ, ರ, ಲ, ವ, ಶ, ಷ, ಸ, ಹ, ಳ" ಆಗಬೇಕು.

ಯುನಿಕೋಡ್
ಪ್ರಪಂಚದ ಮಟ್ಟಿಗೆ ಹೇಳುವುದಾದರೆ ಭಾರತೀಯ ಭಾಷೆಗಳ ಜೊತೆ, ಚೀನಾ, ಜಪಾನ್, ಅರೇಬಿ, ಯುರೋಪಿನ ಭಾಷೆಗಳು, ಹೀಗೆ ನೂರಾರು ಭಾಷೆಗಳಿಗೆ ಸ್ಥಾನ ಕಲ್ಪಿಸಿ ಕೊಡಬೇಕಾಗುತ್ತದೆ. ಇದಕ್ಕೆಲ್ಲ ಮದ್ದೆಂದರೆ 8 ಬಿಟ್‌ಗಳ ಸಂಕೇತೀಕರಣದ ಬದಲಿಗೆ 16 ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುವುದು. 16 ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುವುದರಿಂದ ಸುಮಾರು 65,೦೦೦ ಮೂಲಾಕ್ಷರಗಳಿಗೆ ಜಾಗ ಮಾಡಿಕೊಟ್ಟಂತಾಗುತ್ತದೆ. ಇದು ಪ್ರಪಂಚದ ಬಹುತೇಕ ಭಾಷೆಗಳಿಗೆ ಸಾಕು. ಇದುವೇ ಯುನಿಕೋಡ್ (Unicode). ಯುನಿಕೋಡ್ ಎಂಬುದು uniform, universal, unique ಮತ್ತು code (ಸಂಕೇತ) ಎಂಬ ಪದಗಳನ್ನು ಸೂಚಿಸುತ್ತದೆ. ಪ್ರಪಂಚಕ್ಕೆಲ್ಲಾ ಒಂದೇ ಸಂಕೇತ ವಿಧಾನ ಇರತಕ್ಕದ್ದು. ಪ್ರಪಂಚದ ಪ್ರತಿ ಭಾಷೆಯ ಪ್ರತಿಯೊಂದು ಅಕ್ಷರಕ್ಕೂ ತನ್ನದೇ ಆದ ಪ್ರತ್ಯೇಕ ಸಂಕೇತ ಇರಬೇಕು. ಈ ಎಲ್ಲ ಬೇಕುಗಳಿಗೆ ಉತ್ತರವೇ ಯುನಿಕೋಡ್. ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಪ್ರತಿ ಭಾಷೆಗೂ ತನ್ನದೇ ಆದ ಸಂಕೇತಶ್ರೇಣಿ ಇದೆ. ಇದು ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೂ ಅನ್ವಯಿಸುತ್ತದೆ. ಯುನಿಕೋಡ್ ವಿಧಾನದಲ್ಲಿ ಮಾಹಿತಿ ಸಂಗ್ರಹಣೆ ಮಾಡಿದರೆ ಒಂದೇ ಕಡತದಲ್ಲಿ ಪ್ರಪಂಚದ ಎಲ್ಲ ಭಾಷೆಗಳಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಶೇಖರಣೆ ಮಾಡಲು ಸಾಧ್ಯ. ಗ್ರಂಥಾಲಯವೊಂದರಲ್ಲಿ ಭಾರತದ ಎಲ್ಲ ಭಾಷೆಯ ಪುಸ್ತಕಗಳಿದ್ದಲ್ಲಿ ಅವುಗಳ ವಿವರಗಳ ದತ್ತಸಂಚಯ (database) ತಯಾರಿಸಬೇಕಾದರೆ ಯುನಿಕೋಡ್ ವಿಧಾನದಿಂದ ಮಾತ್ರ ಸಾಧ್ಯ.

ಯುನಿಕೋಡ್ ಆಧಾರಿತ ತಂತ್ರಾಂಶಗಳಲ್ಲಿ ಬೆರಳಚ್ಚು ಮಾಡಿದ ಮಾಹಿತಿಯನ್ನು ನೇರವಾಗಿ ಮಾಹಿತಿ ಶೇಖರಣೆಯ ಸಂಕೇತವಾದ ಯುನಿಕೋಡ್‌ನಲ್ಲೇ ಸಂಗ್ರಹಿಸಿಡಲಾಗುತ್ತದೆ. ಅಂದರೆ ನುಡಿ, ಬರಹ, ಆಕೃತಿ, ಶ್ರೀಲಿಪಿ, ಸಿಡಾಕ್, ಇತ್ಯಾದಿ ತಂತ್ರಾಂಶಗಳಂತೆ ಅಕ್ಷರಶೈಲಿ (ಫಾಂಟ್) ಗಳ ಸಂಕೇತಗಳಲ್ಲಿ ಮಾಹಿತಿ ಸಂಗ್ರಹಣೆ ಅಲ್ಲ. ನಿಮ್ಮಲ್ಲಿ ಯುನಿಕೋಡ್ ಆಧಾರಿತ ಕನ್ನಡದ ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್ ಇರತಕ್ಕದ್ದು. ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ತಯಾರಿಸಿದ ಕಡತವನ್ನು ಬೇರೊಬ್ಬರಿಗೆ ಕಳುಹಿಸುವಾಗ ಕಡತದ ಜೊತೆ ನಿಮ್ಮ ಅಕ್ಷರಶೈಲಿಯನ್ನೂ ಕಳುಹಿಸುವ ಅಗತ್ಯವಿಲ್ಲ. ನಿಮ್ಮಲ್ಲಿರುವ ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್ ಮತ್ತು ನಿಮ್ಮ ಸ್ನೇಹಿತರಲ್ಲಿರುವ ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್ ಬೇರೆ ಬೇರೆ ಇರಬಹುದು. ಮಾಹಿತಿಯನ್ನು ಅಕ್ಷರಶೈಲಿಯ ಸಂಕೇತಗಳ ಬದಲಿಗೆ ಮೂಲ ಮಾಹಿತಿಯಾಗಿಯೇ ಕಳುಹಿಸುವುದರಿಂದ ಮಾಹಿತಿ ಸಂವಹನೆಯಲ್ಲಿ ಯಾವ ತೊಡಕೂ ಇಲ್ಲ.

ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಪ್ರತಿ ಭಾಷೆಗೂ ತನ್ನದೇ ಆದ ಸಂಕೇತಗಳಿರುವುದು ಮಾತ್ರವಲ್ಲ, ಪ್ರತಿ ಭಾಷೆಗೂ ತನ್ನದೇ ಆದ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಸೂತ್ರವೂ ಯುನಿಕೋಡ್‌ನಲ್ಲಿದೆ. ಇಸ್ಕಿಯಲ್ಲಿರುವ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಸಮಸ್ಯೆಗೆ ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಪರಿಹಾರಹವಿದೆ. ಯುನಿಕೋಡ್‌ನ ಹಳೆಯ ಆವೃತ್ತಿಯಲ್ಲಿ ಕನ್ನಡದ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಗೆ ಇಸ್ಕಿಯಲ್ಲಿನ ಸೂತ್ರವನ್ನೇ ಬಳಸಲಾಗಿತ್ತು. ಆದರೆ ಯುನಿಕೋಡ್‌ನ 4.0 ಆವೃತ್ತಿಯಲ್ಲಿ ಈ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲಾಗಿದೆ.

ಪ್ರಪಂಚದ ಖ್ಯಾತ ಗಣಕ ಕಂಪೆನಿಗಳು, ತಂತ್ರಾಂಶ ತಯಾರಕರು, ದೇಶಗಳು ಸೇರಿ ಆಗಿರುವ ಒಂದು ಸಂಸ್ಥೆ ಯುನಿಕೋಡ್ ಕನ್‌ಸೋರ್ಟಿಯಂ. ಭಾರತ ದೇಶವೂ ಇದರ ಸದಸ್ಯತ್ವ ಹೊಂದಿದೆ. ಯುನಿಕೋಡ್ ಒಂದು ಕಂಪೆನಿಯ ಸ್ವತ್ತಲ್ಲ. ಈಗ ಎಲ್ಲ ತಂತ್ರಾಂಶಗಳು ಯುನಿಕೋಡ್‌ನ್ನೇ ಬಳಸುತ್ತಿರುತ್ತವೆ.

ಮೈಕ್ರೋಸಾಫ್ಟ್‌ನವರ ವಿಂಡೋಸ್ ಎಕ್ಸ್‌ಪಿ, ಸರ್ವರ್ 2003 ಮತ್ತು ವಿಸ್ಟ ಕಾರ್ಯಾಚರಣ ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿ (operating system) ಕನ್ನಡದ ಯುನಿಕೋಡ್ ಸವಲತ್ತನ್ನು ನೀಡಲಾಗಿದೆ. ವಿಂಡೋಸ್ ಎಂಇ, 98, 95, ಇತ್ಯಾದಿಗಳಲ್ಲಿ ಯುನಿಕೋಡ್‌ನ ಸೌಲಭ್ಯ (ಸರಿಯಾಗಿ) ಇಲ್ಲವೆಂದೇ ಹೇಳಬಹುದು. ಕನ್ನಡ ಲಿನಕ್ಸ್‌ನಲ್ಲಿ ನೇರವಾಗಿ ಯುನಿಕೋಡ್‌ನ್ನೇ ಬಳಸಲಾಗಿದೆ. ಅಂದರೆ ವಿಂಡೋಸ್‌ನಲ್ಲಿ ಯುನಿಕೋಡ್ ವಿಧಾನದಲ್ಲಿ ಕಡತವೊಂದನ್ನು ತಯಾರಿಸಿದರೆ ಅದನ್ನು ಲಿನಕ್ಸ್‌ನಲ್ಲಿ ಯಾವ ತೊಂದರೆಯೂ ಇಲ್ಲದೆ ಓದಬಹುದು.

Read More on....

This site uses Unicode and Open Type fonts for Indic Languages. Powered by Microsoft SharePoint
©2017 Microsoft Corporation. All rights reserved.