ကျွန်တော် unicode ကို စစိတ်ဝင်စားလာခဲ့တဲ့အကြောင်း

ဒီလောက်ထိ စာအများကြီး တခါမှမရေးဖူးပါဘူး။
ကျွန်တော် အရင်ကတည်းက ရှင်းပြချင်နေတာလေးတွေမို့ ဒီတခါတော့ ကြိုးစားပြီး ရေးထားတယ်။
unicode သမားတွေကို ကျွန်တော် ရန်လုပ်ခဲ့တာတွေဆဲခဲ့တာတွေလည်း ပါပါတယ်။ စိတ်ဝင်စားဖို့ ကောင်းမှာပါ။
စပြောရရင် လွန်ခဲ့တဲ့ တနှစ်ခွဲလောက်က ဗိုက်ခဏခဏ အောင့်တာနဲ့ ဘာ ဆေးမီးတိုသုံးရမလဲ google ကနေရှာတာက စတာပဲ။
ဆေးမီးတိုကို အင်္ဂလိပ်လို ဘယ်လို ခေါ်မှန်း ကျွန်တော် မသိခဲ့ဘူး။
ဒါနဲ့ home cure chest pain ဆိုပြီးရှာတယ်။ home remedies ဆိုတာတွေအများကြီးကျလာတယ်။
home cure လို့ရှာတာနဲ့ google က home remedies ကိုလိုချင်နေမှန်း ဘယ်လိုလုပ် သိတာပါလိမ့်။
သေချာတယ် google က အင်္ဂလိပ်စာ နားလည်လို့ပဲ။
ဒီလိုပုံစံတူ အင်္ဂလိပ်စာကိုသုံးပြီး google မှာလွယ်လွယ်ရှာလို့ရမှန်း အများသိပြီးဖြစ်မှာပါ။
ဟုတ်ပြီ home remedies ဆိုတာတော့ တွေ့ပြီ။
အင်္ဂလိပ်လို ဟိုအပင် ဒီအပင် ရေးထားတာတွေလည်း ကျွန်တော်မသိပြန်ဘူး။
ဘာပင်တွေမှန်းလည်း မသိဘူး။ သူတို့ပြောထားတဲ့အပင်တွေကို စကားလုံးလေး copy ကူး။
ပုံအနေနဲ့ပြန်ရှာကြည့်တယ်။ ပုံမြင်ရတောင် ဘာမှန်းမသဲကွဲပြန်ဘူး။
ဒီတော့ မြန်မာ လိုလေး ရှာလို့ရရင် ပိုမကောင်းဘူးလားဗျာ။
အယ်... မြန်မာလိုရှာတော့ ဒီလောက်မလွယ်တော့ဘူးဗျာ။
online မှာ မြန်မာ data နည်းနေသေးတာရယ်။
google က မြန်မာစကားကို အရမ်းကြီးနားမလည်သေးတာရယ်။
( အရမ်းကြီးနားမလည်သေးတယ်ဆိုတာ အနည်းအကျဉ်းနားလည်နေပြီထင်လို့။ ထင်တာကို ပြောတာနော်။ ဟုတ်မဟုတ် သေချာမသိဘူး )
ကြားဖြတ်ပြောပါရစေ။
"ရှာလို့မလွယ်တော့ ဘာဖြစ်လဲ။ အင်္ဂလိပ်လိုပဲရှာမှာပေါ့"
ဒါဆို အင်္ဂလိပ်စာ မတတ်တဲ့သူတွေအတွက် ကျတော့ရော။
"မတတ် မရှာနဲ့ပေါ့ကွာ။"
လစ်လိုက်တော့။ ခင်ဗျား ဆက်မဖတ်နဲ့တော့။
အိုကေ ခုန ဆေးမီးတို ရှာတဲ့အကြောင်း ပြန်ဆက်ကြရအောင်။
ဒီလို ဘာ ဆေးမီးတို သုံးရမလဲဆိုတာ ရှာချင်တဲ့သူတွေအတွက် လွယ်ကူလာအောင် website လေးတခုထောင်ချင် စိတ်ဖြစ်လာတယ်။
ပထမအဆင့်အနေနဲ့ data ထည့်ပေးမယ့်သူတွေနဲ့ ဘယ်လိုပူးပေါင်းရမလဲ မစဉ်းစားသေးဘူး။
data တွေရှိပြီထား user က ကိုယ်လိုချင်တာ လာရှာတော့ လွယ်မှာလား စဉ်းစားတယ်။
မလွယ်ဘူး သေချာတယ်။ ဘာလို့မလွယ်လဲဆိုတော့
ဥပမာ။ post ရေးတဲ့သူက "ဗိုက်နာ" လို့ရေးမယ်။ ရှာတဲ့လူက "ဗိုက်အောင့်" လို့ရှာမယ်။ ဒါဆို မတွေ့တော့ဘူး။
ဘာလို့ဆို "ဗိုက်နာ" နဲ့ "ဗိုက်အောင့်" နဲ့ဆင်မှန်း ကွန်ပျူတာက မသိလို့။
ဒါ ဥပမာပဲရှိပါသေးတယ်။ မြန်မာစကားက အရမ်းရှုပ်ထွေးပါတယ်။
ဒါဆို ရှာရလွယ်အောင်ဘယ်လိုလုပ်မလဲ စဉ်းစားတယ်။
အဲဒီမှာ လူတွေသုံးတဲ့ ဘာသာစကားကို ကွန်ပျူတာ နားလည်အောင် လုပ်တဲ့ field ကို Natural Language Processing ဆိုပြီး စသိတယ်။
ဒီဟာအဆင်ပြေရင် ကျွန်တော်တို့ဖြစ်နေတဲ့ပြဿနာ အဆင်ပြေပြီ။
NLP အဆင်ပြေသွားရင် ဆေးမီးတို website တင်မဟုတ်ပါဘူး။
မြန်မာတွေအားလုံးအတွက် အသုံးဝင်နိုင်မယ့် ကျန်တဲ့ website တွေပါ အဆင်ပြေပြီ။
website ဆိုတာ မနီးမဝေးမှာရှိတဲ့ platform တခုကို ပြောတာ။
Natural Language Processing ကိုသုံးပြီး ဒီ့ထက်မကဆက်သွားလို့ရတယ်။
Voice Recognition နဲ့ပေါင်းပြီး ဘယ်သူ့ဆီဖုန်းခေါ်လိုက်။ ဘယ်သူ့ဆီ ဘာ message ပို့လိုက် စသဖြင့်လုပ်လို့ရလာမယ်။
ဒီ့ထက်မြင့်လာရင် smart home အိမ်မှာ တပ်ဆင်ပြီး ဘယ်အခန်းမီးတွေပိတ်။ ရေတင်ထားလိုက်။ အစရှိတာတွေလုပ်လို့ရလာမယ်။
ဒီ့ထက်မြင့်လာရင် ကားမှာ AI တပ်ပြီး။ မန္တလေးသို့ မောင်းပါ။ ရန်ကုန်သို့မောင်းပါ။ auto မောင်းခိုင်းလို့ရမယ်။
နောက်တကယ့်လူလို စကားပြောနိူင်တဲ့ domestic robots တွေပေါ်လာမယ်.
ပါးစပ်နဲ့တင်ပြောခိုင်းရုံပဲ။ ဘယ်လောက် ဇိမ်ကျလဲ။
အင်း အဲဒီတော့ Natural Language Processing ဆိုတာကြီးက အသုံးဝင်တာတော့ မှန်ပြီ။
အဲဒါကြီးရအောင် ဘယ်လိုလုပ်မလဲ။
အဲဒါမှ ပြဿနာပဲ။ ဒီ field က ကိုယ်နဲ့ အဝေးကြီးပဲ။
အဲအချိန်က basic algorithm တွေတောင် ကောင်းကောင်းနားမလည်တာ။
အဲဒါကို လေ့လာဖို့ ကျွန်တော့်အတွက် ဘယ်လိုမှမဖြစ်နိုင်ဘူး။
အချိန်တွေအများကြီးပေးရလိမ့်မယ်။
ဒီ field ထဲမှာ ပါဝင်နိုင်ဖို့ အနည်းဆုံး ၁၀ နှစ်လောက်တော့ လေ့လာရမယ်ထင်တယ်။
လေ့လာရမယ့်အချိန်ကိုပဲ ပြောတာနော်။ ဖန်တီးတဲ့အချိန်မပါသေးဘူး။
ဒီတော့ လုပ်နိုင်တဲ့သူတွေလိုက်ကြည့်တယ်။
အဲမှာ Unicode Zawgyi ပြဿနာကို စတွေ့တာပါပဲ။
Zawgyi နဲ့ရေးတာကို Natural Language Processing လုပ်လို့မရဖူးလား စဉ်းစားတယ်။
ဖြစ်နိုင်မှာပါ။ ထင်တာပဲ။ ဒါပေမဲ့ Zawgyi နဲ့လုပ်လိုက်ရင် တိုင်းရင်းသား စာလုံးတွေမပါတော့ဘူး။
တိုင်းရင်းသားတွေကို ပြစ်ပယ်လွန်းရာကျသွားပြီ။
နဂိုကတည်းကမှ ဗမာတွေက တိုင်းရင်းသားတွေကို လူရာမသွင်းဘူးဆိုပြီး ထင်နေကြတာ။
နောက်တချက်က Zawgyi နဲ့လုပ်ထားတာကို standard မဟုတ်လို့ဆိုပြီး ဘယ် company မှယူသုံးမှာမဟုတ်ဘူး။
Standard မဟုတ်တော့ဘာဖြစ်လို့လဲ performance optimized မဖြစ်နိုင်ဘူး။
အလွယ်ပြောရရင် သူတို့ software တွေ platform တွေမှာ မမြန်ဘူးဆိုပါတော့။
အဲအခါကျ လုပ်သမျှအကုန် သဲထဲ ရေသွန်ပဲ။
နောက်တချက်က မြန်မာစာက နဂိုကတည်းက အရမ်းရှုပ်ထွေးနေပြီးသားပါ။
standard မဟုတ်တာနဲ့ဆို standard ထက်အများကြီးပိုခက်လိမ့်မယ်။
standard ဆိုတာလည်း ဒါတွေအတွက် လွယ်အောင် standard သတ်မှတ်ပေးထားတာ။
ရေရှည်ကောင်းအောင် foundation ချပေးထားတယ်ဆိုပါတော့။
ဒီတော့ နောက်တမျိုးစဉ်းစားတယ်။
Unicode code point တွေကို Zawgyi နဲ့ခပ်ဆင်ဆင်ဖြစ်အောင် ပြင်ပေးလို့မရဘူးလား။
အဲမှာ ကျွန်တော် Unicode သမားတွေကို လိုက်ဆဲတော့တာပဲ။
standard ဆိုတာကြီးက ပြင်လို့မရဘူးလား။ Standard ဆိုတာ လူတွေသတ်မှတ်တာပဲမလား။
လူသုံးများနေတဲ့ဟာနဲ့ တပုံစံတည်းမတူတောင် ခပ်ဆင်ဆင်ဖြစ်အောင် ပြင်မရဘူးလား။
ဘာလို့ လူသုံးမများတာကြီးကိုပဲ လိုက်သုံးခိုင်းနေရတာလဲ။ လိုက်ရန်လုပ်တယ်။
Unicode က Zawgyi ကို အကုန်လုံး မဖတ်နိုင်တောင် အနည်းအကျဉ်းတော့ဖတ်နိုင်ရမယ်။
ခင်ဗျားတို့မပြင်လည်း ကျွန်တော်ဘာသာ ပြင်မယ်။
Unicode Consortium ကို submit လုပ်မယ်ဆိုပြီး ကိုယ့်စိတ်ထဲတင်ကိုယ် ကြိမ်းဝါးနေတယ်။
ကြိမ်းတာ ကြိမ်းဝါးတာ အဲဒါနဲ့ပတ်သက်ပြီး ဘာမှမလေ့လာဖြစ်ခဲ့ပါဘူး။
Unicode သမားတွေကိုပဲ ဆဲမြဲ လိုက်ဆဲနေခဲ့တာ။
ကျွန်တော် ဘယ်လိုတွေဆဲခဲ့တယ်။ ဘာတွေပြောခဲ့တယ် ဆိုတာ MUA ကလူတွေတော်တော်များများသိကြပါတယ်။
အဲလိုတွေပြောရင်းကနေ ကျွန်တော် ဆဲနေ ပြောနေတာကို ကိုဆန်းလင်းနိုင် နဲ့ ကိုရဲဇာနည်အောင်က တွေ့ပြီး ဘာကြောင့်ပြင်မရတယ်ဆိုတာ ရှင်းပြတယ်။
သူတို့နှစ်ယောက်ကပဲ ကျွန်တော့ကို ဝိရာမဆိုတာလေး ကို စပြီး မိတ်ဆက်ပေးလိုက်တယ်။
အဲမှာ သဘောပေါက်သွားပြီ။ Zawgyi ကဘယ်လိုမှ Standard ဖြစ်မလာနိုင်သလို။
Unicode ကလည်း Zawgyi နဲ့ဆင်အောင် ပြင်လို့မဖြစ်နိုင်ဘူး
ဘာကြောင့် ဘာလို့ မရတယ်ဆိုတာ MUA ကလူတွေရေးထားတဲ့ post တွေအများကြီးရှိလို့ ကျွန်တော်မရေးတော့ပါဘူး။
ဖတ်ချင်တယ်ဆိုရင် ကျွန်တော် link ပြန်ရှာပေးပါ့မယ်။
ဒါက ကျွန်တော့် unicode ဘက်ကို ပြောင်းချင်လာရတဲ့အကြောင်း။
အများပြောနေကြတဲ့ unicode သမားတွေ ကြီးကျယ်တယ် စမာန်တက်တယ်။
ဟုတ်ချင်လည်း ဟုတ်မှာပါ။ အကုန်လုံးတော့မဟုတ်ပါဘူး။
ကျွန်တော်မြင်နေတဲ့ MUA ထဲကလူတွေ ကျွန်တော့် မိတ်တွေတွေကတော့ အဲလိုမဟုတ်တာသေချာပါတယ်ဗျာ။
သူတို့တွေလည်း သာမာန် user တွေပါ။
နောက်ပြီး သာမာန် လူသားတွေပဲ ဖြစ်တဲ့အတွက် တခါတလေ ဒေါသအလျောက်ပြောမိတာတွေလည်း ရှိမှာပါ။
ငါ စံစနစ် လိုက်နာသူကြီး။ ငါကွ ဆိုပြီး ကြီးကျယ်နေကြတာတော့ မဟုတ်ပါဘူး
ဟုတ်တယ်ပဲထားပါဦးဗျာ။
သူတို့ စမာန်တက်တာ မတက်တာ တကယ်အရေးမကြီးတဲ့ ကိစ္စပါ။
ကျွန်တော် သူတို့ကို ဆဲနေတဲ့အချိန်တုန်းကလဲ သူတို့ကို အလကားနေရင်း စမာန်တက်နေတဲ့သူတွေလို့မြင်ခဲ့တာပါပဲ။
ဒါပေမဲ့ ကျွန်တော့် စိတ်ထဲမှာ NLP ရဖို့ပိုအရေးကြီးနေခဲ့တယ်။
ဒါကြောင့်ပြောင်းဖြစ်လာခဲ့တယ်။
နှစ်ခုစလုံးသုံးနေတယ်ဆိုပိုမှန်ပါတယ်။
အော်။ ဘာကြောင့် နှစ်ခုလုံးသုံးလဲ ဆို ကျွန်တော်တို့အနေနဲ့ ပေါင်းကူးလိုအပ်ပါတယ်။ အခုဆို Zawgyi  80% Unicode 100% ရောမြင်ရတဲ့ ZawDecode ဆိုတဲ့ font ရှိနေပါပြီ။ ကျွန်တော်လည်း ဒီ font ကိုပဲသုံးပါတယ်။ Keyboard ကတော့ KeyMagic, Zawgyi Keyboard နဲ့ English Keyboard သုံးမျိုးသုံးပါတယ်. ZawDecode ကို ဒီမှာဒေါင်းလို့ရပါတယ်.
http://guides.mmunicode.org/index.php/File:ZawDecode1.1_for_Windows01.ttf
အခက်အခဲတစုံတရာရှိရင် ကျွန်တော်တို့ကို မေးပါ. ကူညီဖို့ အဆင်သင့်ရှိပါတယ်။
နောက်ဆုံးပြောချင်တာက လူအများပြောနေကြတဲ့အချက်ပါ။
“Unicode သမားတွေက ကိုယ့်ပစ္စည်းကို လူသုံးများလာအောင် customer တွေကြိုက်အောင် လုပ်ရမယ်ဆိုတဲ့၊
customer တွေကို support တွေပေးရမယ်" ဆိုတဲ့အချက်ပါ။
တကယ်က
“Unicode ကို ပိုင်တဲ့လူမရှိသလို unicode customer ဆိုတာလည်း မရှိပါဘူး။
Unicode ကအများပိုင်ပါ။ Unicode user ဆိုတာပဲရှိပါတယ်။"
ကျေးဇူးတင်ပါတယ်။
Written by Aung Thiha

Comments

Popular posts from this blog

Oppo ဖုန်းများတွင် Unicode ပြောင်းပုံ

Typing Tutor For Myanmar Unicode

ပြည်ထောင်စု font