O‘zbek tilining milliy korpusi yaratiladi
O‘zbek tili turkiy tillar oilasiga mansub eng yirik tillardan biri bo‘lib, dunyo bo‘yicha 50 millionga yaqin kishi shu tilda so‘zlashadi. Keyingi yillarda davlat tilining xalqaro miqyosdagi o‘rni va nufuzi, boshqa tillar bilan aloqalari istiqbolini belgilash, o‘zbek tilining milliy korpusini yaratish, xorijda istiqomat qiluvchi vatandoshlar va o‘zbek tilini o‘rganish istagida bo‘lgan chet el fuqarolari uchun o‘zbek tili darsliklari, elektron dasturlarni ishlab chiqish va o‘zbek tilini o‘rgatish bo‘yicha amaliy ishlar qilinmoqda.
“2020-2030 yillarda o‘zbek tilini rivojlantirish va til siyosatini takomillashtirish konsepsiyasi”da davlat tilining zamonaviy axborot texnologiyalari va kommunikatsiyalariga faol integratsiyalashuvini ta’minlash ustuvor yo‘nalish sifatida belgilangan. Konsepsiyada o‘zbek tiliga oid barcha ilmiy, nazariy va amaliy ma’lumotlarni o‘zida jamlagan elektron ko‘rinishdagi o‘zbek tili milliy korpusini yaratish va uni jahon axborot tarmog‘ida ommalashtirish vazifalarining ko‘rsatib berilishi biz, mutaxassislarga katta mas’uliyat yukladi.
Zamonaviy axborot texnologiyalari tilning funksional imkoniyatlaridan foydalanish borasida benihoya imkoniyatlar eshigini ochdi. Kompyuter tarjimasi, avtomatik tahrir va tahlil, yozma matnni ovozlashtiruvchi nutq sintezatorlari, og‘zaki nutqni yozma matnga aylantiruvchi nutqni tanish dasturlari, elektron lug‘atlar, lingvistik mobil ilovalar, tezauruslar va til ontologiyasi fikrimizning dalilidir. Ayniqsa, zamonaviy elektron lug‘atlar tuzish va undan foydalanish madaniyatini shakllantirish til imkoniyatini egallashda samarador ekanligi o‘z isbotini topgan. Xususan, tilning imkoniyatini namoyon qilish va egallash borasida dunyo miqyosida tez sur’atlarda yaratilayotgan til korpuslarining roli beqiyos.
Bu borada “O‘zbek tilining milliy korpusini loyihalash va dasturiy majmua ishlab chiqish” mavzusida 9 nafar ilmiy va texnik xodimlarimiz bilan birgalikda amaliy ishlarni boshladik.
Dastavval, mavjud xorijiy milliy korpuslarni tahlil qilish, o‘zbek tili milliy korpusini yaratish tamoyillarini aniqlash, dasturiy ta’minot talablarini shakllantirish, loyihalash, dasturiy ta’minot uchun algoritmlarni ishlab chiqish, sinovdan o‘tkazish va tasdiqlash kabi loyihamizning asosiy vazifalarini belgilab oldik.
Ushbu amaliy tadqiqot davomida ayni paytga qadar mavjud xorijiy milliy korpuslarni tahlil qilish asosida o‘zbek tili milliy korpusi modeli yaratildi. Matnlarni avtomatik qayta ishlash, tokenlash, lemmalash va grammatik razmetkalash modellari va algoritmlari ishlab chiqildi. Internet orqali o‘zbek tili milliy korpusidan foydalanish uchun uzbekcorpora.uz veb-sayti ishga tushirildi.
Tadqiqotning asosiy natijasi o‘zbek tili milliy korpusini yaratish uchun ishlab chiqilgan dasturiy majmuadan iborat bo‘ladi. Ushbu dasturiy majmua korpus lingvistikasi mutaxassislariga mo‘ljallangan bo‘lib, zamonaviy internet texnologiyalari asosida o‘zbek tilining tanlangan matnlar jamlanmasi bo‘yicha mualliflik yoki tematik korpuslar hamda o‘zbek milliy korpusini yaratishga imkoniyat beradi. Dasturiy ta’minot “Alpomish” dostoni matnlari asosida korpus yaratish yo‘li bilan sinovdan o‘tkazilgan va foydalanishga tayyor holatga keltirilgan.
Ushbu yo‘nalishda olib borilayotgan amaliy ishlar samarasida xorijiy va mahalliy jurnallarda 10 ga yaqin, anjumanlarda 24 ta maqola e’lon qilinib, 5 ta dasturiy guvohnoma olindi. Amaliy tadqiqot ishlarining kelgusi bosqichlarida o‘zbek tilining tanlangan matnlar jamlanmasi bo‘yicha korpus shakllantiriladi va korpusga kiritilgan matnlar ustida turli ilmiy tadqiqotlar o‘tkazishga imkoniyat beradigan dasturlar yaratiladi.
Suyun KARIMOV,
filologiya fanlari doktori, Sharof Rashidov nomidagi SamDU professori.