Matnlarni tahrirlovchi dastur o‘zbek tili uchun nechog‘lik zarur?
Jahon tilshunosligida XX asrning 50-yillaridan til va matn muammolari bilan bog‘liq masalalarni kompyuter texnologiyalari yordamida hal qilish tadqiqi bilan nafaqat tilshunoslar, balki boshqa soha olimlari ham shug‘ullanib kelmoqda. Shunday bo‘lsa-da, mazkur masalalar har qanday matnni lisoniy o‘rganishning yangi-yangi imkoniyatlari til materialini axborot texnologiyalari dasturlari orqali tanlash va uni qayta ishlash jarayonini muayyan darajada tezlashtirish, katta hajmdagi matnlarni lingvistik tahlil qiluvchi texnologiyalar hamda axborotni qayta ishlovchi dasturlar va ularning lingvistik ta’minotlarining ishlab chiqilishiga zamin yaratmoqda.
O‘zbek tilshunosligi sohasida XXI asrning boshlarida kompyuterdan foydalanish natijasida yangi, zamonaviy yo‘nalish bo‘lmish kompyuter lingvistikasi yuzaga keldi. Kompyuter lingvistikasi kursining universitetlarda o‘quv jarayoniga joriy qilinishi bugungi globallashuv, optimallashuv va standartlashuv davrida tilning ijtimoiy ahamiyatiga e’tibor oshganligidan dalolat. Kompyuter lingvistikasida matnlarni tahrirlovchi va tahlil qiluvchi dasturlar, nutqiy sintezator, mashina tarjimasi, matnlarni referatlash, matn korpusi, matnlarni lingvostatistik tahlil qiluvchi kabi yo‘nalishlardagi tadqiqotlar tilshunoslikda katta hajmli lingvistik bazalarning yaratilishiga omil bo‘lib xizmat qiladi.
Kompyuter lingvistikasi an’anaviy tilshunoslikka tayanib ish ko‘radi. Uni amaliy jihatdan boyitadi. Ba’zi hollarda an’anaviy tilshunoslikni inkor etadi (ko‘p ma’nolilik, omonim so‘zlarni inkor qiladi). An’anaviy tilshunoslik tabiiy til qonuniyatlari asosida ishlaydi. Kompyuter lingvistikasi esa sun’iy til qonuniyatlariga bo‘ysunadi. Sun’iy til dasturlash tilidir (BASIC, PASCAL, C++ va hokazo). Tilshunoslik tarixida 1897-yili butun dunyo xalqlarini birlashtirish va hech bir davlat manfaatini ko‘zlamagan holda yagona muloqot vositasini vujudga keltirish maqsadida birinchi bo‘lib shifokor L.Zamengof tomonidan esperanto tili yaratilgan. Kompyuter lingvistikasida esperanto tilining ahamiyati shundaki, aniq lingvistik me’yorlarga asoslangan va ixcham grammatikaga ega ushbu til tabiiy tilni optimallashtirish va formallashtirishda qulay lingvistik dastur vazifasini o‘taydi.
Keyingi paytlarda jahon kompyuter lingvistikasida matnga avtomatik ishlov berishning ilmiy va amaliy natijasi ustida keng ko‘lamli ishlar olib borilmoqda. Jumladan, matnni avtomatik tushunish, mashina tarjimasi, matnni referatlash (gipermatnni asosiy mazmunni o‘zida saqlagan minimatn shakliga keltirish, ya’ni matn hajmini qisqartirish, uni qisqa bayonga aylantirish), tasniflash (mavzu, uslub va janr jihatidan yaqin matnlarni guruhlash), matnni tahrir va tahlil qilish, matnni generatsiyalash (bir nechta tabiiy tilga oid hujjatli matnlardan formula, texnik ishlanmalar, dasturiy tizimlarni yig‘ish), matndan ma’lumotni olish, og‘zaki nutqni aniqlash va sintez qilish kabi dolzarb masalalar kompyuter lingvistikasining mundarijasini egallagan.
Matnlarga ishlov berishning avtomatik tahrir yo‘nalishi XX asrning 60—70-yillarida shakllandi. U matn muharriri dasturlari bilan birga yangicha imkoniyatlar asosida rivojlanmoqda. Oddiy muharrirlardan farqi shundaki, unda avtomatik tarzda qisqa vaqt ichida katta hajmli matnlarni tez tekshirib, xatolarni samarali to‘g‘rilash imkoniyati mavjud. Avtomatik tahrirning pragmatik ahamiyati shundaki, u kelajakda taraqqiy etsa, yetarli ma’lumotlar bazasi yaratilsa va maxsus dasturlar ishlab chiqilsa, muharrir kasbi uchun ehtiyoj qolmaydi. Bu esa matn bilan ishlashni osonlashtiradi.
Lingvistik tahrir — turli ko‘rinishdagi (ilmiy, badiiy, publitsistik va rasmiy uslublardagi) matnlarning orfografik, grammatik, stilistik hamda mantiqiy qurilishini tekshirish demakdir.
Avtomatik imlo tekshirish imkoniyati ingliz tilidan Yevropa davlatlari tillariga qadar kengaytirildi. Garchi flektiv tillarni tahrir qiluvchi dasturning lingvistik ta’minoti va algoritmi agglyutinativ tabiatli tillar grammatikasiga mos kelmasa-da, keyinchalik bir qancha Osiyo tillari doirasida shunday sistemalar ishlab chiqildi. Jumladan, venger va fin tillaridagi matnlar imlosini tekshirish tizimini yaratish uchun lingvistik ta’minotning morfologiyasini qayta ishlashga to‘g‘ri kelgan.
Bugungi kunda Firefox 2.0 kabi veb-brauzerlar ko‘plab elektron sayt, blog va ijtimoiy tarmoq foydalanuvchilari yozadigan har qanday hajmdagi matnlarning imlosini tekshirish, tahrirlash imkoniyatiga ega. Mac OS X (Makintosh operatsion) sistemasi hozir boshqa barcha sistemalar uchun avtomatik orfografik tekshirish funksiyasiga ega bo‘lib, uni yanada takomillashtirish yo‘lidan bormoqda.
Ba’zi imlo tekshiruvchi dasturiy mahsulotlar muayyan sohalarga mo‘ljallangan. Asosiy maqsad soha doirasida yaratilgan lingvistik ta’minotdagi terminlar, etimologik lug‘atlar, qisqartma so‘zlar, maxsus belgilar asosida kompyuterga kiritilayotgan matnlarni sifatli tahrir va tahlil qilishdan iborat.
Bugun o‘zbek tilidagi matnlarni tahrir qilish inson mehnati bilan amalga oshirilmoqda. Bu esa o‘z navbatida matnlarni tahrirlashga ko‘p vaqt sarflanishi, iqtisodiy xarajatlarning oshishi, inson tomonidan yo‘l qo‘yiladigan xatoliklarga sabab bo‘moqda. Shu bois o‘zbekcha matnlarni tahrir va tahlil qiluvchi dasturning lingvistik ta’minotini yaratish muhim ilmiy-amaliy ahamiyat kasb etadi.
Manzura ABJALOVA