Ўзбек тилининг миллий корпуси
Миллий корпус миллий тил хазинаси демакдир. Ундан лингвист, лексикограф, компьютер лингвистлари, дастурчи, муҳаррир, таржимон, журналист, ноширлар, олим, ўқитувчи, таълим олувчилар ва бошқа ҳар қандай соҳа мутахассиси кенг фойдаланади.
Фойдаланишда деярли касбий табақаланишга йўл қўймайдиган тил корпуслари барча соҳа вакилларини бирдай қизиқтириши табиий. Айниқса, она тили ва чет тилларни ўқитиш ҳамда ўрганиш борасида корпусларнинг ўрни беқиёс. Бугун дунё миқёсида тил ўргатиш тизими корпусларга йўналтирилаётгани ҳам фикримиз далилидир. Шунинг учун таълим, шева матнлари, поэтик матнлар, оғзаки, илмий, расмий матнлар корпуслари каби қатор микрокорпусларнинг тузилаётгани эътиборга молик. Бироқ ўзбек тили корпусини яратиш ишлари ҳануз ортга сурилмоқда.
Талаб ва эҳтиёж
Тил маънавий меросимизни асраш ва бойитишнинг асосий воситаси ҳисобланади. Тилларни сақлаб қолиш миллий маънавиятни сақлаб қолиш демакдир. Зеро, асл маънавият фақат миллий шакл¬дагина мавжуд бўлади.
ЮНЕСКО ҳисоб-китобига кўра, бугунги кунда мавжуд 6 мингтача тилнинг қарийб ярми яқин вақтда ўзининг охирги соҳибларидан ҳам ажралиши мумкин. Ўлик тилга айланаётган бу тилларни сақлаб қолиш инсоният олдидаги энг ўткир муаммолардандир.
1999 йил 17 ноябрда ЮНЕСКО Бош анжумани эълон қилган Халқаро она тили куни 2000 йилнинг февралидан бошлаб ҳар йили лисоний ва маданий тараққиёт ҳамда кўп тиллиликни таъминлашга кўмаклашиш мақсадида нишонлаб келинади. БМТ Бош ассамблеяси ўз резолюциясида 2008 йилни Халқаро тиллар йили деб эълон қилди.
Мамлакатимизда тилга эътибор маънавиятга эътиборнинг устувор йўналишларидан бири даражасига кўтарилди. Шу боис она тилимизни авайлаб-асраш, бойитиш, ундан амалий фойдаланиш самарадорлигини ошириш билан бирга, ўзбек тилининг замонавий ахборот-коммуникация тизимида кенг қўлланишига эришиш кечиктириб бўлмайдиган, долзарб вазифага айланди. Чунки она тилимизнинг жаҳонга чиқишига эришиш миллий маънавиятни такомиллаштириш ва юксалтиришнинг асосий йўлларидандир.
Замонавий ахборот технологиялари тилнинг функционал имкониятларидан фойдаланиш борасида бениҳоя кенг қулайликлар эшигини очди. Компьютер таржимаси, таҳрири, таҳлили, электрон луғатлар ва тезаурус(тил хазинаси)лар фикримиз тасдиғидир. Айниқса, замонавий электрон луғатлар тузиш ва улардан фойдаланиш маданиятини шакллантириш тил имкониятини кенгайтиришда муҳим аҳамиятга эга.
Корпус нима?
Корпус — тил бирликларининг хусусиятларини аниқлаш мақсадида қидирув дастурига бўйсундирилган матнлар мажмуи, табиий тилдаги электрон шаклда сақланадиган ёзма ёки оғзаки, компьютерлаштирилган қидирув тизимига дастурий таъминот асосида жойлаштирилган on-line ёки off-line тизимда ишлайдиган матнлар жамланмаси. Тил корпуслари — тил бўйича тадқиқот ва амалий топшириқлар ечими учун инкор этиб бўлмас иш қуроли. У оддий электрон кутубхонадан фарқланади. Электрон кутубхонанинг мақсади — халқнинг ижтимоий-сиёсий, маънавий, иқтисодий ҳаётини акс эттирувчи бадиий ва публицистик асарларни нисбатан тўлиқ қамраб олиш. Электрон кутубхона матнлари тил нуқтаи назаридан ишлов берилмаганлиги сабабли тадқиқотлар учун ноқулайлик туғдиради. Чунки электрон кутубхона илмий тадқиқот материали базасини тайёрлаш мақсадида тузилмайди, балки миллий маънавий меросни жамлашни мақсад қилган бўлади. Тил корпуси эса электрон кутубхонадан фарқли ўлароқ, тилни ўрганиш ва тад¬қиқ қилиш учун зарур, фойдали ва қизиқарли матнларни тўплашни назарда тутади. Корпусни электрон кутубхонадан ажратиб турувчи биринчи омил ундаги матннинг хусусияти ва қўшимча маълумот билан бойитилгани ҳисобланади ҳамда бу белги корпуснинг алоҳида қисми — корпус бирликларига ёзилган изоҳни ташкил этади. Фойдаланувчига бирор сўз керак бўлса, буни одатий матн муҳаррири ҳам топиб беради. Лекин матндаги тил ҳодисасининг маъноси, мазмуни ва тузилишини «тушунадиган» дастурий тизим билан ишлаш жуда афзал ва қулай. Тил бирлигини қидириш, керак бўлса, бундай дастурий таъминот, яъни корпус тадқиқотчи ёки фойдаланувчига жуда катта ёрдам бериши мумкин. Тадқиқотчи ўз иши учун мисоллар топиш, уларни картотекага (компьютер технологиялари ривожланишидан олдинги даврда) кўчиришга ойлаб, баъзан йиллаб вақт сарфлаган бўлса, бугун дунё тил корпуслари ёрдамида саноқли дақиқада юзлаб мисоллар топиш, улар устида ишлаш имконига эга бўлди. Махсус қидирув тизими корпусдан маълумот олишга мўлжалланган бир қанча дастурдан иборат. У статистик ахборот ва қидирув натижасини фойдаланувчига қулай шаклда тақдим эта олади. Тилда қандай жараён кечаётганини аниқ тасаввур қилиш учун корпус қамровини янада кенгайтириш, нафақат ёзма, балки оғзаки нутқ материалидан ҳам фойдаланиш мақсадга мувофиқ. Бундай корпус ёрдамида тараққиёт натижасида тилда содир бўлган ва кутилаётган ўзгариш ҳақида аниқ хулоса чиқариш мумкин.
Корпус бўйича қидирув фойдаланувчига қуйидагиларни аниқлаш имконини беради:
1) Белгиланган тил бирлигининг турли қўлланишлардаги барча шаклли кўринишини;
2) Тилнинг луғат таркибидаги ўрни ва вариантларини;
3) Белгиланган сўз билан бирикиш имкониятига эга сўзлар рўйхатини;
4) У ёки бу муаллифнинг айни сўздан фойдаланиш частотаси ёки статистикасини;
5) Сўзнинг ўз ва кўчма маъноларини;
6) Сўз қўлланишининг яширин модели(имконияти)ни;
7) Тил тараққиётининг турли даврида қўлланиш ҳолатини.
Таснифи
Корпуслар турли мақсадларда, турли соҳалар бўйича тузилиши мумкин. Дунё тиллари бўйича яратилган корпусларнинг таснифи қуйидаги жадвалда келтирилди:
Тасниф белгиси Корпус турлари
Нутқ турига кўра Оғзаки, ёзма, аралаш
Матн тилига кўра Русча, инглизча ва ҳоказо
Параллеллигига кўра Бир тилли, икки тилли, кўп тилли
Матннинг Бадиий, диалектал, суҳбат,
ихтисослашувига кўра терминологик, аралаш
Жанрига кўра Адабий, фольклор, драматик, публицистик
Кириш усулига кўра Эркин, пулли, ёпиқ
Мақсадига кўра Тадқиқий, тавсифий
Изоҳланишига кўра Қўшимча изоҳли, изоҳсиз
Ўзгарувчанлигига кўра Ўзгарувчан, турғун
Структурасига кўра Марказий, архив, маҳаллий
Изоҳ хусусиятига кўра Морфологик, синтактик, семантик
Матн ҳажмига кўра Тўлиқ матнли, лавҳа матнли
Хронологик
жиҳатига кўра Синхрон, диахрон
Умумийлигига кўра Умумий, якка муаллифли, соҳавий
Корпусни яратиш мақсади
Корпуснинг кенг кўламли бўлиши маълумотнинг ўзига хослигини кафолатлайди. Тил ҳодисаларининг барча қиррасини тўлиқ намойиш этишни таъминлайди. Турли типдаги маълумот тил корпусида қўлланиш шаклига кўра жойлашади. Бу эса уни ҳар томонлама ва холис ўрганиш учун асос бўлади. Бир марта тузилган ва тайёрланган ахборотлар массиви бир неча тадқиқотчи томонидан кўп марта, турли мақсадда ишлатилиши мумкин. Корпус — тилни тадқиқ этиш (тил бирлигининг ўзгариши, эскириши, янгиларининг пайдо бўлиши, маъносининг кенгайиши ва торайиши; янги ибораларнинг пайдо бўлишини кузатиш), ўрганиш, анъанавий ва замонавий луғатлар тузишда кенг имкониятли дастурлаштирилган тизим. Корпуссиз бугунги кун назарий ва амалий филологиясини тасаввур этиб бўлмайди.
Тилшуносликка оид тадқиқотда факт билан иш кўриладиган ҳолларда материал йиғилиши, системага солиниши лозим. Бундай катта ҳажмли ишни бажаришда корпус вақт ва меҳнатни тежайдиган иш қуроли вазифасини бажаради. У техник жараённи тезлаштирувчи воситагина эмас, муайян тил замонавий шаклининг ахборот тизими бўлиб, кутилмаган саволга ҳам жавоб бера оладиган, тил ҳодисаси билан шуғулланадиган, соҳа олдига аввал қўйилмаган долзарб муаммоларни қўя оладиган тизим.
Мавжуд корпуслар таркибидаги матнларнинг нисбатига қарасак, бадиий адабиёт ҳиссаси 40 фоизни ташкил этганига гувоҳ бўламиз. Унинг таркибига мемуар асарлар ҳам кириб кетадики, бу жанр тил хусусияти бадиий ва публицистик услуб оралиғида бўлиб, жонли тилни ўрганиш учун анча қулай. Европа тиллари корпусларида бадиий адабиёт материали 20 фоизни ташкил этади. Масалан, замонавий ёзувчилар тил хусусиятини ўрганишга бағишланган 20 дан ортиқ тадқиқот мавжуд бўлса-да, улар ҳали тўлалигича бу муаммони ўрганиб бўлди, дейиш қийин. Чунки алоҳида ёзувчи асарининг тил хусусиятидаги ўзгаришга ҳали тилдаги янги ҳодиса деб қараб бўлмайди. Ана шундай жараёнларни кузатиш ва тад¬қиқ этишнинг энг қулай воситаси — тил корпуси. Шу сабабли матннинг мазмуни катта аҳамият касб этади. Корпус таркибига кирадиган матнлар алоҳида бир муаллиф ёки бир неча ёзувчи асаридан олинган, маълум давр(бир неча ўн ёки юз йил)ни қамраб олган, белгиланган мавзудаги, тил ва жамиятнинг бугунги ҳолатини акс эттирувчи замонавий матнлардан иборат бўлиши ҳам мумкин.
Тузилиши ва таркиби
Мавжуд миллий корпусларни кузатиш асосида корпуснинг тузилиши ва таркибини ўрганар эканмиз, корпус интерфейси, қидирув тизими ва матнлар базаси унинг энг асосий таркибий қисми, деган хулосага келамиз. Рус тили миллий корпуси жойлашган www.ruscorpora.ru сайтининг биринчи саҳифасида корпус ва унинг тузувчилари ҳақида асосий маълумот, ўнг томондаги менюда исталган саҳифага ўтиш имконияти мавжуд. Бу корпус менюси тўрт қисмдан иборат. Бош саҳифа, сайтнинг қидирув ресурси, матн ҳақида унга бириктирилган қўшимча маълумот иловаси, корпус бирликларига изоҳ ёзиш принциплари, охирги блок корпус тузувчилари жамоаси, фойдаланилган дас¬тур, матнларнинг муаллифлик ҳуқуқи ҳақида тўлиқ маълумотлар базасидан иборат.
Албатта, корпуснинг тузилиши ва таркиби тилнинг хусусиятлари, ижтимоий талаб ва бошқа жиҳатларга кўра турлича бўлиши мумкин. Корпуслар учун ягона ва ўзгармас андоза белгиланмайди. Масалан, тузилажак ўзбек тили корпуслари жамиятимиз талабларидан келиб чиққан ҳолда ўзига хос бўлиши мумкин. Корпусдаги миллий сўзи нафақат тилнинг, балки корпус тузилиши ва таркибининг ҳам ўзига хослигини англатади.
Ижтимоий аҳамияти
Корпус катта ҳажмли луғатларни тузиш учун манба вазифасини ўтайди. Вақт ўтиши билан корпус турли лингвистик йўналишлар учун аҳамиятли бўлиши билан кучли информацион ресурсга айланди. Корпус асосида компьютер ёрдамида луғатлар аввалгига нисбатан тез тузилади ва қайта ишланади. Шу йўл билан иш бошланишидан тугаш жараёнигача (нашргача) тилни акс эттириб туради. Луғат мақоласи «эскириш»га улгурмайди. Тилнинг замонавий ҳолатини акс эттирувчи корпус турли давр¬ларда яшаб ижод этган ижодкорларнинг муаллифлик корпуслари учун асос бўлиб хизмат қилади.
Cўзнинг қўлланиш даври ва частотасини аниқлашда ҳеч қандай восита корпусга тенглаша олмайди. Корпус лингвистикасининг кейинги тараққиёт бос¬қичида статистик тадқиқ методи компьютер таржимаси, нутқни синтезлаш ва таниш, аниқлаш, орфографик текширув каби лингвистик амалларни бажаришда қўл кела бошлади. Рус ва Европа тилшунослигида тил бўйича ўтказиладиган барча тадқиқотларнинг корпусга асосланиши одатий ҳолга айланган ва ҳатто баъзи тадқиқотларда мажбурий ҳам саналади.
Яқин орада тил ўрганаётган ўқувчи ёки унинг бирор жиҳатини тадқиқ этаётган кишининг бугунги кунда луғатга бўлган эҳтиёжи корпусга кўчиши шуб¬ҳасиз.
Гап тузилишини ўрганишдаги аҳамияти тилнинг жонли қурилишини, сўзларнинг ўзаро бирикиш имкониятини таҳлил қилишда кўринади. Анъанавий тилшуносликдаги мисолни олишда бадиий асар тилига таяниш тажрибасидан кўра корпусга таяниш мисолнинг бугунги кун учун ҳам ишонарлилигини таъминлайди. Корпус таржима дастурларини яратишда катта аҳамиятга эга.
Услубиятни ўрганишда матннинг ўзига хослигини таҳлил этишда ҳам корпусга таяниш мумкин. Бу амалиётни бажаришда матнларнинг статистик ҳолати таҳлили (матндаги жумланинг узунлиги, бир сўзнинг бошқа сўз билан бирикиш ҳолатининг доимий ёки ноодатийлиги) аниқланади. Бундай усулда корпус ёрдамида ёзма нутқ билан бирга оғзаки нутқни ҳам ўрганиш мумкин. Масалан, расмий иш қоғозларида ҳужжат матнида шартнома бўйича талаблар шакли маъқулми ёки шарт¬нома талаблари конструкцияси тўғрими? Корпус бу саволга жавобан саноқли дақиқаларда қайси шакл кўпроқ қўлланишини аниқлаб беради. Шундай қидирув натижасида рус тили миллий корпусида шартнома бўйича талаблар конструкцияси 40 марта, шартнома талаблари шакли 3 марта қўллангани тўғрисида статистик маълумот берилади. Бу конс¬трукциянинг қўлланиши, албатта, рус тилига хос. Эҳтимол, у ўзбек тилида бошқача натижа берар. Корпусимиз бўлмагани туфайли бу саволга аниқ жавоб бера олмаймиз.
Корпус жуда муҳим бўлган ва фаол қўлланадиган соҳа — лингводидактика. У она тили ва хорижий тилни ўрганишда бирдек аҳамиятли. Тилни ўргатишда луғат бойлигини кўрсата олиш, сўзнинг қўлланиш имкониятини у ёки бу грамматик қурилиш орқали тушунтириш учун мисоллар келтиришда корпус жуда зарур. Тил таълими учун муҳим бўлган мисолнинг доимий янгиланиши, буни акс эттириш хусусияти ҳамда имконияти фақат корпусга хос. Ўқитувчи янги, ишонарли, чексиз ҳамда хилма-хил мисолларни шу ердан топа олади. Топшириқ ва машқларни белгилашда қийналмайди. Бир неча дақиқада мавзу бўйича янги мисоллардан иборат машқ тайёрлай олади. Корпусда мавжуд матнларни саралаш, мисолни барча матнлардан эмас, балки изланувчи учун қизиқарли ва керакли бўлганидан ажратиш мумкин. Ҳатто корпус матнларини белгиланган давр (ҳатто аниқ йилигача), матннинг аниқ бир тури(масалан, реклама матни, иш ҳужжати ёки шунчаки бир неча муаллиф асарлари)ни танлаб олиш имконияти мавжуд. Турли мавзу ва жанрдаги матнлар билан доимий бойитилиши — корпуснинг асосий хусусиятларидан бўлиб, таълимда йўналтириб ўқитиш имкониятини очади. Академик лицей ва коллежда она тили барча йўналиш ва мутахассисликларда ўқитилади. Йўналишлар мавзуси бир хил бўлиши мумкин, лекин ҳар бир мутахассисликда мавзуни тушунтириш учун мос матнни танлашда корпусда мавжуд имконият бирорта манбада йўқ. Аслида, академик лицей ва касб-ҳунар коллежлари давлат таълим стандартларида мақсад эгалланаётган мутахассислик бўйича ёзма ва оғзаки нутқни ривожлантириш экани белгиланган. Айни бир мавзу (масалан, сўзнинг шакл ва маъно муносабатига кўра тури, атамашунослик, топоним, қўлланиш доираси чегараланган лексика ва ҳоказо) турли йўналишда алоҳида, ихтисослаштирилган матнлар асосида ўрганилиши лозим. Шундагина тил таълими ўз мақсадига эришади.Тил таълимига оид дарслик ва қўлланмаларда иқтисод, молия, сиёсат, ҳуқуқшуносликка хос матнларга дуч келмаймиз, мисолни бадиий асардан олишга одатланганмиз. Ваҳоланки, адабий тил бадиий асар тили дегани эмас. Тил таълими ҳаётдан узилиб қолган. Кундалик турмушда ўқувчи тузадиган, ишлатадиган ёки таҳлил этадиган матнлардан узилиб, машқ ва топшириқни жонли тилдан олмасликка кўникиб қолганмиз.
Н.Р.Добрушина рус тили бўйича дарс¬лик ва қўлланмаларни таҳлил қиларкан, шундай ёзади: «Типик рус тили дарслигида машқдаги мисолларнинг 60 фоизи XIX аср, 20 фоизи XX аср бадиий адабиётига оид; 10 фоизи муаллиф томонидан тузилган; замонавий ОАВ материалидан эса битта ҳам мисол йўқ. Албатта, дарсликда мумтоз наср намунаси берилиши табиий, ижобий ҳолат. Бугунги кун ўқувчиси ўзи учун анча нотаниш бўлган бу матнни ўқишни унутмаслиги учун ҳам керак. Агар таълимнинг биз ўқитаётган шахсга аниқ қаратилиши ва таълим мақсадига эришишини, таълим ва ҳаёт ўртасида фав¬қулодда катта тафовут бўлмаслигини истасак, замонавий тил(ҳозирги адабий тил)га мурожаат этишимиз, дарс¬ликка фақат бадиий адабиёт эмас, балки кундалик турмуш тарзи ва ҳаёт билан боғлиқ матн намуналарини ҳам киритишимиз керак».
Ўқитувчи учун корпус — тенгсиз хазина. Масалан, у топшириқни тайёрлаш учун фақат бадиий адабиётдан (ёки бадиий бўлмаган матндан: спорт, автобиография ёки шунчаки маълум ижодкор асари билан чекланмоқчи) фойдаланмоқчи. Унда «Менинг корпусим» иловаси орқали ўзига керакли матнни ажратиб олиш имкони мавжуд, яъни мисоллар сирасини чегаралайди. Корпус турли жанр ва услубдаги матнларни қамраб олгани сабабли ҳар қандай талабни қондириш имконига эга. Мисол учун, журналистика факультети талабалари учун ёзилган дарсликда публицистик матнлар анча эскирган. Ҳар куни мунтазам бойитиладиган корпусдан янги мисоллар олиш, уларни талабага тақдим этиш ёки унга ҳам шундай топшириқ бериш, албатта, таълимни ҳаётга яқинлаштиради. Кўпинча қайта-қайта нашр этилган дарсликда мисоллар эскилигича қолиб кетади. Бугунги кун учун мавзу эскиради, талабалар билимни даврга ҳамоҳанг ўзлаштирмайди.
Бугун филолог ёки журналист бўлиб етишаётган мутахассисга тилимизнинг барча нозик қирраларини ҳис этиши учун фақат эски — 20–30 йил олдинги матн намунаси етарли эмас, у бугун ёзилган барча соҳа, услуб ва жанрдаги асарлар билан ишлаши лозим. Шундагина таълим ижтимоий буюртмани бажарган ҳисобланади.
Қайси фанлар, уларнинг айнан қайси бўлимида корпусдан қандай фойдаланиш мумкинлигини аниқ мисолларда кўриб ўтамиз.
Тил корпусидан ўқитувчи, талаба ва мактаб ўқувчиси ҳам анча унумли фойдаланиши мумкин. Чунки фақат корпус орқали жуда осонлик билан кам ишлатиладиган сўз, ибора ва бирикмани топиш, қўлланиши ва ёзилиши(орфографияси)ни ўрганиш мумкин. Таъкидлаш жоизки, тил корпусида тил грамматика ва дарслик муаллифи тавсифлаганидек эмас, балки жамиятда қандай яшаса ва ишласа, шундай акс этади. Бу эса ўқувчининг ўзини ўраб турган муҳит — умумхалқ тили ва адабий тилни ўрганишида энг сермаҳсул восита бўлиб хизмат қилади.
Инглиз, немис, француз, рус тилларини хорижий тил сифатида ўқитиш масаласи методикада алоҳида тадқиқ этилмоқда. Айнан тил ўргатишни мақсад қилувчи корпуслар ҳам мавжуд бўлиб, «Учебный корпус русского языка», «Learner corpus of English» шулар жумласидан. Хорижий тил вакиллари билан ишлаш жараёнида тил корпусининг аҳамияти бир неча марта ортади. Тадқиқ предмети она тили бўлмаган (иккинчи ёки хорижий тил ҳисобланган) ўқитувчи ва ўқувчи учун ҳам корпус жуда муҳим ва қулай восита. Ўрни келганда айтиш лозимки, илк рус тили корпуслари Россияда эмас, Европада рус тили тадқиқотчилари томонидан яратилган.
Тил корпусига энг кўп эҳтиёж сезувчи мутахассис бу — матнни автоматик қайта ишлаш (масалан, таржима дастури) ва турли қидирув тизимлари билан ишлайдиган дастурчи. Чунки у табиий тил билан иш кўради ҳамда ушбу тилда ёзилган барча матнлар структурасини (табиий ва жонли тилда, илмий грамматика ва дарсликлардаги мисолларга таяниб эмас!) мукаммалроқ «тушуниши», ҳис этиши лозим.
Тил корпусига эҳтиёж сезадиган мутахассислардан яна бири — кундалик иш жараёнида ёзма ва оғзаки нутқ жозибасига тез-тез мурожаат этувчилар: газета ва журнал муҳаррири, журналист, радио ва телевидение ходимлари. Чунки бу мутахассислар муайян сўз, ибора ёки гапнинг қўлланиш ҳолати, даражаси, ким, қачон илк марта бу гапни қўллагани, қандай услуб учун хосланишини билишга грамматика билан шуғулланувчи олимдан кўра кўпроқ эҳтиёж сезади. Корпусдан ташқари ҳеч қандай ахборот банки бу каби саволларга зудлик билан жавоб бериши мумкин эмас. Шунинг учун корпус лингвистикаси тадқиқотчилари корпуслар журналист, мухбир, муҳаррир, ўқитувчи ҳамда дастурчи учун махсус яратила бошланган, деган хулосага ҳам келишади. Биз бугунгача дарслик, илмий грамматика ва луғатга қандай таянган бўлсак, замонавий соҳа вакиллари корпусга шу қадар эҳтиёж сезишади, ундан фойдаланишади.
Жаҳон корпус лингвистикаси
Жаҳон тилларининг жуда кўпи мукаммаллик даражаси ва матнни илмий қайта ишлаш имконияти билан фарқ қилувчи ўз миллий корпусига эга. Инглиз тилида яратилган Браун корпуси, Ланкастер-Осло/Берген (ЛОБ) корпуси, Лондон-Лунд корпуси, Лексикографик тадқиқотлар учун Америка мерос корпуси, Ланкастер инглиз тили сўзлашув корпуси, диахроник корпус саналган Инглиз матн¬ларининг Хельсинки корпуси, лингводидактик тадқиқотлар учун Инглиз тили ўрганувчиларининг халқаро корпуси, инг¬лиз тилидаги корпусларнинг энг сўнгги авлоди сифатида Инглиз тили банки, Британия миллий корпуси, Халқаро инг¬лиз тили корпуси, Америка миллий корпуси каби машҳур корпусларнинг мавжудлиги миллий ва давлат тили тараққиётида миллий корпуснинг аҳамияти ва ўрни нечоғлик муҳимлигини кўрсатади. Дунё тили саналган инглиз, испан, хитой, араб, француз, рус, немис тилларининг миллий корпусидан ташқари, поляк, поляк-украин, чех, словак, серб, хорват, босния, болгар, болгар-рус, македон, шотланд, нидерланд, нидерланд-француз, швед, дат, норвег, исланд, фарер, ўрта аср француз тили, итальян, португал, румин, литва, латиш, грек, шарқий арман, осетин, албан, ҳинд, циган, хетт, фин, урал тиллари, эстон, вепс, венгер, удмурт, грузин, инглиз-грузин, лезгин, турк, татар, бошқирд, қрим-татар, қалмиқ, бур¬ят, мўғул, иврит, амхар, япон, қадимий япон, баман, эсперанто тиллари корпуслари мавжуд. Дунё компьютер лингвистикасида Миллий тил корпусининг мавжудлигига тилнинг яшовчанлик ва компьютер тилига айланиш мезони сифатида қаралмоқда.
Кечикаётган вазифа
Ўзбек тили дунёнинг ривожланган тиллари қаторида туради.
Афсуски, тилимизнинг ички имкониятлари ахборот технологиялари тизимида етарли даражада ишга солинмаяпти. Юртимизда ўзбек тили корпусларини яратиш ишларини қониқарли деб бўлмайди. Бу она тилимизнинг ахборот технологиялари тили сифатида, шунингдек, миллий корпус шаклида глобал корпуслар тўрига уланиб, жаҳонга чиқишига монелик қиляпти.
Бу соҳада олиб борилаётган илмий тадқиқот ишлари ўзбек корпус лингвистикасининг назарий асосларини ишлаб чиқиш, намуна сифатида бир-икки корпус лавҳаси яратиш босқичида турибди, холос. Ўзбекистонда амалий тилшуносликнинг бир йўналиши саналган ўзбек корпус лингвистикасини ривожлантириш, уни илмий-назарий жиҳатдан тадқиқ этиш, компьютер ва корпус лингвистикаси маркази ёки лабораториясини ташкил қилиш ҳамда унга мутахассисларни бириктириш орқали амалга ошиши мумкин.
Бахтиёр МЕНГЛИЕВ, филология фанлари доктори, ТошДЎТАУ профессори,
Содиқжон БОБОЖОНОВ, Инновацион ғояларни ривожлантириш ёшлар жамоаси раҳбари,
Шаҳло ҲАМРОЕВА, Бухоро давлат университети тадқиқотчиси