Т.Пүрэвсүрэн: Эх хэл боловсруулалтын судалгаа дэвшилтэт технологиос хоцорч байна

2019 оны 9 сарын 25

Arslan.mn

ШУА-ийн Хэл зохиолын хүрээлэнгийн эрдэм шинжилгээний ажилтан, доктор Т.Пүрэвсүрэнтэй ярилцлаа.

-Сүүлийн үед хийж байгаа судалгааны тань ажлаас сонирхвол?

-“Шинжлэх ухааны түлхүүр нэр томьёоны цахим тайлбар толь” инновацийн төсөл дээр ажиллаж байна. Энэ төсөлд ШУА-ийн бүтцэд байдаг бүх хүрээлэн төвийн эрдэмтэн судлаач гээд 100 гаруй хүн оролцож буй томоохон төсөл юм.

Манай хүрээлэнгийн Хэрэглээний хэл шинжлэлийн салбарын эрдэм шинжилгээний ажилтнууд үндсэн гүйцэтгэгчээр нь оролцож байна. Ийм төсөл хэрэгжүүлэх санааг манай тасгийн эрхлэгч О.Шинэбаяр 2017 оны жилийн эцсийн тайлангийн хурлын үеэр гаргасан.

Тус хуралд суусан академич Г.Чулуунбаатар дэмжиж, төслийн удирдагчаар оролцохыг зөвшөөрснөөр бид инновацийн төсөлд нэр мэдүүлж, дэмжигдсэн.

-Яагаад заавал түлхүүр нэр томьёо гэж нэрлэх болов?

-“Түлхүүр нэр томьёо” гэдгийг энгийнээр ойлгомжтой тайлбарлавал, тухайн салбар шинжлэх ухааны үндсэн ойлголт, ухагдахууныг илэрхийлсэн нэр томьёо гэж ойлгож болно.

Өөрөөр хэлбэл, шинжлэх ухааны тухайн салбарын мэдлэгийг эзэмшихийн тулд түлхүүр нэр томьёог нь мэдэхгүй бол ойлгох боломжгүй. Жишээлбэл, атом гэдэг нэр томьёог мэдэхгүйгээр хими, физикийн шинжлэх ухааны суурь мэдлэг эзэмшсэн гэж хэлэх боломжгүй.

Монгол хэлний өгүүлбэр зүйн үндсэн ойлголтын нэг өгүүлбэрийн гишүүд, тэр дундаа өгүүлэгдэхүүн, өгүүлэхүүн, тодотгол, тусагдахууны тодорхойлолтыг мэдэхгүйгээр монгол хэлээрээ зөв сайхан найруулан бичих, цаашлаад гадаад хэл сурах боломжгүй.

Гадаадад хэлийг тухайн улс оронд нь очоод эзэмшсэн хүмүүсийг гадаад хэлний өндөр мэдлэгтэй гэж хэлж болох хэдий ч монгол хэлнийхээ өгүүлбэрийн талаарх суурь ойлголтыг мэдэхгүйгээсээ болж орчуулга хийх, бичиг хэрэг төлөвлөх үед асуудал үүсдэг.

Монгол хэлээр, кирил үсгээр бичсэн атлаа хөндлөнгийн хүн уншаад ойлгохгүй зүйлтэй бид сүүлийн үед их таарч байна.

Иймээс цахим орчноор дамжуулан тухайн шинжлэх ухааны мэдлэгийг эзэмшүүлэхэд шаардлагатай үндсэн ухагдахуун, ойлголтын мэдээллээр хангах боломж бүрдэж буй юм.

Цахим орчинд ашиглах боломжтой түлхүүр нэр томьёоны толь байхгүйгээс нэр томьёо нь эрдэмтэн судлаачдынхаа хүрээнд ч орчуулга болон оноолтын зөрүүтэй хэрэглэж байна. Үүнээс болоод судалгааны үр дүнг хүмүүс олон янзаар ойлгож, харилцан адилгүй хүлээн авч байна.

Сургалтын байдлаас харахад нэр томьёоны оноолтыг олон хувилбартай хэрэглэж буйгаас болоод залгамж холбоо бүхий мэдлэгийг илэрхийлсэн нэр томьёог ойлгохгүй, өөр үзэгдэл мэтээр тайлбарлах асуудал үүсэж байна.

Жишээлбэл, Монгол хэлний тухайд гэхэд өгүүлбэрийн туслах /дэд/ гишүүдийг тодотгол, нэмэлт, байц, тусагдахуун /шууд болон шууд бус тусагдахуун/ гэх мэтээр нэрлэж ирсэн байдаг.

Эдгээр нэр томьёо нь тухайн үеийнхээ сурах бичигт хэрэглэгдээд өнгөрсөн учраас бидний ээж аав, ах эгчийн үед зааж байсан “нэмэлт” гэдэг ойлголт нь одоогийн “тусагдахуун, байц”-тай дүйх ойлголт ч гэдэг юм уу.

Энэ мэтчилэн мэдээлэл дутмаг байгаагаас хүмүүсийн хувьд нэр томьёоны ойлголтын зөрүү үүсэж байна.

Энэ мэтээс шалтгаалаад харамсалтай нь суурь судалгааны ажлын олон жилийн үр дүнг иргэд сайн ойлгохгүй, буруу хэрэглэж буйгаас болоод шинжлэх ухааныг үнэлэх үнэлэмжид тодорхой хэмжээгээр нөлөөлж байна.

Иймд зөвхөн түлхүүр нэр томьёо гэлтгүй, нэр томьёоны үндэсний хэмжээний нэгдсэн сан байгуулах шаардлагатай байгаа.

Тиймээс энэ ажлынхаа суурь эхлэлийг тус цахим толиор тавьж байна гэж ойлгож болно. Цаашид олон улсын нэр томьёоны байгууллагатай хамтрах, олон хэлний эх баялгийг төрөлх хэлээрээ нэр томьёоны хүрээнд ашиглах боломжтой болох гээд л манай салбарынхан их олон ажил хийхээр төлөвлөж байна.

Одоогоор зарим ажил маань сэрчихгүй бол сайхан зүүд гэдэг шиг л хэмжээнд байгаа.

-Хэтийн төлөвлөгөө, мөрөөдөл гэснээс таны төлөвлөгөө, мөрөөдөл хэр биелж байна даа?

-Би мөрөөдөх дуртай. Энэ ажлыг ингэж хийгээд ийм үр дүнд хүрнэ гэж бодоод л, бодол минь биелэх үед аз жаргалыг мэдэрдэг. Биелэхгүй бол бас гуниглана л даа, хүн л юм чинь.

Эргээд бодоход харьцангуй гайгүй, ихэнх тохиолдол биелж байгаа юм байна. “Монгол хэлний дэлгэрэнгүй тайлбар таван боть толь”-д ажиллаж байх үедээ картын санг цахим сан болгох юмсан, монгол хэлний цахим тайлбар тольтой болох юм сан гэж боддог байлаа.

-Энэ бүхэн өнөөдөр бодит ажил болчихсон биз дээ. Тэгэхээр таны мөрөөдөл биелжээ?

-Тийм ээ. Академич Л.Болд багшийн маань хүчин зүтгэлээр монголчууд бид монгол хэлний цахим тайлбар толь https://www.mongoltoli.mn/-той болчихсон. Мөн сайн багш, хамтран ажиллагчдынхаа хүчээр 108 ботийн цахим сангаа байгуулчихсан байна.

108 ботийн санг байгуулж байхдаа энэ сан маань зөвхөн хэл судлаачдад биш уран зохиол судлаачид, иргэдэд зориулсан сан байх ёстой гэж бодож байлаа.

Өнөөдрийн байдлаар тус сангийн программаа судлаач, олон нийтэд нээлттэй, цахим орчинд тавьж л чадаагүй байгаа болохоос биш судлаачид маань судалгаа шинжилгээндээ ашигладаг, тодорхой хэмжээгээр мэддэг болжээ.

Өөрөөр хэлбэл, эрдэм шинжилгээний ажлыг ахисан түвшинд хийхийн тулд дэвшилтэт технологи ашиглан, эх хэрэглэгдэхүүнээ бүрдүүлэх нь маш чухал, тухайн судалгааны ажлыг үнэлэх гол шалгуурын нэг нь энэ гэдгийг ойлгодог болсон.

Тиймээс 108 ботийн цахим санг ашиглах хүсэлт их ирдэг. Энэ сан, программыг маань ашигласан хамтын бүтээл “Монгол хэлний хоршоо үгийн толь” хэвлэгдээд байна.

-Сүүлийн үед компьютер хэл шинжлэл буюу цахим хэл шинжлэл гэж ярих боллоо. Цахим хэл шинжлэл гэж яг юу юм бэ?

-“Сomputational linguistic, компьютерная лингвистика” гэдгийг манайхан “компьютер хэл шинжлэл”, “цахим хэл шинжлэл” гэж хоёр янзаар орчуулж хэрэглэж байна.

Өвөр монголчууд “тооцоо хэл шинжлэл” гэж нэрлэдэг.

Хамгийн ойлгомжтой, энгийнээр хэлбэл, компьютер ашиглан хэлийг судалдаг хэрэглээний хэл шинжлэлийн салбар гэж ойлгож болно. Миний хувьд “компьютер хэл шинжлэл” гэж нэрлэх нь илүү оновчтой санагддаг.

Манай улсын хувьд төдийгүй дэлхий дахинд харьцангуй сүүлд хөгжсөн шинэ салбар учраас нэр томьёоны хувьд тогтоогүй байна. Шинэ нэр томьёо учраас зарим тохиолдолд хүмүүст оновчгүй, буруу мэт бодогдох нь байдаг.

Гэхдээ цаад утга, агуулгаа бүрэн илэрхийлж чадсан нэр томьёог оноож тогтоох нь чухал. Анх Чой.Лувсанжав багш “компьютер”-г “тооцоолуур”, “электрон”-г “цахим” хэмээн орчуулсан байдаг.

Өдгөө “компьютер” нь “компьютер” гэсэн нэрээрээ, “электрон” нь “цахим” гэдэг нэрээрээ цахим шуудан, цахим хаяг, цахим ном гэх мэтээр нэршин тогтоод байна.

Мөн компьютер хэл шинжлэлийн нэг үндсэн салбар болох corpus linguistics буюу хөмрөгийн хэл шинжлэлийг хөгжүүлэх асуудал чухал байна.

-Монгол хэл мөхлөө, харийн хэл соёлын нөлөө хэт их болж байна гэсэн хандлага нийгэмд бий. Монгол хэлний харь үгийг энэ санд яаж оруулах вэ?

-Нөгөө л сангаа ярина даа. Сан байгуулчихвал монгол хэлний нийт үгийн санг бүртгэх боломжтой болно. Энэ асуудлыг шийдэхэд технологийн талаас ямар ч асуудалгүй. Харин эх хэлний боловсруулалтын судалгаа л дэвшилтэт технологийн шаардлагыг хангаж чадахгүй байна.

Өөрөөр хэлбэл, машин сургалтын аргад зориулсан “сургалтын загвар байгуулах” хэрэгтэй. Үүнд бид монгол хэлний мэдээллээ хэрхэн оруулж өгөх вэ.

Эх хэл боловсруулалтад зориулсан хэлний мэдээлэл боловсруулалтыг хэрхэн хийх вэ гэсэн асуудал манай салбарт шийдэгдээгүй байна.

Юуны өмнө компьютер хэлэнд шинжлэлд зориулсан эх хэлний мэдээлэл боловсруулалтын тэмдэглэгээг нэгдсэн журмаар гаргах, үүний үндсэн дээр үгийн сан, хэлзүйн тэмдэглэгээт хөмрөг байгуулах гээд л яриад байвал нэлээд их юм бий.

Манай хэлний тогтолцоо өөрөө их ерөнхий учраас нэг бүрчлэн тодорхойлон бүлэглэж багцлах боломж муутай юм байна гэж би хувьдаа боддог. Энэ нь монгол хүний сэтгэлгээтэй холбоотой юм байна.

Зөвхөн нэг л жишээ татахад олон тооны “нар” нөхцөл нэр үгийн ямар үндсэнд залгах нь тодорхойгүй, дүрэмдээ “Ихэвчлэн ажил, мэргэжил заасан үгийн ард залгана” гэж байдаг.

Ихэвчлэн гэдэг энэ үг өөрөө тодорхойгүй хүрээ заасан учраас ажил, мэргэжил заасан бүх үгийг оруулж болохгүй.

Гэхдээ бас оруулахгүй байж болохгүй эмч, багш, жолооч нар гэж болох атлаа дуучин, мастер нар гэж болохгүй, дуучид, мастерууд гэнэ, мөн багшууд, жолоочууд, эмчүүд гэж болохгүй.

Энэ бүхнийг тодорхой болгохын тулд хэлний хэрэглээний бодит баримт болох их өгөгдөл буюу big data хэрэгтэй. Тодорхой хэмжээний хөмрөгтэй болчихвол, монгол хэлэнд орж буй харь үгийг бүртгэх бол асуудалгүй.

Нийгмийн хөгжилтэй уялдан үүсэж буй шинэ үг хэллэг, нэр томьёог тэр дор нь олон нийтэд мэдээлэх, орчуулах боломжтойг нь Монголоороо оноох зэрэг цаг үеэ дагасан ажлуудыг ч түргэн шуурхай хийх боломжтой болно.

Бид сангүйгээсээ болоод хэлнийхээ үгийн санг бүртгэж чадахгүй байна.

Тиймээс монгол хэл үнэхээр мөхөх хэмжээнд харь үгийг их хэрэглэж байна уу гэдгийг баталгаат тоо баримтад тулгуурлан хэлж чадахгүй хэдий ч энэ салбарт ажилладаг хүний хувьд бусдын судалгаанаас үзэхэд харь хэлний нэг үгийн хэрэглээний давтамж их байгаа.

Түүнээс олон харь үг орж ирээд монгол хэлийг мөхөөх хэмжээнд очсон зүйл байхгүй.

Нийтийн эх хэлний боловсрол монголчууд ЮНЕСКО-гоос “Бүх нийтээрээ бичиг үсэгтэн” болсон шагнал авч байсан үетэй харьцуулбал мэдээж муудсан.

Эх сурвалж: “Зууны мэдээ” сонин

2019.9.25  ЛХАГВА  №190  (6157)

Мэдээнд өгөх таны үнэлгээ?
Like an post Love an post
haha an post
wow an post
yay an post
sad an post
ouch an post
confuse an post
angry an post
608481
0 эможи

Зочин
2019-09-25 13:23
keyboard_arrow_up