Симпатични јапански робот „асимо” ћаскао је недавно с Београђанима на енглеском. Ако желимо да му једног дана затражимо кафу на српском потребно је да му обезбедимо „уџбенике” из којих ће учити наш језик.
Да би осигурао себи опстанак у дигиталној будућности, неопходно је да језик има дигитализоване ресурсе. Према резултатима најновијег истраживања, српски је нажалост у групи оних који су у умреженом друштву информација и знања осуђени да нестану.
– Наш језик није припремљен за дигитално доба. Као што су поједини језици који нису имали писмо изумрли с последњим говорником, мислимо да језицима који немају добру подршку технологија прети дигитално изумирање, односно потиснуће их велики светски језици – каже професор математике Иван Обрадовић, који је са групом домаћих информатичара и лингвиста урадио анализу за српски језик у оквиру студије Технолошког савеза за вишејезичну Европу (МЕТА-НЕТ).
Језичке технологије већина људи редовно користи. На пример, за проверу граматичке исправности („спел чек” за енглески или РАС за српски). Ту спадају и интерактивне „секретарице” на смартфонима и системи аутоматског превођења попут популарног „Гугловог” преводиоца.
Језичке технологије, посебно машинско превођење, у највећој мери се ослањају на статистичке методе које захтевају невероватно велики број писаних и говорних фајлова, што је проблем за језике с малим бројем говорника. Често су непрецизне, што се види у неразумљивим машински преведеним упутствима за техничке производе, али и другде.
– Недавно сам добио писмо од жене која се представља као „промашај Селена”. Систем је механички превео енглеску реч „госпођица” као „промашај” јер се исто пише и изговара (miss). Дигитализовани језички ресурси побољшавају те преводе – објашњава Обрадовић, директор Информативног центра Београдског универзитета.
Дигитализација језичких ресурса је производња у дигиталном облику онога што смо навикли да срећемо у штампаном: речника, граматика, текстова, информација. Врло су важни паралелни корпуси на више језика, који су основа за машинско превођење.
У студији коју су за МЕТА-НЕТ урадили домаћи истраживачи, предвођени професором Душаном Витасом са Математичког факултета, српски је добио две јединице (за аутоматско превођење и граматичку проверу) и две двојке (за синтезу говора и расположивост језичких ресурса).
Исте оцене су добили бугарски, мађарски, румунски, грчки и језици земаља бивше СФР Југославије. Најбоље је оцењен енглески (четворком), а тројку су добили немачки, француски, холандски, италијански и шпански.
Холандски је, каже Обрадовић, добар пример да и мали језици могу да добију високо место на лествици. Иако нема велики број говорника, тамошња стручна јавност је препознала значај дигитализације.
Оно што енглески, француски и немачки имају, а српски (тренутно) нема јесте управо обимна језичка збирка у електронском облику.
Оливера Дурбаба, професор на катедри за германистику Филолошког факултета, каже да Немци овај посао раде веома темељно и развијају корпусне базе деценијама.
– Немачки и српски, у том смислу, не могу да се пореде, јер су немачки ресурси много обимнији и људи су обучени да направе спону између технологије и лингвистичке обраде. Код нас базе постоје, али су мале и неповезане.
Овај посао тражи ширу сарадњу лингвиста и информатичара и свих који се баве језиком и препознају значај информационих технологија за језик, наглашава професор Обрадовић.
Ако српски у неком будућем истраживању заради петицу, да ли то значи да ће зависност од енглеског бити мања?
– У Београду већ имамо неколико паметник кућа. Идеја је да сутра у управљању говорним језиком можемо да се обраћамо паметним уређајима на српском. Такође, уколико бисмо имали висок ниво подршке за машинско превођење, могли бисмо да користимо свој језик, а да га машина преводи. Не може се очекивати да ће рачунари савршено радити књижевне преводе, али у пословној комуникацији би то било сасвим могуће – закључује Обрадовић.
———————————————-
Интернет не доноси пропаст
У јавности се често води полемика о томе да ли ће начин комуникације на интернету нанети штету језику. Др Оливера Дурбаба, која је проучавала језик на „Фејсбуку” и форумима, верује да интернет неће довести до пропасти српског.
– Тај језик, без обзира што је писан, носи све особености говорног језика. Он се сада само измешта у други медиј, што нама истраживачима олакшава посао, јер постоји у писаној форми. Наравно да то није књижевни стандард, али од разговорног стила и не очекујемо да има књижевни стил. Проблем настаје онда када у писани говор неосновано убацујемо елементе разговорног стила: у саставима, семинарским радовима или у штампи.