Pagājušajā mēnesī pie lietotājiem nonāca Sabiedrības "Tilde" jaunākais produkts Tildes Birojs 2011. "Rīgas tulki" uz sarunu aicināja „Tilde” Biznesa attīstības direktori Indru Sāmīti, lai plašāk iztaujātu par jaunākās Tildes Biroja versijas priekšrocībām un gaidāmajiem jaunumiem Latvijas tulkošanas nozarē.
Pagājušajā mēnesī pie lietotājiem nonāca Sabiedrības "Tilde" jaunākais produkts Tildes Birojs 2011. "Rīgas tulki" uz sarunu aicināja „Tilde” Biznesa attīstības direktori Indru Sāmīti, lai plašāk iztaujātu par jaunākās Tildes Biroja versijas priekšrocībām un gaidāmajiem jaunumiem Latvijas tulkošanas nozarē.
„Rīgas tulki”: Pavisam nesen pie lietotājiem nonācis jaunākais "Tildes Birojs 2011". Ar ko jaunais „Tildes Birojs” ir labāks par tā priekšgājēju - 2008. gada versiju?
Indra Sāmīte: Par vienu no lielākajiem jaunumiem noteikti uzskatāmi Tildes Datorvārdnīcas uzlabojumi. Tagad vienā rīkā daudz kompaktāk un ātrāk iespējams veikt tulkošanas darbu. Viena no svarīgākajām funkcijām jaunajā Tildes Datorvārdnīcā ir automātiskās tulkošanas jeb mašīntulkošanas funkcija, kuru izmantojot iespējams tulkot veselas frāzes vai pat garākus tekstus. Lai to nodrošinātu, tiek lietotas Amazon mākoņdatošanas iespējas, pateicoties kurām tulkojums līdz lietotājam nonāk mazāk nekā sekundes laikā. Svarīgi atzīmēt arī uzlaboto gramatikas pārbaudi. Jaunais Tildes Birojs tagad spēj atpazīt par 20 kļūdu tipiem vairāk, nekā iepriekš. Tāpat gramatikas pārbaude tagad pieejama ne tikai Microsoft Office lietotājiem, bet arī atvērtā koda cienītājiem, kuri izmanto tādas programmas kā Open Office vai Libre Office.
R.T.: Vai šie uzlabojumi ir tapuši sadarbībā ar Mākslīgā Intelekta Laboratoriju vai kādu citu organizāciju, kas darbojas valodas izpētes jomā?
I.S.: Nē, visi uzlabojumi, kuri atrodami Tildes Biroja 2011. gada versijā ir mūsu pašu darbs. Trīs gadus esam cītīgi strādājuši, lai lietotājiem atvieglotu darbu ar tekstiem un ceram, ka tas mums ir izdevies.
R.T.: Šobrīd jūsu mašīntulkošanas serviss ļauj tulkot angļu – latviešu valodu pārī, kā arī no latviešu valodas uz krievu valodu. Vai tuvākajā laikā lietotāji var cerēt, ka mašīntulkošanas rīkam tiks pievienots vēl kāds valodu pāris?
I.S.: Diemžēl tuvākajā laikā nevaram solīt šādus uzlabojumus. Vēl jāturpina darbs pie esošo valodu pāru izstrādes mašīntulkotājā, kas nebūt nav viegls un ātrs darbs.
R.T.: Esat minējuši, ka jūsu mašīntulkošanas serviss piedāvā labākos automātiskās tulkošanas pakalpojumus latviešu valodā un pārspēj Google Translate mašīntulkotāju. Ar ko labāks ir Tildes Tulkotājs?
I.S.: Mūsu uzskatam ir objektīvs pamatojums. Mašīntulkošanas kvalitātes noteikšanai esam izmantojuši BLEU mērīšanas metodi, kura ir viena no visplašāk izmantotajām metodēm pasaulē. Saņemtie rezultāti ļauj izdarīt šādus secinājumus.
R.T.: Šobrīd automātiskais Tildes Tulkotājs ir pieejams gan jaunā Tildes Biroja 2011 īpašniekiem, gan tiem lietotājiem, kuri izmanto jūsu mašīntulkošanas servisu tiešsaistē. Vai blogu un mājas lapu uzturētājiem tuvākajā laikā arī būs iespēja integrēt savās interneta vietnēs jūsu mašīntulkošanas spraudni vai kodu?
I.S.: Šobrīd mēs pie tā strādājam, lai tāda iespēja tiktu piedāvāta. Domājams, septembrī, oktobrī ikviens, kurš vēlēsies saviem apmeklētājiem piedāvāt Tildes automātiskās tulkošanas rīku, to varēs izdarīt.
R.T.: Šobrīd ir noslēdzies vērienīgs darba posms, ieviesti daudzi jauninājumi. Ko no jums varam sagaidīt nākotnē? Kam plānojat pievērsties tuvākajā laikā?
I.S.: Viens no aktuālākajiem jaunumiem, pie kura strādājam, ir produkts, kurš būs izmantojams ierīcēs, kas aprīkotas ar Android un iOS mobilo ierīču operētājsistēmām, lai Tildes rīkus būtu iespējams lietot arī viedtālruņu īpašniekiem. Mēs ceram, ka šāda lietojumprogramma būs pieejama dažu mēnešu laikā. Tāpat nopietns darbs rit pie mašīntulkošanas rīka, kurš tiek izstrādāts īpaši uzņēmumu vajadzībām. Šāda pakalpojuma pamata versija būs bez maksas, bet lietotājiem, kuri gribēs izmantot sarežģītākas funkcijas, tiks piedāvāta abonēšanas iespēja. Rīks būs īpaši noderīgs lieliem uzņēmumiem, kuriem veicams liels, standartizētu tulkojumu apjoms. Šo produktu plānojam laist tirgū vasaras beigās.
R.T.: Tilde ir viena no iniciatorēm starptautiskā valodu tehnoloģiju projekta „Valodu krasts” uzsākšanai Latvijā. Vai varat pastāstīt kā šī iniciatīva darbojas un kādi ir tās panākumi?
I.S.: Šī iniciatīva tika uzsākta pēc Valsts prezidenta Valda Zatlera ierosinājuma. Galvenie partneri programmas izstrādē ir sabiedrība Tilde, Microsoft Corporation un Latvijas Nacionālā bibliotēka. Iniciatīvas mērķis ir atbalstīt mazās valodas informācijas tehnoloģiju laikmetā. Par pirmajiem panākumiem varam uzskatīt koptulkošanas rīka izstrādi mājas lapām. Ir prieks, ka tādām iestādēm, kā bērnu nami vai bibliotēkas, kurām ir ierobežoti līdzekļi, tagad ir iespēja ne tikai automatizēti tulkot savas mājas lapas saturu pašiem, bet arī saņemt palīdzību tulkošanā no jebkura interneta lietotāja, kurš vēlas dalīties savās zināšanās.
Saskaņā ar Informācijas tehnoloģijas, telekomunikācijas un elektronikas apakškomisijas sēdes protokolu Nr. 372, kurš pieņemts 2011. gada 1. aprīlī, turpmāk tulkiem un tulkotājiem attiecībā uz terminoloģijas izmantošanu jāņem vērā jaunie angļu terminu latviskojumi.
Saskaņā ar Informācijas tehnoloģijas, telekomunikācijas un elektronikas apakškomisijas sēdes protokolu Nr. 372, kurš pieņemts 2011. gada 1. aprīlī, turpmāk tulkiem un tulkotājiem attiecībā uz terminoloģijas izmantošanu jāņem vērā jaunie angļu terminu latviskojumi.
Attiecībā uz esošajiem latviešu valodā apstiprinātajiem ekvivalentiem sēdes ietvaros izdarītas sekojošas izmaiņas: terminu "file name", kura iepriekšējais oficiālais tulkojums bija "datnes (faila) vārds", turpmāk dokumentos ieteicams tulkot kā "datnes (faila) nosaukums".
Šo izmaiņu ietekmē tiek mainīti arī atvasinātie termini:
file name extension
datnes nosaukuma paplašinājums datnes paplašinājums faila nosaukuma paplašinājums faila paplašinājums
file base name
datnes nosaukuma pamatdaļa faila nosaukuma pamatdaļa
Tāpat sēdes laikā tika pieņemti vēl 28 jauni termini latviešu valodā, kuri izmantojami veicot tulkojumus no angļu uz latviešu valodu (un otrādi).
Pagājušajā nedēļā Latvijas datorlietotājus, bet īpaši tulkus un tulkotājus, iepriecināja ziņa par to, ka beidzot klajā nākusi jaunā Tildes Biroja 2011 versija. Ar ko atšķiras jaunais Tildes Birojs no vecās 2008. gada versijas? Kādi ir būtiskākie uzlabojumi? Un galu galā vai jaunāko Tildes izstrādājumu ir vērts iegādāties? Uz šiem un citiem jautājumiem centīsimies sniegt atbildes šajā apskatā.
Pagājušajā nedēļā Latvijas datorlietotājus, bet īpaši tulkus un tulkotājus, iepriecināja ziņa par to, ka beidzot klajā nākusi jaunā Tildes Biroja 2011 versija. Ar ko atšķiras jaunais Tildes Birojs no vecās 2008. gada versijas? Kādi ir būtiskākie uzlabojumi? Un galu galā vai jaunāko Tildes izstrādājumu ir vērts iegādāties? Uz šiem un citiem jautājumiem centīsimies sniegt atbildes šajā apskatā.
Mašīntulkošana
Pirmais jautājums, kas noteikti nodarbina ikvienu 2008. gada versijas lietotāju, noteikti saistās ar jauninājumiem, kuri nav pieejami vecajā Tildes Birojā. Kā galveno 2011. gada versijas jaunumu noteikti jāmin mašīntulkošanas funkciju, kas iestrādāta Tildes Datorvārdnīcā. Šeit gan uzreiz jāpiezīmē, ka mašīntulkošanu iespējams izmantot tikai atsevišķos valodu pāros: frāžu vai tekstu tulkošanai no angļu uz latviešu valodu un otrādi, kā arī tulkošanai no latviešu valodas uz krievu valodu. Attiecībā uz citiem valodu pāriem, kuri pieejami izvēlnē, šī funkcija nav izmantojama. Tā kā Tildes mašīntulkotāja darbību nodrošina mākoņdatošanas serviss, tad tā lietošana ir iespējama tikai tad, ja dators ir pieslēgts internetam. Ja interneta pieslēgums ir pārtraukts vai nav pieejams, būs iespējams darbināt tikai vārdnīcas standarta funkcijas.
Runājot par mašīntulkotāja kvalitāti, jāatzīst, ka vietām teksts tiek iztulkots pat ļoti atbilstoši saturam, taču citur teksta jēgu saprast ir ļoti sarežģīti. Piemēram, attēlā redzamais izvilkums no raksta par Latviju, kas publicēts Wikipedia, būtu stipri rediģējams pirms to varētu uzskatīt par publicējamu vai kā citādi lietojamu.
Labā ziņa ir tāda, ka lietotājiem, kuriem nav pieejams Tildes Birojs, mašīntulkošanas servisu ir iespējams izmantot arī tiešsaistes režīmā, neinstalējot programmatūru.
Produkta izstrādātāji ir minējuši, ka Tildes paspārnē attīstītais mašīntulkotājs ir pārāks par Google Translate tulkotāju. Par to gan ir visai sarežģīti spriest, jo tulkojot augstāk minēto tekstu ar Google produktu, rezultāts ir visai līdzīgs un pat ja tiešām Tildes izstrādājums ir kaut kādā ziņā pārāks, to vienkāršam lietotājam uzreiz pamanīt ir visi sarežģīti.
Kopumā par šo Tildes Datorvārdnīcas jauninājumu jāsaka, ka automātiskās tulkošanas funkcija ir visnotaļ noderīga un neuzbāzīgi iestrādāta jaunajā vārdnīcas versijā, ar to ir patīkami un interesanti strādāt. Tā ļauj ātri un viegli iztulkot vienkāršas frāzes un tekstus, kā arī noprast sarežģītāku tekstu nozīmi. Taču paši izstrādātāji lietotājus brīdina, ka "automātiskās tulkošanas rezultāti ļauj saprast teksta nozīmi, bet tie nevar aizstāt cilvēka tulkojumu," un tas ir visai likumsakarīgi, jo arī citās pasaules valodās vairāk vai mazāk mašīntulkošana vēl joprojām nav spējīga veikt darbu tulkotāju vietā, taču kā atbalsta funkcija reizēm var lieti noderēt gan profesionāļiem, gan citiem datorvārdnīcas lietotājiem.
Datorvārdnīcas ātrais skatījums
Kā nākamo jaunumu, kurš tiek piedāvāts Tildes Biroja 2011 lietotājam, var minēt Tildes Datorvārdnīcas ātrā skatījuma funkciju. Piespiežot taustiņu kombināciju (Alt+W) vai ikonu labajā augšējā stūrī iespējams iegūt kompaktu, vienkāršotu vārdnīcas variantu bez papildu funkcijām, kas atsevišķos gadījumos var būt ļoti noderīgi. Tāpat "mini-vārdnīcu" iespējams piespraust (Alt+S) ekrāna darbvirsmas priekšplānā, lai lietojot citas programmas tā nekur "nepazustu" un vienmēr būtu acu priekšā. Ātrajā skatījumā ir iespējama gan vārdu, gan automātiskā tekstu tulkošana.
Jaunas vārdnīcas
Vēl viens nozīmīgs papildinājums salīdzinājumā ar 2008. gada versiju ir franču-latviešu un latviešu-franču vārdnīcas iekļaušana jau esošo vārdnīcu saimē. Tāpat valodu pāru izvēlnē tiek piedāvāta piekļuve WordNet angļu valodas datu bāzei, kas var būt visai noderīgi, kad tulkojams specifisks termins, kas nav atrodams parastajās angļu - latviešu vārdnīcās. Datorvārdnīcas interaktivitāte
Ļoti nozīmīgs jaunievedums ir funkcijas, kuras ļauj lietotājiem interaktīvā veidā uzlabot šī tulkošanas rīka lietojamību. Piemēram, sadaļā "Pievienot jaunu tulkojumu" konkrētajam šķirklim iespējams pievienot jaunu tulkojumu pie reizes to arī nosūtot datorvārdnīcas izstrādātājiem, lai gadījumā, ja jūsu tulkojums izrādītos akceptējams arī no citu speciālistu puses, tas tiktu iekļauts vārdnīcas atjauninājumos vai nākamajās versijās. Līdzīgā veidā ātri un ērti iespējams arī ziņot par trūkstošu vai nepilnīgu tulkojumu, kas atklāts kādā no šķirkļiem.
Tāpat lietotāji tagad salīdzinoši vienkārši no datorvārdnīcas sākumlapas (Alt + Home) var uzsākt komunikāciju ar Tildes Biroja izstrādātājiem gan izmantojot sociālos tīklus, gan tiešā veidā uzrakstot savu atsauksmi. Mūsdienu apstākļos, kad terminoloģija mainās tik ātri, gan vārdnīcas izstrādātājiem, gan pašiem lietotājiem šāda sadarbība var būt izšķiroša, lai, piemēram, laicīgi nodrošinātu kvalitatīvus tulkojumus.
Gramatikas pārbaude
Lai izpētītu uzlabojumus šajā ziņā, būtu nepieciešams ilgāks laiks, taču kā sola paši produkta izstrādātāji, tad tagad teikumu struktūras analīze latviešu valodā ir pacelta vēl augstākā līmenī, līdz ar to tiek nodrošināta vēl kvalitatīvāka izplatītāko gramatikas kļūdu labošana. Par lielu ieguvumu lietotāji var uzskatīt tehniskā atbalsta nodrošināšanu arī tādām atvērtā pirmkoda programmatūrām kā Open Office un Libre Office.
Dizains
Reti gadās, ka jaunas programmatūras versijas ārējais izskats apmierina pilnīgi visus lietotājus. Taču šoreiz tādu, kam būtu iebildumi attiecībā uz Tildes Datorvārdnīcu, vajadzētu būt maz, jo starp izmaiņām un veco izkārtojumu ir saglabāta samērīga proporcija. Jāatzīmē gan, ka sākumā ir nedaudz nepierasti, ka vārdnīcas izvēles logs (kurā alfabēta kārtībā tiek parādīti visi vārdnīcas šķirkļi) aizņem tik daudz vietas. Parasti tulkotājs meklē kādu konkrētu vārdu vai izteicienu, nevis vienkārši lasa šķirkļus un, iespējams, šī liekā informācija kreisajā malā atsevišķos gadījumos var nedaudz traucēt koncentrēties uz atrastā šķirkļa izpēti. Runājot par citām komponentēm var tikai uzteikt dizaina izstrādātāju krāsu izvēli, kas acīm ir ļoti tīkama un neliek sasprindzināt redzi cilvēkiem, kuri lielāko darba dienas daļu pavada strādājot ar datoru. Tāpat vārdnīcas izmantotāji var paši mainīt atrastā šķirkļa burtu izmēru, kas ir visai svarīgi, ja ikdienā ilgas stundas jāpavada pie datora ekrāna.
Kopsavilkums
Kopumā pēc jaunās Tildes Biroja 2011 versijas izmēģināšanas atgriezties pie Tildes 2008. gada izstrādājuma, īsti negribās, kaut arī tāda mēroga uzlabojumi, bez kuriem tulkotāji vai citi lietotāji principiāli nevarētu iztikt, jaunajā produktā nav. Tomēr, ja jāizdara izvēle starp šiem abiem produktiem, svaru kausi drīzāk nosveras par labu jaunajai Tildes Biroja versijai, jo tā ir ātrāka, lietotājiem draudzīgāka un daudz mūsdienīgāka. Būtiskākie jaunievedumi, kas varētu būt īpaši noderīgi profesionāļiem, ir integrēta automātiskās tulkošanas (mašīntulkošanas) funkcija, atjauninātas vārdnīcas (tostarp franču - latviešu - franču vārdnīcas iekļaušana esošo vārdnīcu saimē), uzlabota pareizrakstības pārbaude un kas ļoti svarīgi - atgriezeniskās saites nodrošināšana ar datorvārdnīcas izstrādātājiem, kā arī iespēja pašrocīgi konfigurēt vārdnīcu savām vajadzībām, kas šo rīku, salīdzinājumā ar iepriekšējo versiju, padara lietotājam daudz noderīgāku.