Kā ziņo Busuu.com, sākot no 2011. gada oktobra Maksa Planka institūta Valodu arhīvs Berlīnē ir kļuvis publiski pieejams. Valodu arhīvs ir viens no lielākajiem arhīviem pasaulē, kurā tiek glabāta informācija par eksotiskām, reti sastopamām un apdraudētām valodām (kopā apmēram 200), tostarp audio materiāli. Līdztekus klausāmajiem ierakstiem arhīvā arī ir savāktas ziņas par cilvēkiem, vēsturi un kultūrām, kuras ir saistītas ar pētāmajām valodām. Visa informācija ir pieejama apjomīgā datu bāzē, kuras apjoms mērāms 80 terabaitu apmērā!
Kā ziņo Busuu.com, sākot no 2011. gada oktobra Maksa Planka institūta Valodu arhīvs Berlīnē ir kļuvis publiski pieejams. Valodu arhīvs ir viens no lielākajiem arhīviem pasaulē, kurā tiek glabāta informācija par eksotiskām, reti sastopamām un apdraudētām valodām (kopā apmēram 200), tostarp arī audio materiāli. Līdztekus klausāmajiem ierakstiem arhīvā arī ir savāktas ziņas par cilvēkiem, vēsturi un kultūrām, kuras ir saistītas ar pētāmajām valodām. Visa informācija ir pieejama apjomīgā datu bāzē, kuras apjoms mērāms 80 terabaitu apmērā!
Valodas nepārtraukti mainās, izzūd un rodas no jauna. Daži pētnieki uzskata, ka līdz 21. gadsimta beigām izzudīs apmēram puse no 6000-7000 valodām, kuras šobrīd pasaulē pastāv. Maksa Planka institūts vāc liecības un unikālus materiālus par izzūdošajām valodām un nodarbojas ar to, lai šīs valodas netiktu aizmirstas.
Saskaņā ar LZA Terminoloģijas komisijas Informācijas tehnoloģijas, telekomunikācijas un elektronikas apakškomisijas sēdes protokolu Nr. 382, lietošanā pieņemti jaunu terminu latviskojumi.
Saskaņā ar LZA Terminoloģijas komisijas Informācijas tehnoloģijas, telekomunikācijas un elektronikas apakškomisijas sēdes protokolu Nr. 382, lietošanā pieņemti zemāk atrodamie terminu latviskojumi no angļu valodas.
Saistībā ar MI (mākslīgā intelekta) (bet ne tikai) jomu:
wetware - intelektūra actuator - aktuators
Saistībā ar standartu ISO 2382-23 pieņemti 3 termini:
range specification - apgabala uzdošana multistroke character entry - rakstzīmes vairākpiespiedienu ievade ideogram entry - ideogrammievade
Saistībā ar standartu ISO 2382-23 pieņemti sekojoši termini:
text editor - teksta redaktors line editor - rindredaktors screen editor - ekrānredaktors syntax-directed editor - sintaktisks redaktors text and document formatting - teksta un dokumentu formatēšana document merge - dokumentu saplūdināšana adjust text mode - teksta pielāgošanas režīms page length control, page depth control - lappuses garuma regulējamība document formatter - dokumenta formatētājs landscape, landscape format, horizontal format - ainavformāts, horizontālais formāts portrait, portrait format, vertical format - portretformāts, vertikālais formāts default format, basic format - noklusējuma formāts margin - mala page header, running head - galvene footer, running foot - kājene to center - centrēt to indent - atkāpināt, izveidot atkāpi to underline, to underscore - pasvītrot right-aligned, right-adjusted, flush right, right-justified (deprecated in this sense) - pa labi līdzināts left-aligned, left-adjusted, flush left, left-justified (deprecated in this sense) - pa kreisi līdzināts ragged right - pa labi nelīdzens ragged left - pa kreisi nelīdzens to justify (in text processing) - abpuslīdzināt (teksta apstrādē)
Gandrīz ikviens ir izmantojis kādu no mašīntulkošanas servisiem vai tas būtu Google Translate, Tildes tulkotājs vai arī kāds cits mākoņtulkošanas pakalpojums. Reizēm tulkošanas rezultāti ir apmierinoši, bet dažkārt tekstu nākas rūpīgi vai pat pilnībā pārstrādāt, lai tulkojums būtu izmantojums. Pīters Norvigs (Peter Norvig), Google Inc. Izpētes direktors un Stenfordas Universitātes doktors, atklāj dažus noslēpumus, kā līdz mums nonāk mašīntulkojums.
Gandrīz ikviens ir izmantojis kādu no mašīntulkošanas servisiem vai tas būtu Google Translate, Tildes tulkotājs vai arī kāds cits mākoņtulkošanas pakalpojums. Reizēm tulkošanas rezultāti ir visai apmierinoši, bet dažkārt tekstu nākas rūpīgi vai pat pilnībā pārstrādāt, lai tulkojums būtu izmantojums. Pīters Norvigs (Peter Norvig), Google Inc. Izpētes direktors un Stenfordas Universitātes doktors, atklāj dažus noslēpumus, kā līdz mums nonāk mašīntulkojums.
Lai noskatītos video materiālu ar subtitriem latviešu valodā, piespiediet pogu "CC" (video loga apakšējā daļā), pavelciet uz leju sānjoslas pogu (tumši sarkanā krāsā) un izvēlieties "Latvian - Latvian via dotsub", kā tas redzams zemāk pievienotajā attēlā.
Video materiāla transkripcija latviešu valodā:
Mēs jau esam iepazinušies ar Mākslīgā intelekta (MI) kursa ievaddaļu. Dzirdējuši par dažādām vides īpašībām, kā arī aplūkojuši atsevišķu aģentu uzbūvi. Tagad es jums vēlētos nedaudz pastāstīt par MI pielietojumu praksē. Man un Sebastianam Tranam (P.N. līdzstrādnieks) šajā jomā ir uzkrāta liela pieredze strādājot tādās vietās kā Google, NASA un šeit Stenfordā, un es vēlētos nedaudz ar jums padalīties savās zināšanās. Viena no lielākajām MI tehnoloģijas pielietošanas veiksmēm Google vēsturē ir bijusi mašīntulkošanas sistēmas izveide. Ekrānā redzams teksts, kurš automātiski pārtulkots no itāļu valodas angļu valodā. Šobrīd šīs sistēmas ir pieejamas lietošanai 50 dažādām valodām, un mēs varam veikt tulkošanu no jebkuras no šīm valodām jebkurā citā valodā. Kopā pastāv vairāk nekā 2,500 sistēmas, un mēs tās esam izveidojuši, drīzāk izmantojot mašīnu mācīšanās tehnikas jeb MI tehnikas, nekā šīs sistēmas būvējot manuāli.
Mēs to darām sekojoši. Mēs paņemam viena teksta paraugu 2 valodās. Piemēram, atrodam avīzi, kura tiek drukāta itāļu un angļu valodā, tādā veidā iegūstot nepieciešamos tulkojumus. Ja kāds izsūtīs pieprasījumu pēc šī konkrētā raksta tulkojuma, mēs to interesentam varēsim nodrošināt. Tomēr šāda sakritība būs retums. Visticamāk, ka pieprasījuma atbilstība būs tikai daļēja. Šeit ir daži vārdi, ar kuriem mēs jau esam sastapušies iepriekš, un mums ir jāizlemj, kuri jau zināmie vārdi atbilst vārdiem tulkojamajā tekstā. Pārbaudot daudzus miljonus vārdu abās valodās un mēģinot noteikt atbilstību, mēs varam salikt kopā tulkojumu. Ieraugot jaunu teksta paraugu pirmo reizi mēs varam veikt salīdzināšanu un meklēt atbilstību par pamatu ņemot pagātnē aplūkotos tekstus.
Līdz ar to uzdevums sastāv no divām daļām. Esot nesaistē (off-line), pirms redzam teksta paraugu, kuru jātulko, mēs vispirms izveidojam mūsu tulkošanas modeli. Mēs to darām analizējot mums pieejamos paraugus un cenšoties noskaidrot atbilstības likumības. Kad mēs saņemam pieprasījumu tulkot tekstu, mēs šo modeli izmantojam, lai piemeklētu visticamāko teksta tulkojumu.
Kā tas izskatās realitātē? Palūkosimies uz to, izmantojot par piemēru kāda teksta paraugu. Lai modeļa ideja būtu vieglāk uztverama, paņemsim kādu vienkāršāku piemēru. Šim nolūkam izmantosim ķīniešu valodas tekstu. Šeit ir redzams bilingvāls teksts. Dažādus tekstu paraugus var atrast tīmeklī. Šo piemēru Ādams Lopess atrada ķīniešu restorānā. Kā redzams šajā gadījumā, teksta rindiņa ķīniešu valodā atbilst teksta rindiņai angļu valodā. Šī atbilstība saglabājas visa teksta garumā. Pētot šos tekstus mēs varam noskaidrot atsevišķu ķīniešu vārdu vai nelielu frāžu atbilstību vārdiem vai frāzēm angļu valodā. Es šo procesu esmu uzsācis atzīmējot vārdu "wonton" angļu valodā. Tas tekstā parādās 3 reizes. Katrā no šī teksta rindiņām redzama arī atbilstoša rakstzīme, un tās ir vienīgās vietas ķīniešu tekstā, kur šī rakstzīme parādās. Tāpēc ar lielu varbūtību iespējams secināt, ka šī rakstzīme ķīniešu valodā atbilst vārdam "wonton" angļu valodā. Palūkosimies, vai mēs varam izsecināt ko vairāk. Mans jautājums ir: kura rakstzīme vai rakstzīmes ķīniešu valodā atbilst vārdam "chicken" angļu valodā? Vārds "chicken" tekstā parādās šajās vietās. Uzklikšķiniet uz rakstzīmes vai rakstzīmēm ķīniešu valodā, kuras atbilst vārdam "chicken".