Home > nynorsk, opne standardar > Apertium

Apertium

November 11th, 2009

Apertium_ an open-source machine translation engine and toolboxVia gode twitter-buddies (@ingerhilde, som igjen fekk det frå ein elev (!)) blei eg gjort merksam på eit prosjekt, Apertium (sjekk nettsida her og Wikipedia-oppslaget her), for omsetjing av tekst mellom språk. Dette kjenner vi jo frå fleire andre tenester, det interessante her synest eg for det første er at det er eit open source-prosjekt (utvikla med støtte frå den spanske og den katalanske regjeringa, som òg er interessant nok i seg sjølv), og for det andre at eitt av para der det blir utvikla reglar for omsetjing er nynorsk/bokmål.

For berre eitt år sidan snakka vi om den dyre, innelåste og proprietære (så vidt eg veit) Nyno, som truga stilskrivingsparadigmet i norsk skule, og –vips!– så har vi ei opa løysing som ganske sikkert dreg til seg merksemd.

Kvifor? For det første av di det er interessant for fleire å kunne omsetje mellom ulike språk, og spesifikt i Noreg mellom bokmål og nynorsk: Offentlege kontor med sine krav er det mest opplagte dømet når det gjeld det siste. Men òg tenester som handlar om omsetjing av større mengder tekst på nett som no kan bli tilgjengeleg for langt fleire. (Dette har vi forsåvidt hatt via Google translate frå før, men sjølvsagt ikkje mellom nynorsk og bokmål. Ei nyttig teneste, faktisk, dersom du er interessert i å lese ein spansk nyheitsartikkel og ikkje kan språket godt nok til dette.) For det andre av di det er eit ope prosjekt, og (med atterhald om ressursar, ambisjonar og tilknyting til gode miljø) dermed eit prosjekt som kan suse forbi prosjekt som Nyno, som lèt til å vere forankra i ein god, gammal og seig forretningside om sal av dyre lisensar.

I tillegg har dette epistemologiske undertonar i diskusjonane om informasjon, tekst, lesing, kunnskapar og læring i ein digitalisert del av verda. Kva i all verda skal argumenta vere for ikkje å sleppe elevane til med slike verktøy? Argumentet må vere at utviklinga på den digitale fronten kjem til å snu, eller at vi ikkje har noen garanti for at vi har tilgang til desse vertkøya i framtida, og derfor må lære oss dei underliggjande systema.

Eg trur følgjande: Digitaliseringa er ikkje eit eksternt fenomen, lausrive frå resten av verda. Det er ein del av større samanhengar, som ògså skulen er ein del av. Skulen er altså ingen naiv motkultur, som autonomt kan utøve kraft til dømes mot det digitale, men ein del av ein langt større dynamikk. I denne dynamikken kan (må) utviklinga skje, og då må ein her søkje å forstå både samanhengar og motsetnader. Heilt konkret: Å bruke slike digitale verktøy i skulen bør motivere til å skape smartare oppgåver; å plassere dette inn i kanon-tenkjinga og det reproduktive regimet som dominerer store delar av skulen no, er heilt meiningslaust.

På eitt plan er det då ingen prinsipiell skilnad mellom Apertium brukt i språkundervisinga og skyvelæret brukt i snekringa, men det handlar om kva normer, lover og reglar (kva episteme) dette skal tenkjast som ein del av. Her ligg ingen føringar for ikkje å kunne systemet under språket, tvert om bør vi tenkje nettopp dèt, men på ein annan måte.

Vel, nokre døme på nynorskomsetjingar, frå bokmål (riksmål :-) , som viser både det eine og det andre, men som likevel er lovande. Problema som her teiknar seg er (vil eg tru) svært overkomelege. Tenk dette kopla opp mot regelverk, i eit grensesnitt der du kan jobbe med språket på ein smart måte:

BM: Den siste krig (den 2. verdenskrig) tok livet av den unge mann jeg tidligere refererte til som Per.

NN: Den siste krigen (den 2. verdskrig) tok livet av den unge mannen eg tidlegare refererte til som Per.

BM: Damen, hvis hund het Bella, eide en villa, hvor jeg leide hybel.

NN: Damen, viss hund heitte Bella, eigde ein villa, der eg leidde hybel.

nynorsk, opne standardar , ,

  1. November 12th, 2009 at 09:23 | #1

    (Et lite parentes: etter en del frem og tilbake er fri programvare-bevegelsen enige med seg selv om at “open source” heller bør omtales som “free software”, og da på norsk “fri programvare”. De vil at ordet “free” skal understrekes mer enn ordet “open”.)

    Jeg ser at apertium finnes i ubuntu, men at nb-nn-pakkene ikke finnes der enda.

  2. admin
    November 12th, 2009 at 10:03 | #2

    Ja, då må ein jo rette seg etter det :-) Var ikkje klår over det. Men eg synest free software er dårlegare enn open source, av di free software i alle år har vore noe heilt anna. I alle høve i mi amatørverd. Viss grunnen til bytet er at nokre vil at free er betre i denne samanhengen enn open, stiller eg meg litt undrande til det òg, heilt sånn der personleg: Eg synest “open” har betre og viktigare konnotasjonar enn “free,” der openheit handlar om tilgjengelegheit på fleire nivå enn det reint økonomiske — openheit handlar om å gjere tilgjengeleg for deling, medverknad etc., medan gratis handlar om å sleppe å betale… Det første er storslagent, det siste er kjipt, liksom :-)

  3. November 12th, 2009 at 13:15 | #3

    Jeg er helt enig med deg, men fikk selv så hatten passet av alle toppene i fri programvare-begevelsen i Norge (og noen fra utlandet). Det er “free as in speech” de vil ha vektlagt mer enn “open”. Jeg tror allikevel at ordet “åpen” fungerer bedre enn “fri” i en norsk verden, men de sentrale personene i Norge er ikke enig med meg… Jeg tror det også er knyttet til at ingen ikke-datakyndige skjønner det andre ordet i “open source”, og da heller ikke på norsk “åpen kildekode”. Selv mener jeg at det er lette å forklare “åpen kildekode” enn “fri programvare” – fordi du er nødt til å forklare det uansett. “Fri programvare” blir, etter min erfaring, alltid misforstått som “gratis programvare” og det er ikke det vi vil ha frem. Det er enklere å forklare innholdet i et nytt ord som “åpen kildekode” enn å endre forståelsen av “fri programvare”. Microsoft har også en masse programvare som er fri, men som ikke er fri programvare.

    (Enmannsforetaket mitt heter “Åpen skole” – det er ikke samme sus over “Fri skole”.)

  4. admin
    November 12th, 2009 at 13:44 | #4

    Nei, er samd i at Åpen skole er betre enn fri skole. Friskole, liksom. Kan hende det er vanskane med omsetjing som gjer dette kludrete på norsk.

  5. November 16th, 2009 at 03:01 | #5

    Hei, takk for Apertium-omtalen :-)

    Som deltakar i Apertium-prosjektet har eg lurt veldig på korleis norsklærarar kjem til å ta i mot prosjektet. Eg meiner sjølv at eit språk som skal vere i dagleg bruk er nøydt til å hengje med i språkteknologien, og maskinomsetjing har jo iallfall to positive verknader på minoritetsspråk:

    (1) assimilering: utanforståande kan, med hjelp av maskinomsetjing, lese tekst skrive på minoritetsspråket; dette tek vekk litt av argumentet med at brukarar av minoritetsspråk ikkje kan gjere seg forstått elles i samfunnet

    (2) disseminering: maskinomsetjing som er av god nok kvalitet til å kunne publiserast med få manuelle endringar kan føre til meir tekst i minoritetsspråket, noko som au vil styrke statusen til språket

    …men eg veit ikkje heilt kva eg skal si til ein norsklærar som lurer på kva denne nye «kalkulatoren» kjem til å gjere med grammatikkunnskapane til elevane (utanom at elevane, i kraft av å vere menneske, sannsynlegvis kan ganske mykje meir grammatikk enn Apertium); det som er sikkert er iallfall at skulen ikkje kan stritte i mot utviklinga.

    —–

    «dame» er forresten no lagt til i ordbøkene[1], men «hvis hund het Bella» er eg litt usikker på korleis ein best/enklast set om, forslag?

    [1] Ordtilfanget på http://aperitum.org og i Debian-pakkene vil alltid hengje litt etter det som er i utviklingsversjonen, dei blir oppdatert når me slepp ei ny utgåve.

  6. November 16th, 2009 at 03:16 | #6

    @Odin Nøsen
    Frå wikipedia-artikkelen:
    «Free software focuses on the philosophical freedoms it gives to users while open source focuses on the perceived strengths of its peer-to-peer development model.» Fri programvare-folk vil typisk velje lisensar med streng copyleft, medan open kjeldekode-folk kanskje ikkje har noko i mot å dobbeltlisensiere (t.d. tillate at eit visst firma får rett til å vidareutvikle ei eiga utgåve av koden som _ikkje_ er open).

    —–

    Elles, om du vil installere apertium-nn-nb på Ubuntu må du nok installere VISL CG-3 først, sidan dette språkparet nyttar føringsgrammatikkar (eg trur ikkje VISL CG-3 finst i synaptic enno :-/). Båe er på «wishlist» til Debian, så når Debian-folka har tid til å inkludere dei, vil dei komme i Ubuntu.

  1. November 17th, 2009 at 03:41 | #1