Detta inlägg handlar om begreppen CAT-verktyg och MT, om tekniken och de möjligheter och problem den kan medföra. Det handlar också om teknikens möjliga konsekvenser för vårt språk och om de ekonomiska implikationer som CAT-verktyg och MT har på översättningsmarknaden.

 

I dagens översättningsyrke är hjälp av datorn varmt välkommen. Själva översättningarna går snabbare och man slipper att slå upp ord och utryck i onödan vilket sparar väldigt mycket tid, vilket ni själva kan säkert tänka er.

I den här artikeln kommer jag att beskriva MT (maskinöversättning) och CAT-verktyg.

Maskinöversättning möjliggör översättning mellan två språk. Det finns två olika typer: regelbaserad och korpusbaserad. Den första typen skapas genom ett samarbete mellan språk- och datorexperter. De anger ordlistor och grammatiska regler som får användas.  I den andra typen är det maskinen själv som lär sig översätta ur texter på båda språk som har sammanlänkande meningar.

De första tankarna om MT kom redan på 1600-talet, men de första riktiga MT kommer efter andra världskriget, då behov av förståelse mellan engelska och ryska under det kalla kriget. Första MT var väldigt enkla och deras egenskaper var mycket begränsade. Vi pratar om en databas med 250 ord och 6 grammatiska regler. På 70-talet skapades SYSTRAN som kunde översätta tekniska manualer.

Mellan moderna MT skulle jag som exempel ange Google translator som finns tillgänglig på internet. Den är kostnadsfri, tillgänglig till alla och mycket väl använt. Den används av 200 miljoner användare varje dag och stöder 80 språk. Fram till 2007 var den baserad på SYSTRAN, men sedan 2008 är det baserad på statistisk maskinöversättning. Google translate själv kan ange gissningar om lämpliga översättningar som genomförs med hjälp av olika mönster och utgår från mänskliga översättningar. Programmet letar efter mönster i texter som översätts av människor och sedan sparas det. Programmet kan även enligt dessa mönster själv välja lämpliga ord enligt kontexten. Ju större dess databas är, desto bättre blir översättningarna. Vanliga användare får också påverka kvaliteten av programmet genom att direkt korrigera fel.

Vad finns det för begränsningar? Bland annat finns det ett maximalt antal av rader som kan översättas och antalet facktermer är begränsade. Dessutom har programmet svårt med att knyta samman och dela upp satser. Om det uppstår stavningsfel i källtexten orsakar det väldigt ofta helt felaktig översättning. När vi fokuserar oss på översättningar mellan engelska och svenska uppstår det ofta problem med så vanliga särskrivningar i svenska vilka som översätts isär från engelska. Kvaliteten av översättningar skiljer sig mellan olika språk, ju mer språkkombinationen används desto bättre resultaten får man. Man måste tänka på att översättningen som genomförs är bara till för en grundläggande förståelse av texter. Man behöver ha språkliga kunskaper för att kunna rätta till måltexten och kunna bearbeta texten till ett användbart idiomatiskt målspråk. Viktig aspekt

MT kan vara bra hjälp för översättare men enligt det som vi vet för tillfället verkar det absolut inte kunna ersätta mänskliga översättningar.

Vad är CAT-verktyg då? CAT-verktyg är förkortning till Computer Aided Translation Tool. Det är en databas som hanteras av översättare. Det är ingen maskin som skulle översätta text utan översättares egen databas baserades bara på ord och fraser vilka översättare själv översatt och tillade i databasen. Detta kan komma till nytta speciellt vid facköversättningar. Vid sådan översättning är det mycket vanligt att fraser ofta repeteras och det som programmet gör är att det underlättar återanvändning av gjorda översättningar.

CAT-verktygen kan inte bara översätta tidigare översatta fraser utan även föreslå ord och fraser i sådant fall de är lika så kan översättare bestämma om de är lämpliga eller inte. Verktyget har också egenskap att påpeka på skillnader och hantera enkel grammatik, till exempel att upptäcka pluralform, felaktig stavning o s v. Den ersätter alltså skrivna anteckningar som kan vara otydliga och svåra att jobba med. Översättaren var tvungen att ha antingen väldigt bra ordning och reda i sina anteckningar eller mycket tid för att kolla upp alla fraser och ord om och om igen. CAT-verktyget sparar betydligt mycket av översättarens tid och ger honom utrymme för att kunna fokusera på nya utryck och fraser istället för att göra om redan gjort arbete i onödan.

Som jag skrev ovanför är detta program mycket lämpligt för facktexter eller texter där det förekommer repetitioner. Å andra sidan rekommenderas det inte för texter i vilka det krävs originalitet, till exempel reklam, skönlitteratur o s v.

CAT-verktyg består av två olika databaser, alltså frasdatabas och termdatabas. Man kan även utnyttja hjälp av Google translate. De alla används samtidigt under översättares arbete. CAT-verktyg började användas på 60-talet och genom snabb utveckling av datorer under föregående decennium har skapats nya och bättre versioner. Som det första CAT-verktyget räknas s k IBM pionjär, men deras version används inte längre.

Idag är det märken som DéjàVu, WordFast, Transit,  Across och MemoQ som står i spetsen. Tidigare var det inte möjligt att använda Mac eller Linux datorer för arbete med CAT-verktyg och det var bara PC som man var tvungen att ha om man ville arbeta med CAT-verktyg. Idag ger dock vissa nya versioner undantag och möjliggör även användning av Mac idag.

Kort om ledarna på marknaden:

Trados är ett tyskt märke som levererar upp till 70{957064da1cc73a574d45b70bc0aac5132d10a4b64ba3389ba9a7032f14fcaf35} av det totala antalet. De finns på marknaden sedan slutet på 80-talet. De nyaste versionerna heter Trados Studio 2009 och Trados Studio 2014. Det är Vista, Windows 7, Microsoft och Windows XP som behövs för att kunna jobba med Trados CAT verktyg. Man får ladda ner en provversion och testa Trados Studio 2009 helt gratis under en månad. Idag har detta program omkring 200 000 användare i hela världen. Det kostar 2595 EUR.

Déjà Vu är ett spanskt program som stöds av Windows 98, ME, NT 4,2000, XP, Vista och Windows 7 är väldigt lätt att hantera. Det som är bra med detta program är att det är integrerat med maskinöversättning. Man använder en databas med källtexter och måltexter som sedan skapar nya översättningar. Déjà Vu erbjuder också en provversion vars nyaste version Déjà Vu X3 Professional kostar omkring 420 EUR.

WordFast är ett franskt program som konkurrerar med sitt pris. Den största skillnaden mellan WordFast verktyg och andra program är att WordFast är javabaserat vilket betyder att det inte är begränsat av en särskild plattform. Alla operativsystemen stöder alltså detta verktyg vilket innebär att även Linux och Mac kan användas. WordFast erbjuder också provversion och ett nytt program kostar ca 500 EUR.

STAR Transit är också ett tyskt märke. Det som är speciellt med detta program är hanteringen av dess översättningsminne. Översättningsminnet är virtuellt och associerar översatta filer med varandra istället för att ha ett centralt segmentbaserat översättningsminne. Det är Windows 2000, XP,Vista och Windows som stöder 7STAR Transit NXT.

Det är svårt att säga om vi med maskiners hjälp kommer att helt kunna ersätta människors översättningsarbete i framtiden. Nu för tiden är det så att varken MT eller CAT-verktyg i sin nuvarande form kan använadas utan mänsklig inblandning. den. Den snabba utvecklingen under de senaste decennierna har visat att vi kan skapa väldigt bra översättningsmaskiner. De översättarna som vill stå utanför datavärlden kommer förmodligen få mycket mindre uppdrag för att deras jobb kommer att genomföras mycket långsammare än de översättarna som har blivit ”vänner” med den nya hjälpen från datorerna.  Jag håller med de som hävdar att maskinerna aldrig kommer att ha samma kompetens som en mänsklig översättare. Att kunna skilja mellan nyanser, formellt och informellt språk, identifiera sin målgrupp o s v. kommer datorer aldrig kunna.