Generativ kunstig intelligens har været top of mind i det meste af to år. Nu beder ledere på tværs af brancher og funktioner deres teams om at finde måder at bruge det til at reducere omkostninger eller øge effektiviteten. Men spørgsmålet er, om AI rent faktisk virker i oversættelse?
I løbet af de sidste 18 måneder har Smartling fokuseret vores forsknings- og udviklingsindsats på at finde et svar. Specifikt ville vi vide, om kunstig intelligens kunne hjælpe os med at levere oversættelsesløsninger med den bedste kvalitet, pris, hastighed og oplevelse i verden.
Svaret? Et rungende ja! AI fungerer, og det fungerer i skala. Men ikke hver ansøgning er en vinder.
Hvor fungerer AI i dag i oversættelse?
Da Large Language Models (LLM'er) først kom ud, begyndte virksomheder at teste dem som en direkte erstatning for maskinoversættelse. Men selvom denne brugssag har potentiale, er der stadig et par knæk, der skal arbejdes for at sikre ensartet ydeevne.
Vores R&D-team evaluerede adskillige LLM'er og maskinoversættelse på tværs af flere sprog og kvalitetsmålinger (dvs. BLEU, MQM, TER osv.). Dette eksperiment viste, at ved brug af LLM'er til oversættelser på tværs af alle sprog, indikerede automatiserede kvalitetsevalueringsmålinger, at maskinoversættelsesmaskiner stadig overgik LLM'er med hensyn til oversættelseskvalitet. Oven i det er maskinoversættelse en meget mere overkommelig tilgang til oversættelse end at bruge LLM'er.
Selvom LLM'er endnu ikke er den optimale mulighed for oversættelse, begyndte vores team at se dem skinne i automatisk efterredigering og evaluering af maskinoversættelsesoutput. I stedet for at være en erstatning for maskinoversættelse har AI vist sig at være en kraftfuld tilføjelse til maskinoversættelse.
Især følgende viser sig at være stærke applikationer til kunstig intelligens:
- Reparation af fuzzy tændstik
- Ordliste term indsættelse
- Rediger indsatsestimat
- Formalitet
- Gender de-biasing
Med denne viden begyndte vi at udvikle og implementere nye AI-løsninger til vores kunder. Det startede med AI-Powered Human Translation, en oversættelsesløsning, der samler Smartlings ekspert-lingvister og AI-teknologi for at levere oversættelser af høj kvalitet til halvdelen af prisen og dobbelt så hurtigt.
Så begyndte kunderne at spørge os, om de kunne bruge vores AI-funktioner med deres tredjeparts sprogtjenesteudbydere. Så vi sagde ja.
Introduktion til AI Translation Toolkit
Smartlings AI Translation Toolkit leverer en række AI-oversættelsesfunktioner designet til at reducere oversættelsesomkostningerne betydeligt og forbedre den sproglige ydeevne uden at ofre kvaliteten. Vi gør vores AI-teknologi, der har leveret utrolige resultater til vores AIHT-kunder, tilgængelig for alle, inklusive:
- AI Fuzzy Match Repair: Øg gearingen af oversættelseshukommelsen med så meget som 35 procentpoint, hvilket fører til betydelige omkostningsbesparelser og forbedret kvalitet.
- AI-ordliste-udtryksindsættelse: Integrer dine ordlisteudtryk problemfrit i indhold, hvilket garanterer kontekstuel og grammatisk nøjagtighed.
- Rediger indsatsvurdering: Grupperer oversættelser baseret på forventet indsats for at opnå menneskelig kvalitet. Indsigt kan bruges i vores workflowautomatisering til at tildele strenge til specifikke lingvister eller helt omgå menneskelig gennemgang.
Lad os dykke ned i hver af disse funktioner og den forskning, der understøtter dem.
Deep Dive: AI Fuzzy Match Repair
I dag er det en standardpraksis at udnytte oversættelseshukommelsen. Imidlertid tager AI Fuzzy Match Repair den traditionelle tilgang et skridt videre ved at bruge LLM'er til at reparere og udglatte strenge, som normalt ikke ville blive udnyttet til besparelser.
For eksempel kan du på billedet nedenfor se, at kildeteksten og oversættelseshukommelsen matcher kun et ord fra hinanden. Med almindelig oversættelseshukommelse vil kildeteksten typisk skulle oversættes fuldstændigt. Men med fuzzy match reparation er LLM i stand til at identificere forskellen og levere en repareret oversættelse. Den foreslåede oversættelse ville nu være berettiget til fuzzy match-rabatter, hvilket giver kunderne mere udnyttelse af deres TM'er og reducerer arbejdsbyrden for lingvister.
Mens det er i konceptet, lyder dette som en rigtig fed funktion - vores R&D-team ville sikre sig, at det virkede. Endnu vigtigere, de ønskede at sikre, at det gav reel værdi i form af omkostninger, kvalitet eller hastighedsforbedringer.
For at gøre dette oversatte de det samme indhold to gange - én gang med AI fuzzy match-reparation tændt og én gang med den slukket. De evaluerede begge scenarier baseret på HTER for outputoversættelsen og den endelige menneskelige oversættelse. Vi ønskede at se, hvor mange strenge der ikke behøvede nogen menneskelig indgriben efter Fuzzy Match Repair.
Undersøgelsen fandt, at AI fuzzy match-reparation øgede oversættelseshukommelsesmatchene med op til 35 procentpoint og gjorde det ret konsekvent på tværs af sprog. Det betyder, at kunderne kan bruge oversættelseshukommelsen til meget mere af deres indhold, hvilket fører til betydelige omkostningsbesparelser og forbedret konsistens.
Deep Dive: AI Ordliste Indsættelse af term
En anden standardpraksis inden for oversættelse er indsættelse af ordlister. Den traditionelle tilgang er blot at rippe og erstatte termer i kilde- og målteksten med de relevante termer fra ordlisten. Dette har dog en tendens til at introducere nye flydende problemer, når disse ordlisteudtryk ikke stemmer overens med det numeriske antal, bøjninger eller andre grammatiske elementer i den samlede sætning.
Med AI Glossary Term Insertion bruges en LLM til at "udjævne" indsættelsen af ordlisteudtrykket, hvilket sikrer kontekstuel og grammatisk nøjagtighed. For eksempel kan du på billedet nedenfor se, at den traditionelle anvendelse af ordlistebegrebet "publicación" har indført en grammatisk fejl i den overordnede streng, hvor det tilhørende adjektiv nu har den forkerte bøjning (primer vs. primera). Ved hjælp af en LLM indsættes den passende adjektivform og fejlen elimineres.
Baseret på vores forskning kan LLM'er have en enorm indflydelse på antallet af morfologisk korrekte ordlisteindsættelser. Når den blev testet for russisk og spansk indhold, øgede AI Glossary Term Insertion-funktionen antallet af korrekte indsættelser med henholdsvis 25 % og 17,5 %. Det er indhold, som ikke længere kræver menneskelig indsats at rette op på.
Deep Dive: Rediger anstrengelsesestimering
Vores Edit Effort Estimation-teknologi grupperer oversættelser baseret på forventet indsats for at opnå menneskelig kvalitet. Alle strenge sendes med vores proprietære prompt til en LLM, som evaluerer strenge baseret på:
- Grammatisk korrekthed
- Flydende
- Semantisk sammenhæng
- Leksisk nøjagtighed
- Kvalitetskontrol
- Stilguide (unik for hver kunde)
Disse grupperinger (niveau 1, niveau 2 og niveau 3) kan bruges inden for dynamisk workflowautomatisering til at behandle strenge baseret på deres forventede indsats. For eksempel kan en virksomhed tildele strenge, der kræver omfattende redigeringer, til mere erfarne lingvister eller helt omgå menneskelig gennemgang på strenge, der kræver få eller ingen redigeringer. Kunder kan også bruge vores Rediger indsats-estimering-rabatter til at oprette rabatniveauer for højtydende stik.
Dette har potentiale til at give betydelige tids- og omkostningsbesparelser til virksomheder, især for dem, der i høj grad bruger menneskebaserede oversættelsesarbejdsgange. Det giver også teams dybere indsigt i deres oversættelsesproces.
Revolutionér din oversættelsesstrategi
Vi har set AI arbejde på at udvide løftestangen, forbedre nøjagtigheden af ordlisteindsættelse af termer, anvende formalitet og mere. Det kræver dog meget tid og forskning at identificere de steder, hvor kunstig intelligens kan være mest effektiv og levere et stærkt investeringsafkast. Det er her hjælpen fra en partner, som Smartling, kommer ind, så du ikke behøver at gøre det på egen hånd.
En kritisk komponent i vores strategi er vores investering i R&D for at sikre, at vi er i stand til at levere den mest omfattende LanguageAI ™ -løsning i branchen. Vi har adskillige patenter på vores arbejde med generativ kunstig intelligens, og vores ingeniørteam har leveret over 70 vigtige funktioner eller forbedringer på tværs af forbløffende 3300 produktionsudgivelser i det seneste år.
Det er det, der skal til for virkelig at sikre, at AI-løsninger leverer den bedste kvalitet, omkostninger, hastighed og oplevelse i verden.
Lær mere om vores seneste forskning, og hvad vi udforsker næste gang i Global Ready Conference session: Research Revealed - nu på efterspørgsel.