Mój CAT i TMS siedzą pod łóżkiem na wieść o rewolucji AI. Co robić?

Agenor Hofmann-Delbor

„Narzędzia CAT są jak młotki” — Wojciech Froelich, CTO, Argos Multilingual

Wokół narzędzi CAT narosło wiele mitów. Choć powstały ponad 30 lat temu, przez wiele lat napotykały opór części środowiska, które mylnie utożsamiało je z tłumaczeniem maszynowym lub szeroko rozumianym zastępowaniem tłumacza. Niezależne od generacji, były to zawsze dość proste i praktyczne narzędzia — vide powyższy cytat — do rozwiązywania dwóch podstawowych problemów:

pracy z bazą danych (aby tłumaczenie zapamiętywać i wyszukiwać)
oraz kontroli jakości (wszelakich testów, które można na tłumaczeniach wykonać).

Jak w kilku akapitach streścić historię trzech dekad CAT-ów? Warto zacząć od tego, że te specyficzne programy zawsze technologicznie podążały za tym, co działo się na naszych komputerach domowych. Wpierw były bardzo prostą nakładką na edytor Word i pracowały na formatach binarnych. Świat zanurkował w kierunku formatów tekstowych i strukturalnych, takich jak XML. CAT-y rozwinęły się więc w tym kierunku, tworząc standardy, które znamy do dziś: tmx, xliff, tbx, itd. Pierwszy etap rozwoju CAT-ów przede wszystkim wyraźnie oddzielił tłumacza od plików źródłowych, tworząc formaty pośrednie i dbając o to, by w procesie tłumaczeniowym dokumenty nie ulegały uszkodzeniu. Początkowo z bardzo różnym skutkiem.

Kolejna generacja to próba wyciśnięcia z baz danych tego, co tylko się da, szukanie wszelkich podpowiedzi i podobieństw, również na poziomie fragmentów zdań (and. sub-segment). CAT-y na chwilę wyprzedziły edytory z innych branż i codziennych aplikacji, a nieświadomy tych możliwości świat wciąż kojarzył tekstowe podpowiedzi (tzw. predykcja tekstu na podstawie początkowych znaków) z uciążliwymi próbami rodem z wczesnych telefonów komórkowych. Drugi etap w rozwoju branża tłumaczeniowa zakończyła, dysponując nowoczesnymi, szybkimi i bardzo sprytnymi edytorami. Tym w końcu zawsze były CAT-y.

„Z pewną taką nieśmiałością” narzędzia CAT powiedziały stop rewolucji w podstawowych funkcjach, rozumiejąc, że coraz trudniej pogodzić rolę szybkiego i sprawnego edytora z wielozadaniowym kombajnem, który przy okazji obiera ziemniaki i wydobywa hel-3 na Księżycu. Stopniowo pojawiły się dodatki i magiczne trzy litery, API (ang. application programming interface), które otwierały możliwość korzystania z narzędzia zewnętrznym programom. CAT-y zaczęły znowu, przynajmniej koncepcyjnie, udawać telefony komórkowe i normą stały się wszechobecne dodatki, widżety i apki. Nagle można było z CAT-a podłączać się do wielu różnych systemów. Czasem miało to sens, czasem nie. Z naciskiem na tę drugą możliwość.

Czwarta generacja CAT-ów to złota era postedycji, nowego branżowego sposobu na sprzedaż usług tłumaczeniowych w oparciu o interakcję z efektami pracy silnika tłumaczenia maszynowego (wówczas statystycznego). Edytor nadal zachowywał swoje dotychczasowe funkcje, ale rola tłumacza coraz częściej przesuwała się w kierunku weryfikacji tekstów, poprawiania ich lub zatwierdzenia przygotowanego wcześniej materiału. Coraz częściej rozmowa dotyczyła miejsca w większym procesie tłumaczeniowym, momentu skorzystania z tłumaczeń zewnętrznych i tego, które silniki warto podłączyć w konkretnym przypadku (język, dziedzina). Bezlitosne kalkulatory branżowe stale liczyły, jak ograniczyć zakres weryfikacji (przykładowo: kontekstowe tłumaczenia z blokowaniem segmentów PerfectMatch w Tradosie). Wygłodzony zamrożonymi stawkami rynek bardzo mocno poszedł w tym kierunku. O dziwo, jednym z głównych czynników popularyzacji postedycji stała się rewolucja w MT z 2016/2017 roku, która wprowadziła dzisiejszy standard — neuronowe tłumaczenia maszynowe (NMT). Tyle że ta zmiana spowodowała zarazem, że pierwotne założenia postedycji straciły sens. CAT-y jednak zawsze robią to, do czego zmusi je użytkownik. Lub księgowość.

Piąta generacja próbowała zaistnieć już znacznie wcześniej. Były to wszelkiego rodzaju rozwiązania online, których wspólnym mianownikiem było hasło „kontrola”. Across, który dawał firmom pełną władzę nad tym, co tłumacz może zrobić w swoim edytorze, był jednym z prekursorów centralizacji zarządzania projektami tłumaczeniowymi. Ten kierunek mocno wspomógł rozwój CAT-ów online, zwanych też czasem „przeglądarkowymi”. Założenia są rozsądne: tłumacz może korzystać z dowolnego systemu operacyjnego, a nawet dowolnego urządzenia. Znika ryzyko uszkodzenia plików, ustawienia przygotowuje zleceniodawca, a tłumacz nie ryzykuje katastrofą. Głównym minusem były jednak ograniczenia takiego edytora. Dopiero w miarę rozwoju kolejnych wersji standardu HTML, CSS i języka JavaScript stało się możliwe coraz wierniejsze odwzorowanie mechanizmów edycyjnych, znanych z narzędzi wspomagania tłumaczeń instalowanych lokalnie. Powstało też wiele CAT-ów z piekła rodem, które tworzyły wewnętrzne działy firm, sądząc, że pomagają w ten sposób tłumaczom. Nie ulega wątpliwości, że tłumacze nadal nie kochają przesadnie CAT-ów online, ale nikt już też specjalnie nie protestuje przed ich użyciem. Te programy po prostu działają, a różnice w wydajności nie są już dramatyczne, o ile ktoś nie jest tzw. Power Userem, który o 3 w nocy budzi się, krzycząc coś o nowym wyrażeniu regularnym. Kontrola nad procesem po stronie biura jest też czymś, co zdejmuje z tłumacza szereg czynników ryzyka.

Dzisiejsze narzędzia wspomagania tłumaczeń to z pewnością jeszcze nie jest generacja szósta. Dla lepszego uwidocznienia stanu rzeczy można nazwać ją pięć i pół. CAT-y stały się mieszanką wszystkich swoich wcześniejszych odsłon. Czasem przeciążonymi Behemotami. Czasem narzędziami, które udają, że w środku nie ma człowieka-tłumacza. Korzystają z zewnętrznych źródeł, dodatków, rozszerzeń. To narzędzia po ponad 3 dekadach dość stabilnego rozwoju. Są też nadal nieco bardziej zaawansowanymi edytorami tekstu, których głównym ograniczeniem jest ludzka percepcja. Jeśli tekst ma być w całości przeczytany przez tłumacza, żadna technologia najbliższych lat nie sprawi, że nastąpi to szybciej. Przez świat przetacza się właśnie rewolucja AI na skalę, której nigdy dotąd nie było, a która nieuchronnie wpłynie na to, jak pracujemy na co dzień. Branża mówi o niej bardzo dużo, ale dobrych pomysłów jest wciąż niewiele. Pojawiają się już pierwsze dodatki typu chatGPT w Tradosie. Czy mają sens? Cóż, można oczywiście potraktować model językowy jako silnik tłumaczenia maszynowego. Ostatnie wyniki opublikowane przez Custom.MT pokazują, że już teraz sprawuje się w niektórych kierunkach językowych lepiej niż rynkowi hegemoni MT. Taki dodatek do CAT-a będzie więc mieć w środku zaszyte zapytanie (tzw. prompt) o wygenerowanie tłumaczenia. Problemem jest jednak wydajność i czas przesyłania poszczególnych zapytań i odpowiedzi. LLM-y są, póki co, w praktycznych zastosowaniach dużo wolniejsze niż wyspecjalizowane silniki NMT. Oprócz tego prawdziwym ograniczeniem jest zakres zapytania. Przy pracy na poziomie segmentu tracimy najmocniejszą stronę tych rozwiązań — kontekst. Można sobie wyobrazić, że dodatek będzie mógł też przeczytać fragment dokumentu i dopiero później wysłać go do modelu, ale nawet tutaj są ograniczenia długości i „pamięci konwersacji” (na dziś: nie wystarczy na dłuższe dokumenty). Podobnie z terminologią. Można będzie zmusić chatGPT do wyciągnięcia terminów i szybszego zbudowania słownika. Tyle że korzystanie z CAT-a w ten sposób będzie udawaniem, że nadal tkwimy w czasach sprzed rewolucji AI. I że musimy tłumaczyć po staremu.

Co zatem przyniesie generacja szósta? Zanim nadejdzie, potrzebujemy kilku lat w świecie modeli językowych w praktycznych zastosowaniach. Skalę zmian trudno oszacować. Są jednak pewne wskazówki. Procent treści tłumaczonych tradycyjnie w stosunku do treści tłumaczonej maszynowo z każdym rokiem spada. Wśród tej przetłumaczonej przez NMT coraz mniej trafia do ludzkiej weryfikacji. Jakość tłumaczeń maszynowych jest też coraz lepsza, choć postęp — co naturalne na tym poziomie rozwoju — odczuwalnie zwolnił. LLM-y, takie jak chatGPT, będą nadganiać szybko, więc na jakimś etapie pojawi się pytanie o dalszy sens rozwijania MT, skoro ten sam efekt można uzyskać bardziej wszechstronnym rozwiązaniem. Business is business, a trening systemów kosztuje grube miliony dolarów. Coraz częściej będzie też rozbrzmiewać pytanie „po co tłumaczyć, gdy można napisać w języku docelowym?” I to łączy się również z koncepcją „headless TMS”, czyli pozbycie się całego administracyjnego narzutu zarządzania tłumaczeniami. Odpowiednio skonfigurowany system w ogóle nie będzie wymagać logowania się, interfejsów, tradycyjnego zarządzania projektami. Firmy, które i tak wybiorą tłumaczenie maszynowe, wyraźnie chcą po prostu kliknąć jeden przycisk, by odpalić cały proces. Czy to znaczy, że koniec jest bliski i trzeba pakować manatki? Bynajmniej. Te procesy będą, jak zawsze, ujawniać się nierównomiernie w różnych fragmentach rynku. Już teraz pojawiają się jednak nowe możliwości i nowe zastosowania. Dzięki AI tłumacze mogą wykorzystać swoją wiedzę o kulturze i języku, by tworzyć lepsze teksty. Osoby, które przerażała wizja napisania fragmentu kodu lub skryptu, mogą teraz z pomocą najlepszego kompana, chatGPT, z powodzeniem rozwiązać programistycznie jakiś problem ze swojego świata. To nowe możliwości i tłumacz może się do nich doskonale przygotować. Jest tylko jeden kurs na rynku, który to robi, więc nie będę go przesadnie reklamować.

Co jednak z CAT-ami? Czy warto je jeszcze aktualizować i zajmować się nimi? Nie ulega wątpliwości, że bez CAT-a nie ma dziś tłumacza pisemnego (jeszcze parę lat temu dopisałbym tu „nowoczesnego” tłumacza). Narzędzia te jednak osiągnęły taki poziom rozwoju, w którym nowości nie stanowią rewolucji. Dużo bardziej istotne od nazwy czy wersji narzędzia wspomagania tłumaczeń jest to, czy program jest właściwie wykorzystywany. Starszy CAT, poznany dogłębnie i praktycznie, jest dużo skuteczniejszy niż nowy, ale poznany po łebkach. Czasy, gdy oczywistym i niemal obowiązkowym wydawało się coroczne cieszenie się nową wersją narzędzia minęły. Warto oczywiście czysto pragmatycznie co kilka lat podnosić wersję programu, by zachować wsparcie techniczne. Inwestycja w siebie i swoją wiedzę o programie będzie jednak procentować w znacznie większym stopniu. W przypadku CAT-ów jest obecnie całe morze możliwości szkoleniowych. Często świetnych. Zanim wybierzesz, sprawdź, czy osoba prowadząca kurs realnie pracowała z tłumaczeniami, czy rozumie od podszewki proces i czy będzie w stanie rozbudować wiedzę o programie o praktyczne zastosowania i wskazówki dla tłumaczy i biur. A jeśli nie, polecam kurs z Tradosa w Localize.pl. Sprawdzi się w dowolnej wersji programu.