Usuwanie powtarzajączych się tresci przed wysłaniem ich przez OmegaT (lub podobny CAT tool) do tłumaczenia maszynowego API

Zlecenie zamknięte
maksioo
maksioo
Zleceniodawca
12 umów
Kategoria zlecenia:
Usługi programowania
Budżet:

200,00 PLN

Umiejętności:
xml
Opublikowano:
Ważne do:

Opis zlecenia

Drodzy eksperci,

Mamy pliki e-commerce, SKU o podobnych nazwach, różnych numerach typu

Na przykład:

PŁYTKA ELEKTRONICZNA PF34534500-2

PŁYTKA ELEKTRONICZNA OPF435400

PŁYTKA ELEKTRONICZNA KKLFI 24/36/48

PŁYTKA ELEKTRONICZNA S442000

Problem polega na tym, że jeśli przetłumaczymy 10k takich akapitów maszynowo, tylko 10% będzie unikalnych, reszta to tylko powtarzający się tekst.

W rezultacie wszystkie znaki przetłumaczone za pomocą tłumaczenia maszynowego API zostaną policzone jako tlumaczone. W przypadku tłumaczenia powtarzających się tekstów jest to ważny czynnik, który należy wziąć pod uwagę, aby uniknąć tłumaczenia tego samego tekstu w kółko i w ten sposób zaoszczędzić na zużyciu.

Moje pytanie brzmi: jak skonfigurować program OmegaT, aby przed zapytaniem do MT API o przetłumaczenie dowolnego tekstu korzystał z baz danych, tak aby jego system najpierw sprawdzał, czy dla tekstu, który ma być przetłumaczony, istnieją istniejące tłumaczenia. Jeśli odpowiedź brzmi "tak", wyświetlane jest tłumaczenie już dostępne. Jeśli odpowiedź brzmi "nie", wówczas tekst do przetłumaczenia jest wysyłany do MT API i zapisywany w bazie danych. Jakieś wtyczki, proces, niestandardowa praca? Dziękuję z góry. Plik nalezy sprowadzic do pierwotnej postacie po otrzymaniu odpowiedzi z MT.

informacje odnosnie OmegaT

https://omegat.org/resources

http://185.13.37.79:8003/index.php/p/omegat-core/source/tree/3.1.1/docs_devel/OmegaT-plugin-demo/Creating%20an%20OmegaT%20Plugin.odt

https://github.com/omegat-org/plugin-skeleton

Wymagane funkcje:

Przesłane oferty

To zlecenie nie ma jeszcze ofert.