Meta rozwija tłumacza, który ma działać prawie tak sprawnie, jak Babel fish z „Autostopem przez galaktykę”

SEAMLESSM4T meta tłumacz

Zespół badaczy Meta zaprezentował SEAMLESSM4T, model uczenia maszynowego, który może umożliwić niemal natychmiastowe tłumaczenie mowy między 36 językami. Choć technologia wciąż jest w fazie rozwoju, jej potencjał budzi duże zainteresowanie.

Meta ogłosiła opracowanie modelu SEAMLESSM4T, który stanowi krok naprzód w tłumaczeniu mowy na mowę. Wyniki badań nad modelem zostały opublikowane w czasopiśmie Nature, a naukowcy opisują go jako narzędzie zdolne do „usprawnienia wielojęzycznej wymiany zdań w różnych kontekstach”.

Model szkolony był na bazie 4,5 miliona godzin nagrań audio, a do ich zebrania wykorzystano „innowacyjne” podejście do gromadzenia i analizy danych. Badacze zastosowali metodę „miningu” internetu, aby znaleźć fragmenty nagrań audio pasujące do napisów w różnych językach i w ten sposób udało się zgromadzić około 443 tysiące godzin materiału audio powiązanego z tekstem oraz 30 tysięcy godzin dialogów.

Profesor Tanel Alumäe z Estońskiego Uniwersytetu Technologicznego zwraca uwagę, że model jest bardziej otwarty niż inne narzędzia tej klasy, co umożliwia dalszy rozwój aplikacji opartych na tej technologii przez niezależnych badaczy i instytucje.

słownik tłumacz

Photo By: Kaboompics.com

 

SEAMLESSM4T może tłumaczyć mowę na tekst w ponad 100 językach, ale wciąż daleko mu do obsługi wszystkich 7 tysięcy języków używanych na świecie. Model zmaga się także z problemami, które dla ludzi są naturalne do rozwiązania, takimi jak rozmowy w hałaśliwym środowisku czy zrozumienie silnych akcentów.

Allison Koenecke z Uniwersytetu Cornella podkreśla, że technologia może znacząco obniżyć koszty tłumaczeń, ale jej ograniczenia, w tym różnice w jakości tłumaczeń dla różnych grup demograficznych, wymagają dalszych badań. W artykule towarzyszącym badaniom Meta opisano również analizę toksyczności języka i uprzedzeń płciowych, które mogą wpływać na funkcjonowanie modelu.

Zdaniem badaczy przyszłe prace powinny skupić się na naturalności generowanego dźwięku oraz tłumaczeniu w czasie rzeczywistym, co mogłoby zwiększyć zastosowanie takich systemów w praktyce. Choć technologia wciąż jest w fazie eksperymentalnej, wyniki badań sugerują, że SEAMLESSM4T otwiera nowe możliwości w zakresie tłumaczeń mowy.