Veon znajduje sprzymierzeńców do wypełnienia „luki językowej AI”
Firma telekomunikacyjna Veon, operator komórkowy Beeline Kazachstan, Centrum Superkomputerowe w Barcelonie i grupa lobby GSMA środę wydały oświadczenie, w którym ogłosiły, że zamierzają współpracować, aby wypełnić „lukę językową sztucznej inteligencji” w przypadku języków niedostatecznie reprezentowanych.
Jak relacjonuje Reuters, podmioty będą współpracować przy opracowywaniu narzędzi i dokumentacji modeli językowych w niedostatecznie reprezentowanych językach, w tym językach używanych w krajach, w których Veon prowadzi działalność – Pakistanie, Ukrainie, Bangladeszu, Kazachstanie, Uzbekistanie i Kirgistanie. W oświadczeniu podano, że innym językiem jest kataloński, którym posługuje się około 10 milionów ludzi.
„Brak zasobów w innych językach skutkuje luką językową w sztucznej inteligencji, co prowadzi do nieoptymalnego doświadczenia użytkownika w aplikacjach sztucznej inteligencji, pogłębia stronniczość w modelach sztucznej inteligencji i stwarza ryzyko pogłębienia przepaści cyfrowej w technologiach sztucznej inteligencji” – dodali zaangażowani w projekt.
Duże modele językowe obsługujące „boty”, takie jak chatGPT, często opierają się na obszarach danych online, takich jak cyfrowe książki, strony internetowe, artykuły i blogi, aby dowiedzieć się, jak generować odpowiedzi podobne do ludzkich. Jednak dane i zasoby w niektórych językach są ograniczone.
„Spośród prawie 7000 języków używanych na całym świecie tylko siedem uważa się za języki o dużych zasobach w cyfrowym świecie: angielski, hiszpański, francuski, mandaryński, arabski, niemiecki i japoński” – podkreśliły grupy we wspólnym oświadczeniu.