Polski zespół inżynierów i naukowców z firmy Snowflake opracował rewolucyjne rozwiązanie, które usprawnia zarządzanie firmową dokumentacją
Średni czas przeznaczany przez pracowników biurowych na poszukiwanie dokumentów i zawartych w nich informacji może sięgać nawet dwóch godzin dziennie. W rezultacie, największe przedsiębiorstwa łącznie tracą średnio 12 miliardów dolarów w ciągu roku z powodu nieefektywnego zarządzania danymi nieustrukturyzowanymi. A co, gdyby te procesy zautomatyzować? Nad rewolucyjnym rozwiązaniem, które usprawni zarządzanie firmową dokumentacją przez dwa lata pracował polski zespół inżynierów i naukowców z firmy Snowflake. Dziś z tego rozwiązania korzystają już firmy na całym świecie.
Biznes co roku generuje ogromne ilości nieustrukturyzowanych dokumentów. Są to pliki tekstowe i PDF, prezentacje, arkusze kalkulacyjne, obrazy i wideo, czyli wszystkie zasoby tworzone przez pracowników w trakcie realizacji codziennych zadań służbowych. Szacuje się, że stanowią one nawet od 80 do 90 procent wszystkich danych na świecie. Jednak ze względu na ich różnorodne formaty czy złożoność języka nie nadają się one do zaawansowanej analizy, a co za tym idzie, ciężko jest wyciągnąć z nich prawdziwą wartość biznesową.
„Wyobraźmy sobie zasób firmowych plików, liczący 40 mln obiektów, każdy o objętości 20 stron. Gdyby chcieć wyekstrahować z nich konkretne informacje siłami personelu, to przy zatrudnieniu do tego zadania 200 osób, proces trwałby cały rok” – przekonuje Michał Gdak, Senior Engineering Manager w Snowflake, ukazując wyzwanie, z jakim mierzą się tysiące organizacji na całym świecie. Rozwiązaniem tego problemu, jak się okazuje, może być sztuczna inteligencja.
Document AI to innowacyjne rozwiązanie do przetwarzania i wyodrębniania nieustrukturyzowanych danych z dokumentów, które wykorzystuje sztuczną inteligencję, aby zautomatyzować i usprawnić zarządzanie danymi. Za rozwój aplikacji przez ostatnie dwa lata odpowiadał zespół dwudziestu inżynierów i kilkunastu naukowców z warszawskiego oddziału firmy Snowflake.
Rozwiązanie pozwala organizacjom łatwo wyodrębniać z dokumentów kluczowe informacje, takie jak kwoty na fakturach czy postanowienia i warunki kontraktowe bez konieczności ręcznej analizy każdego dokumentu. To sprawia, że procesy obiegu dokumentów stają się bardziej płynne, umożliwiając szybszą reakcję pracowników.
„Document AI działa nie tylko w oparciu o standardowe procesy rozpoznawania pisma (OCR), ale przekazuje do modelu koordynaty każdego wyrazu na stronie oraz jego relacje do innych słów wraz z reprezentacją graficzną. Pozwala to rozpoznawać wzajemne korelacje poszczególnych elementów oraz ekstrahować informacje zawarte w elementach nietekstowych” – wyjaśnia Michał Gdak.
Szerokie zastosowanie
Document AI dobrze sobie radzi również z problemem, z którym zmaga się wiele systemów OCR, a mianowicie z rozpoznawaniem elementów graficznych w dokumentach, na przykład pól wyboru – tzw. check-boksów. Dzięki temu, przykładowo w służbie zdrowia idealnie nadaje się do analizy wyników badań laboratoryjnych i wszelkiego rodzaju formularzy, aby zapewnić bardziej kompleksową opiekę nad pacjentem, w krótszym czasie. Podstawą działania usługi jest nowoczesny model Snowflake Arctic-TILT, będący rozwinięciem modelu TILT, który Snowflake nabył wraz z przejęciem polskiej spółki Applica w 2022 r. TILT jest modelem wyspecjalizowanym w ekstrakcji informacji z dokumentów i dorównuje czołowym modelom od Google czy OpenAI.
Document AI dowiódł już o swojej przydatności – świadczy o tym m.in. przykład amerykańskiej uczelni Florida State University, gdzie łączenie i udostępnianie nowych zestawów danych z różnych źródeł skróciło się z dziewięćdziesięciu dni do pięciu. Z kolei firma Applica odnotowała obniżkę kosztów operacyjnych związanych z zarządzaniem dokumentami o około 80 proc. Co istotne, korzystanie z Document AI jest tańsze w porównaniu do modeli ogólnych, takich jak ChatGPT, dzięki czemu rozwiązanie ma szansę konkurować z największymi graczami w tej dziedzinie.
„Cały czas rozszerzamy dostępność Document AI pośród naszych dostawców chmurowych. Obecnie jesteśmy dostępni w Microsoft Azure i Amazon Web Services, a już wkrótce będzie można korzystać z naszych usług również na Google Cloud Platform” – zapowiada Michał Gdak. Dzięki szerokiej dostępności w chmurze, firmy mogą korzystać z Document AI bez względu na preferowanego dostawcę chmury, co daje im dużą elastyczność w integracji tego rozwiązania z istniejącymi systemami IT.