Ośrodek Przetwarzania Informacji zdecydował się na wdrożenie technologii autonomicznej Oracle. OPI stawiając na sztuczną inteligencję uzyskało aż o 40% szybsze dostarczanie usług!
Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy, dostarczający analizy m.in. na zlecenie Ministerstwa Nauki i Szkolnictwa Wyższego, zdecydował się na wdrożenie technologii autonomicznej Oracle, wykorzystującej sztuczną inteligencję. Pozwoliła ona nie tylko znacząco skrócić czas dostarczania odpowiedzi na zapytania, ale też poprawić ich jakość dzięki automatyzacji prac administracyjnych. To pierwszy w Polsce kontrakt podpisany przez jednostkę administracji publicznej na implementację autonomicznej bazy danych Oracle.
Potrafi się samodzielnie naprawiać, optymalizować i zabezpieczać. Cały czas się uczy i do obsługi nie potrzebuje administratora. Autonomiczna baza danych Oracle, której opracowanie Larry Ellison porównał do rewolucji na miarę Internetu, została wdrożona przez polską instytucję: Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy. Do tej pory takie rozwiązanie wdrażali głównie zachodni giganci, tacy jak np. Hertz.
Sprawdzi plagiat i liczbę absolwentów z Ukrainy
OPI to jednostka gromadząca i udostępniająca informacje na potrzeby Ministerstwa Nauki i Szkolnictwa Wyższego, jak również Narodowego Centrum Nauki oraz Narodowego Centrum Badań i Rozwoju. Z danych OPI korzystają też inne instytucje oraz media.
– Można powiedzieć, że jesteśmy oczami Ministerstwa Nauki i Szkolnictwa Wyższego, dostarczając resortowi wartościowych danych i analiz dotyczących nauki. To np. dane na temat potrzebnych z punktu widzenia rozwoju firm kierunków studiów czy deficytu określonych specjalności, wysokości zarobków po ukończeniu określonych kierunków czy czasu potrzebnego przez absolwentów wyższych uczelni na znalezienie pracy. Ale nie tylko. Dostarczamy też informacje dla mediów czy innych odbiorców instytucjonalnych. Niedawno zwróciła się do nas np. firma transportowa z zapytaniem o liczbę absolwentów narodowości ukraińskiej i białoruskiej, kończących uczelnie w konkretnych miastach. Dostarczaliśmy też np. informacje dotyczące zasadności otwarcia studiów podyplomowych o danej specjalności, analizując liczbę absolwentów uczelni wyższych – tłumaczy Krzysztof Wiliński, Kierownik Działu Zasobów Informacyjnych Ośrodka Przetwarzania Informacji.
Aby dostarczać wartościowych i przekrojowych odpowiedzi na zapytania, OPI gromadzi i przetwarza wiele danych, w tym także te wrażliwe. To m.in. informacje o studentach, ich wieku, numerach PESEL, osiągnięciach naukowych, pobieranych stypendiach, sprawozdaniach finansowych kilkuset szkół wyższych, publikacjach naukowych czy pracach dyplomowych, które są analizowane i sprawdzane przez Jednolity System Antyplagiatowy pod kątem możliwości wystąpienia plagiatu.
– To wymusza odpowiedni poziom bezpieczeństwa. Ten aspekt był jednym z powodów decyzji o wyborze technologii autonomicznej, jednak nie najważniejszym. Bezpośrednią przyczyną poszukiwania nowych rozwiązań stała się ograniczona przestrzeń dyskowa używana do przechowywania baz analitycznych. Rosła liczba i złożoność zapytań, co wraz z potrzebą dostosowania naszych raportów do sprawozdawczości międzynarodowej, skutkowało dużymi obciążeniami serwera. Przy iteracyjnym podejściu do budowania raportów, pociągało to za sobą trudne do zaakceptowania czasy realizacji zapytań – zwraca uwagę Krzysztof Wiliński.
Nawet 1200 zapytań miesięcznie
Jeszcze 3 lata temu ich liczba w ciągu miesiąca nie przekraczała 200. W ostatnich latach, w rekordowym miesiącu było ich ponad 1200, co więcej, nierzadko różnice w liczbie zapytań w poszczególnych miesiącach sięgały kilkuset procent. To rodziło wiele wyzwań związanych z koniecznością zapewnienia odpowiedniej mocy obliczeniowej do przetwarzania większej liczby danych, przy jednoczesnym braku możliwości prognozowania liczby zapytań. Spełnienie wymagań pociągnęłoby za sobą dodatkowe i niemałe koszty, których OPI chciało uniknąć.
– Problemem był brak możliwości równoczesnej pracy na więcej niż jednej kopii bazy. Mieliśmy też sytuacje, w których do obsługi zapytań potrzebowaliśmy zaledwie 2 rdzeni procesora, a były też takie, gdzie potrzebowaliśmy ich np. 16. Poszukiwaliśmy więc rozwiązania z jednej strony o wysokiej dostępności i niezawodnego, gwarantującego spełnienie wymagań, np. RODO, a z drugiej taniego, które łatwo było skalować. Z tego powodu rozwiązania autonomiczne, nie wymagające od analityka danych głębokiej wiedzy technicznej z zakresu administracji i optymalizacji bazy czy hurtowni danych, od początku były rozwiązaniami przez nas preferowanymi – zwraca uwagę Krzysztof Wiliński.
AI w kilka godzin
Ośrodek Przetwarzania Informacji zdecydował się na wdrożenie technologii bazodanowej Oracle. Konkretnie na zastosowanie autonomicznej bazy danych Oracle Autonomous Database Warehouse Cloud. Baza ta przechowuje dane analityczne w chmurze i jest jedną z wersji Oracle Autonomous Database, która została skonfigurowana specjalnie dla potrzeb OPI – realizowania zadań związanych z szybkim przesyłaniem i analizowaniem danych.
– Autonomiczna baza danych jest jednym z najważniejszych produktów Oracle w całej historii tej firmy – komentuje Tomasz Przybyszewski, Autonomous Cloud, Regional Senior Sales Leader odpowiedzialny za obszar Polski i Ukrainy. – Dzięki wykorzystaniu sztucznej inteligencji na potrzeby obsługi zadań administracyjnych, baza ta jest właściwie bezobsługowa. Sama się skaluje, stroi, dba o swoje bezpieczeństwo i aktualność. Autonomiczna baza Oracle działa w chmurze, co daje niemal nieskończoną skalowalność zasobów. Jest także bardzo łatwa do uruchomienia i może zostać wykorzystana niemal od razu.
– Uruchomienie usługi zajęło efektywnie kilka godzin pracy wykonanej w większości przez osoby nie będące administratorami. Aktualnie korzystamy ze wsparcia administratorów wyłącznie przy ładowaniu danych do chmury – potwierdza to Krzysztof Wiliński, Kierownik Działu Zasobów Informacyjnych Ośrodka Przetwarzania Informacji.
Nawet 40% szybciej
Wdrożenie autonomicznej technologii przyniosło szereg korzyści. Najbardziej widocznym efektem było przyśpieszenie tworzenia analiz i poprawa jakości dostarczanych informacji. Automatyzacja i związany z nią brak konieczności realizowania działań administracyjnych, sprawiła, że pracownicy OPI mogli się w większym stopniu zaangażować w prototypowanie zapytań.
– Sztuczna inteligencja daje nam możliwość skoncentrowania się na tym, co jest najważniejsze – zwiększeniu satysfakcji odbiorców naszych analiz. Dzięki technologii mamy znacznie więcej czasu na zrozumienie problemu z jakim zwraca się do nas klient i prototypowanie zapytań. To sprawia, że analizy dostarczamy szybciej i są one dokładniejsze – przekonuje Krzysztof Wiliński.
Jako przykład podaje np. analizę udziału kobiet w polskiej nauce, realizowaną na potrzeby Komisji Europejskiej. Aby przygotować dane we właściwych przekrojach, w długim horyzoncie czasu, zapytania wysyłane do bazy danych przed erą autonomicznej technologii, przetwarzały się nawet kilka godzin. Dziś, dzięki chmurze rekordów i sztucznej inteligencji, czas ich realizacji jest znacznie krótszy i w dodatku tańszy.
– Autonomiczność rozwiązania pozwoliła na wyeliminowanie czynności administracyjnych związanych z utrzymywaniem danej kopii bazy – mówi Krzysztof Wiliński. – Szacujemy, że dzięki zastosowaniu Oracle ADW, czas realizacji wspomnianych zleceń skrócił się średnio o 40%. Jednocześnie dzięki możliwości szybkiego skalowania bazy danych Oracle, czas wykonywania ekstrakcji i agregacji danych zredukował się nawet kilkukrotnie.
Zwraca on jednocześnie uwagę na elastyczność kosztów, które obecnie OPI ponosi wyłącznie za wykorzystaną moc obliczeniową, przestrzeń dyskową i faktycznie używane aplikacje.
– Nie musimy ponosić wysokich, jednorazowych kosztów na zakup i utrzymywanie serwerów fizycznych i aplikacji, z konieczności kupowanych „na wyrost” dla zabezpieczenia przyszłych potrzeb. Tutaj „ekonomia współdzielenia”, w której płacimy za wykorzystane rdzenie, licencje i przestrzeń dyskową, tylko gdy są one używane, wykazuje swoją przewagę kosztową nad rozwiązaniami tradycyjnymi. Dodatkowo możliwość skalowania zasobów przeznaczanych na realizację ciężkich zapytań pozwala na usprawnienie realizacji zleceń – zwraca uwagę Krzysztof Wiliński.
Do tej pory autonomiczną bazę danych Oracle wdrożył np. Hertz, który przyśpieszył realizację projektów IT dzięki skróceniu czasu konfiguracji baz danych z kilku tygodni do kilku minut. Beneficjentem tej technologii jest też m.in. producent oprogramowania Data Intensity, który po jej wdrożeniu odnotował 10-krotnie szybszy dostęp do danych i 4-krotnie wyższą wydajność w porównaniu do najnowszych rozwiązań wykorzystywanych do tej pory w firmie.