Państwowy Instytut Badawczy NASK z kluczową rolą – w centralnym, Krajowym Centrum Doskonałości Danych
Lepszą jakość gromadzonych danych ma zapewnić sieć Centrów Doskonałości Danych przy jednostkach badawczych i naukowych, która powstaje w ramach pilotażowego programu Ministerstwa Cyfryzacji. Państwowy Instytut Badawczy NASK pełni w nim kluczową rolę – centralnego, Krajowego Centrum Doskonałości Danych. Jego zadaniem będzie koordynacja systemu doskonałości danych i efektywne wdrażanie standardów zgodnych z krajowymi i europejskimi regulacjami.
Porozumienie zostało podpisane w piątek w siedzibie Uniwersytetu Warmińsko-Mazurskiego, gdzie prezentowano potencjał naukowy i komercyjny regionu w zakresie data science oraz sztucznej inteligencji i rozmawiano o kierunkach rozwoju, również w kontekście wdrażania standardów dotyczących jakości danych. Porozumienie podpisali przedstawiciele Ministerstwa Cyfryzacji, NASK PIB oraz Uniwersytetu Warmińsko-Mazurskiego. UWM jest pierwszą z łącznie czterech instytucji naukowych, które pilotażowo staną się Centrami Doskonałości Danych i wspólnie dadzą początek sieci takich centrów w Polsce.
Odpowiednie standardy dotyczące danych
Polska już teraz jest liderem w kwestii otwartych danych w Unii Europejskiej. Natomiast wyzwaniem jest zapewnienie ich jakości oraz opracowanie i egzekwowanie standardów dotyczących bezstronności i reprezentatywności danych. Podjęcie inicjatywy w tym zakresie jest odpowiedzią również na tworzące się właśnie regulacje europejskie dotyczące przestrzeni danych oraz sztucznej inteligencji. By jednostki badawcze w momencie wejścia w życie zapisów m.in. AI Act czy European Health Data Space mogły kontynuować swoje badania i wdrożenia bez ryzyka ich wstrzymania czy reorganizacji, należy już teraz podejmować działania mające na celu przygotowanie i wdrożenie odpowiednich mechanizmów użycia, standardów dotyczących danych, które jednostki te pozyskują, opracowują i na których prowadzą badania.
– Jeśli chcemy wspierać rozwój innowacji wykorzystującej metody oparte na danych, takie jak metody predykcyjne czy sztuczna inteligencja, to musimy inwestować – czas, uwagę i finanse – w dane. Od pewnego czasu zdajemy sobie sprawę z tego, że niezwykle ważna jest kwestia ich bezpieczeństwa oraz zasoby sprzętowe do ich przechowywania i przetwarzania. Teraz, w świetle nieodległych zmian legislacyjnych, przychodzi czas na powiedzenie „sprawdzam” jakości zbieranych danych. I mam tu na myśli dosłownie jakość obrazu, tekstu czy dźwięku, ale też jakość etykiet i cech przypisanych tym danym, ich dobór, format. Wreszcie na scenę wchodzą początkowo trudne, czasem pewnie niewygodne, ale niesłychanie ważne: transparentność, bezstronność i reprezentatywność – mówi dr Inez Okulska, Dyrektor Departamentu Innowacji i Technologii w Ministerstwie Cyfryzacji.
Ponadto sama jakość badań naukowych bezsprzecznie zależy od jakości danych, które są do nich wykorzystywane, dlatego dbałość o najwyższe standardy doboru, etykietowania czy reprezentatywności to aspekty, które wymagają szczególnej uwagi. I wreszcie wspólne standardy w zakresie formatów i metod anonimizacji (pseudonimizacji) danych mogą istotnie przyczynić się do skutecznej wymiany danych pomiędzy jednostkami.
– Dynamiczny rozwój technologii wiąże się ze zbieraniem ogromnych ilości danych. Aby wyniki badań opierających się na takich zbiorach były reprezentatywne, niezwykle istotna jest jakość danych, warunkowana m.in. właściwym ich opracowywaniem. Sprawowanie pieczy nad całym systemem Centrów Doskonałości Danych stawia przed NASK kolejne, niełatwe wyzwania, ale ich podjęcie jest niezbędne do uzyskania wysokiej jakości materiałów do badań naukowych – podkreśla Wojciech Pawlak, Dyrektor NASK.
NASK jako Krajowe Centrum Doskonałości Danych
Właśnie dlatego przy instytutach i jednostkach badawczych powstają Centra Doskonałości Danych (CDD) wraz z Krajowym Centrum Doskonałości znajdującym się w Państwowym Instytucie Badawczym NASK. CDD będą zbierały i przygotowywały dane z podległej sobie instytucji na użytek badawczy tej instytucji (model danych zamkniętych, projektowych), na użytek współpracy naukowej z innymi instytucjami (model danych warunkowo otwartych), a także na użytek całkowicie publiczny (model otwartych danych, tak jak na otwartedane.gov.pl).
– Pilotażowa sieć Centrów Doskonałości Danych to forpoczta zmiany cywilizacyjnej – budowy systemu doskonałości danych, fundamentu nowej gospodarki opartej na wielkoskalowym, maszynowym, inteligentnym i etycznym przetwarzaniu informacji – zauważa Paweł Kostkiewicz, Dyrektor ds. Certyfikacji NASK-PIB.
Nadrzędnym celem Krajowego Centrum Doskonałości Danych będzie koordynacja systemu w skali kraju i efektywne wdrażanie regulacji krajowych i europejskich sukcesywnie przyjmowanych i wpisujących się w ramy europejskiej strategii w zakresie danych. Wśród jego zadań będzie również przygotowanie wybranych do pilotażu jednostek naukowych, mających stać się Centrami Doskonałości Danych i późniejsza koordynacja procesu opracowania danych wykorzystywanych do celów naukowych i komercyjnych w tych centrach, by były zgodne z wytycznymi. NASK jako Krajowe Centrum Doskonałości Danych będzie również opracowywał wytyczne w zakresie standardów dotyczących transparentności, bezstronności i reprezentatywności danych, a także rekomendacje w zakresie formatów oraz ich egzekwowanie. Jego zadaniem będzie także certyfikacja danych, w tym procesu ich anonimizacji.