Infobazy 2011 - streszczenia

Zarządzanie danymi podstawowymi w obszarze instytucji sektora publicznego

Cezary Mazurek1, Damian Mierzwiński1, Aleksander Stasiak1, Maciej Stroiński1, Marcin Wolski1

1IChB PAN - Poznańskie Centrum Superkomputerowo-Sieciowe, Dział Usług Sieciowych, ul. Noskowskiego 10, 61-704 Poznań

 

Celem referatu jest przedstawienie podejścia do zarządzania danymi podstawowymi (ang. Master Data Management), określanego dalej jako MDM, jako istotnego usprawnienia w procesie rozwoju systemów informatycznych. Prace te mają istotne znaczenie dla informatyzacji sektora publicznego w Polsce. W szczególności jednym z głównych problemów współdziałania systemów IT jest określenie wspólnego widoku na dane.

Artykuł składa się z trzech zasadniczych części. W części pierwszej przedstawiona jest definicja MDM, jako procesu będącego w posiadaniu kluczowych jednostek danych, który je opisuje i nimi zarządza. Część druga prezentuje cztery podstawowe wzorce architektoniczne: 1) centralne repozytorium danych podstawowych, 2) system wiodący, 3) standardy oraz 4) repozytorium indeksujące. W części trzeciej przedstawiony jest przykładowy proces MDM oraz możliwe sposoby nadzoru danych podstawowych, w tym określenie ich przynależności, a także metryki umożliwiające ocenę ich jakości. Omawiane są też wymierne korzyści, które mogą stać się udziałem organizacji implementującej MDM: 1) ograniczenie liczby błędów w danych, 2) określenie ich globalnego widoku, a także 3) oszczędności związane z łatwiejszą rozbudową już istniejących aplikacji oraz wdrażania nowych.

Jako wstęp do ewaluacji poczynionych wcześniej założeń opisano scenariusze przyszłych badań nad rozwojem architektury repozytoriów danych w ramach MDM. Ich celem jest zbadanie wpływu przyjętych rozwiązań architektonicznych na jakość danych podstawowych oraz wydajność ich przetwarzania, zredukowaną przez konieczność synchronizacji ich źródeł. Wynikiem realizacji prac będzie projekt repozytorium danych gwarantujący wymaganą jakość danych przy akceptowalnym poziomie wydajności.

Artykuł nawiązuje do realizacji prac badawczo-rozwojowych prowadzących do zbudowania pilotowego repozytorium MDM jako jednego ze składników zintegrowanych platform teleinformatycznych nowej generacji.