Infobazy 2011 - streszczenia

Problemy metodologiczne i kierunki rozwojowe wydobywania wiedzy z danych

Juliusz L. Kulikowski

Instytut Biocybernetyki i Inżynierii Biomedycznej im. M. Nałęcza PAN, Warszawa

 

Streszczenie

Postęp cywilizacyjny w bieżącym stuleciu odbywa się pod hasłem budowy społeczeństwa opartego na wiedzy, jako kolejnego etapu po okresie budowy społeczeństwa opartego na informacji, zapoczątkowanego w latach 70-tych ub. stulecia. W obu przypadkach mamy do czynienia z tendencją wynikającą z szybkiego rozwoju technik informatycznych i telekomunikacyjnych, ale wymuszoną ogólniejszymi procesami globalizacji gospodarki światowej. Wiedza jest informacją dotyczącą określonego obiektu, zdarzenia, procesu lub rządzących nimi reguł, o zweryfikowanej wiarogodności, przedstawioną w sposób usystematyzowany i umożliwiający jej jednoznaczną interpretację. Rozwój technicznych możliwości gromadzenia danych w różnych dziedzinach działalności ludzkiej stworzył też warunki do ekstrakcji zawartej w nich wiedzy przy użyciu zaawansowanych metod matematycznych i techniki komputerowych. Tak powstał kierunek badań zwany inżynierią wiedzy, a w jego ramach – kierunek zwany eksploracją lub wydobywaniem wiedzy z danych. Efektem jego rozwoju  powinny być opisy obiektów, zdarzeń, procesów i/lub rządzących nimi reguł,  spełniające określone kryteria jakości: wiarogodności, dokładności, weryfikowalności, aktualności, wzajemnej spójności logicznej, przydatności, dostępności itp. Dobór właściwych modeli matematycznych wydobywania wiedzy z danych, któremu w literaturze tego przedmiotu poświęca się najwięcej uwagi, zapewnia  spełnienie jedynie niektórych spośród wyżej wymienionych kryteriów jakości. Spełnienie innych kryteriów wymaga sformułowania i przestrzegania określonych  zasad metodologicznych w tym większym stopniu, im szerzej dostępne są elementy wiedzy uzyskanej na drodze eksploracji danych lub im ważniejszy jest  obszar ich ewentualnych zastosowań. Wydobywanie wiedzy nie jest już tylko problemem informatycznym, lecz na skutek jego rozpowszechnienia stało się problemem społecznym: zespołowego tworzenia zasobów wiedzy przeznaczonych do szerokiego użytku z wszelkimi tego następstwami społecznymi, gospodarczymi, kulturowymi itp. Z kolei, te właśnie szersze aspekty wydobywania i upowszechniania wiedzy wymagają stworzenia narzędzi informatycznych, które umożliwią lub ułatwią kontrolę nad jej jakością. W referacie powyższe problemy rozwoju systemów wydobywania wiedzy i środki zmierzające do ich  rozwiązania zostaną omówione szerzej, także w aspekcie ich związku z zadaniami Komitetu ds. Danych dla Nauki i Techniki CODATA.