Dane w procesie eksploracji danych
Przedsiębiorstwa często nie zdają sobie sprawy z posiadanych zasobów danych, które posiadają. W celu wyciągania wiedzy z takich źródeł korzysta się z data mining, który jest eksploracją danych. W skład takiego działania wchodzi pozyskiwanie, analiza oraz wykorzystanie danych. Jako iż dotyczy to dużych zbiorów danych i wydobywanie z nich zależności oraz schematów działania takie przeprowadzane są z wykorzystaniem odpowiedniego oprogramowania komputerowego.
Dane pozostają zawsze najważniejsze
Eksplorację danych inaczej nazywa się zagłębianiem danych i stanowi ono etap odkrywania wiedzy, a przy tym jest złożonym procesem analitycznym. Dzięki podejmowaniu działania w obrębie data mining możliwe staje się przewidywanie przyszłych sytuacji. Proces eksploracji danych dzieli się na trzy etapy:
- wstępną eksplorację;
- budowanie modelu i wyznaczenie wzorców wraz z oceną i weryfikacją;
- wdrożenie i wykorzystanie modelu dla kolejnych danych.
Jak odkryć wiedzę w wielości informacji?
Odkrywanie wiedzy w bazach danych koncentruje się na zastosowaniu metod uczenia się, które ukazują występujące regularności w danych. Metody te dzieli się ze względu na rodzaj wiedzy, które odkrywają. Do metod tych zalicza się na przykład:
- klasyfikacje – stosunek między przynależnością do danej kategorii, a ilością i wartością atrybutów;
- zależności przyczynowe – zależności przyczynowe między różnymi atrybutami;
- zależności funkcyjne – wzorce, jakimi najlepiej wyrażają się zależności pomiędzy atrybutami o wartościach liczbowych;
- asocjacje – wartości atrybutów, które często występują razem w danym zbiorze.
To może podlegać pod badanie!
Zależności statystyczne oraz schematy, które zostają odkryte w procesie badawczym prezentowane są za pomocą reguł logicznych, drzew decyzyjnych bądź sieci neuronowych. Najpopularniejszym oprogramowanie komputerowym stosowanym w celu zagłębienia danych jest SAS. Do danych uwzględnionych w data mining zaliczyć można między innymi:
- dokumenty tekstowe;
- bazy danych (ilościowych i jakościowych);
- multimedia;
- sekwencje DNA.
Badanie, które wymaga pewnych informacji
Eksploracja danych swoje działania nakierowuje na różne techniki, które w efekcie dają specyficzny rodzaj wiedzy. Punktem wyjściowym w podejmowanych działaniach są dane, które powinny charakteryzować się wysoką jakością, a przy tym powinny być zgodne z badanym zagadnieniem. Za najważniejszy etap data mining może uznać zbieranie danych oraz ich przygotowanie, gdyż to od posiadanych danych zależy powodzenie całego procesu badawczego.