Bazy danych

 

Podstawowe pojęcia   2

Rekordy i pola   2

Administrowanie danymi  3

Administrowanie baza danych   3

Struktura bazy danych   3

Hierarchiczne bazy danych   4

Sieciowe bazy danych   4

Relacyjne bazy danych   4

SQL   4

Hurtownie danych   5

Minimalizacja redundancji  6

 


Podstawowe pojęcia

Baza danych to zbiór wzajemnie powiązanych ze sobą i zintegrowanych danych z pewnej dziedziny. Korzyściami ze stosowania baz danych są:

q       Likwidacja lub znaczne ograniczenie redundancji (powtarzania się) danych

q       Integracja danych

q       Bezpieczeństwo danych

System zarządzania bazą danych to zbiór programów umożliwiających zapamiętywanie, manipulowanie i przetwarzanie danych i zapewniający użytkownikom bezpieczeństwo, poufność i integralność danych. Jego podstawowe cechy to:

q       Tworzenie struktur do przechowywania danych

q       Wprowadzanie i aktualizacja danych w bazie danych

q       Zapewnienie możliwości korzystania z bazy przez wielu użytkowników

q       Automatyzacja archiwizacji i odtwarzania zasobów

Rekordy i pola

Podstawowy element bazy to rekord. Poszczególne jednostki informacji w rekordzie to pola. Dane w bazie są powiązane, co oznacza, że istnieją między nimi określone relacje, związki.

Warunki integralności do zdefiniowane przez użytkownika reguły, pozwalające zachować poprawność danych.

q       Warunki unikatowości

q       Warunki typu sprawdź czy

q       Warunki wskazujące na powiązania danych

Obraz bazy może być tworzony na żądanie użytkownika, przez komunikację z bazą danych z wykorzystaniem systemu zarządzania bazą danych lub odpowiedniej aplikacji.

Administrowanie danymi

Administrowanie danymi polega na polega na ustanowieniu i kontrolowaniu ogólnej polityki i szczegółowych procedur dotyczących danych, zbierania, przechowywania i rozpowszechniania: Podstawowe elementy tego procesu to:

q       Modyfikowanie modelu logicznego

q       Kontrola zgodności struktury bazy z modelem logicznym

q       Szkolenie personelu

q       Ustalanie standardów projektowania bazy

q       Ustalanie praw dostępu dla poszczególnych użytkowników

q       Kontrola operacji z uwzględnieniem integralności bazy

Administrowanie baza danych

Administrowanie bazą danych to funkcja techniczna. Obejmuje ono takie zadania jak:

q       Projektowanie fizycznego zapisu bazy

q       Współpraca z zespołem odpowiedzialnym za sprzęt

Struktura bazy danych

Logiczna organizacja bazy danych może być:

q       Hierarchiczna

q       Sieciowa

q       Relacyjna

Dla użytkownika końcowego fakt wyboru określonej organizacji nie jest dostrzegalny. Wybór sposobu organizacji zależy od projektanta bazy danych. Wybór typu powinien być podyktowany:

q       Szybkim wykonywaniem operacji na bazie

q       Elastycznością w przypadku dokonywania zmian

Hierarchiczne bazy danych

W hierarchicznej strukturze bazy danych zapisuje się zwykle zależności jeden do wielu (1:n), bądź też (1:1) w których rozróżniane są dwa poziomy – wyższy i niższy.

q       Jeden departament może zatrudniać wielu pracowników (1:n)

q       Jeden pracownik może być zatrudniony w jednym departamencie (1:1)

Przy takiej strukturze bazy łatwo jest na przykład uzyskać informacje o imionach i nazwiskach wszystkich pracowników poszczególnych departamentów.

Bazy hierarchiczne nie są stosowane w przypadku zależności wiele do wielu (m:n) – klasycznym przykładem są przedmioty (oceny z nich) i studenci.

Sieciowe bazy danych

Sieciowa baza danych pozwala także na odwzorowanie zależności n:1, co daje większe możliwości przy definiowaniu struktury.

Schemat sieciowy można zamienić na jeden lub wiele schematów hierarchicznych.

Struktura sieciowa pozwala na dostęp do danych począwszy od pewnego punktu startowego według określonej ścieżki.

Relacyjne bazy danych

Relacyjna baza danych pozwala na zapisywanie danych w dwuwymiarowej tablicy relacji. Model relacyjny został po raz pierwszy przedstawiony w 1970 przez E.F. Codd’a. Może być ona zbudowana z wielu relacji, między którymi istnieją związki 1:n lub 1:1. Większość obecnie istniejących baz to bazy relacyjne.

SQL

Użytkownicy poszukujący informacji w bazie wykorzystują języki zgodne ze standardem SQL – Structured Query Language.

SQL został zatwierdzony w 1986 przez organizacje ANSI i ISO. Pozwala on na:

q       Wykonywanie operacji na danych

q       Tworzenie obiektów bazy – tablic

q       Zarządzanie prawami dostępu do bazy

q       Definiowanie warunków integralności

Projektowanie baz danych odbywa się często z wykorzystaniem narzędzi CASE – Computer Aided Software Engineering, często stosujących podejście obiektowe – analizę, projektowanie i programowanie.

Podczas etapu tworzenia strategii budowy bazy zapadają decyzje dotyczące obszaru rozpatrywanych zagadnień, koszcie przedsięwzięcia.

Etap analizy prowadzi do powstania modelu koncepcyjnego.

Podczas etapu projektowania model koncepcyjny ulega transformacji w model logiczny, który umożliwia utworzenie fizycznych struktur danych.

Tworzenie dokumentacji, wdrożenie i eksploatacja systemu nie są procesami statycznymi.

Hurtownie danych

Idea hurtowni danych powstałą w połowie lat ’80, stąd brak jest dokładnej definicji tego pojęcia. Hurtownia danych to zbiór danych zorientowanych tematycznie, zintegrowanych, statycznych, nie zmieniających się w czasie, dedykowanych dla potrzeb procesów zarządzania. Hurtownie budowane się w celu wspierania zarządzania organizacją gospodarczą. Współczesne systemy transakcyjne mogą gromadzić zbiory mierzone w Gigabajtach, zasoby informacyjne hurtowni mierzone są w Terabajtach. Hurtownie danych gromadzą dane dotyczące otoczenia, w którym działa przedsiębiorstwo: konkurencji, kosztach, zatrudnieniu, udziale w rynku.

Podstawowe cechy hurtowni danych:

q       Zorientowanie tematyczne – wszystkie dane dotyczące jednego tematu przechowywane są w tym samym miejscu, co umożliwia na łatwy dostęp do informacji

q       Integracja – proces wspomagany jest narzędziami odwzorowania i migracji danych

q       Niezmienność danych w czasie – dane hurtowni obejmują okres 5-10 lat, mają one więc do pewnego stopnia charakter historyczny.

q       Statyczność – dane aktualizowane są wsadowo w określonych odstępach czasu, wprowadzona porcja danych pozostaje w hurtowni bez zmian; użytkownik nie ma prawa do zmiany danych.

Minimalizacja redundancji

Hurtownie danych zapewniają minimalizację redundancji:

q       Wprowadzane są jedynie te dane, które są tam niezbędne

q       Większość danych podlega obróbce i zmianom zanim zostaną wprowadzone do hurtowni

q       Hurtownia zawiera dane sumaryczne i zbiorcze, które nie istnieją w systemach dostarczających danych

q       „Dylatacja” czasowa powoduje, że dane w hurtowni są zawsze „starsze” od danych źródłowych

Hurtownie danych dają wspieranie procesów zarządzania - hurtownie są przeznaczone przede wszystkim dla osób zarządzających organizacjami gospodarczymi

Hurtownia danych ma jednoznaczną strukturę, w skład której wchodzą różne typy danych:

q       Dane operacyjne – aby zapewnić szybki dostęp do tych danych są one indeksowane.

q       Dane referencyjne – zawierają informacje, które są szczegółowym opisem odpowiednich wartości, znajdujących się w hurtowni.

q       Dane sumaryczne – stanowią zagregowane (np. zsumowane) dane operacyjne; ich odpowiednie zaprojektowanie wpływa na skrócenie czasu realizacji zapytania skierowanego do hurtowni.

q       Metadane – zawierają informacje o innych typach danych, ich lokalizacji, strukturze i znaczeniu.