Co to są metadane?
Autorzy: Artur Żarski, Katarzyna Lewtak, Grzegorz Masiewicz
Istotnym elementem związanym z udostępnianiem danych np. na portalach otwartych danych jest opis informacji, które zostają tam opublikowane, czyli tzw. metadane.
Metadane to nic innego jak „dane o danych” lub też „informacja o informacji”. To ustrukturyzowane informacje służące do opisu zasobów informacji lub obiektów informacji, które dostarczają nam szczegółowych danych, dotyczących atrybutów zasobów lub obiektów informacji. A wszystko w celu ułatwienia odnalezienia, identyfikacji, a także zarządzania tymi zasobami.
Metadane opisujące zasób informacyjny to na przykład:
- tytuł – nazwa zasobu informacyjnego, która umożliwia jego identyfikację;
- słowa kluczowe – zestaw słów lub wyrażeń zwięźle opisujących zasób informacyjny;
- opis – streszczenie lub krótkie określenie zawartości zasobu informacyjnego;
- aktualność danych – (data utworzenia, data ostatniej modyfikacji) a także częstotliwość aktualizacji (informacja o częstotliwości aktualizacji zasobu informacyjnego lub metadanych).
Metadane noszą w sobie ustrukturyzowane dane i zawierają opis dokumentów będących określonymi nośnikami informacji. Są to określenia umożliwiające wyszukanie pożądanej informacji wraz z odpowiedzią w jakiej relacji pozostaje ona w stosunku do innych informacji.
Zapisywanie metadanych możliwe jest w: pliku txt, arkuszu kalkulacyjnym, pliku XML.
Rodzaje metadanych:
- metadane wyszukiwania – służą do wyboru zbiorów, mogą stać się przedmiotem zainteresowań danej osoby o konkretnych wymaganiach, obejmują one np.:
- nazwę i opis zbioru danych;
- podstawowe przeznaczenie i zakres stosowania danych;
- datę pozyskania danych i ich aktualizacji;
- producenta, dostawcę i głównych użytkowników danych;
- obszar, do którego dane się odnoszą (współrzędne);
- nazwy geograficzne lub jednostki podziału administracyjnego;
- strukturę zbiorów i sposób dostępu do danych;
- metadane rozpoznania, które zawierają więcej szczegółów o zbiorze, umożliwiają:
- ocenę jakości danych;
- określenie przydatności zbioru danych pod względem wymagań użytkowników;
- nawiązanie kontaktu z dysponentem danych celem uzyskania dalszych informacji;
- metadane stosowania – zawierają szczegóły zbioru, które gwarantują:
- odczytania danych oraz ich transferu;
- interpretacji danych i praktycznego korzystania z nich w aplikacji użytkownika;
- metadane konserwatorskie – jest to połączenie pozostałych rodzajów metadanych; wspierają one długoterminowe przechowywanie materiałów cyfrowych.
Funkcje jakie pełnią metadane (wg M. Nahotko “Metadane. Sposób na uporządkowanie Internetu”):
- ukazanie opisu bibliograficznego i opisu elektronicznego dokumentu;
- ułatwienie wyszukiwania danych;
- zabezpieczenie danych przed dostępem osób do tego niepowołanych;
- ułatwienie oceny przydatności określonych danych;
- nadzór nad zarządzaniem danymi;
- ukazanie informacji o historii danych.
Wskaźniki jakości metadanych:
- kompletność (ang. completeness) dotyczy ilości i rozkładu elementów metadanych w rekordach z punktu widzenia zawartości pojedynczych rekordów, jak i rozkładu danych w całej bazie danych;
- poprawność (ang. correctness) – określana nieraz jako dokładność (ang. accuracy), analizuje poprawność rekordów, wartości metadanych, pisownię (gramatyka, znaki specjalne bądź interpunkcję);
- spójność obejmuje pojedyncze bazy danych oraz współpracujące biblioteki cyfrowe. Można mówić o spójności zapisu elementu danych, tworzonych linkach między zasobami powiązanymi relacjami;
- analiza zdublowanych rekordów, które powstają w działaniach lokalnych oraz podczas wymiany/integracji danych.
Korzyści płynące ze stosowania metadanych:
- szybsze uzyskanie informacji na temat zbiorów danych, dostępnych dla interesującego nas obszaru;
- łatwiejsze zarządzanie zasobami danych w obrębie organizacji;
- możliwość lepszego zaplanowania działań dotyczących aktualizacji danych;
- zwiększenie prawdopodobieństwa zdublowania zbiorów danych zgromadzonych wcześniej przez inne organizacje;
- poszerzenie kręgu użytkowników danych.