Danymi wytwarzanymi przez administrację publiczną należy umiejętnie dysponować i zapewnić im odpowiednią ochronę. Otwarte dane mogą ponownie wykorzystywać organizacje, placówki naukowe, czy ośrodki biznesu. Dane są dla nich cennym surowcem, którym posługują się tworząc produkty, aplikacje, czy usługi.
Efektywność danych
Otwarte dane służą poprawie funkcjonowania instytucji publicznych, zwiększają zaangażowanie obywateli w sprawy publiczne, ale również stanowią wsparcie dla rozwoju biznesu. W tym celu dane powinny być odpowiednio przygotowane. Istotne jest tu zastosowanie komunikatywnego i odpowiedniego dla odbiorcy języka, ponieważ tylko wtedy dane stają się dla użytkownika zrozumiałe. Dane powinny spełniać również wszystkie filary otwartości, w których zawarte jest odniesienie m.in. do kwestii prawnych, udostępnione w formacie przeznaczonym do odczytu maszynowego, czyli zidentyfikowania i rozpoznania przez aplikacje komputerowe oraz w otwartych formatach, a więc udostępniane obywatelom bez żadnych ograniczeń, które utrudniałyby ponowne wykorzystywanie dokumentów.
Filary otwartości danych
Na podstawie informacji przekazanych przez międzynarodowe inicjatywy dotyczące otwierania danych publicznych tj. karty otwartych danych G8, Partnerstwa na Rzecz Otwartego Rządu, Open Data Guidelines i Komunikatu Komisji Europejskiej 2014/C 240/01 za otwarte dane uznaje się dane:
- Dostępne – udostępnione bez żadnych ograniczeń dla szerokiego grona użytkowników (obywatele, firmy, uczelnie, instytucje) do dowolnych celów;
- Upublicznione w wersji źródłowej – dostępne w oryginalnej i niezmienionej formie (nie w postaci np. analiz, podsumowań, skrótów czy streszczeń). Forma tzw. surowa umożliwia np. łączenie danych z różnych źródeł oraz ma istotne znaczenie dla rzetelności dalszych analiz prowadzonych w oparciu o dane publiczne;
- Kompletne – udostępnione w całości. Wybiórcze udostępnianie danych publicznych (np. wybranych dokumentów, czy dokumentacji pozbawionej załączników) jest sprzeczne z ideą dostępu do danych publicznych i może wpłynąć na użyteczność tych danych;
- Aktualne – udostępnione na tyle szybko, aby zachować wartość tych danych. Zaleca się opatrywanie datą udostępnianych danych i ich bieżących aktualizacji;
- Odczytywalne maszynowo – udostępnione w formatach przeznaczonych do odczytu maszynowego i formacie otwartym. Przykładem takich formatów jest CSV, JSON, XML, arkusz kalkulacyjny. Formaty te ułatwiają dostęp i umożliwiają bardziej zaawansowane analizy dużej ilości informacji. Formaty takie jak PDF czy plik tekstowy są trudne do maszynowego odczytu i wymagają przetworzenia do ustrukturyzowanego formatu otwartego.
- Udostępnione niedyskryminująco – dostępne dla każdego bez konieczności rejestracji, posiadania konta internetowego, weryfikacji tożsamości poprzez podawanie hasła, loginu czy podpisywania umów;
- Dostępne bez ograniczeń licencyjnych – dane nie są przedmiotem patentów, znaków towarowych, tajemnicy handlowej lub praw autorskich i mogą być używane w dowolnych celach bez konieczności ubiegania się o zgodę na ich wykorzystywanie;
- Niezastrzeżone – dostępne w formacie powszechnie stosowanym, który nie jest kontrolowany przez żaden podmiot. Jeśli dane zostaną udostępnione w formacie, którego obsługa wymaga specjalistycznego, niestandardowego oprogramowania, wówczas korzystanie z nich może być utrudnione lub kosztowne.
Na podstawie:
1. Program otwierania Danych publicznych: http://archiwum.mc.gov.pl/files/program_otwierania_danych_publicznych.pdf
2. Standard Prawny. Standardy otwartości danych: https://dane.gov.pl/media/ckeditor/2018/10/04/standard-prawny_KzKwaxU.pdf