Keskkonnaagentuuri avaandmete ja andmeteenuste kasutamise näited ehk andmete kasutuslood on loodud eesmärgiga anda ilma- ja keskkonnavaldkonna andmete kasutajatele andmelugusid, mis oleks samal ajal ka juhendmaterjaliks. Nende koodi saab kasutada põhjana Keskkonnaagentuuri andmemaailmas orienteerumiseks ja avaandmete kasutamiseks. Kasutuslood on mõeldud neile, kes on alles avaandmete maailma avastamas ning soovivad luua ise rakendusi-tööriistu, teha analüüse või kasutada neid andmeid muudes infosüsteemides.
Et tegu ei oleks väga igava ja tehnilise juhendiga, siis on valitud iga andmeloo jaoks konkreetsed teemad, sündmused ja huviobjektid.
Kellele suunatud
Andmelugu on suunatud mitmele kasutajagrupile.
- Neile, kes näevad praktilist väärtust andmeloost ja tahavad luua midagi sarnast enda isiklikeks vajadusteks.
- Andmeteadlased, andmeanalüütikud, tudengid ja teadurid, kes soovivad andmeid väärindada ja analüüsida.
- IT-arendajad/programmeerijad, ettevõtjad või kes vajavad andmeid üle masin-masin liidese.
Keskkonnaagentuuri andmetest tuleb järjepidevalt juurde uusi avaandmete teenuseid ja seega avaandmete populariseerimise eesmärgiks on suurendada avaandmete kasutamist ning andmetest uue väärtuse loomist.
Andmed
Andmete kasutamise näited R-is ja Pythonis illustreerivad protsessi, mille peab läbima, et andmeid saaks kasutada või väärindada teiste osapoolte poolt. Takistuseks võib olla andmetest arusaamine ja õigete andmeallikate “otsade” leidmine. Selle probleemi lahendamiseks on loodud andmelugu koos vastava koodiga. Andmetest arusaamine võib olla valdkonna välisetele kasutajatele keeruline ja seetõttu oleme antud näite puhul lisanud ohtral linke ja juhismaterjale koodi, et järgmised andmete kasutajad saaksid üles leida vajaliku info ning teaksid kuidas on üles ehitatud meie andmekataloog, sh andmestike/levituse info, andmekirjeldused ja andmeteenused. Kasutatud on erinevaid andmeid erinevatest allikatest, peamiselt andmeteenustena, sealhulgas ruumiandmeteenuseid,
Andmetöötlus ja skriptid
Koodi kirjutamine ei peaks olema iga kord nullist alustamine, vaid võiks olla hea praktika kohaselt taaskasutamine. Andmeloos on kasutatud erinevat tüüpi andmeid ja iga andmestik on oma spetsiifilises formaadis (nt kuupäevade formaat) siis selle andmeloo koodi taaskasutamise tulemusena saab järgmine andmete ja koodi kasutaja hoida kokku aeg ja närve andmetöötluse osas. Andmeloo mõte on anda põhiinfo andmete kasutamiseks, seega on kood võimalikult puhas ja lihtne ning minimaalselt on kasutatud R-i spetsiifilist süntaksit. R on küllaltki lihtne programmeerimiskeel, mis sobib andmeteaduseks, andmeanalüüsiks ja kiirelt valmivate lahenduste loomiseks või prototüüpimiseks. Sel põhjusel on ka see kood üsna arusaadav ja kasutatav või ülevõetav teistes programmeerimiskeeltes ja keskkondades. Kood on ära toodud andmeloo skriptide sektsioonis ning selle kasutamisel tuleks vaadata ka juhiseid. Lisaks R-ile on ka andmeteaduses väga populaarne Pythoni programmeerimiskeel ja seega on osad näited ka loodud Pythoniga et leida suurem kasutajaskond andmetele
Andmete võrdlus ja prognoos
Koodi loetavuse ja arusaadavuse tagamiseks on kasutatud lihtsaid näiteid andmete võrdluseks ja kasutatud peamiselt olemasolevaid mudeleid ja parimaid praktikaid. Andmete kasutamise näidised on olemas ja igaüks saab andmeid edasi analüüsida ja luua endale sobilike analüüse ja mudeleid ning täiendada selle andmeloo skripte.