Analyysi avoimen datan innovaatiokilpailun tunnustusta saaneista kilpailutöistä 2010-2013

Anna Eteläaho

Raportti pdf-muodossa (4.7.2014)

Viimeisin päivitys: 20.8.2014 / TiM

Sisällysluettelo

1  Johdanto

1.1 Kilpailun taustaa
1.2 AVARAS – hanke
1.3 Yleistä työn sisällöstä ja kilpailutöistä
1.4 Tutkimusmenetelmät

2 Sovellusalueet

2.1 Töiden luokittelu aihepiireittäin
2.2 Kohderyhmät
2.3 Käyttökohteet
2.4 Kaupallistaminen

3 Tietovarannot

3.1 Luokitteluperusteet ja tietovarantotyyppien yleisyys
3.2 Suosituimmat tietovarannot

4 Tekniikat

4.1 Tiedonhaku tietovarannoista
4.2 Tietovarantokohtaiset rajapinnat ja rajapintatekniikat
4.3 Muut käytetyt tekniset ratkaisut

5 Yhteenveto ja arviointi

Lähteet

Liitteet (pdf)

(HUOM. Liitteet-pdf:n linkkien joukossa on muutamia viallisia URL:eja joiden lopussa on merkkijono ”%E2%80%8E”. Linkin saa toimivaksi poistamalla ko. merkkijonon selaimen osoiteriviltä.)

1 Johdanto

Tämän luvun kohdassa 1.1 tuodaan esiin kilpailun taustalla olevia tekijöitä ja kohdassa 1.2 kerrotaan lyhyesti AVARAS-hankkeesta, jonka yhteydessä tämä raportti on laadittu. Kohdassa 1.3 määritellään tarkasteltavien kilpailutöiden joukko ja esitellään kilpailusarjat sekä töiden tekijäryhmät, ja lopuksi kohdassa 1.4 kerrotaan käytetyistä tutkimusmenetelmistä.

1.1 Kilpailun taustaa

Avoimella datalla tarkoitetaan julkishallinnolle, yrityksille, organisaatioille ja yksityishenkilöille kertynyttä jalostamatonta informaatiota, johon on avattu maksuton pääsy organisaation ulkopuolisille [1]. Avointen tietovarantojen määritelmän [2] mukaisesti aineiston tulee olla kokonaisuudessaan saatavilla käyttökelpoisessa ja muokattavassa muodossa Internetin kautta ja sen tulee olla lisensoitu niin, että sen käyttöä, muokkausta ja uudelleenjakelua ei rajoiteta [3]. Tietovarannoilla tarkoitetaan tässä saman määritelmän mukaan 1) sisältöä, kuten musiikkia, elokuvia ja kirjoja; 2) dataa eli digitaalisessa muodossa olevia tilastoja, julkaisuja, videotallenteita, kuvia, karttoja, 3D-malleja ja niin edelleen poislukien tietokoneohjelmistot ja 3) julkishallinnon tuottamaa tai muuta hallinnollista informaatiota. Avoimuus tarkoittaa, että nämä varannot ovat saatavilla koneluettavassa muodossa, kenen tahansa luvallisesti käytettävissä.

Konkreettiset, toimivat sovellukset ja hyvät datan käyttöideat kannustavat julkishallinnon toimijoita avaamaan tietovarantojaaan. Muun muassa tähän haasteeseen pyrkii vastaamaan Apps4Finland-kilpailu, jota on järjestetty vuodesta 2009 lähtien. Sen tarkoituksena on kannustaa kansalaisia, yrityksiä ja yhteisöjä ideoimaan ja kehittämään uusia tapoja hyödyntää avoimia tietovarantoja. Kilpailun pääjärjestäjät ovat Suomen Verkkodemokratiaseura [4] ja Forum Virium Helsinki [5], ja sitä on tukenut lisäksi vuosittain joukko yhteistyökumppaneita yksityiseltä ja julkiselta sektorilta.

Kisan ytimessä ovat uudet teknologiaa, dataa ja ihmisiä yhdistävät tietoteot. Eri kilpailusarjojen puitteissa on mahdollisuuksia luoda hyvinkin erityyppisiä töitä ideatasolta aina valmiisiin sovelluksiin asti. Kilpailuun voi osallistua omavalintaisella säännöt täyttävällä tietoteolla, mutta osallistuja voi myös ratkoa ennalta-asetettuja ongelmia eli haasteita. Haasteiden ratkaisut osallistuvat myös pääsarjoihin. Säännöt ovat saatavilla kilpailun kotisivuilta [6].

1.2 AVARAS – hanke

Avoimet tietovarannot on yksi kypsymässä oleva kehitystrendi. Selvitysten mukaan teemaan liittyvien liiketoimintakonseptien merkitys kasvaa lähitulevaisuudessa voimakkaasti ja saatujen hyötyjen odotetaan kohdentuvan erityisesti PK -sektorille. Satakunnassa toimii useita pieniä ohjelmistoyrityksiä, joille avoimien tietovarantojen hyödyntäminen osana sovelluksia tai uusina sovelluksina voi tuoda uutta liiketoimintapotentiaalia. Avoimista tietovarannoista liiketoimintaa Satakuntaan (AVARAS) –hanke keskittyy avointen tietovarantojen hyödyntämistä tukevan tiedon tuottamiseen satakuntalaisen elinkeinoelämän tarpeiden pohjalta [7]. AVARAS-hankkeen toteuttaa Tampereen teknillisen yliopiston Porin laitos satakuntalaisten PK-yritysten ohjaamana, ja se on ajoitettu aikavälille 1.8.2013 – 31.12.2014. Rahoittajina toimivat Satakunnan ELY-keskus (EAKR) ja Porin kaupunki.

Päätulostensa näkökulmasta hanke jakaantuu seuraavaan kolmeen osaan: 1) selvitys avoimien tietovarantojen kehitysnäkymistä ja liiketoimintamahdollisuuksista; 2) portin avoimien tietovarantojen portaaleihin tarjoava ns. metaportaali (portaalien portaali); 3) Satakunnan alueen yritysten vaatimusten perusteella toteutetut avointen tietovarantojen soveltamisesimerkit. Hankkeen toteuttavan projektiryhmän ja projektin hallinnollisen ohjausryhmän lisäksi hankkeessa toimii satakuntalaisten PK-yritysten edustajista muodostuva projektin työtulosten sisältöä määrittelevä intressiryhmä.

Tämä raportti on tuotettu  AVARAS-hankkeen yhteydessä. Raportti vastaa osaltaan kaikkiin hankkeelle esitettyihin kysymyksiin: millä tavalla avointa tietoa voidaan hyödyntää liiketoiminnassa, minkälaisia avoimia tietovarantoja on olemassa ja miten avoimia tietovarantoja teknisesti hyödynnetään.

1.3 Yleistä työn sisällöstä ja kilpailutöistä

Tässä raportissa on tarkasteltu kilpailutöitä neljältä eri vuodelta, vuosilta 2010-2013. Näiltä vuosilta on kertynyt yhteensä 398 työtä. Yksityiskohtaisemman tarkastelun kohteeksi on otettu vain kilpailussa jollakin tavalla erityishuomiota saaneet 114 työtä. Näitä ovat finalistit, yleisöäänestysten voittajat ja erikoispalkintojen saajat.

Kilpailusarjat ovat jonkin verran vaihdelleet vuosittain. Taulukossa 1 on esitetty tarkasteltujen vuosien sarjat ja kilpailutöiden jakautuminen niihin. Taulukossa on huomioitu kaikki kilpailutyöt, eivät vain tunnustusta saaneet. Vuoden 2013 sarjoista voidaan mainita, että Innosta-sarjan tarkoituksena on innostaa ihmisiä tietotekojen pariin. Tyypillisiä sarjan tuotoksia ovat luonnokset, datataide, kampanjat ja konseptisuunnitelmat. Hahmota-sarjassa hahmotetaan haasteiden taustalla olevien ongelmien piirteitä. Tuotostyyppeinä voi olla esimerkiksi datajournalismia, analyysejä ja visualisointeja. Mahdollista-sarjassa  pyritään mahdollistamaan tietotekojen tekeminen muille käyttäen apuvälineinä muun muassa tietoaineistoja, rajapintoja, avointa lähdekoodia, standardeja ja oppaita. Näistä rajapinnat ovat olleet suosituimpien tuotosten joukossa. Yksi tärkeimmistä sarjoista on Vaikuta, jossa vaikutetaan ymparöivään maailmaan tietoteoilla. Nämä ovat tyypillisesti sovelluksia, mutta voivat olla myös vaikkapa laitteita tai ohjausjärjestelmiä.

Taulukko 1

toiden_maara_sarjoittain

Kilpailijoiden jakautuminen eri tekijäryhmiin on esitelty kaaviossa 1. Siitä käy ilmi, että 19%:ssa tarkastelluista töistä tekijänä on varmuudella yritys (tai useampia), ja julkinen sektori on ollut tuottajana 13%:ssa töistä. Kuitenkin lähes 70% töistä on sellaisia, että niiden yhteydessä on Apps4Finland:in web-sivustolla mainittu ainoastaan yksittäisten henkilöiden nimiä. Lienee siis ainakin teoriassa mahdollista, että näidenkin töiden taustalla on yrityksiä, yhdistyksiä tai organisaatioita.

Kaavio 1: Ao. tekijäryhmään kuuluvien kilpailutöiden osuus (%) tarkastelluissa 114 kilpailutyössä

tekijäryhmät

1.4 Tutkimusmenetelmät

Kilpailutöitä on tutkittu monesta  eri näkökulmasta. Töistä on pyritty selvittämään perustietojen kuten vuosi, kilpailusarja, sija kilpailussa ja tyyppi (sovellus, rajapinta jne.) lisäksi käytetyt ja tarjotut tietovarannot ja rajapinnat, käytetyt tietokannat, JavaScript-kirjastot, sovelluskehykset, käyttöalustat (esim. Android, iOS, web jne.), ohjelmointikielet, tekijäryhmät (yksityinen, yritys jne.), kohderyhmät ja sovellusalueet. Näitä kutsutaan jäljempänä luokittelukriteereiksi. Kilpailutöiden luokittelu ja analyysi on tehty käyttäen MS Excel 2007 -taulukkolaskentaohjelmaa. Tietoa kilpailutöistä on etsitty Apps4Finland-sivustolta sekä siellä kuhunkin työhön liitettyjä linkkejä seuraamalla. Töissä käytettyjä ohjelmakirjastoja on ollut mahdollista jossain määrin analysoida selaimessa lähdekoodeja tutkimalla. Monissa tapauksissa sovellusten lähdekoodit ovat saatavilla myös GitHubissa, joka on avoimen lähdekoodin Git-versionhallintaa hyödyntävä lähdekoodien hallinta- ja jakopalvelu.

Sanojen esiintymistiheyttä kussakin luokittelukriteerissä on analysoitu Excelin avulla melko yksinkertaisilla VBA-makroilla.  Esimerkiksi kussakin työssä käytetyt ohjelmointikielet on lueteltu Excel-taulukossa pilkuilla eroteltuna ko. työn yhteydessä, jonka jälkeen makrojen avulla on laskettu yhteen kaikissa tarkastelluissa töissä käytettyjen eri kielten lukumäärät. Sanojen yleisyyden perusteella on pystytty tekemään johtopäätöksiä tiettyjen tekniikoiden, tietovarantojen, ohjelmointikielten jne. esiintyvyydestä tutkituissa kilpailutöissä. Lähes kaikissa tässä raportissa esiintyvissä taulukoissa ja kaavioissa on lisäksi huomattava, että yksi kilpailutyö, tietovaranto tai mikä tahansa muu tarkasteltavana oleva kohde voi kuulua luokitteluissa useampaan kuin yhteen kategoriaan (esim. yksittäinen tietovaranto voi olla määritelty kuuluvaksi kategorioihin Tilastot, Joukkoliikenne ja Matkailu) tai siihen voi olla liitetty useampia luokittelutageja (esim. kilpailutyössä voi olla käytetty ohjelmointikielinä sekä JavaScriptiä että PHP:tä, tai kilpailutyön tekijänä voi olla sekä yritys että julkinen sektori), ja tästä johtuen kaavioissa esitettyjen prosenttiosuuksien summat ylittävät useimmiten sadan.

2 Sovellusalueet

Kohdassa 2.1 kerrotaan kilpailutöiden aihepiirikohtaisesta luokittelusta. Kohdassa 2.2 esitellään suosituimpia kohderyhmiä, joille kilpailutöitä on suunnattu, ja kohdassa 2.3 on konkreettisia esimerkkejä töistä, jotka liittyvät kohdassa 2.1 esiteltyihin suosituimpiin aiheisiin. Viimeinen kohta 2.4 tarkastelee kaupallisuusaspektia ja esittelee 14 kaupalliseksi luokiteltua kilpailutyötä.

2.1 Töiden luokittelu aihepiireittäin

Erilaisten luokittelujen mahdollistamiseksi kilpailutöihiin liitettiin mm. sovellusaluetta, kohderyhmiä ja työn kaupallisuutta kuvaavia asiasanoja eli tageja. Osa niistä otettiin suoraan Apps4Finland-sivustolla töille määritellyistä tageista, osa lisättiin itse. Näitä kuvaavia sanoja poimittiin kilpailutöiden kuvauksista käsityönä ja yleistämällä esimerkiksi niin, että jos työ liittyi Helsinkiin, siihen liitettiin ”pääkaupunkiseutu”  -tagi vaikkei sitä olisi kuvauksessa eksplisiittisesti mainittukaan. ”Kaupallistaminen” –tagin saivat työt, jotka jo olivat kaupallistettuja tai joissa oli selkeä kaupallistamistavoite.

Enemmistö (61%) analysoiduista kilpailutöistä liittyi tavalla tai toisella paikkatietoon. Suosittu teema oli myös liikenne, erityisesti  joukkoliikenne, johon liittyi 15% töistä. Kaaviossa 2 on esitetty 15 yleisintä tagia ja niiden prosenttiosuuksia.

Kaavio 2: Niiden kilpailutöiden osuus (%) tarkastelluissa 114 kilpailutyössä, joihin on liitetty ao. tagi

sovellusalueet

Muita suhteellisen yleisesti esiintyviä tageja olivat mm. vapaa-aika, rakentaminen, luonto, avoin data, vaalirahoitus, datajournalismi, visualisointi, energia, peli, infra ja kansanedustajat, joista kukin esiintyi kolmessa kilpailutyössä eli 2.6%:ssa tarkastelluista töistä.

2.2 Kohderyhmät

Kohderyhmä oli määritelty vain 50%:ssa töistä. Kilpailutöiden Apps4Finland-sivustolla olevista kuvauksista saadut kohderyhmätiedot Exceliin siirtämällä ja niistä laskelmia tekemällä saatiin kuitenkin esiin joitakin suosituimpia kohderyhmiä, jotka on esitetty kaaviossa 3. Sovelluskehittäjille suunnatut työt ovat enimmäkseen rajapintoja.

Kaavio 3: Kilpailutöiden kohderyhmät tarkastelluissa 114 työssä (osuus prosentteina)

kohderyhmät

2.3 Käyttökohteet

Seuraavassa esitellään konkreettisia esimerkkejä töistä, joihin on liitetty yksi tai useampia kaavion 2 kuudesta yleisimmästä tagista.

Kilpailutöissä käytetään paikkatietoa hyvin erilaisiin tarkoituksiin. Sen avulla paikallistetaan käyttäjä, suodatetaan paikallisesti relevanttia informaatiota, etsitään joukkoliikennereittejä ja käyttäjän lähettyvillä olevia palveluita, nähtävyyksiä ja tapahtumia. Sanom.at (2013) ja Tässä.fi (2010) ovat samantyyppisiä sovelluksia: niiden idea on koota ja esittää tiettyyn alueeseen liittyvää informaatiota. Tavallaan myös sokeille tarkoitettu Blindsquare (2012) kuuluu tähän kategoriaan: sovellus hakee käyttäjän lähistössä sijaitsevia paikkoja Foursquare-palvelusta [1] ja kertoo niistä suosituimmat halutun säteen sisältä.

Paikkatietoa käytetään myös ympäristön kolmiulotteiseen mallintamiseen (Stormwind Simulator (2013)), säätietojen hakemiseen, paikkatietoaineistojen visualisointiin kuten liikenneonnettomuuksien ja liikennemelun esiintyvyyden tai sähköliittymien sijaintien havainnollistamiseen (Heatmaps4Finland, Tuntimittaustiedon avoin palvelualusta (2013)), pysäköintimaksujen maksamiseen (ParkMan (2011)) , paikkatietolähteiden listaamiseen (Spatineo Directory (2012))  ja niin edelleen.

Joukkoliikenne liittyy moneen työhön, joista kaupalliseksi luokiteltavia (ks. kohta 2.4) ovat vain Tässä.fi ja Reitit v.2.0 (2012). Pysäkkikummi (2013) on idea palvelusta, jonka avulla joukkoliikenteen käyttäjät voisivat auttaa pitämään pysäkit paremmassa kunnossa. Kullakin pysäkillä voisi olla yksi tai useampi kummi, joka käyttää pysäkkiä usein ja pystyy samalla tarkistamaan pysäkin kunnon. Joukkoliikenteen Infrastruktuuritieto (2013) tutkii joukkoliikenteen infrastruktuuritiedon tallentamiseen ja välittämiseen käytettyjä dataformaatteja. Ta-daa, dataa! –julisteet (2012) visualisoivat mm. sitä, kuinka pitkälle Helsingin keskustassa ehtii ruuhka-aikaan 10 minuutissa eri kulkuvälineillä, busbus (2011) puolestaan pääkaupunkiseudun bussireittidataa yhdistettynä yhden vuorokauden lipunmyynti- ja matkakorttidataan. Eräs visualisointi on myös Helsinki Public Transport Visualized (2011), joka näyttää lintuperspektiivistä kuinka pääkaupunkiseudun joukkoliikenne herää uuteen aamuun esittäen ajoneuvot liikkuvina valopisteinä. Reaaliaikaista joukkoliikennedataa on avattu eri muodoissa, kuten töissä Avoimen liikennedatan jakelu Tampereella (2013) ja VR:n Junat kartalla –palvelun rajapinta (2011).

Oma sovellusryhmänsä ovat erilaiset reitti- ja aikatauluoppaat, kuten Nysse (2013), Reitit v2.0 ja Kyyti (2011, 2010). Spot In Helsinki (2012) kertoo paikat, tapahtumat ja miten niihin pääsee julkisella liikenteellä. Saman tekee Tässä.fi. Junat.info (2012) on mobiilikäyttöön suunniteltu junien aikatauluhakupalvelu. Liikenne.seuranta.org (2011) tarjoaa liikenteeseen liittyvää tietoa KML-muodossa, joka on Keyhole Inc:n ja Googlen kehittämä kevyt XML-sanasto paikkatiedon kuvaamiseen. Junat Suomessa (2010) kertoo, mihin aikaan juna lähtee asemalta, onko se myöhässä ja jos on niin miksi. LiveInfoboard (2010) ideoi yleistä palvelua, jossa kaikkien joukkoliikenteen näyttötaulujen tiedot olisivat vapaasti käytettävissä esim. verkkosivuilla ja mobiilisovelluksissa.

Julkishallintoon ja yhteiskuntaan liittyviä töitä ovat esimerkiksi kuntakohtaista tilastotietoa visualisoiva KuntaNavigaattori (2012), Verokuitti (2011), joka laskee valtiolle kokonaisuudessaan maksamasi verot ja Budjettikone (2011), jonka avulla voi tehdä ja jakaa budjetteja.  Velkakello (2010) näyttää reaaliajassa Suomen valtion velan määrän ja havainnollistaa velkaantumisnopeutta, ja esimerkki julkisen sektorin datan avauksesta on Suomi.fi-portaalin sisältö REST-rajapinnassa (2011).

Politiikkaan liittyvät mm. Kansan muisti (2010, 2013), jonka avulla voi seurata kansanedustajien poliittista työtä ja esimerkiksi tutkia heidän äänestyskäyttäytymistään ja vaalirahoitusta sekä Datavaalit (2012), joka on joukkoistamalla koottu vaaleihin liittyvien avoimien tietovarantojen kokoelma. Eduskuntarajapinta, äänestyskone ja visualisointipalvelu (2010) puolestaan avaa äänestystulokset sovellusten käyttöön ja esittää tulokset helppolukuisesti.

Ympäristö-tagilla merkittyjä töitä ovat esimerkiksi Ilmanlaadun mukaan vaihtuva kännykän taustaväri (2012), jossa sovellus näyttää ajantasaisen ilmanlaatuindeksin puhelimen taustavärinä sekä Ilmanlaatu rajapintana (2012), jossa haetaan dataa Ilmatieteen laitoksen ilmanlaatuportaalista ja esitetään se koneluettavassa JSON-muodossa. Tulvakartta (2012) visualisoi todennäköiset keskimääräiset vedenkorkeudet Helsingissä, Turussa ja Oulussa vuonna 2100 ja Energiatieto-palvelu (2012) puolestaan yhdistää saatavilla olevaa energiatietoa eri lähteistä ja tarjoaa mahdollisuuden vertailla erilaisia energiaratkaisuja tasapuolisesti keskenään. Energiaan liittyy myös Espoon aurinko- ja geoenergiakartat (2012), joiden avulla selviää kaikkien Espoossa sijaitsevien rakennusten kattopinnoille lankeavan aurinkosäteilyn määrä sekä maa- ja kalliolämmön toteutuskelpoisuus Espoon alueella sekä Help Me Save Energy (2012), jonka avulla voi seurata sähkönkulutusta ja verrata sitä edelliseen kuukauteen.

2.4 Kaupallistaminen

Vain noin 9% tutkituista töistä on edes jossain määrin kaupallisia, ja näiden töiden sovellusalueet ovat hyvin vaihtelevia. Sovellus on tässä luokiteltu kaupalliseksi, jos se on itsessään maksullinen ohjelma tai palvelu, tai sovelluksen takana oleva yritys jollakin tavalla generoi liikevaihtoa sovelluksen avulla – tavallisimmin mainostuloilla. Eräs ansaintamalli on myös erilaisten avoimen tiedon jalostuspalveluiden tarjoaminen. Tähän pyrkii Cloud’N’Sci.fi–markkinapaikka, josta löytyy esimerkiksi vuoden 2013 kilpailutyönä ollut Heatmaps4Finland –sovellus.

Näillä kriteereillä tarkastelluista töistä kaupallisia olivat Sanom.at, Tuntimittaustiedon avoin palvelualusta (2013), Heatmaps4Finland, Stormwind Simulator (2013), Reitit v2.0, Spatineo Directory (2012), Blindsquare, Karttaselain (2011), ParkkiNappi (nyk. ParkMan) (2011) sekä Tässä.fi. Muita tällaisia kilpailutöitä ovat esimerkiksi Duunitori.fi (2011), Nomadi (2012), Kelihelper (2013) ja b-bark (2013). Nämä eivät ole kilpailussa tunnustusta saaneita eivätkä siten mukana analyysissä, joskin ne esitellään seuraavassa muiden ns. kaupallisten töiden ohella. Kaikissa edellä mainituissa töissä on tekijänä yritys. Huomionarvoista on myös, että paikkatietoa hyödynnetään kaikissa analysoiduissa kaupallisissa sovelluksissa, ja 60% näistä on saatavilla mobiilisovelluksena. Yleisesti ottaen ne ratkovat käytännön ongelmia, eikä joukossa esimerkiksi ole yhtään varsinaista peliä (kolme ilmaispeliä löytyy tarkasteltujen 114 kilpailutyön joukosta: Valttikunnat (2012), Budget Fall (2012) sekä Yle Hirsipuu (2011)).

Kaupallisia kilpailutöitä

Sanom.at (2013)
  • Kuvaus: sosiaalinen lähimedia, joka tuo kaiken kaupunginosaan liittyvän informaation yhteen paikkaan; ”kokonaisvaltainen paikallisviestinnän alustaratkaisu”
  • Käytetyt datalähteet: Open Ahjo, Linked Events API, Helsingin palauterajapinta, OpenStreetMap, Norjan ilmatieteen laitoksen sääennusteet (yr.no)
  • Käyttöalustat: Android, iOS, web
  • Ansaintamalli: markkinointikanava paikallisille yrityksille
  • Kohderyhmät: tietyn alueen asukkaat
  • Palkinnot ja sijoitukset kilpailuissa: haastesarjan voittaja, Apps4Europe-kilpailun finalisti 2014
  • http://sanom.at/
Heatmaps4Finland (2013)
  • Kuvaus: visualisoi Suomen alueelle sijoittuvia paikkatietoaineistoja heatmap-visualisointeina Google Maps -karttapohjan päällä. Käyttäjä voi valita haluamansa visualisointiratkaisun sekä kiinnostavan paikan Suomen kartalta, jonka jälkeen sovellus generoi heatmap-visualisoinnin Cloud’N’Sci.fi:stä löytyvien tietoaineistojen ja algoritmien avulla.
  • Käytetyt datalähteet: Liikennevirasto (hirvieläinonnettomuudet), Helsingin kaupunki (Helsingin liikennemeluvyöhykkeet, liikenneonnettomuudet)
  • Käyttöalustat: web
  • Ansaintamalli: Cloud’N’Sci.fi tarjoaa maksullisia algoritmisia palveluita tiedon, esim. avoimen datan, jalostamiseen. Heatmaps4Finland on esimerkki tällaisesta. Lisätietoja ansaintalogiikasta löytyy esimerkiksi osoitteesta http://www.slideshare.net/CloudNSci/presentations
  • Kohderyhmät: ”tuottajat”: sovellusten ja algoritmien kehittäjät, avoimen datan tarjoajat sekä ”kuluttajat”: tuottajien tarjoamien tietotuotteiden käyttäjät
  • Palkinnot ja sijoitukset kilpailuissa: yleisöäänestyksen voittaja; Cloud’N’Sci.fi -markkinapaikka, jota sovellus hyödyntää, oli  Apps4Europe-kilpailun finalisti 2014.
  • https://apps.cloudnsci.fi/heatmaps4finland/
Stormwind Simulator (2013)
  • Kuvaus: veneily- ja navigaatiosimulaattorisovellus, joka visualisoi yli 30 000 neliökilometriä suomalaista saaristoaluetta
  • Käytetyt datalähteet: mm. Maanmittauslaitoksen korkeuskäyrät ja maastotietokanta, Metsäntutkimuslaitokselta latvuspeitto ja puuston keskipituus, Liikennevirastolta elektroniset merikartat (ei vielä avointa)
  • Käyttöalustat: Windows 8, 7, Vista ja XP
  • Ansaintamalli: maksullinen sovellus
  • Kohderyhmät: kotitaloudet, viranomaiset, kouluttajat
  • Palkinnot ja sijoitukset kilpailuissa: Vaikuta-sarjan voittaja
  • http://stormwind.fi/fi/
Tuntimittaustiedon avoin palvelualusta (2013)
  • Kuvaus: tuntimittaustieto (sähkö, kaukolämpö, vesi…) kaikkien (verkkoyhtiö, myyntiyhtiö, asiakas, palveluntarjoaja, yhteiskunta) osapuolten hyötykäyttöön REST API:n kautta. Tarjoaa liiketoimintamahdollisuuksia sovelluskehittäjille.
  • Käytetyt datalähteet:
  • Käyttöalustat: web
  • Ansaintamalli: raha tulee energiayhtiöiltä, sovelluskehittäjille ilmainen
  • Kohderyhmät: energiayhtiöt, sovelluskehittäjät
  • Palkinnot ja sijoitukset kilpailuissa: Mahdollista-sarjan 3. sija
  • http://www.avointuntimittaus.fi/
b-bark (2013)
  • Kuvaus: koirapaikannusjärjestelmä (panta + ohjelmisto) esim. metsästäjille, jonka asiakasohjelma sisältää Maanmittauslaitoksen avoimeen aineistoon perustuvat maastokartat
  • Käytetyt datalähteet: OpenStreetMap, Maanmittauslaitoksen ilmakuvat ja maastokartat, Norjan, Ruotsin sekä Viron maastokartat, Viron ilmakuvat
  • Käyttöalustat: Android, iOS, Windows Phone 8, web
  • Ansaintamalli: maksullinen tuote (panta ja tarvikkeet), ohjelmisto- ja karttalisenssit.
  • Kohderyhmät: metsästäjät, koiranomistajat; pelkät ohjelmistot vaeltajille, luonnossa liikkujille, geokätköilyn harrastajille
  • Palkinnot ja sijoitukset kilpailuissa: –
  • http://www.b-bark.com/
Kelihelper (2013)
  • Kuvaus: sovellus, jolla keliaakikko, kelikaakikon lähipiiri tai gluteenittomalla ruokavaliolla oleva henkilö voi tarkastaa sisältävätkö elintarvikkeiden pakkausmerkinnöistä löytyvät ainesosat keliaakikon ruokavalioon sopimatonta gluteenia
  • Käytetyt datalähteet: Keliakialiiton web-sivut
  • Käyttöalustat: iOS
  • Ansaintamalli: maksullinen mobiilisovellus
  • Kohderyhmät: keliaakikot, keliaakikoiden lähipiiri, gluteenitonta ruokavaliota noudattavat henkilöt ja heidän lähipiirinsä
  • Palkinnot ja sijoitukset kilpailuissa: –
  • https://itunes.apple.com/hk/app/kelihelper/id573447936?mt=8
Spatineo Directory (2012)
  • Kuvaus: tarjoaa käyttöön ”googlemaisen” tavan löytää ja vertailla maailman paikkatietolähteitä, niiden tietotarjontaa, käytettävyyttä sekä luotettavuutta. Lähes 18 000 paikkatietopalvelua tietokannassa – myös kaikki Suomen avoimet paikkatietolähteet. Jokaisestä lähteestä löytyy mm. metatiedot, sisältökuvaukset, linkki tekniseen rajapintaan, reaaliaikaiseen monitorointiin perustuva luotettavuustieto sekä mahdollisuus kommentointiin ja keskusteluihin.
  • Käytetyt datalähteet: lähes 500 000 paikkatietoaineistoa eri puolilta maailmaa
  • Käyttöalustat: web
  • Ansaintamalli: hakemisto maksuton, liikevaihto tulee asiakkaina olevien paikkatiedon tarjoajien palveluiden monitoroinnista
  • Kohderyhmät: ei määritelty
  • Palkinnot ja sijoitukset kilpailuissa: finalisti, NewBiz4Finland-palkinnon voittaja
  • http://www.spatineo.com/
Nomadi (2012)
  • Kuvaus: paikkatietosovellus, jonka tarkoitus on koota erilaisista tietosisällöistä käyttäjälle reittejä mielenkiintoisiksi sisällöiksi. Sovelluksen avulla voi tutustua jonkin paikan paikallishistoriaan ja tarinoihin sekä tapahtumiin. Käyttäjät voivat luoda omia reittejään järjestelmään ja tulevaisuudessa myös kerätä näille sisältöä avoimista datalähteistä. Reittejä voi selata teeman tai oman sijainnin mukaan.
  • Käytetyt datalähteet:  mm. HSL/TKL julkisen liikenteen API:t, Espoon geoenergiakartta, Helsingin pysäköintilippuautomaatit, OpenStreetMap
  • Käyttöalustat: Android, iOS, Windows Phone, web
  • Ansaintamalli: sisällöntuottajat eli yritykset/organisaatiot tekevät reittejä joko itse tai Citynomadi tekee, ja maksavat siitä että ne ovat esillä Citynomadi-medioissa, mainostaminen myös mahdollista
  • Kohderyhmät: ei määritelty (matkailijat)
  • Palkinnot ja sijoitukset kilpailuissa: –
  • https://citynomadi.com/fi/
Blindsquare (2012)
  • Kuvaus: lisätyn todellisuuden mobiilisovellus, joka auttaa näkövammaisia. Käyttää puhelimen paikannusominaisuuksia käyttäjän paikallistamiseen ja puhuu ympäristön tietoja 16 eri kielellä. Sovellus hakee lähistön paikkoja FourSquare-palvelusta ja kertoo niistä suosituimmat halutun säteen sisältä
  • Käytetyt datalähteet: FourSquare, OpenStreetMap, HSL:n poikkeusliikennetiedotteet, pääkaupunkiseudun palvelukartta
  • Käyttöalustat: iOS
  • Ansaintamalli: maksullinen mobiilisovellus
  • Kohderyhmät: näkövammaiset
  • Palkinnot ja sijoitukset kilpailuissa: Sovellussarjan voittaja, OpenCities App Challenge -voittaja 2012,  GSMA Global Mobile Awards 2013: Best Mobile Health Product or Service, Tietotekniikan Liitto ry: Paras tuote 2012
  • http://www.blindsquare.com
Reitit v2.0 (2012)
  • Kuvaus: Koko Suomen kattava reittiopas, joka hakee nopeimmat reitit kohteeseen.
  • Käytetyt datalähteet: käyttää automaattisesti Matka.fi-, HSL- tai TKL -reittioppaita tilanteesta riippuen. Hakee myös Helsingin paikkatietoa HS Oma kaupunki –palvelusta ja Pääkaupunkiseudun palvelukartan palveluita.
  • Käyttöalustat: iOS
  • Ansaintamalli: maksullinen mobiilisovellus
  • Kohderyhmät: ei määritelty
  • Palkinnot ja sijoitukset kilpailuissa: Sovellussarjan 2. sija
  • https://itunes.apple.com/fi/app/reitit/id474018978
Duunitori.fi (2011)
  • Kuvaus: Työn etsimiseen ja ilmoittamiseen tarkoitettu karttapohjainen sivusto. Työpaikkoja voi etsiä ammattinimikkeen, työnantajan nimen ja sijainnin mukaan; tarjoaa myös ajankohtaisia vinkkejä ja uutisia rekrytoinnista ja työnhausta.
  • Käytetyt datalähteet: työpaikat mm. Mol.fi-, Oikotie-, Uranus- ja Aarresaari –palveluista
  • Käyttöalustat: web
  • Ansaintamalli: liikevaihto tulee mainostamisesta ja työnantajilta (ilmoittaminen, artikkelit)
  • Kohderyhmät: työnhakijat ja työnantajat
  • Palkinnot ja sijoitukset kilpailuissa: –
  • http://duunitori.fi/
ParkMan (2011)
  • Kuvaus: paikannusta hyödyntävä mobiilisovellus. Autoilija pystyy maksamaan pysäköinnistä painamalla yhtä nappia, sillä sovellus tietää katupysäköinnin hinnan sijainnin perusteella. Pysäköinninvalvojat  näkevät reaaliaikaiset maksutilanteet omista mobiililaitteistaan. Sovellus pystyy suosittelemaan autoilijoille parkkipaikkoja jos kaupungissa on erikoistapahtumia. Pysäköintimaksujen vertailu on helppoa.
  • Käytetyt datalähteet: kaupunkien pysäköintikartat (maksuvyöhykkeet)
  • Käyttöalustat: Android, iOS, Windows Phone
  • Ansaintamalli: mobiilisovellus ilmainen. Yritysasiakkaille maksullinen rekisteröinti ja lisäpalvelu. Sekä yksityis- että yritysasiakkaat maksavat varsinaisen parkkimaksun lisäksi pysäköintikertakohtaisen maksun.
  • Kohderyhmät: autoilijat, kaupungit, yksityiset parkkipaikan omistajat
  • Palkinnot ja sijoitukset kilpailuissa: Sovellussarjan voittaja
  • http://parkmanworld.com/
Karttaselain (2011)
  • Kuvaus: sovellus, joka yhdistää tarkat maastokartat ja ilmakuvat  ajantasaisiin paikkatietoaineistoihin
  • Käytetyt datalähteet: Maanmittauslaitoksen maastokartta, kiinteistörajat ja ilmakuvat, Metsähallituksen REISKA-aineistotietokanta, Ympäristöministeriön OIVA-aineistotietokanta, GPSAlbum.com -sivuston yhteisölliset reittiaineistot, Norjan maanmittauslaitoksen (Statens Kartverk) maastokartta-aineistot, Google/Panoramio kuva-aineistot, Liikenneviraston merikartat
  • Käyttöalustat: Android, iOS, Windows Phone, Windows 8, Symbian Qt, MeeGo
  • Ansaintamalli: 1 kk ilmainen, sen jälkeen maksullinen
  • Kohderyhmät: ulkoilijat,  metsästäjät, kalastuksen harrastajat, vaelluksen harrastajat
  • Palkinnot ja sijoitukset kilpailuissa: Maps4Finland–erikoispalkinnon voittaja
  • http://www.karttaselain.fi/
Tässä.fi – reittiopas aina mukana (2010)
  • Kuvaus: Tarjoaa helposti löydettävää ja ajantasaista tietoa valitun alueen kaupoista ym. yrityksistä, niiden tarjouksista, palveluista, tapahtumista,  nähtävyyksistä, työpaikoista jne. Lisäksi mm. julkisen liikenteen reititys kohteisiin.
  • Käytetyt datalähteet: mm. HSL Reittiopas ja Poikkeusinfo, suomi.fi
  • Käyttöalustat: Android, iOS, MeeGo, Symbian, Windows Phone, web
  • Ansaintamalli: mainostamismahdollisuuksien tarjoaminen; itse sovellus on ilmainen
  • Kohderyhmät: joukkoliikenteen käyttäjät, turistit, autoilijat, tietyn alueen asukkaat
  • Palkinnot ja sijoitukset kilpailuissa: Sovellussarjan 2. sija
  • http://www.tassa.fi/

3 Tietovarannot

Tässä luvussa esitellään yleisimmin kilpailutöissä käytettyjä aineistoja. Tietovarannot on luokiteltu aihepiireittäin kappaleessa 3.1 kuvatulla tavalla. Kappaleessa tarkastellaan myös näiden eri tyyppien yleisyyttä. Kappale 3.2 esittelee suosituimmat aineistot ja luettelee niitä hyödyntäviä kilpailutöitä.

3.1 Luokitteluperusteet ja tietovarantotyyppien yleisyys

Tarkastelluissa kilpailutöissä oli hyödynnetty yhteensä 193:a tietovarantoa. Luokittelussa ne päädyttiin jakamaan taulukossa 2 näkyviin tyyppeihin (14 kpl):

Taulukko 2: Luokittelussa käytetyt datakategoriat

Avoin lähdekoodi
Hallinto
JJoukkoliikenne
Julkiset palvelut
Kartat ja paikannimipalvelut
Kulttuuri
Liikenne
Luonto ja ympäristö
Matkailu
Media ja uutiset
Muut datalähteet
Terveys ja hyvinvointi
Tilastot
Yhteiskunnallinen päätöksenteko

Luokitteluperusteet noudattavat pääpiirteissään samaa jakoa, mikä on Apps4Finland-kilpailusivuston Datakatalogissa. Kategoriat Matkailu ja Yhteiskunnallinen päätöksenteko päädyttiin lisäämään – jälkimmäinen siksi, että monet kilpailutöistä liittyivät vaaleihin. Liikenne ja Joukkoliikenne ovat toisensa poissulkevia kategorioita, eli tietovarantotyyppinä ei voi samanaikaisesti olla sekä Liikenne että Joukkoliikenne.

Luokitteluja olisi luonnollisesti voitu tehdä lukemattoman monella tavalla. Eräs esimerkki käyttökelpoisesta luokituksesta on Helsinki Region Infosharen kategoriat taulukossa 3:

Taulukko 3: HRI:n datakategoriat

Alue Maankäyttö
Asuminen Muut palvelut
Demokratia ja osallistuminen Oikeuslaitos ja turvallisuus
Elinkeinot Rakennukset
Elinolot Rakentaminen
Energia- ja vesihuolto Sosiaalitoimi
Julkiset palvelut Talous
Kartat Terveys
Kaupunkihistoria Tulot ja kulutus
Kiinteistöt Työmarkkinat
Koulutus Väestö ja väestönmuutokset
Kulttuuri Vapaa-aika
Kunnallistalous Ympäristö
Liikenne Yritykset

Kategorioita on kaksinkertainen määrä verrattuna tässä raportissa käytettyyn luokitukseen. Tämä lisää tietenkin tarkkuutta, mutta myös käsin tehtävän luokittelun työmäärä kasvaa huomattavasti.

Kaavio 4 havainnollistaa tietovarantotyyppien yleisyyttä. Yksittäiset tietovarannot on luokiteltu edellä mainittuihin luokkiin. Tietovaranto voi kuulua useampaan luokkaan, esimerkiksi Espoon kaupungin aurinko- ja geoenergiakartat kategoriaan Kartat ja toisaalta Luonto ja ympäristö, tai Tampereen Reittiopas kategorioihin Joukkoliikenne ja Julkiset palvelut. Kaaviossa ei ole otettu huomioon ko. tietovarantoja hyödyntävien kilpailutöiden määrää, vaan on vain yksinkertaisesti luokiteltu kaikki tietovarannot mitä kilpailutöissä on käytetty.

Muut datalähteet-luokassa on paljon aineistoja, koska ensinnäkin monet tietovarannot kaipaisivat lisätarkennusta, jolloin niihin on laitettu yhdeksi luokittelutagiksi Muut datalähteet. Lisäksi ko. luokkaan kuuluu ”yleisaineistoja”, jotka voivat sisältää dataa lähes kaikista kategorioista. Tällaisia ovat esimerkiksi HRI:n datat, StatFin-tilastotietokanta ja käyttäjien tuottama data.

Kaavio 4: Eri luokittelutagien osuudet (%) tarkastelluissa 193 tietovarannossa

tietovarantotyypit

Kartat ja paikannimipalvelut -kategoriassa on vain varsinaisia karttoja, ei paikkatietodataa joka on esitetty kartalla; tällaista dataa on esimerkiksi VR:n Junat kartalla –palvelun junien sijaintitieto.

3.2          Suosituimmat tietovarannot

Enemmistö töistä hyödynsi puhtaasti kotimaisia tietovarantoja. Jotkin kilpailutyöt olivat sovelluksia, jotka itsessään tuottavat avointa dataa, esimerkkinä avoindata.net (2013). Kansainvälisistä aineistoista käytetyimpiin kuuluivat karttapalvelut OpenStreetMap ja Google Maps. Kaupungit tuottavat suuren osan kaikesta käytetystä datasta, ja pääkaupunkiseutuun liittyvät aineistot, joita haettiin paljon Helsinki Region Infoshare:n kautta, olivatkin kattavasti edustettuina [8]. Joidenkin töiden yhteydessä oli myös kerrottu, mitä dataa haluttaisiin käyttää, mutta mitä ei (vielä) ole avoimesti saatavilla. Esimerkkejä tällaisesta ovat vaikkapa päivittäistavarakaupan isojen toimijoiden tuote- ja hintatiedot sekä bonuskorttidata, puhelinoperaattoreiden asiakasdata, viranomaisten ostoreskontrat ja joukkoliikenteen palveluntarjoajien (esim. HSL, VR jne.) näyttötauluinformaatio.

Kaaviosta 5 voidaan havaita, että Google Maps ja OpenStreetMap olivat yhdessä käytetyimpiä tietovarantoja tutkituissa töissä. OpenStreetMap on avoin yhteistyöprojekti, ”karttojen Wikipedia”, jossa luodaan, tarjotaan ja ylläpidetään vapaasti muokattavaa karttatietoa. Google Maps –karttapalvelu on ilmainen tai maksullinen käyttötilanteesta riippuen.

Kaavio 5: Suosituimmat tietovarannot (kyseistä tietovarantoa hyödyntävien kilpailutöiden osuus (%) tarkastelluissa 114 kilpailutyössä)  

tietovarannot

Helsinki Region Infoshare-verkkopalvelu sisältää pääkaupunkiseudun kaupunkien tuottamia tai keräämiä julkisia tietoaineistoja avoimena datana. Tarjolla on monenlaista tietoa Helsingin seudusta, sen asukkaista ja palveluista: mm. tilasto- ja ennustetietoa, paikkatietoa ja erilaisia karttoja. Kilpailutöissä käytettyjä HRI:n aineistoja ovat mm. ilmakuva-arkisto, pääkaupunkiseudun kartta-aineistot, osoiteluettelot, liikennemeluvyöhykkeet, kaupunkien budjetit ja Helsingin terassit. HSL:n Reittiopas tarjoaa  aikataulu- ja reittitietoja pääkaupunkiseudun joukkoliikenteeseen, Poikkeusinfo taas tiedottaa pääkaupunkiseudun joukkoliikennettä koskevista, aikatauluihin vaikuttavista poikkeuksista ja ennakkoon tiedetyistä liikennejärjestelyistä. Jälkimmäistä hyödynnetään töissä Kyyti, Blindsquare  ja Tässä.fi.

Sovelluksen käyttäjien tuottama data voi olla esimerkiksi  yksityisten jäteastioiden sijaintitietoa (Koirankakkaroskis.fi (2010)), käyttäjien luomia kirjalistoja (Carnegie (2010)), tuotetietoa (Kulutusskanneri (2011)) tai  kaupunkilaisten havaitsemia ongelmia, esim. kaatuneet liikennemerkit, kuopat teissä jne. (korja.us (2012)).

Pääkaupunkiseudun toimipisterekisterissä, joka on palvelukartan pohjana, on tiedot kaikista pääkaupunkiseudun julkisista palveluista, puistojen patsaista pullonkeräyspisteisiin, verovirastoista koirapuistoihin. Lähes 10 000 julkisen palvelun toimipisteen tiedot kerätään kymmenistä virastoista Helsingissä, Espoossa, Vantaalla ja Kauniaisissa ja useista muista ulkoisista tietolähteistä.

Maanmittauslaitoksen Maastotietokanta on koko Suomen kattava maastoa kuvaava aineisto. Sen tärkeimpiä kohderyhmiä ovat liikenneväyläverkosto, rakennukset ja rakenteet, hallintorajat, nimistö, maankäyttö, vedet ja korkeussuhteet. Laserkeilausaineisto on maanpintaa ja maanpinnalla olevia kohteita kuvaava kolmiulotteinen pistemäinen aineisto, jonka jokaisella pisteellä on x-, y- ja z-koordinaattitieto. Sitä hyödyntävät kilpailutöistä Porottaa – terassibongari (2013), Espoon aurinko- ja geoenergiakartat, MetsäKauppaTeho (MKT) (2012) ja Karttapullautin (2012). Terassibongarissa laserkeilausaineiston avulla on tehty 3D-malli Helsingin Kalliosta. Aurinkoenergiakartta on tehty käyttämällä koko kaupungin kattavan laserkeilausaineiston pohjalta rakennettua kolmiulotteista mallia yhdessä Ilmatieteen laitoksen vertailuvuoden säätietojen kanssa. MetsäKauppaTehossa laserkeilausaineistoa käytetään tietyn alueen puuston tutkimiseen. Karttapullautin puolestaan tekee luokitelluista laserkeilauspistepilviaineistoista harjoituskäyttöön sopivia suunnistuskarttoja, ja se osaa myös lukea Maastotietokantaa ja lisätä laserkeilausaineistosta tuotettuun karttaan Maastotietokannan vesistöt, tieverkon ja rakennettun ympäristön elementtejä.

Maanmittauslaitoksen ilmakuvat ovat joko filmille tallentuneita analogiakameralla otettuja kuva tai digitaalisensorilla otettuja oikaisemattomia rasterimuotoisia ilmakuvia. Kuvat ovat maastosta otettuja kartoituskäyttöön soveltuvia pystykuvia. Ilmakuvien ajantasaisuus vaihtelee 3-10 vuoteen. Ilmakuvan voi hankkia mustavalkoisena, värillisenä tai väri-infrana riippuen kuvauksessa käytetystä filmistä. Niitä käyttävät Karttaselain, Sotasankarit (2013), Helsinki Public Transport Visualized ja Karttavahti-toiminto (2010). Kilpailutöissä (Karttaselain, iFish – Lupa- ja tietopalvelu (2011)) käytettyjä Maanmittauslaitoksen kartta-aineistoja ovat mm. maasto- ja yleiskartat.

Statfin on Tilastokeskuksen palvelu. Se sisältää Suomea koskevaa keskeistä tilastotietoa; tuhansia taulukoita eri aihepiirien tilastoista. Terveyden ja hyvinvoinnin laitoksen (THL) ylläpitämä tilasto- ja indikaattoripankki SOTKAnet sisältää kattavasti tilastotietoja suomalaisten hyvinvoinnista ja terveydestä. Palveluun on lisäksi koottu keskeisiä Euroopan maiden tasolla saatavia väestö- ja terveystietoja. Sitä on käytetty töissä Astman omahoito –sovellus(2013), ReplicaX (2013), Sotasankarit, Alueellinen hyvinvointi (2013), soRvi- avoimen datan työkalupakki R-kielelle (2011) ja Verokuitti (2011).

Valtiontalouden tarkastusviraston vaalirahoitustietoja on käytetty seuraavissa töissä: Datavaalit, Vaalirahoituksen verkko (2012), Visualisointi kansanedustajista (2011) sekä Kansan Muisti (2010). Helsingin Sanomien vaalikonedataa (ko. datan avaus on itse asiassa ollut eräs finaaliin päässyt kilpailutyö vuonna 2012) hyödyntävät Kuntavaaliehdokkaiden mielipiteiden arvokartta (2012) ja Visualisointi kansanedustajista.

4 Tekniikat

Tämä luku esittelee tarkastelluissa kilpailutöissä käytettyjä tekniikoita. Kappale 4.1 määrittelee lyhyesti ohjelmallisen tiedonhaun kaksi eri tekniikkaa, kappaleessa 4.2 esitellään töissä käytettyjä tietovarantokohtaisia rajapintoja, yleisiä rajapintatekniikoita ja rajapintoihin liittyviä tiedonsiirtoformaatteja. Töissä hyödynnettyjä käyttöalustoja, ohjelmointikieliä, sovelluskehyksiä eli frameworkeja ja mm. JavaScript-kirjastoja käsitellään kappaleessa 4.3.

4.1 Tiedonhaku tietovarannoista

Moniin kilpailutöissä hyödynnettyihin tietovarantoihin on pääsy tietovarantokohtaisten rajapintojen (API) ja rajapintapalveluiden kautta. Aina ei kuitenkaan ole olemassa valmiita rajapintoja halutun datan koneellista noutoa varten. Tällöin joudutaan hakemaan (HTML-) sivu sellaisenaan ja etsimään haluttu tieto sivun sisältä. Kilpailutöissä on tehty melko paljon screen scraping –tekniikalla tiedon  ”louhintaa” verkkosivuilta, mikäli tietovarantoon ei ole ollut pääsyä jonkin rajapinnan kautta. Screen scraping (tai web scraping) on tekniikka, jolla scraper-ohjelma kerää tietoa toisen ohjelman tulosteesta: verkkosivujen tapauksessa sivuilla olevaa tietoa kerätään ohjelmallisesti koneluettavaan muotoon esim. taulukkoon tai tietokantaan. Kilpailutöistä esimerkiksi Kansanmuisti.fi käy näin läpi eduskunnan sivuja ja duunitori.fi työvoimaviranomaisten sivuja.

4.2 Tietovarantokohtaiset rajapinnat ja rajapintatekniikat

Useat kilpailutyöt ovat rajapintoja olemassaoleviin avoimiin aineistoihin, joihin ei entuudestaan ole liittynyt rajapintapalvelua. Rajapintapalvelu on tekninen käyttöyhteys, jonka avulla tiedonkäyttäjä ottaa yhteyden tietovarannon tarjoajan palvelimelle ja noutaa tarvitsemansa aineiston. Rajapintapalveluiden käyttö edellyttää, että käytössä on ohjelmisto, joka tekee pyynnöt ko. palvelimelle. Käytännössä tämä tarkoittaa esim. paikkatieto-ohjelmistoja tai itse ohjelmoitua sovellusta.

Taulukossa 4 on yhteenveto kaikista tarkastelluissa töissä käytetyistä tietovarantokohtaisista rajapinnoista suosituimmuusjärjestyksessä. Yhteistä useimmille rajapinnoille on, että niiden käyttöön tarvitaan  API-avain (API key). Se on yksilöllinen tunniste, jota käytetään API:n käyttäjän tunnistamiseen. Avainta haetaan rajapinnan tarjoajalta. Toinen yhdistävä piirre on se, että useimmat rajapinnantarjoajat ovat rajoittaneet rajapintansa kautta tietokantaan tehtäviä hakuja johonkin tiettyyn määrään esim. vuorokaudessa tai tunnissa. Esimerkiksi HSL:n Reittioppaalla luku on 5000 hakua tunnissa.

Taulukko 4: Kilpailutöissä käytetyt rajapinnat:  kyseistä rajapintaa hyödyntävien kilpailutöiden lukumäärät ja prosenttiosuudet tarkastelluista 114 kilpailutyöstä

Rajapinta Töiden lkm Osuus (%)
Google Maps API (JS/Android/iOS) 14 12,3
HSL Reittiopas API (HTTP/XML/JSON ja XML-dump) 9 7,9
OpenStreetMap API (REST/ XML) 7 6,1
Googlen muut API:t (JS)* 6 5,3
Pääkaupunkiseudun palvelukartan API (REST/JSON/XML) 6 5,3
Maanmittauslaitoksen rajapinnat (REST/WMS/WMTS/WFS)** 5 4,4
Open Ahjo API (REST/JSON, XML) 3 2,6
Helsingin palauterajapinta (REST/XML/JSON) 2 1,8
Helsingin Sanomien Omakaupunki API (HTTP/JSON) 2 1,8
Here Maps API 2 1,8
HSL Poikkeusinfo API (HTTP/XML) 2 1,8
HSL Live (socket, HTTP) 2 1,8
Ilmatieteen laitoksen rajapinnat (WMS/WFS) 2 1,8
Matka.fi API (HTTP/XML ja XML-dump) 2 1,8
VR:n Junat kartalla (RSS/XML) 2 1,8
Tampere Public Transport SIRI (XML/JSON) 2 1,8
Tampere Reittiopas API (HTTP/XML ja XML-dump) 2 1,8
biomi.org:in Eduskunta-rajapinta 1 0,9
Facebookin Graph API (HTTP) 1 0,9
HelMet data API (HTTP/JSON/MarcXML) 1 0,9
HTML5 Geolocation API (JS) 1 0,9
Hyönteistietokanta API (JSON) 1 0,9
Kasviatlas API (REST/ JSON) 1 0,9
Kierrätys.info API (HTTP/XML) 1 0,9
kilpailijan tekemä rajapinta (ks. Ilmanlaatu rajapintana) (REST) 1 0,9
Linked Events API (REST/JSON) 1 0,9
Lintuatlas API (HTTP/XML/JSON) 1 0,9
Luonnontieteellisen keskusmuseon Löydös-järjestelmän API (HTTP/REST/JSON) 1 0,9
OpenWeatherMap API (HTTP/XML/JSON) 1 0,9
Liikenneviraston liikennetiedotteet (RSS) 1 0,9
SYKE:n luonnonsuojelualueet rajapinnasta (WMS) 1 0,9
Taltioni WS API 1 0,9
TieInfo API (REST/HTML/JSON) 1 0,9
Yleisradion RSS-lähteet 1 0,9

*    Fonts, Geocoding, Visualization, Places

**  karttakuvapalvelu (WMTS), kiinteistörajat ja nimistön kyselypalvelu (WFS), rasteriaineistojen palvelurajapinta (WMS)  

Google Maps API:en avulla Googlen karttapalvelun karttoja on mahdollista liittää verkkosivuille ja mobiilisovelluksiin. Tarjolla on JavaScript- ja Android-API:t sekä iOS SDK Applen mobiililaitteille. Helsingin seudun liikenteen Reittioppaan tietoihin pääsee käsiksi HTTP-rajapinnan kautta, josta tieto tulee XML- tai JSON-muodossa. Vaihtoehtoisesti reitti- ja aikataulutietokanta on saatavilla XML-muodossa yhtenä tiedostona (database dump), jota päivitetään kaksi kertaa viikossa [9].

XML ja JSON ovat hyvin yleisiä formaatteja rajapinnoissa. XML (Extensible Markup Language) on merkintäkieli, jolla tiedon merkitys on kuvattavissa tiedon sekaan. XML:ää käytetään mm. formaattina tiedonvälitykseen eri järjestelmien välillä, ja se on sekä ihmiselle ymmärrettävä että koneluettava. Yksinkertainen esimerkki XML-muotoilusta (erään kyselyn tulos Pääkaupunkiseudun  palvelukartan REST-rajapinnasta):

<department> 
<id>SOTE</id>
<name__fi>Sosiaali- ja terveysvirasto, Helsinki</name__fi> <name__sv>Social- och hälsovårdsverket, Helsingfors</name__sv> <name__en>The Department of Social Services and Health Care, Helsinki</name__en> 
<abbr>SOTE</abbr>
<org__id>91</org__id> 
</department>

JSON (JavaScript Object Notation) on toinen yksinkertainen tiedonsiirtomuoto, jota on helppo käyttää JavaScript-ohjelmissa ja myös muissa ohjelmointiympäristöissä. Sama esimerkki JSON-notaatiota käyttäen:

{
"department": { 
"id": "SOTE", "name__fi": "Sosiaali- ja terveysvirasto, Helsinki", "name__sv": "Social- och hälsovårdsverket, Helsingfors", 
"name__en": "The Department of Social Services and Health Care, Helsinki",
"abbr": "SOTE", 
"org__id": 91 } 
}

Useiden rajapintapalveluiden, esim. THL:n SOTKAnetin, TieInfon tai kirjastot.fi:n Kirjastohakemiston, yhteydessä on mahdollista hyödyntää JSONP-tekniikkaa (JSON  with  Padding). Se on  yleisesti käytetty  tapa  mahdollistaa  JSON-datan  haku  selaimeen  eri  palvelimelta kuin missä web-sovellus sijaitsee, sillä normaalisti selaimet  estävät  tietoturvasyistä  palvelinten  välisen  suojaamattoman  JSON –liikenteen. Tekniikka toimii niin, että asiakaspuolella   JSON  -datan   sisältävää osoitetta kutsuttaessa annetaan kutsussa takaisinkutsufunktion  nimi,  jonka  tuloksena  saadaan  JSON-data paketoituna funktion parametriksi.

REST API:t ovat erittäin yleisiä. REST (Representational State Transfer) on HTTP-protokollaan perustuva arkkitehtuurimalli ohjelmointirajapintojen toteuttamiseen. Palveluita jotka toteuttavat REST-arkkitehtuurimallin periaatteet, sanotaan RESTful-palveluiksi. REST ei ole varsinainen standardi vaan yleinen tapa tietojärjestelmien tiedonvaihtoon. Käytännössä REST toimii niin, että asiakassovellus lähettää kutsun palvelimella olevaan resurssiin (joka on URL) ja palvelin palauttaa pyyntöä vastaavan tekstipohjaisen informaation (esim. JSON tai XML) tai esim. karttakuvan. Esimerkiksi kutsu http://api.reittiopas.fi/hsl/prod/?request=stop&code=2222222&format=xml palauttaa XML-muodossa tietoa pysäkistä, jonka koodi on 2222222.

Paikkatiedon siirrossa käytössä ovat myös OGC:n (Open Geospatial Consortium) standardien mukaiset WMS,- WMTS- ja WFS-rajapintapalvelut [2], joista suosituimpana kilpailutöissä ovat olleet Maanmittauslaitoksen rajapinnat.

WMS (Web Map Service) -rajapintatekniikan avulla tuotetaan vektori- ja rasteripaikkatietoaineistoista dynaamisesti paikkatiedollista kuva-aineistoa. Paikkatietoaineistosta muodostetaan kuva halutussa formaatissa (esim. PNG/JPG/GIF). Tähän kuvaan liittyy tieto sen spatiaalisista ulottuvuuksista, sisällöstä ja metatiedoista, mutta sitä ei pidä sekoittaa alkuperäiseen paikkatietoaineistoon. WMS onkin vain tapa välittää aineiston sisältämää tietoa, ei itse alkuperäinen tiedosto ja se soveltuu näin hyvin taustakartta-aineistoksi ja karttapalveluiden käyttöön. WMS-pyynnöt välitetään URL-muotoisena ja pyyntöihin palautetaan vastaus kuvina halutulta alueelta. WMS sisältää myös tukipyyntöjä, kuten GetCapabilities, joilla voidaan tiedustella karttapalvelimen palveluita. Tukipyyntöjen vastaukset palautetaan XML-muodossa. WMS-pyynnöt välitetään HTTP-protokollalla.

WMTS (Web Map Tile Service) on toiminnoiltaan sama kuin WMS-palvelu, mutta se mahdollistaa rasterimuotoisten karttakuvien tiilityksen. Tiilityksellä (eng. ”tiling”) tarkoitetaan tekniikkaa, jossa suuret kuvat tai kartat jaetaan pieniin neliön muotoisiin kuvapaloihin vierekkäin aseteltuna. Tekniikka parantaa karttakuvapalvelun suorituskykyä, kun käyttäjä voi valita kerralla pienemmän osa-alueen kuvat. Esimerkiksi MML:n karttakuvapalvelu, josta saa maasto- ja taustakarttoja, ortokuvia sekä kiinteistörajoja, on WMTS-palvelu.

WFS (Web Feature Service) on vektoriaineistojen, kuten tieverkostot, rakennukset tai hallintorajat, tietojen välittämiseen soveltuva rajapintatekniikka. WFS -kyselyt eivät palauta kuvaa WMS:n tavoin, vaan tiedot saadaan XML-skeemana, joka asiakaspäässä vastaanotetaan vektorimuotoisena paikkatietoaineistona. Myös WFS-pyynnöt välitetään HTTP-protokollalla. Esimerkiksi Maanmittauslaitoksen kiinteistötietojen,- nimistön- ja rakennustietojen kyselypalvelut ovat WFS-palveluita.

Tietoa haetaan edellä kuvatuista HTTP-protokollaan perustuvista rajapinnoista yksittäisinä kyselyinä. Jos data muuttuu ja päivittyy jatkuvasti, kuten esimerkiksi ajoneuvojen sijainnit tai poikkeusliikennetiedotteet joukkoliikenteessä, tarvitaan  toisentyyppisiä rajapintapalveluita, joista tietoa saa jatkuvana virtana. Näitä ovat  socket– ja SIRI-rajapinnat sekä  RSS– ja Atom-syötteet.  

HSL:n paikannuspalvelun socket-rajapinnasta (HSL Live) saa tietoja tiettyjen joukkoliikenneajoneuvojen sijainneista. Se mahdollistaa jatkuvan kaksisuuntaisen yhteyden palvelinohjelman ja asiakasohjelman välillä, ja toimii käytännössä niin, että lähetetään XML-pyyntöjä tiettyyn IP-osoitteeseen ja porttiin.

Tampereen kaupungilla on reaaliaikainen SIRI-rajapinta joukkoliikennedataan. SIRI (Service Interface for Real Time Information) on yhteiseurooppalainen XML-protokollastandardi aikataulujen, ajoneuvojen ja yhteyksien reaaliaikatietojen välittämiseen joukkoliikennetoimijoiden välillä. Tampere Public Transport SIRI-rajapinnasta löytyvät palvelut ovat SIRI VM (reaaliaikaiset sijaintitiedot), SIRI SM (reaaliaikaiset pysäkkitiedot) ja SIRI GM (joukkoliikenteen tiedotteet). Tiedot päivittyvät tyypistä riippuen 1-60 sekunnin välein [10].

RSS on joukko verkkosyötemuotoja, joita käytetään usein päivittyvän digitaalisen sisällön julkaisemiseen. RSS antaa tietonsa XML-tiedostona, jota kutsutaan RSS-syötteeksi. Atom-syötteitä (XML-muotoinen standardoitu verkkosyöte) ei ole tarkasteltujen kilpailutöiden hyödyntämissä tietolähteissä käytetty. Esimerkiksi VR:n Junat kartalla –palvelu tarjoaa ajantasaista tietoa GeoRSS-syötteinä, joka on sijaintimerkinnät sisältävä syöte. Junalistasyöte sisältää perustiedot kaikista liikenteessä olevista junista. Asemasyöte sisältää asemakohtaisista perustietoa. Kaikille junille on lisäksi yksilöllinen RSS –syötteensä, joka sisältää yksityiskohtaisempia tietoja junan kulusta ja sen pysähdyspaikoista. Tiedot päivittyvät tyypistä riippuen 5-60 sekunnin välein [11].

4.3 Muut käytetyt tekniset ratkaisut

Suurin osa (61%) kilpailutöistä on web-sovelluksia. Noin viidenneksessä töistä käyttöalustaa ei ole määritelty tai kysymys siitä on ollut irrelevantti. Allaolevassa kaaviossa 6 puolestaan ”mobiili” tarkoittaa, että käyttöalustaa ei ole määritelty tarkasti käyttöjärjestelmätasolla, mutta kilpailutyö on tarkoitettu käytettäväksi mobiililaitteissa. Sama pätee ”tabletille”. Applen iOS-mobiililaitteille on tehty sovelluksia hieman enemmän kuin Androidille, ja Windows Phone on näistä kolmesta suosituimmasta mobiilialustasta vähiten tuettu. Kategoriassa ”muut” on yksittäistapauksia (navigaattorit, OS X, MeeGo, Linux, Symbian, PC).

Kaavio 6: Suosituimmat käyttöalustat (kyseiselle alustalle suunniteltujen kilpailutöiden osuus (%) tarkastelluissa 114 kilpailutyössä)

käyttöalustat

Web-ohjelmointi – HTML, CSS, JavaScript sekä PHP – on luonnollisesti ollut hallitsevassa asemassa kilpailutöissä. Muuten kielivalikoima on kirjava, kuten  kaaviosta 7 voi havaita. Lähes puolet (48,2%)  töistä on ollut tyypiltään sellaisia, että kysymys kielestä on irrelevantti tai sitä ei ole saatu selville käytettävissä olevien tietojen perusteella.

Kaavio 7: Suosituimmat ohjelmointikielet (kyseistä kieltä käyttävien kilpailutöiden osuus (%) tarkastelluissa 114 kilpailutyössä)

ohjelmointikielet

Ohjelmisto- tai sovelluskehys tarkoittaa ohjelmistotuotetta, joka muodostaa rungon sen päälle rakennettavalle tietokoneohjelmalle. Ohjelmistokehys on ohjelmoinnin apuväline, jonka tarkoituksena on nopeuttaa uusien ohjelmistotuotteiden valmistusta. Kehys tarjoaa valmiiksi rakennettuja tietokoneohjelman osia. Twitter Bootstrap oli suosituin ohjelmistokehys, jota hyödynnettiin 8 kilpailutyössä. Muita, yksittäisissä töissä käytettyjä kehyksiä olivat Hibernate, Sinatra, Django, Tastypie, CodeIgniter, Vaadin ja Grails. Twitter Bootstrap on yleiskäyttöinen työkaluvalikoima, jolla voi nopeasti toteuttaa hyvännäköisen käyttöliittymän. Twitter itse käyttää tätä välinettä, mutta väline on luonteeltaan hyvin yleiskäyttöinen. Se tarjoaa valmiita käyttöliittymän rakennus­palikoita, kuten ruudukkojärjestelmiä, navigointiin tarvittavia komponentteja, dialogeja ja lomake-elementtejä. Mukana on lisäksi responsiivisen käyttöliittymän toteuttamiseen tarvittavia määrityksiä.

JavaScript-kirjastot olivat varsin paljon käytettyjä. Taulukossa on 11 yleisintä kirjastoa.

Taulukko 5: Suosituimmat JavaScript-kirjastot: kyseistä kirjastoa hyödyntävien kilpailutöiden lukumäärät ja prosenttiosuudet tarkastelluista 114 kilpailutyöstä

Kirjasto Töiden lkm Osuus (%)
jQuery 22 19,3
jQuery UI 7 6,1
Modernizr 5 4,4
Leaflet 4 3,5
jQuery Fancybox 3 2,6
Underscore 2 1,8
Moment 2 1,8
Raphaël 2 1,8
Dojo 2 1,8
Lo-Dash 2 1,8
jQuery Mobile 2 1,8

jQuery on kaikille selaimille tarkoitettu ilmainen, avoimen lähdekoodinJavaScriptkirjasto. jQueryn syntaksi on tehty mahdollisimman helposti ymmärrettäväksi, mikä tekeekin kirjastosta erittäin suositun. jQuery sopii toimintojen käsittelyyn, animaatioiden tekemiseen, DOM-elementtien valitsemiseen ja Ajax-sovellusten toteutukseen. jQuery julkaistiin vuonna 2006, ja se on nykyään maailman suosituin JavaScript-kirjasto [12]. jQuery UI on web-sovelluksen käyttöliittymän rakentamiseen tarkoitettu jQueryyn perustuva kirjasto. Modernizr:in avulla pystytään tunnistamaan tukeeko käyttäjän selain web-sovelluksessa mahdollisesti käytettyjä HTML5/CSS3-tekniikoita. Leaflet on avoimen lähdekoodin kirjasto, jonka avulla voi liittää interaktiivisia karttoja web-sovelluksiin. Se toimii hyvin myös mobiiliympäristöissä ja pystyy hyödyntämään selainten HTML5/CSS3-ominaisuuksia.

Mainittakoon myös, että Google Analytics -palveluita käytetään todella paljon, lähes jokaisessa web-sovelluksessa. Google Analytics on ilmainen verkkosivujen kävijäseurantaan tarkoitettu tietokoneohjelma, jota käytetään WWW-selaimen välityksellä. Ohjelma saa verkkosivun kävijästä tietoa, kun kävijän selain suorittaa Javascript-komentosarjan, joka haetaan Googlen palvelimelta verkkosivun lähdekoodiin sisältyvällä lyhyehköllä kutsulla. Kävijöistä kerätyt tiedot tallennetaan Googlen palvelimelle, josta niistä koottuja tilastoja voidaan tutkia Analytics-ohjelmaan kirjautumalla.

Käytetyistä tietokantatekniikoista ei ollut saatavilla juurikaan tietoa. Parissa sovelluksessa käytettiin MySQL:ää, ja MongoDB:tä sekä Spatialiteä käytettiin kumpaakin yhdessä kilpailutyössä.

5 Yhteenveto ja arviointi

Apps4Finland on Euroopan vanhin avoimen datan kilpailu, mutta silti vain yksi monien joukossa [13]. Maailmalla on lukemattomia avoimen datan kilpailuja Apps4Russia:sta aina vuonna 2013 ensimmäistä kertaa järjestettyyn Apps4Pirkanmaa-kilpailuun asti, johon osallistuvan kilpailutyön pitää käyttää vähintään yhtä Pirkanmaalla avattua datajoukkoa tai rajapintaa [14]. Ensimmäisenä vuonna avoimen datan osaajat innovoivat kyseiseen kilpailuun yhteensä 15 avoimeen dataan perustuvaa sovellusta ja ideaa. Uusimpia tulokkaita paikallisissa kilpailuissa ovat Apps4Lounais-Suomi ja Apps4Pohjois-Pohjanmaa, jotka molemmat järjestetään vuonna 2014 ensimmäistä kertaa. Ensin mainitun aiheena on tänä vuonna Itämeri: ideana on tuottaa toimivia sovelluksia ja ideoita Itämeren hyväksi (matkailun kehittäminen, ympäristöasiat, öljyntorjunta jne.). Jälkimmäisen alueellisen kilpailun teemana on terveyden, hyvinvoinnin ja liikunnallisuuden edistäminen avoimia datalähteitä ja mobiliteettia hyödyntämällä.  

Apps for Europe puolestaan on kansainvälinen verkosto, joka tavoitteena on synnyttää avoimesta datasta liiketoimintaa. Siinä on mukana toimijoita kymmenestä Euroopan maasta [15]. Tarjolla on osaamista ja työkaluja avoimen tiedon kaupallistamiseen. Toiminta tuo yhteen julkisen tiedon avaajat, sovelluskehittäjät, alan yritykset ja potentiaaliset rahoittajat. Verkosto on mukana lukuisissa sovelluskilpailuissa, tapahtumissa ja hackathoneissa [3], joita avoimen tiedon ympärillä järjestetään.

Julkishallinnon avaamat tietovarannot ovat yleisimpiä, mutta kokonaan toinen näkökulma avoimeen dataan saadaan, kun tutkitaan yrityksiä datan avaajina. Ulkomailta löytyy runsaasti esimerkkejä: italialainen energiayhtiö Enel, verkossa toimiva muotitavaratalo Asos, musiikkimaailman trendejä analysoiva MusicMetric, sanomalehdet The New York Times ja The Guardian, Twitter, Google, Nike, Tesco ja niin edelleen, jotka kaikki ovat rakentaneet omia ohjelmointirajapintojaan tietovarantoihinsa. Yksi mielenkiintoinen esimerkki löytyy Expedia –matkatoimistosta, joka on yksi suurimmista online-matkatoimistoista. Vuonna 2010 se avasi ja dokumentoi omat tietovarantonsa, mm. hotelli-, matkakohde- ja varaustiedot, ja loi niiden käyttämiseksi avoimen rajapinnan. Expedian datojen päälle on rakennettu noin 10 000 eri tarkoituksiin luotua webbimatkatoimistoa, sovellusta ja liiketoimintoa, joiden tulovirrasta Expedia saa osuutensa. Muita mielenkiintoisia toimijoita ovat mm. urheilukanava ESPN tai vaikkapa ranskalainen pankki Axa Banque joka on avannut oman tietopääomansa (asiakkaiden tili- ja luottokorttimaksutiedot) erilaisten sovellusten ja liiketoimintojen kasvualustaksi [16]. Myös BestBuy:llä, joka on eräs Yhdysvaltojen suurimmista elektroniikka-alan jälleenmyyjistä, on useita API-rajapintoja omiin aineistoihinsa (mm. tuotetieto, liikkeet ja tuotearviot).

Avoimen datan käyttö kaupallisiin sovelluksiin ei analysoitujen töiden perusteella ole vielä kovinkaan yleistä. Tästä ei tietenkään voi syyttää pelkästään sovellusten kehittäjiä, vaan myös datan omistajia. Dataa varmastikin osataan hyödyntää, jos siihen on helppo pääsy rajapintojen kautta. Suomessa yritykset eivät ole vielä tottuneita datan avaajia, ja täällä  merkittävimmät yksityisten yritysten avaamat tietoaineistot  liittyvät  datajournalismiin.  Mediatalot  ovat  avanneet  omia tutkimustuloksiaan sekä vaalikoneiden vastauksia suurelle yleisölle [17]. Voi vain toivoa, että yhä useampi suomalainenkin yritys motivoituisi avaamaan omia datojaan ja keksisi kaupallista hyötykäyttöä jo avatuille tietovarannoille.

 

Lähteet

[1] Helsinki Region Infoshare , ”Mitä on avoin data?,” [Verkossa]. Saatavilla: http://www.hri.fi/fi/mita-on-avoin-data/. [Haettu 10. joulukuuta 2013].
[2] Open Knowledge Foundation , ”Avointen tietovarantojen määritelmä,” [Verkossa]. Saatavilla: http://opendefinition.org/okd/suomi/. [Haettu 10. joulukuuta 2013].
[3] Wikipedia, ”Avoin tieto,” [Verkossa]. Saatavilla: http://fi.wikipedia.org/wiki/Avoin_tieto. [Haettu 10. joulukuuta 2013].
[4] ”Suomen Verkkodemokratiaseura ry.,” [Verkossa]. Saatavilla: http://www.verkkodemokratia.fi/.
[5] ”Forum Virium Helsinki Oy,” [Verkossa]. Saatavilla: http://www.forumvirium.fi/.
[6] ”Apps4Finland-kilpailun säännöt,” [Verkossa]. Saatavilla: http://www.apps4finland.fi/kilpailu/saannot/. [Haettu 5. joulukuuta 2013].
[7] ”Avoimista tietovarannoista liiketoimintaa Satakuntaan (AVARAS) -hanke,” [Verkossa]. Saatavilla: http://www.avoinsatakunta.fi/avaras-projekti/.
[8] Pääkaupunkiseudun kaupungit, ”Helsinki Region Infoshare -palvelun datakategoriat,” [Verkossa]. Saatavilla: http://www.hri.fi/fi/data-haku/#. [Haettu 11. helmikuuta 2014].
[9] Helsingin seudun liikenne, ”Kalkati.net, XML database dump,” [Verkossa]. Saatavilla: http://developer.reittiopas.fi/pages/en/kalkati.net-xml-database-dump.php. [Haettu 3. huhtikuuta 2014].
[10] Tampereen Kaupunkiliikenne Liikelaitos, ”SIRI-rajapinnan kuvaus,” [Verkossa]. Saatavilla: http://developer.publictransport.tampere.fi/pages/en/siri.php. [Haettu 4. huhtikuuta 2014].
[11] VR, ”Junat kartalla -rajapinta,” [Verkossa]. Saatavilla: http://www.vr.fi/fi/index/palvelut/avoin_data/Junatkartalla-rajapinta.html. [Haettu 4. huhtikuuta 2014].
[12] Wikipedia, ”jQuery,” [Verkossa]. Saatavilla: http://fi.wikipedia.org/wiki/JQuery. [Haettu 2 huhtikuuta 2014].
[13] ”Forum Virium Helsinki: City of Helsinki’s Smart City Innovation Unit,” [Verkossa]. Saatavilla: http://www.forumvirium.fi/node/2590. [Haettu 9. huhtikuuta 2014].
[14] [Verkossa]. Saatavilla: http://apps4pirkanmaa.fi/. [Haettu 9. huhtikuuta 2014].
[15] ”Apps for Europe -kilpailun kotisivu,” [Verkossa]. Saatavilla: http://www.appsforeurope.eu/about-us. [Haettu 9. huhtikuuta 2014].
[16] Ajatushautomo, ”Data driven innovation,” [Verkossa]. Saatavilla: http://ajatushautomo.com/tag/avoin-data-2/. [Haettu 10. huhtikuuta 2014].
[17] P. Sarkola, ”Tekesin katsaus 297/2012: Avoimen maastotiedon liiketoimintamahdollisuudet,” [Verkossa]. Saatavilla: http://www.tekes.fi/Julkaisut/avoin_maastotieto_297_12.pdf. [Haettu 10. huhtikuuta 2014].
[18] ”JSON Example,” [Verkossa]. Saatavilla: http://json.org/example.html. [Haettu 3. huhtikuuta 2014].

Liitteet

Taulukko 6: Tarkastelluissa kilpailutöissä käytetyt tietovarannot
Tietovaranto Tietovarannon avaaja/ylläpitäjä/omistaja
2m korkeusmalli Maanmittauslaitos
Ajoneuvoverotus Liikenteen turvallisuusvirasto
Alkoholijuomien kulutus 2012 -tilasto Terveyden ja hyvinvoinnin laitos
Asumiskulut Tilastokeskus
Aurinko- ja geoenergiakartat Espoon kaupunkisuunnittelukeskus
Avoimet aineistot Suomen Ympäristökeskus
Avoindata.net API Avoindata.net
CIA World Factbook 2011 CIA
Datavaalit API Kansan muisti ry
Demografiadata Tilastokeskus
Digitraffic: liikenteen sujuvuustiedot, linkkien nimi- ja lokaatiotiedot, säätiedot ja sääasemien lokaatiotiedot Liikennevirasto
Eduskunnan asioiden käsittelytiedot Eduskunta
Eduskunnan seuraava täysistunto Eduskunta
Eduskunnan täysistuntojen pöytäkirjat Eduskunta
Eduskunnan äänestysten tulokset Eduskunta/Mikko Heikkinen (biomi.org)
Elektroniset merikartat (ENC) Liikennevirasto
Elävä arkisto YLE
Eurostat Euroopan komissio
Facebookin Graph API:n tarjoama fanisivudata (eduskuntavaaliehdokkaat) Facebook
Finanssialan keskusliiton vuosijulkaisut Finanssialan keskusliitto
Finnveran pankkisalaisuuden alaisten tukien toistuvuus Tilastokeskus
French Sub Administrative boundaries IGN (Institut National de l’information géographique et forestière)
Global Administrative Areas: Yhdysvaltojen osavaltiot GADM
Google Fonts API Google
Google Geocoding API Google
Google Maps Google
Google Places API Google
Hallituksen esitys valtion vuoden 2012 talousarvioksi 5.10.2011. Valtioneuvosto
Hatikka-havaintotietokanta Luonnontieteellinen keskusmuseo
Havaintoilmoitin Luonnontieteellinen keskusmuseo
HelMet data API HelMet-kirjastot (Helsinki Metropolitan Area Libraries)
HelMet www-sivuilta saatavat teosten saatavuustiedot HelMet-kirjastot (Helsinki Metropolitan Area Libraries)
Helmet-kirjastojen halutuimmat teokset -tietokanta HelMet-kirjastot (Helsinki Metropolitan Area Libraries)
HelMet-kirjastojen tuotetiedot HelMet-kirjastot (Helsinki Metropolitan Area Libraries)
Helsingin kaupungin matkailutoimiston POI– ja tapahtumadata (pääkaupunkiseudun ajankohtaiset tapahtumat ja matkailunähtävyydet) Helsingin kaupunki
Helsingin kaupungin palauterajapinta Helsingin kaupunki
Helsingin kaupungin palvelutiedot: kirjastojen tiedot Helsingin kaupunki
Helsingin kaupungin rakennusrekisterin ote 6/2012 Helsingin kaupunki
Helsingin kaupungin tietokeskuksen tilastoja 2011:17 Helsingin kaupunki
Helsingin kaupungin tilastollinen vuosikirja Helsingin kaupunki
Helsingin kaupunginkirjaston luokitusjärjestelmän tiedot Helsingin kaupunki
Helsingin liikennemeluvyöhykkeet Helsingin kaupunki (ympäristökeskus)
Helsingin osoiteluettelo Helsingin kaupunki
Helsingin piirijako Helsingin kaupunki
Helsingin terassit Helsingin kaupunki (rakennusvirasto)
Helsingin väestötietojärjestelmä Helsingin kaupunki
Helsingin ympäristötilasto Helsingin kaupunki
Helsinki Region Infoshare Helsingin seudun virastot
Helsinki-Vantaa -selvitys Helsingin kaupunki, Vantaan kaupunki
Henkilökohtainen sähkönkulutusdata (Sävel+) Helsingin Energia
Henkilöliikennetutkimus 04–05 Liikennevirasto
Here Maps API Here
Hintatietoa toteutuneista puukaupoista Maa- ja metsätaloustuottajain Keskusliitto MTK ry
Hirvieläinonnettomuudet Liikennevirasto
HS:n vaalikonedata 2011 Helsingin Sanomat
HSL Poikkeusinfo Helsingin seudun liikenne
HSL Reittiopas Helsingin seudun liikenne
HSL:n aikataulut Helsingin seudun liikenne
HSL:n ajoneuvojen pysäkkien sijaintitiedot Helsingin seudun liikenne
HSL:n ajoneuvojen reittitiedot Helsingin seudun liikenne
HSL:n ajoneuvojen sijaintitiedot (HSL Live) Helsingin seudun liikenne
HSL:n ajoneuvot kartalla (socket) Helsingin seudun liikenne
HSL:n yhden vuorokauden lipunmyynti- ja matkakorttikäyttödata Helsingin seudun liikenne
Hyönteistietokanta Luonnontieteellinen keskusmuseo
Ilmakuva-arkisto Helsingin seudun virastot/HRI
Ilmanlaatuportaalin data Ilmatieteen laitos
Itellan ja MML:n avoimista aineistoista muodostetut postinumeroalueet Itella, Maanmittauslaitos/latuviitta.org
Julkisen hallinnon suositukset JHS-järjestelmä/Julkisen hallinnon tietohallinnon neuvottelukunta JUHTA
Jyväskylän luottamushenkilörekisteri Jyväskylän kaupunki
Järviwiki Suomen Ympäristökeskus
Kalojen rauhoitusajat alueittain Maa- ja metsätalousministeriö
Kansanedustajien Facebook-syötteet Facebook
Kansanedustajien Twitter-syötteet Twitter
Kansantaloudellinen tilinpito 2000 – 2009 Tilastokeskus
Kartta-aineisto Geologian tutkimuskeskus
Kasviatlas Luonnontieteellinen keskusmuseo
Katsastustilastot vuodelta 2012 A-katsastus Oy
Kaupparyhmien bonuskorttidata (ei vielä yleisesti avointa) Kaupparyhmät
Kaupunginvaltuustojen jäsenet kaupunkien verkkosivuilta Kaupungit
Kaupunkien pysäköintikartat (maksuvyöhykkeet) Kaupungit
Keskikulutus Liikenteen turvallisuusvirasto
Keskipäästöt Liikenteen turvallisuusvirasto
Kierrätys.info API Jätelaitosyhdistys ry
Kiinteistörajat Maanmittauslaitos
Korkeuskäyrät Maanmittauslaitos
Kotitalouksien säästöt Tilastokeskus
Kunnallisvaaliehdokkaiden some-profiilit YLE
Kunnallisvaalien ehdokastiedot Oikeusministeriö
Kunnallisvaalien äänestysalueet Tilastokeskus
Kunnallisvaalitieto Tilastokeskus
Kuntaliiton tilastoaineistot Kuntaliitto
Kuntarajat Maanmittauslaitos
Kuntatiedot Tilastokeskus
Kuntien ja seurakuntien tuloveroprosentit Verohallinto
Kuntien kartta-aineistot: saastuneet maat Kunnat
Käypä Hoito -suosituksien kotisivut Suomalainen Lääkäriseura Duodecim
liikenne.seuranta.org Samuel Rinnetmäki
Liikennetiedotteet Liikennevirasto
Liikenteen sujuvuus Helsingissä vuonna 2011 (tutkimus) Helsingin kaupunki
Linked Events API Forum Virium, Helsingin kaupunki, HelMet-kirjastot (Helsinki Metropolitan Area Libraries)
Lintuatlas Luonnontieteellinen keskusmuseo
Lounaispaikan aineistot Lounaispaikka
Luonnonsuojelualueet suojelumääräyksineen Suomen Ympäristökeskus
Maa-ja kallioperätiedot Geologian tutkimuskeskus
Maanmittauslaitoksen ilmakuvat Maanmittauslaitos
Maanmittauslaitoksen kartta-aineistot Maanmittauslaitos
Maanmittauslaitoksen laserkeilausaineisto Maanmittauslaitos
Maanmittauslaitoksen Maastotietokanta Maanmittauslaitos
Maanpuolustuskorkeakoulun SA-kuvien arkisto Puolustusvoimat
Maaperäkartat Espoon kaupunkisuunnittelukeskus
Maastokartta-aineistot Norjan maanmittauslaitos
Maastokartta-aineistot Maanmittauslaitos
Maat ja maanosat Natural Earth
Maksetut yritystuet Liikenneministeriö
Matka.fi API Liikennevirasto
Matka.fi-pysäkit Liikennevirasto
Merikartat Liikennevirasto
MONICA-data (WHO) Terveyden ja hyvinvoinnin laitos
Museoviraston aineistot Museovirasto/latuviitta.org
National Public Transport Access Nodes (NaPTAN) UK Department for Transport
Natura2000-alueet European Environmental Agency
Nimistö Maanmittauslaitos
OIVA-aineistotietokanta Ympäristöministeriö
Oma kaupunki API Helsingin Sanomat
Open Ahjo Helsingin kaupunki
Open Linked Data -aineistot
Open Transport Group Vocabulary
OpenStreetMap OpenStreetMap
OpenWeatherMap API Extreme Electronics LTD.
palvelun käyttäjien luovuttama roskisten sijaintitieto koirankakkaroskis.fi
palveluntarjoajien (esim. HSL, VR jne) näyttötauluinformaatio Helsingin seudun liikenne, VR
Panoramion kuva-aineistot Google
Peltolohkot Maaseutuvirasto
Puhelinoperaattorien data (ei vielä yleisesti avointa) Puhelinoperaattorit
Puolueiden ja eduskuntavaaliehdokkaiden blogit Puolueet ja eduskuntavaaliehdokkaat
Puuston keskipituus Metsäntutkimuslaitos
Puuston latvuspeitto Metsäntutkimuslaitos
Pääkaupunkiseudun aluerajaukset ja seutukartta-aineisto Helsingin seudun virastot/HRI
Pääkaupunkiseudun bussireitit Helsingin seudun liikenne
Pääkaupunkiseudun liikennevaloristeykset Liikennevirasto
Pääkaupunkiseudun palvelukartta Pääkaupunkiseudun kaupungit
Rakennukset Maanmittauslaitos
Rakennus- ja huoneistorekisteri Väestörekisterikeskus
REISKA-aineistotietokanta Metsähallitus
Sallitut kalastusmenetelmät Maa- ja metsätalousministeriö
Sovelluksen käyttäjien tuottama data Sovelluksen käyttäjät
StatFin-tilastotietokanta Tilastokeskus
Suomen kuntakartta
Suomen Pankin tilastot Suomen Pankki
Suomen Teollisuussijoituksen pääomasijoitukset Suomen Teollisuussijoitus
Suomi.fi:n Avoin data -sivu (data.suomi.fi) Valtiokonttori
Suomi.fi-portaalin sisältö Valtiokonttori
Sähkön keskikulutus Vattenfall
Säähavaintoaineisto Ilmatieteen laitos
Säätiedot Ilmatieteen laitos
Säävaroitusdata Ilmatieteen laitos
Taksiliiton verkkosivut Suomen Taksiliitto
taltioni.fi Taltioni osuuskunta
Talvilintulaskennat Luonnontieteellinen keskusmuseo
Tampere Public Transport SIRI (bussitiedot, poikkeustiedotteet) ITS Factory
Tampere Reittiopas API Tampereen kaupunki
THL:n Sotkanet Terveyden ja hyvinvoinnin laitos
Tiedot metsäpalstoista ja niiden omistajista Maanmittauslaitos
TieInfo API: liikenteen sujuvuustiedot Liikennevirasto/Matti Mustonen/mustcode.fi
Tilastoaineistot Oikotie
Tuloveroasteikko Verohallinto
Tuotteiden viivakoodit
Työssäkäyntitiedot Tilastokeskus
Vaalirahoitusdata Helsingin Sanomat
Vaalirahoitustiedot Valtiontalouden tarkastusvirasto
Vaalitulos Vaalit.fi
Valmisteverotettaviin tuotteisiin liittyvät tiedot Tulli
Valtion talousarvioesitykset Valtiovarainministeriö
Valtiovarainministeriön tiedotteet Valtiovarainministeriö
Vantaan kaupungin tulot ja menot 2010 ja 2011 Vantaan kaupunki
Velkatilastot ja suhdannekatsaukset Valtiokonttori
Verotiedot Verohallinto/Taloussanomat
Verotiedot Helsingin Sanomat
Verotilastot Veronmaksajien keskusliitto
Verotukitilasto Tulli
Vesistöjen ja erityiskalastusalueiden kalastusluvat Maa- ja metsätalousministeriö
World Administrative Boundaries
VR:n aikataulut VR
VR:n Junat kartalla (aikataulu- sekä junien kokoonpanotiedot, asematiedot) VR
VR:n lähiliikenteen rataverkko Google Mapsin koordinaatteina VR
VR:n verkkosivut VR
Yhteisölliset reittiaineistot GPSAlbum.com
Yleisen kirjastojen luokittelujärjestelmän tiedot Opetus- ja kulttuuriministeriö/Kirjastot.fi
Yleiskartat Maanmittauslaitos
Yleisradion RSS-lähteet YLE
Älypuhelimien liikeanturidata

Taulukko 7: Tarkastelluissa kilpailutöissä käytettyjen tietovarantojen avaajat/ylläpitäjät/omistajat
A-katsastus Oy
Avoindata.net
CIA
Eduskunta
Espoon kaupunkisuunnittelukeskus
Euroopan komissio
European Environmental Agency
Extreme Electronics LTD.
Facebook
Finanssialan keskusliitto
Forum Virium
GADM
Geologian tutkimuskeskus
Google
Google
GPSAlbum.com
HelMet-kirjastot (Helsinki Metropolitan Area Libraries)
Helsingin Energia
Helsingin kaupunki
Helsingin kaupunki (rakennusvirasto)
Helsingin kaupunki (ympäristökeskus)
Helsingin Sanomat
Helsingin seudun liikenne
Helsingin seudun virastot/HRI
Here
IGN (Institut National de l’information géographique et forestière)
Ilmatieteen laitos
Itella
ITS Factory
JHS-järjestelmä/Julkisen hallinnon tietohallinnon neuvottelukunta JUHTA
Jyväskylän kaupunki
Jätelaitosyhdistys ry
Kansan muisti ry
Kaupparyhmät
Kaupungit
Kirjastot.fi
koirankakkaroskis.fi
Kunnat
Kuntaliitto
latuviitta.org
Liikenneministeriö
Liikennevirasto
Liikenteen turvallisuusvirasto
Lounaispaikka
Luonnontieteellinen keskusmuseo
Maa- ja metsätalousministeriö
Maa- ja metsätaloustuottajain Keskusliitto MTK ry
Maanmittauslaitos
Maaseutuvirasto
Matti Mustonen/mustcode.fi
Metsähallitus
Metsäntutkimuslaitos
Mikko Heikkinen/biomi.org
Museovirasto
Natural Earth
Norjan maanmittauslaitos
Oikeusministeriö
Oikotie
OpenStreetMap
Opetus- ja kulttuuriministeriö
Puhelinoperaattorit
Puolueet ja eduskuntavaaliehdokkaat
Puolustusvoimat
Pääkaupunkiseudun kaupungit
Samuel Rinnetmäki
Sovelluksen käyttäjät
Suomalainen Lääkäriseura Duodecim
Suomen Pankki
Suomen Taksiliitto
Suomen Teollisuussijoitus
Suomen Ympäristökeskus
Taloussanomat
Taltioni osuuskunta
Tampereen kaupunki
Terveyden ja hyvinvoinnin laitos
Tilastokeskus
Tulli
Twitter
UK Department for Transport
Vaalit.fi
Valtiokonttori
Valtioneuvosto
Valtiontalouden tarkastusvirasto
Valtiovarainministeriö
Vantaan kaupunki
Vattenfall
Verohallinto 
Veronmaksajien keskusliitto
VR
Väestörekisterikeskus
YLE
Ympäristöministeriö

 

Alaviitteet

[1] Wikipedia: Foursquare on paikkatietoon perustuva sosiaalisen verkostoitumisen verkkopalvelu ja mobiilisovellus. Palvelun ideana on, että sen käyttäjät ”kirjautuvat” (eng. check-in) mobiililaitteillaan eri paikkoihin ja näin kertovat tuttavapiirilleen, missä liikkuvat. Käyttäjä valitsee paikat Foursquare-sovelluksen listasta. Kirjautumisen jälkeen sovellus lähettää ilmoituksen käyttäjän ystäville. Jokainen kirjautuminen tuo käyttäjälle pisteitä, ja jos kirjautuu samaan paikkaan hyvin usein, voi saada sen pormestarin arvonimen.

[2] OGC:llä on paljon muitakin verkkopalvelustandardeja, kuten WCS, WCPS ja WPS, mutta edellä mainitut kolme ovat yleisimmin sovellettuja.

[3] Hackathonit ovat ohjelmointikilpailuja, joissa kokoonnutaan yhteen ja toteutetaan jokin ohjelmistoprojekti/projekteja alusta loppuun. Ne kestävät tyypillisesti yhdestä päivästä viikkoon.

Jaa Facebooktwitterlinkedinmail
Seuraa Facebooktwitter