Marraskuun alussa järjestettiin Helsingissä Kansalliskirjaston tiloissa Suomen DSpace-käyttäjien tapaaminen kolmatta kertaa. Paikalla oli yhteensä parikymmentä henkeä: Kansalliskirjaston, Helsingin yliopiston, Jyväskylän yliopiston, Tampereen yliopiston, Tampereen teknillisen yliopiston, Arcadan sekä Ammattikorkeakoulujen Open Access ‐hankkeen edustajia.
Tapaaminen aloitettiin keskustelemalla Göteborgissa lokakuussa pidetystä kansainvälisestä DSpace-käyttäjien kokouksesta, johon osallistui kahdeksan suomalaista edustajaa. Göteborgin kokouksessa oli läsnä vähemmän väkeä kuin aiemmissa vastaavissa kokouksissa, alle sata henkeä. Pieni osallistujamäärä mahdollisti sen, että monet pääsivät keskustelemaan kahden kesken DSpace-gurujen kanssa. Tilaisuudessa esittäytyi uusi organisaatio nimeltä DuraSpace, joka on muodostettu yhdistämällä kaksi suurta avoimeen lähdekoodiin perustuvaa digitaalisen arkistoinnin ohjelmistokehittäjää, Fedora Commons ja the DSpace Foundation. Göteborgin kokouksessa esiteltiin loppuvuodesta ilmestyvää DSpacen versiota 1.6, jossa kerrottiin olevan kaikkiaan 95 uutta ominaisuutta.
Tärkeimpiä uudistuksia ovat parannettu tilastointi, metadatan massaeditointi, embargot sekä paranneltu auktoriteettikontrolli. DSpace 2.0:n ilmestymisestä ei Göteborgissa sanottu mitään varmaa. Versio 2.0 tulee uudistamaan DSpacen koko arkkitehtuurin ja sen kehittäminen on ilmeisen haastavaa ja aikaavievää. Myös DuraCloud, DuraSpacen kehittämä pilvitekniikkaan perustuva teknologia, oli esillä Göteborgissa. Pilviteknologia mahdollistaa mm. tallennus- ja laskentatilan vuokraamisen kaupallisilta tahoilta sekä datan ja ohjelmistojen automaattisen replikoinnin useampaan pilvivarastoon.
Suomen DSpace-käyttäjien tapaamisen pääteemana oli tällä kertaa tilastointi, josta kuulimme kaikkiaan viisi esitystä. Aluksi Jyrki Ilva Kansalliskirjastosta puhui aiheesta “Mitä tilastoidaan ja miksi”. Ilva totesi, että tilastoinnin tarkoituksena julkaisuarkistokontekstissa voi olla joko toiminnan tuloksellisuuden osoittaminen tai palveluiden parantaminen. Kerättäviä tietoja ovat mm. vierailijoiden, vierailujen ja sivulatausten määrät, IP-osoitteet, käytetyt hakusanat sekä sivulla vietetty aika. Kokotekstin latauskerta vaikuttaa uskottavimmalta mittarilta, kun halutaan mitata julkaisun käyttöä, mutta siihenkin sisältyy haasteita: lataaminen ei kerro mitään julkaisun jatkokäytöstä. Konkreettiseksi esimerkiksi julkaisuarkiston tilastoinnista Ilva esitti Dorian vuonna 2008 kerättyä tietoa. Doriassa on viime vuonna yhteensä noin 2,3 miljoonaa latauskertaa. Käytetyimpiä yksittäisiä julkaisuja ladataan tyypillisesti satoja kertoja kuukaudessa. Suosio ei usein kuitenkaan kerro julkaisun tieteellisestä merkittävyydestä, vaan osa suosikeista käsittelee populaareja ja osalla on paljon julkisuudessa ollut henkilö kirjoittajana.
Ari Alkio Kansalliskirjastosta kertoi COUNTER (Counting Online Usage Of NeTworked Electronic Resources) -tilastosuosituksesta. COUNTER on kirjastojen ja kustantajien välinen yhteishanke, jonka tarkoituksena on edistää käyttötilastoinnin luotettavuutta ja vertailtavuutta sekä tilastoinnin yhteismitallisuutta. COUNTER laatii suosituksia e-lehtien ja viitetietokanta-aineistojen sekä e-kirjojen ja hakuteosten käytön tilastoinnille ja arvioi puolueettomasti kustantajien tuottamien aineistojen käyttötilastointia. COUNTERin käyttöönoton ansiosta tilastotietojeen luotettavuus on parantunut huomattavasti, joskin COUNTER-tilastoinnissa on paljon paranneltavaakin. COUNTER-yhteensopivuutta on toivottu myös julkaisuarkistoihin, mutta käytännön toteutuksia ei vielä ole.
Timo Aalto Helsingin yliopiston kirjastopalveluiden koordinointiyksiköstä esitteli Google Analyticsia. Se on Googlen tarjoama tilastointipalvelu, joka perustuu sivupohjaan liitettävään JavaScript-koodiin. Google Analytics on ilmainen, näyttävä ja monipuolinen tilastointityökalu, mutta silläkin on huonot puolensa: se ei tilastoi kokotekstilatauksia, se on melko monimutkainen ja sen tuottamaa dataa on vaikea siirtää esim. Exceliin. Miinuksena voidaan nähdä myös se, että tilastotiedot ovat ulkopuolisen tahon (Googlen) käytettävissä.
Samu Viita ja Janne Pietarila Kansalliskirjastosta esittelivät kehittämäänsä SimpleStat-tilastointiohjelmaa, jonka avulla seurataan dokumenttien latausmääriä DSpacessa. SimpleStat tilastoi kuukausittaiset latausmäärät (per item, per kokoelma, per yhteisö ja per koko DSpace). SimpleStat-ohjelmassa on Google Analyticsiin verrattuna kaksi oleellista parannusta: se tilastoi myös kokotekstilataukset ja osaa tehdä yhteisö- ja kokoelmahierarkiakohtaiset tilastot.
Lopuksi Joonas Kesäniemi Jyväskylän yliopisto tietohallintokeskuksesta kertoi DSpace 1.6:n tilastointiominaisuuksista. Hän kertoi, että DSpace 1.6:ssa on jo mukana version 2.0 teknologiaa, esimerkiksi luokkarakenne tulee olemaan erilainen kuin versiossa 1.5. Versio 1.6 tulee uudistamaan ja parantamaan DSpacen tilastointiominaisuuksia huomattavasti.
Seuraavan kerran DSpace-käyttäjäryhmä kokoontuu Tampereella keväällä 2010.
Eija Airio
Järjestelmäasiantuntija
Helsingin yliopiston kirjaston Verkkopalvelut