Big Data – Mikä?! – Voiko siitä oikeasti saada bisneshyötyjä?

It's Big DataBig Datan ‘määritelmiä’ tällä hetkellä – Big Data on sellaista dataa, jota on niin paljon, että se ylittää totuttujen tuttujen perinteisten tietokantojen käsittelykyvyn. Big Data on ‘liian isoa’ ja liikkuu ‘liian nopeasti’ eikä sitä oikein ‘muodoiltaan’ saa sovitettua nyt (sinulla) olemassa olevan tietokannan formuun ts. arkkitehtuuriin. Big Datan määritteleminen tai pikemminkin yritys määritellä ja samalla rajata määritystä tiedon lähde- tai kanava- perusteisesti on jatkuvasti hämmentävää. Samoin rajaavaa ja hämmentävää ovat tekniikkaperusteiset määritelmät kuten ‘Big Data on vain yksi tietolähde lisää’ (ETL-tuotelähtöinen) tai ‘Big Data on sosiaalisten medioiden tuottamaa’ tai ‘Big Data on strukturoimatonta tietoa’ ajatuksellisena vastakohtana nyt tietokannoissamme olevat rakenteelliset ja numeeriset tiedot. Tässä vaiheessa minun mieleni tekee määritellä, että Big Data ovat kaikki tieto ja kaikki tietoa/dataa tuottavat lähteet yhteisesti riippumatta siitä ovatko lähteet ja tieto ‘nykyisten rajojemme sisällä´ tai vielä niiden ulkopuolella tai olemmeko jo onnistuneet osan tästä tiedosta valjastamaan omaan käyttöömme. Big Dataa syntyy jatkuvasti myös organisaatiossamme sisällä. Big Dataa syntyy vielä massiivisemmin organisaatiomme ulkopuolella ja näin meille muodostuu helposti ajatus, että vain ulkopuolinen on Big Dataa ja sisäinen ei ole sitä. Esimerkiksi sosiaalisten medioiden piirissä syntyvän Big Datan lisäksi sitä tuottavat jatkuvasti mm. web lokit, kaikenlaiset sensorit aivan valtavia määriä, satelliittikuvat, radio- ja tv-lähetykset, kaikki  transaktiotyyppinen toiminta (niin organisaatioiden sisällä suojatut että julkisesti avoimesti avattu tapahtumatieto), autojen ja tiestön telemetriikat, valvontakamerat jne. jne.

Big Datassa odotetaan ja oletetaan olevan isoja aiemmin piiloon jääneitä hyötyjä ja valtavaa bisnespotentiaalia. Ne ovat jääneet hyödyntämättä tähän asti, koska jalostamiseen tarvittava työmäärä on ollut liian suuri, tarvittava ICT-kapasiteetti liian kallista, eikä hyödyntämiseen ole oikein työkalujakaan löytynyt valmiina. Ja todennäköisesti merkittävin  hyödyntämisen este on ollut yksinkertaisesti ideoiden ja ‘Big Data -tietoisuuden’ puute. Tästä ei ole osattu oikein edes uneksia, suurin osa ihmisistä ja yrityksistä kun ei ‘uneksi’ tulevista potentiaaleista vaan trimmaa nykyisiä tiedossa olevia koetuilla tekniikoilla ja koetuilla ‘parhailla käytännöillä’.  Tunnetut ‘Big Data yritykset’ kuten esimerkiksi Google , Facebook ja Amazon ovat toimineet omalla tavallaan pioneereina ja ovat luoneet itselleen uusia palveluja ja uutta bisnestä Ison Datan luonteisesta tietomateriasta isolla panostuksellaan. Monet toimialat ovat jo ‘altistuneet’ Big Datalle kuten esimerkiksi terveydenhuolto, julkiset toimijat, verkkokauppa ja ‘telecom’ ja ensimmäinen kierros innovaatioista on käynnissä.

Pilvipalvelujen ja avointen ohjelmistojen odotetaan nyt jo hyvinkin nopeasti tuovan Isossa Datassa olevan potentiaalin arkeen hyödynnettäväksi ei vain isoille organisaatioille vaan myös keskisuurille ja pienillekin, koska jokaisen odotetaan saavan pilvipalveluista tähän tarvitsemansa suuren kapasiteetin edullisesti vuokralle hetkeksi, jolloin sille on tarvetta.

Big Datan hyötyjä odotetaan nyt saatavan erityisesti kahdelta osa-alueelta: Uudet tuotteet ja palvelut sekä analytiikan uudet mahdollisuudet. Paljolti tämän päivän analyyttiset uudet mahdollisuudet liitetään kuluttaja -informaation laajempaan hyödyntämiseen kuten esimerkiksi  kuluttajien käyttäytyminen verkkosivulla, ostokäyttäytymisen entistä tehokkaampi seuranta, käyttäytyminen sosiaalisissa medioissa ja verkostonsa, ja liikkuminen paikkatietoa keräämällä ja hyödyntämällä. Koska oikeastaan jokaisella bisnes-/toimintaketjulla on alku- tai loppupäässään ja monesti välissäkin ‘kuluttaja’ ts. ‘kansalainen’ ts. me ‘yksilöt’ ihmiset, myös ‘työntekijöinä’, eikä vain tuotteiden ja palvelujen vaan myös ‘tiedon tuottajina’ ja ‘tiedon/tietopalvelujen kuluttajina’, ei tässä ole missään tapauksessa erityisesti B-to-C -yritysten ja -organisaatioiden juttu, vaan potentiaalia on B-to-B -palveluja ja tuotteita innovoiville ja tuottaville organisaatioille.

Voimakkaasti nyt kehittyvät ‘muistinvaraiset’ analyyttiset tekniikat ja samassa aallossa nyt huokuvat strukturoimattoman Big Datan käsittelyyn valtavaa rinnakkaiskäsittelyn mahdollisuutta ja tehokkuutta tuovat tekniikat (kuten ‘Hadoop’, ‘MapReduce’) lyövät kättä toistensa kanssa ja tämän seurauksena meillä alkaa olla käytettävissämme työkaluja (softaa ja rautaa), joiden avulla halutessamme pääsemme tiedon tarkastelussa tekemään analyysimme käyttäen lähdetiedon alkuperäistä tasoa ja silti erittäin nopeasti (‘Fast Data’, ‘Big Analytics’, ‘Deep Insight’). Tämä tuo uusia ulottuvuuksia verraten esikäsiteltyyn ja summattuihin tietoihin ja näihin perustuviin staattisen luonteisiin ennalta määriteltyihin raportteihin.

‘Iso verkostomme’ on tällä hetkellä huolissaan Big Datan vyörymisen hämmentävistä ‘suhteellisesti meitä tyhmentävistä’ vaikutuksista, koska me kuulemma synnytämme ja keräämme enemmän ja enemmän sellaista dataa varastoihimme, jota emme ole kyenneet ‘jalostamaan’ tiedoksi ja ‘paremmiksi päätöksiksi’. Minä koen tämän ajatustavan periytyvän ‘tietovarastoinnin’ yhdestä perusajatuksesta aikoinaan, miksi kerätään ja jalostetaan vain osa tiedosta, miksi ei kerätä kaikkea tietoa? Jos keräämme ja talletamme kaiken perustiedon, se antaa meille mahdollisuuden jalostaa ja hyötyä siitä myöhemmin keksiessämme miten sitä voisi käyttää ja antaa mahdollisuuden saada trendiä taaksepäin. Aika selvää on, että organisaatiot eivät voi enää lähteä keräämään Big Dataa, perustietoja, ‘sieltä-täältä’ vain siksi, että siitä voisi olla hyötyä joskus, ja koska mahdollisesti ‘tuttu’ tekniikkatoimittaja on tuonut houkuttelevan keräämiseen kykenevän softa-rauta-paketin.

Meidän on pakko kyetä entistä paremmin kohdentamaan panostuksemme niihin toimenpiteisiin ja hankintoihin, jotka tukevat yrityksemme/organisaatiomme liiketoimintaa ja strategisia tavoitteita. Big Datan hyökyessä seiniemme sisä- ja ulkopuolella, meidän tulee tarkastella asiaa liiketoiminnan ‘kokonaisarkkitehtuurin’ ja ‘tietoarkkitehtuurin’ näkökulmista ja samalla ketterästi ja innovatiivisesti ja innokkaastikin. Kokeilemiselle on tässä kyllä sijansa. Ketteryys ja innokkuus ja innovaatiot edellyttävät kokeilevaa ja tutkivaa lähestymistä. Hyvin selvää on, että Big Datan kanssa meidän kaikkien tulee olla hereillä ja opiskella siihen liittyviä ja kehittyviä mahdollisuuksia.

Kts. myös Ari Hovin bloggaus oikeaan osuvan mittaamisen ja faktoihin perustuvan päätöksenteon merkityksestä http://www.arihovi.com/big-data-maaraa-vai-laatua/

 Published on: Jan 15, 2012 / Petri Hakanen