Käsitemallipohjainen tietoalusta

Kirjoittajana on toiminut D# -yhtiön toimitusjohtaja Tero-Matti Kinanen. Tutustu DSharpiin tarkemmin täältä.

Miksi tietoalustoja rakennetaan? Yksinkertaisesti siksi, että organisaatioissa tietoa on paljon ja se halutaan saada helposti ja nopeasti käyttöön. Vuosien mittaan tähän tarpeeseen on pyritty vastaamaan monella eri tavalla. On rakennettu raportointia suoraan lähdejärjestelmistä, on koostettu erilaisia raportointitietokantoja, on rakennettu perinteisiä tietovarastoja Inmonin tai Kimballin metodologian mukaisesti, tehty OLAP-kuutioita, tabular-kuutioita, visualisointeja eri välineillä. Viime aikoina on mallinnettu dataa myös data vault -arkkitehtuurin avulla ja rakennettu tietovarastoja sen mukaisesti. Olen pyrkinyt tiivistämään tämän maailman seuraavaan kuvaan, josta käy ilmi perusperiaate: Tietoa syntyy monessa eri järjestelmässä ja sitä pyritään jalostamaan tavalla tai toisella käyttötarkoitukseen sopivaksi.

Kun työurani aikana olen näitä erilaisia ratkaisuja nähnyt ja tehnyt, niin olen havainnut, että aina tulee uusia tapoja toteuttaa sama asia. Teknologia kehittyy ja se on hyvä asia. Prosessorit nopeutuvat, muistien koot kasvavat ja tallennusvälineet paranevat. Erityisesti pilviteknologia on viimeisen kymmenen vuoden aikana mahdollistanut innovatiivisia ratkaisuja, jotka auttavat myös tietojohtamisen ratkaisuissa paljon. Uusimmat ratkaisut ovat tehneet mahdolliseksi sen, että tieto tallennetaan vain kerran alustaan ja sen jälkeen metatiedot ohjaavat, miten tieto näkyy missäkin. Eli käytännössä miljardienkin rivien ”kopioiminen” paikasta toiseen käy hetkessä, koska oikeasti tietoa ei alustassa siirretä mihinkään.

Teknologian kehittyminen on kuitenkin vain yksi puoli asiaa. Aina on ollut myös erilaisia lähestymistapoja itse tiedon järjestämiseen ja organisointiin. Näissä näen kuitenkin valitettavan usein pikavoittojen hakemista ja varsinkin niiden varjopuolia. Erityisesti uuden teknologian myötä helposti innostutaan tekemään asioita ”nopeasti”, ilman että mietitään samalla myös kokonaisuutta. Valitettavasti IT-ala on tähän itse syyllinen, esimerkiksi ketterää kehittämistä tehdään usein väärin, sitä käytetään ikään kuin lupana tehdä asioita moneen kertaan, vaikka sehän sen tarkoitus ei koskaan ole ollut. Käytännössä n. 10 vuoden sykleissä joku aina keksii uuden tavan oikaista ja rakentaa tietojohtamisen ratkaisuja pikavoittojen kautta. Ensin 1990-luvulla tulivat OLAP-kuutiot, joissa tiedot tuotiin monidimensionaalisten kuutioiden avulla helposti saataville. Hyvä teknologia, mutta väärinkäytettynä tehtiin todella monimutkaisia ratkaisuja. Sitten 2000-luvulla tulivat tabular-mallit, jotka yksinkertaistivat ratkaisuja ja tekivät niiden rakentamisesta helpompaa ja saavutettavampaa useammille. 2010-luvulla tulivat voimalla visualisointiratkaisut, useamman toimijan voimin – Qlik, PowerBI, Tableau joitakin yleisimpiä mainitakseni. Ja nyt 2020-luvulla, erityisesti jopa tänä vuonna 2023 meillä kohistaan Microsoftin uudesta Fabricista ja Lakehouse-arkkitehtuurista. Yhteistä näille kaikille on se, että ne mahdollistivat jokainen uuden, entistä tehokkaamman tavan rakentaa tietojohtamisen ratkaisuja. Mutta samalla ne helppoudessaan innostavat tekemään asiat siten, että ne ratkaisut eivät kestä aikaa, jatkokehittäminen on hidasta ja uudelleenkäytettävyys huonoa

Tiedolla johtamisen ratkaisuissa on aina ollut muutama perusongelma itse teknologisen ratkaisun lisäksi:

·Miten saadaan lähdejärjestelmissä olevat tiedot sellaiseen muotoon, että niitä voidaan käyttää liiketoiminnan tai yleensäkin toiminnan johtamisessa hyödyksi?

·Miten yhdistetään eri järjestelmissä olevat tiedot yhteismitallisiksi siten, että eri järjestelmissä olevat samat tiedot ymmärretään yhtenäisesti?

·Miten yhdistetään eri järjestelmien tiedot toisiinsa siten, että niitä voidaan helposti ja sujuvasti hyödyntää, kun tehdään esimerkiksi yhdistelmämittareita useiden järjestelmien tiedoista?

·Miten toteutetaan tietojen organisointi siten, että pystymme tarjoamaan tietoa jatkossa helposti myös niihin käyttötapauksiin, jotka eivät ole vielä edes tiedossamme?

·Miten toteutetaan ratkaisu, jota voidaan jatkuvasti laajentaa ja kehittää, ottaa käyttöön pienissä paloissa ilman, että aikaisempiin toteutuksiin täytyy koskea?

·Miten toteutetaan ratkaisu, joka kestää aikaa ja myös sen, että käytetyt lähdejärjestelmät vaihtuvat toisiin?

Aina kun uutta teknologiaa tulee käyttöön ammattilaisetkin tahtovat unohtaa, että itse tiedon organisointiin ja jopa projektityöhön sekä kehittämisen prosesseihin täytyy kiinnittää edelleen huomiota. Jokainen meistä innostuu helposti uudesta teknologiasta, joka mainospuheissa lupaa päihittää aikaisemmat ratkaisut mennen tullen. Ja miksi me innostumme? Koska se perus- ja rutiinityö ei aina ole kivaa ja vaatii ihan oikeasti työtä. Vuosien varrella olen kuitenkin nähnyt, että ne ratkaisut, jotka pystyvät vastaamaan edellä mainittuihin kysymyksiin, toimivat pisimpään ja kokonaistaloudellisimmin minkä tahansa teknologian päällä. Ja yhteinen tekijä näiden ratkaisujen kesken on käsitemallinnus.

Liiketoiminnan näkökulmasta tehdyn käsitemallinnuksen edut ovat kiistattomat ja ajan saatossa useaan kertaan testatut:

· Yhteinen käsitys tiedon sisällöstä ja merkityksestä

· Selkeä näkemys tietojen liittymisestä toisiinsa

· Helppo laajennettavuus

· Tukee päätöksentekoa

· Lähdejärjestelmäriippumattomuus

Kun tiedolla johtamisen ratkaisu rakennetaan käsitemallinnuksen pohjalta, niin se liittyy suoraan liiketoimintaan. Ratkaisussa syntyy väistämättä myös paljon uudelleenkäytettävää koodia, koska samaan käsitteeseen on yhdistetty liiketoiminnan näkemys siitä, miten eri järjestelmiin tallennettu tieto pitää esittää ja miten eri tiedot yhtenäistetään ja yhdistellään. Näitä sanotaan liiketoiminnan säännöiksi ja ne pitää joka tapauksessa jossain vaiheessa tehdä. Jos tämä työ tehdään käsitemallinnuksen kautta yhteistyössä liiketoiminnan edustajien kanssa ja toteutetaan oikealla tavalla ratkaisun eri kerroksissa, niin säästetään pitkällä tähtäimellä merkittävästi aikaa, vaivaa ja rahaa. Jos taas tiedot tuodaan esimerkiksi lähdejärjestelmistä tai lähdejärjestelmien raportointikannoista suoraan sellaisenaan, niin tietoja saatetaan yhdistellä myöhemmissä vaiheissa uudestaan, pahimmillaan joudutaan tekemään samaa työtä eri käyttötapausten kanssa moneen kertaan. Ja jos tässä kohtaa oikaistaan, niin viimeistään uusien lähdejärjestelmien lisäyksissä joudutaan palaamaan myös aikaisemmin tehtyihin toteutuksiin ja se voi olla todella kallista.

Käsitemallinnuksen avulla tehdään siis tieto, sen merkitys sekä käsittelysäännöt läpinäkyviksi, jolloin koko organisaatio pystyy hyödyntämään tietoa paremmin. Sen avulla toteutetut ratkaisut ovat laajennettavia ja kestävät aikaa. Se on tehokas työkalu, joka auttaa ratkaisemaan aiemmin mainitut ongelmat:

Tiedon muotoilu hyödylliseksi

Käsitemallinnus auttaa määrittelemään tiedon rakenteet ja yhteydet. Kun tieto on jäsennelty ja kategorisoitu oikein, sen hyödyntäminen liiketoimintapäätöksissä tulee helpommaksi ja tehokkaammaksi.

Tiedon yhdistäminen yhteismitalliseksi

Käsitemallinnus mahdollistaa yhtenäisen terminologian määrittämisen. Tämä varmistaa, että eri järjestelmissä oleva sama tieto ymmärretään ja tulkitaan samalla tavalla.

Eri järjestelmien tietojen yhdistäminen

Käsitemallinnus luo selkeän kuvan siitä, miten eri tiedot liittyvät toisiinsa. Tämä tekee eri järjestelmien tietojen integroinnista helpompaa ja tehokkaampaa.

Tietojen järjestäminen tulevaisuuden käyttötapauksia varten

Koska käsitemallinnus auttaa visualisoimaan tiedon rakenteita ja suhteita, se auttaa myös ennakoimaan tulevia tiedontarpeita ja varmistaa, että tieto on järjestetty niin, että se on helposti saatavilla myöhemmin. Liiketoimintatiedon visualisointi auttaa ja valmentaa samalla johdon henkilöitä hahmottamaan tietojohtamisen mahdollisuuksia, ja he saavat hyvän kuvan siitä, millaisia mittareita, raportteja ja analyysejä on mahdollista tehdä nopeasti ja kustannustehokkaalla tavalla.

Jatkuvasti laajennettava ja kehitettävä ratkaisu

Käsitemallit ovat joustavia ja modulaarisia. Uusien konseptien ja yhteyksien lisääminen olemassa olevaan malliin on suoraviivaista, jolloin järjestelmää voidaan laajentaa ja päivittää ilman, että aikaisempiin toteutuksiin tarvitsee tehdä muutoksia. Usein jopa niin, että ei tarvita minkäänlaisia muutoksia!

Kestävyys ajan ja järjestelmämuutosten suhteen

Kun käsitemallit on laadittu huolellisesti, ne voivat toimia perustana, joka kestää lähdejärjestelmien vaihteluita. Vaikka lähdejärjestelmät saattavat muuttua, käsitemallin keskeiset rakenteet ja terminologia säilyvät.

Riippumatta siitä, mikä on teknologiavalinta, käsitemallinnus auttaa aina itse ratkaisun toteuttamisessa. Sen avulla voidaan muodostaa tietokannan rakenteet ja se auttaa ymmärtämään paremmin myös data lake tai lakehouse-ratkaisuihin tallennettuja tietoja. Käsitemallinnus toimii perustana metadatan hallinnalle ja auttaa tietojen luokittelussa ja hakuominaisuuksissa. Käsitemallinnus toimii yhteisenä kielenä, joka auttaa selkeyttämään ja jäsentämään tietoa. Se varmistaa, että tiedon rakenteet ja merkitykset ovat johdonmukaisia koko organisaatiossa ja että ne voidaan mukauttaa teknologian muutoksiin. Kun käsitemallinnus yhdistetään ymmärrykseen erityisestä teknologia-alustasta, organisaatiot voivat rakentaa tehokkaita, joustavia ja kestäviä tiedolla johtamisen järjestelmiä.

Uusia teknologioita kannattaa ja pitää hyödyntää, mutta jos oikaistaan perustyöstä, niin vaarana on, että syntyy epäjohdonmukaisia ratkaisuja. Pahimmillaan erillisinä toteutetut ratkaisut toimivat itseään vastaan ja saattavat vaarantaa koko tietojohtamisen ratkaisun. Tiedot ovat epäjohdonmukaisia eri osissa organisaatiota ja yhteisen käsityksen puuttuminen tietojen yhdistämisestä tekevät datan ymmärtämisestä vaikeaa. Tiedon laadun varmistaminen vaikeutuu, tiedon ymmärtäminen ja kommunikointi eri käyttäjäryhmien välillä on haasteellista, kun ei ole yhteistä kieltä tai käsitystä tiedosta. Kaikki tämä yhdessä voi johtaa virheellisiin päätöksiin ja ristiriitaisiin tulkintoihin. Ja kun ratkaisuja joudutaan tämän takia jälkikäteen korjaamaan tai muokkaamaan puuttuvan käsitemallin ja johdon yhteisymmärryksen vuoksi, niin kustannukset voivat kasvaa huomattavasti. Lisäksi koko uuden teknologian hyödyntämisestä katoaa ajatus, tämän päivän uusi teknologia muodostuukin rasitteeksi, koska ratkaisua ei voikaan sujuvasti siirtää tulevaisuuden vielä paremman teknologia-alustan päälle.

Käsitemallinnus on yleispätevä lähestymistapa tietoalustojen rakentamiseen. Käytettävän alustan lisäksi oleellista on aina se, miten tiedot organisoidaan, koska tämä toimii alustasta riippumatta kehityksen pohjana. Edellä mainitsemieni hyötyjen lisäksi käsitemallinnuksessa on myös ratkaiseva hyöty itse kehittämisen työssä: Se on paras lähtökohta tietovarastoautomaatiolle. Liiketoiminnan käsitemalli on ja pysyy, mutta siitä voidaan johtaa erilaisia toteutuksia. Tiedolla johtamisen maailmassa käsitemallista voidaan generoida tehokas tiedon tallennusratkaisu, esimerkiksi data vault -tyyppinen, jossa on valmiiksi huomioitu se, että dataa voi tulla eri lähteistä ja että ratkaisua voidaan rakentaa pienissä paloissa, jatkuvasti laajentaen. Ilman, että jo tehtyihin toteutuksiin tarvitsee koskea. Automaatioväline, kuten edustamani DSharp Engine, pystyy lukemaan tuon käsitemallin ja tekemään low code-/nocode -toteutuksena koko tiedolla johtamisen alustan, vaikka kehittäjä ei tietäisi itse rakenteen teknisestä toteuttamisesta kaikkia yksityiskohtia. Tekemällä käsitemallin ja kohdistamalla lähdedata malliin saavutetaan merkittävä tehokkuus, itse asiassa koko tietoalusta pystytään rakentamaan murto-osassa ajasta verrattuna perinteisten tietovarastojen kehittämiseen. Hyvän automaatiovälineen ja käsitemallinnuksen avulla saadaan teknologiariippumaton tiedolla johtamisen ratkaisu, joka on kokonaistaloudellisuudessaan ylivoimainen ja kestää vuosikymmeniä.