Hutki, älä tutki

1) Rakastu kiiltäviin asioihin

Tee projekti siksi, että saisit taloon "tekoälyä". Unohda kaikki todelliset ja konkreettiset tavoitteet ja hyppää vauhdista hypejunaan. Tämä koskee myös tuotteita joiden markkinointimateriaalit puhuvat AI:sta.

Tekoälyllä ei ole itseisarvoa, mutta bisnestä tukevalla datapohjaisella ratkaisulla on. Modernia yrityskuvaa voi ammentaa muualtakin kuin kuumimmista hashtageista. Tekoäly on seksikästä, mutta maalaisjärjen tai ihan vaan järjen käyttö on edelleen suositeltavaa.

2) Kuvittele, että AI ratkaisee kaiken

Kaikki tietävät, että tekoäly on yksi sininen kipinöivä möhkäle, jolle annetaan ongelma ja se tuuppaa ulos ratkaisun. Tosielämän tekoälyratkaisuihin tutustuminen on ajanhukkaa, ei kukaan web-projektiakaan aloita miettimällä voiko johonkin nappiin laittaa eri värin.

Elokuvien terminaattoreihin verrattuna tosielämän tekoälyyn tutustuminen voi olla jokseenkin lattea kokemus, mutta pieni tutkimusmatka aiheeseen kannattaa tehdä. Maagisen taikamöhkäleen sijaan pääset käsiksi tuhansiin tapauskohtaisesti hyödynnettäviin menetelmiin, jotka kaikki ratkaisevat tarkkaan rajattuja ongelmia. On myös syytä ymmärtää, että monen menetelmän rajoitteet eivät ole pääteltävissä maalaisjärjellä. Luovuutta ja innovointia ei kannata tietenkään tukahduttaa, mutta ihan kaikki ei ole vielä mahdollista.

Tutkimusmatkan voi aloittaa esimerkiksi täältä: https://www.elementsofai.com/


Pelko, usko ja epäluulo

3) Hylkää kaikki jo aiemmin testatut ideat

Pidä huolta paikastasi innovaatiopoliisina, jo testattuihin karikkoihin ei kannata seilata uudelleen. Teknologia saattaa kehittyä, mutta kyllä minä olen nämä kaikki valopäiden ideat jo kertaalleen kokeillut.

Teknologiat kehittyvät jatkuvasti. Joskus parikin vuotta sitten kokeiltu epäonnistunut toteutus voitaisiin ehkä tänä päivänä rakentaa toimivaksi. Ehkä väärä lähestymistapa oli syypää epäonnistuneeseen kokeiluun?
Virheistä kannattaa oppia, mutta hyviä ajatuksia ei kannata hylätä lopullisesti ensimmäisen epäonnistumisen jälkeen.

4) Ole hiiri

Varma tapa hidastaa tai pysäyttää dataprojektin kehitys on olla hiiri. Epävarmuutta on aina, mutta sen ei kannata antaa jarruttaa liikaa.
Ei voi hävitä jos ei pelaa edes koko peliä! Ajattele, että joku muu saa ensin tehdä ainakin kokeilut ja sinun puolestasi vaikka koko ratkaisunkin. Ole epävarma ja skeptinen kaiken suhteen, josta ei ole vielä kokemusta. Jos silti uskalsit kokeilla jotain, älä laajenna sitä, ennen kuin kaikki riskit ovat täysin selvillä.

Älä ole hiiri. Varovaisuus on hyve vain järjellisissä mittasuhteissa. Onnistunut projekti vaatii välillä riskinottoa, tai ainakin viisaasti mitoitettuja kokeiluja. Riskejä voi pienentää esimerkiksi pilkkomalla hankkeen pienempiin osiin. Jos tiedät kaiken ennalta, et keksi mitään uutta.

5) Aloita liian massiivinen projekti

Aloita projekti uudistamalla koko yhteisösi strategia, tai ainakin lataa projekti täyteen katteettomia odotuksia. Lupaa varmoja tuloksia. Älä usko kokeiluihin, skaala ratkaisee. Jos olet kokeilevaa sorttia, tee innovaatiokiimassa demoja sellainen kasa, ettet pysy itsekään enää kärryillä. Käytä koko budjetti. Aina.

Hiiren vastakohta on raivotautinen leijona, joka lukitsee saaliikseen T-rexin. Kerralla ei kannata rynnätä hyödyntämään jokaista uutta teknologiaa ja hassata niihin rahaa tietämättä, millaisessa skaalassa projekti kannattaisi todellisuudessa toteuttaa. Istu alas, tutustu aiheeseen, kysy neuvoa, arvioi. Tee kokeilu ja hanki testituloksia. Rohkeat projektit eivät aina tarkoita kolossaalista mullistusta.


Piiloudu ja puolustaudu

6) Ole pessimistinen fossiili

Fundamentalismi on aina hyvästä, kunnon rakentavan keskustelun ja uusien innovaatioiden tyrehdytykseen tarvitaan vain reippaasti jääräpäisyyttä ja ripaus ennakkoluuloja. Tämä on myös paras tapa päästä nauramaan kilpailijoille, jotka vain pöhisevät uusien teknologioiden perässä. Muistuta myös kanssaihmisiä, että juuri tähän ei koneet pysty!

Pessimisti ei pety, mutta muiden touhuja voivotellessa omat saavutukset saattavat jäädä kovin ohueksi. Joskus jääräpäisyyttä kannattaakin käyttää myös maailman muuttamiseen ja kokeilla jotain uutta yhdessä. Pahimmassa tapauksessa tapahtuu vain se minkä jo ennalta ennustit, mutta parhaassa tapauksessa syntyy jotain uutta. Pessimismi saattaa myös rajoittaa oman alan ulkopuolelta tulevia poikkitieteellisiä innovaatioita.

7) Älä kerro kenellekään hankkeesta

Suomalaisella sisulla pääsee pitkälle, mutta jokaista suota ei kannata kuokkia yksin.
"Alussa oli datasuo, kuokka ja kehityspäällikkö Jussi. Jussi kuokki suota yksin elämänsä loppuun saakka, tavoitteenaan tuottava datapelto. Lopulta oli vain kuokka ja suo. The End."

Et kaipaa projektiisi ketään ylimääräistä viisastelijaa, ja muutenkin palavereita on liikaa. Turha innostus ja hypettäminen vain häiritsevät kalliiden ammattilaisten työskentelyä. Hyvistä tuloksista kerrotaan sitten kun niitä saavutetaan.

Eikun miten se menikään? Hankkeeseen kannattaa etsiä innostuneita kumppaneita, sidosryhmien edustajia sekä osaavia tekijöitä. Kaikki kannattelevat projektia yhdessä, nostattavat siihen liittyvää kiinnostusta ja varmentavat, että työ suunnitellaan ja toteutetaan kaikkia hyödyttävällä tavalla. Kuulostaa naiivin helpolta, mutta voitko rehellisesti sanoa, että kaikissa projekteissa näin on aina tapahtunut?

8) Pidä huoli, että projektin kokevat omakseen ainoastaan datatieteilijät

Projektiin kannattaa ehdottomasti ottaa mukaan vain innokkain ja teknisesti pätevin porukka. Kuka muutenkaan ymmärtää miten transformer-arkkitehuuri liittyy mihinkään? Tärkeintä on, että tehdään datasta timantteja. Bisnes ja peruskoodarit saa kerrankin katsoa vierestä miten projekti vedetään kunnialla loppuun.  Data scientist on muutenkin omassa laumassaan viihtyvä eläin, jonka rinkir...rakentamista ei kannata häiritä.

Niin, jos projektin kehitysvaiheessa ei oteta mukaan käyttäjiä ja muita projektin tuloksista hyötyviä tahoja, kokevat sen omakseen vain datatieteilijät. Tuottaako projekti oikeasti hyötyä, jos sen ymmärtävät ja siitä innostuvat vain data-ammattilaiset? Saadaanko projekti käyttöön, jos hyödyt eivät aukea muille? Ehkäpä kannattaisi sisällyttää porukkaan monenlaisia näkemyksiä ja varmentaa onnistuminen. Erityisesti kannattaa varoa dataprojektien siiloutumista.

9) Älä ota mukaan alan asiantuntijoita

Data scientist on projektin tärkein osaaja, sen jälkeen tulee data engineer ja sitten tekninen projektipäällikkö. Viimeisenä voit ottaa kerran kuukaudessa domain-asiantuntijan nyökyttelemään tuloksille, tai säästövinkkinä voit jättää nyökyttelyhetket siihen kun kaikki on jo muutenkin valmista. Älä missään nimessä päästä tällaista tylsää suorittajaa esimerkiksi product ownerin paikalle, kyseessähän on kuitenkin dataprojekti, eikä mikään perusbisneksen peruspalikka. Vai mitä?

Domain-asiantuntijoilla on hyppysissään vuosien kokemus ja ymmärrys siitä kentästä, jota koitat projektillasi parantaa. Vaikka kehitystiimin teknisemmiltä jäseniltä löytyy yleensä näkemystä, ei se vielä riitä parasta haluavalle. Erityisesti ilmiöiden mallintamisessa ymmärtäminen ja tieto aikaisemmista ratkaisuista auttaa. Heidät kannattaakin kutsua mukaan projektiin vaikuttamaan, sekä kommentoimaan sen etenemistä ja onnistumisia. Hyvän projektin ohjaksissa voisi jopa projektipäällikön tai tuoteomistajan paikalta löytyä juuri yksi tällainen.

10) Pidä huoli, että projektin omistajuus ei siirry

Rakennettavan projektin omistajuuden voi omia itselleen, mikäli haluaa varmistaa, että projekti ei tule etenemään mihinkään ilman omaa panosta. Omistajuutta ei kannata myöskään siirtää, jos haluaa jättää projektin tilanteeseen, jossa syntynyttä ratkaisua ei oteta lainkaan käyttöön.

Tai sitten projektin omistajuuden siirron voi pedata valmiiksi alusta asti. Tällä voi lisätä jatkokehityksen sujuvuutta, asiakkaan ja käyttäjien tyytyväisyyttä sekä varmentaa, että ratkaisu tulee oikeasti käyttöön.


Määrittely, suunnittelu, ajan tuhlaus ja mitä näitä nyt on

11) Määrittele ongelma väärin

Tärkeintä on näyttävät liikkeet edes johonkin suuntaan! Nyansseja ehtii murehtimaan sitten myöhemmin. Nyt hommiin että saadaan tuloksia.

Jos ratkaistavan ongelman ja tavoitteiden määrittelyyn ei käytetä aikaa, saattaa lopputuloksena syntyä Vuoden turhake-kilpailun voittaja. Lue kokonainen blogi aiheesta täältä.

12) Älä tee suunnitelmia

Turha suunnittelu hidastaa ketterää kehitystä. Erityisen typerää olisi suunnitella mitä tapahtuu projektin onnistuessa, sehän on "iloinen ongelma". Älä myöskään pohdi tulevia kustannuksia, kyllä joku aina siisteihin juttuihin rahat hankkii. Ja löytää tekijät!

Varmin tapa tunaroida data- tai tekoälyprojekti on suunnittelun unohtaminen. Tämä voi johtaa väärän datan, skaalan, työkalun, budjetin, tavoitteiden ja tekijöiden valintaan. Suunnittele siis ajoissa, mikä on hyvä tulos projektista, kuinka siihen koitetaan päästä, miten valmistumisen jälkeen jatketaan, ja mitä tehdään, jos tulee uusi innovaatio projektin aikana. Monen projektin kustannukset kasvavat todella suurella harppauksella heti prototyypin jälkeen, esimerkiksi tuotekehityshankkeissa protolla harvoin voidaan edetä kovinkaan pitkälle. Sanomattakin on selvää, että kokeellisten projektien osalta on hyvä olla suunnitelma myös idean alasajosta.

On tavanomaista, että ensimmäiset dataa hyödyntävät projektit tehdään pilotinomaisesti vailla sen suurempia visioita, mutta jos siitä tulee tapa, kannattaa harkita laajemman data- tai tekoälystrategian rakentamista.

13) Aliarvioi tarvittavat kulttuurimuutokset

Yhteisösi on täynnä innovaatioilla ja pöhinällä eläviä uudisraivaajia. Ainakaan kenenkään vuosiboonukset eivät voi olla kiinni status quon ylläpitämisessä! Pidä itsestäänselvyytenä työtovereidesi avarakatseisuutta.

Vaikka sinulla riittäisi rohkeutta, intoa ja ymmärrystä, se ei välttämättä päde koko organisaatioon. Testaa ajatustasi kollegalla ja selvitä taustalla piilevät kulttuurilliset sudenkuopat.

14) Älä ajattele eettisiä puolia

Hyvän idean tunnusmerkit: laillista, mahdollista ja parantaa tulosta. Yksittäisten projektien sitominen yrityksen arvoihin on mahdollisuuksien haaskausta. Sitä paitsi jos me ei tehdä, niin joku muu tekee! Datan kohdalla tärkeintä on miettiä onko sitä ylipäätänsä saatavilla. Ei kannata pohtia esimerkiksi vinoumia datassa tai yksityisyydensuojaa, sillä jos sellaisia ongelmia ilmenee, ne on myöhemmin helppo korjata.

Lailliset ja mahdolliset ideat voivat sisältää eettisesti erittäin hankalia teemoja. Mihin kaikkeen ratkaisusi, datan kerääminen ja sen hyödyntäminen vaikuttavat? Millaisia lieveilmiöitä tiedon hyödyntämisestä voi syntyä? Eri sidosryhmien vaikutukset kannattaa tutkia läpi hyvissä ajoin, jotta vältyt yllätyksiltä. Vaikka malli toimisi täydellisesti se saattaa heijastaa datassa esiintyviä vinoumia. Seksistinen tai rasistinen tekoäly ei varsinaisesti ole kenenkään etu.


Dataprojekti on outo ja erilainen

15) Kuvittele että dataprojekti ei olisi softaprojekti

Softaprojekteissa on koodareita, dataprojekteissa on ...datamenninkäisiä(?). Yhdistäviä tekijöitä on tasan yksi: tietokoneet! Versionhallinta, tietoturva, infrastruktuuri, ohjelmistotuotannon menetelmät ja lainalaisuudet eivät mitenkään voi päteä datatieteen puolella.

Enterprise dataprojektit rakennetaan aivan samasta tavarasta kuin mikä tahansa ohjelmistoprojekti. Ohjelmointikielet ovat usein samoja ja suuri osa käytännön toteutuksesta on itse asiassa lähempänä perinteistä ohjelmistokehitystä kuin moni uskookaan. Sille on syynsä, miksi datatieteilijääkin halutummassa roolissa ovat tänä päivänä tittelit "machine learning engineer" ja "data engineer". Perinteisessä dataprojektissa jo pelkästään ajasta suurin osa sujahtaa datan putsaukseen sekä erilaisten putkien ja infrastruktuurin rakenteluun.

16) Kuvittele että dataprojektit ovat ilmaisia

Pilvipalvelut, avoin lähdekoodi ja toistaan upeammat tekkidemot tarkoittavat, että kaipaamasi ratkaisu on lähes täysin ilmainen. Varsinkin, jos oma tapauksesi on kovin lähellä jo valmista ja hehkutettua ratkaisua! Suurin osa työstä on jo tehty, eli maksettavaa ei jää paljoa.

Dataprojektit sisältävät usein toistuvia ja uudelleenhyödynnettäviä komponentteja. Moderni tekoälykehitys pohjaa usein jo tutkittuihin malleihin joita vain hienosäädetään ongelmaan sopivaksi. Tästä huolimatta projekteissa on paljon tekemistä, varsinkin ns. lapiohommien eli datan esikäsittelyn ja muuntelun tiimoilta. Hyvin usein myös ihan toimivan mallin varsinainen tuotantoonvienti on kallein osa projektia, esimerkiksi simulaatiossa toimiva virheellisten tuotteiden luokittelun integrointi oikeaan fyysiseen tuotantolinjastoon voi vaatia paljon työtä ja kattavaa testausta. Juuri koskaan Proof of Concept ei ole tuotteen lopullinen hintalappu.

17) Ajattele, että dataprojektit ovat tähtitieteellisen kalliita

Jos pelkästään kielimallin koulutus maksaa käytetyn laskentatehon osalta satoja tuhansia, niin mitä varsinainen kehitys maksaakaan? Turha luulla, että olemassaoleva tutkimus, avoimen lähdekoodin kirjastot ja kokeneiden tiimien osaaminen auttaisi juuri sinun projektissasi yhtään. Muista, että yksinkertaisia malleja ja ratkaisuja ei ole olemassakaan.

Dataprojektien teko maksaa siinä missä mikä tahansa liiketoiminnan kehitysprojekti, mutta eivät ne aja tilaajaansa konkurssin partaalle. Kyse on jälleen ongelman, tavoitteiden ja tuotettavan ratkaisun hyvästä määrittelystä sekä oikeiden työkalujen valinnasta. Väärät valinnat maksavat, kun taas hyvä suunnittelu ja avoimuus tavoitteissa säästää rahaa.

Tyypillisessä dataprojektissa pelataan suurin osa ajasta tunnetuilla ratkaisuilla ja "tuntemattomimmat muuttujat" liittyvät dataan. On yleistä, että tunnettuja ratkaisuja mukautetaan ja tuunataan sekä sovelletaan uuteen alueeseen, mutta tätä ei pidä sekoittaa aivan täysin alusta tehtävään tutkimukseen tai kehitykseen.
Vertailukohtana perinteisissä ohjelmistoprojekteissakaan harvoin lähetään kehittämään kokonaan uusia frameworkeja vaan tyypillisesti käytetään paljon valmiita kirjastoja ja viilaillaan tarpeen mukaan.

18) Ajattele, ettei kunnon tekoälyä voi olla muilla kuin jättimäisillä yrityksillä

Määrittele tekoälyn toimivuus sen hinnan ja kompleksisuuden kautta. Ainoastaan isolla rahalla ja valtavalla kehityspanostuksella saa aikaiseksi järkeviä tuloksia!

Tekoälyn toimivuuden määrittely sen hinnan tai kompleksisuuden kautta on suorastaan höpsöä, sillä todellisuudessa tekoälyprojekteja on hyvin monenlaisia ja pienemmälläkin panostuksella päästään usein hyviin lopputuloksiin. Tekoälyä voi oikeassa tilanteessa hyödyntää niin Google kuin suomalainen perheyrityskin.

19) Kuvittele, että datan laatu tai määrä ei riitä

Jokainen datan saloihin johdattava kurssi toitottaa, että onnistuneeseen dataprojektiin tarvitaan kasapäin ja laadukasta dataa. Miksi siis aloittaa kun jo nyt on tunne siitä, että sitä ei ole tarpeeksi? Olet kurssisi jälkeen huomattavasti fiksumpi kuin regressioanalyysillä briljeeraava excelniilo, älä siis ota selvää mitä ja kuinka paljon oikeasti tarvittaisiin onnistuneeseen alkuun.

Tai toimi toisin. Tutustu konkreettiseen tilanteeseen, käy datasi läpi ja selvitä tavoitteesi. Jos olet epävarma, vedä hihasta henkilöä joka osaa arvioida datasi riittävyyden. Data ei todellakaan ole mitään öljyä. Toisin kun öljy, data tuppaa lisääntymään ja laatukin paranemaan mitä enemmän sitä käyttää. Jos haluat siis parantaa datan laatua, ensimmäisenä sitä pitää alkaa käyttämään.

20) Kuvittele, että datan laatu ja määrä riittää

Katsoit juuri yrityksenne pilvilaskua ja siitä voi vetää lopputuloksen, että yhteisönne IT-porukka on tallentanut ämpäreihinsä puolen internetin tietosisällön. Kyllä tällä datalla ja vuoropäällikön kännykkäkameralla otetulla kahdeksalla kuvalla voidaan varmasti tunnistaa aukottomasti kun linjastolta tulee ulos sekundaa!

Ennen kuin lukittaudut käytössä olevaan dataan, tee kuitenkin pieni tutkimusmatka ja tarkasta, mitä sieltä tietovarastosta ja kannoista todellisuudessa löytyy. Tarvitaanko sittenkin lisää antureita linjastolle vai pitäisikö vuoropäällikön kännykkä korvata hieman sofistikoituneemmalla menetelmällä. Jos dataa ei kukaan koskaan ole käyttänyt ei se luultavasti suoraan täytä kaikkia kriteerejäkään.


Onko toiveissasi toteuttaa dataprojekti?

Jos kaipaat apua alkuun pääsemisessä, kurkkaa täältä Emblican referenssiprojektit ja testi, jolla voit selvittää, voisiko ongelman ratkaista tekoälyllä. Asiantuntijamme ovat myös käytettävissä ja voit bookata meiltä tapaamisen, jossa määritellään mitä pitää tapahtua, että data saadaan käyttöön ja isoimmilta mokilta vältytään.


Emblica ei ole se tavallinen datatiimi. Rakennamme räätälöityjä ratkaisuja datan keräämiseen, käsittelyyn ja hyödyntämiseen alalle kuin alalle, etenkin R&D:n rajapinnassa. Oli kohteemme tehdaslinjasto, verkkokauppa tai pelto, löydät meidät työn touhusta, kädet savessa - ainakin toimistoltamme Helsingistä.