Tekoäly on jo vahvasti täällä, mutta se ei ole vastaus kaikkiin mahdollisiin ongelmiin

AtoZ Oy:n johtava ohjelmistoarkkitehti Kimmo Hakkarainen on perehtynyt tekoälyalgoritmeihin jo useamman vuoden ajan. Yhä useampi asiakasyritys on kiinnostunut tekoälyn mahdollisuuksista. Erityisesti ChatGPT:n nostaman hypen keskellä Hakkarainen muistuttaa, että tekoäly ei ole vastaus kaikkiin nykypäivän haasteisiin. Tekoälyn käytön pitää perustua todelliseen tarpeeseen.

Kun asiakkaat kertovat tarpeistaan parantaa olemassa olevia tietojärjestelmiään, usein kysytään, voisiko tekoäly olla se taikasana, jolla muutos saadaan aikaan. Usein tulee sellainen tuntu, että tekoäly halutaan vähintäänkin puoliväkisin mukaan.

Monella voi olla se käsitys, että kaikilla muilla on jo tekoäly käytössään, ja se pitää saada ratkaisemaan kaikki omankin yrityksen ongelmat. Jos on vaikkapa ollut vaikeaa ohjelmoida jotain, ajatellaan, että tekoäly tulee ja hoitaa homman.

Tässäkin kuitenkin pätee se, että ensin on tiedettävä tarve, ja sen jälkeen etsitään siihen paras mahdollinen ratkaisu. Tekoälyä ei ihan noin vain saada käyttöön, eikä sellaista kannata yrittääkään ihan joka paikkaan.

Moni tekoälysovellus liittyy tekstin ymmärtämiseen ja tuottamiseen. Tunnetuin lienee yleisesti saatavilla oleva ChatGPT, jonka käyttö on laajentunut suorastaan räjähdysmäisesti. Vastaavia mutta pienimuotoisempia kielimalleihin perustuvia tekoälysovelluksia on mahdollista toteuttaa erilaisiin täsmätarpeisiin.

Muita kuin kieleen pohjautuvia tekoälymalleja käytetään esimerkiksi kuvankäsittelyssä, hahmontunnistuksessa ja äänentunnistuksessa. Niissä käsitellään tekstimuotoisen aineiston sijasta digitaalisia kuva- tai ääninäytteitä.

– Voi hyvinkin kuvitella, että tekoälyä voidaan kouluttaa erilaisten syötteiden tulkinnan osalta ihmistä paremmaksi. Se saattaa havaita esimerkiksi kuvien yksityiskohdista jotain, mitä ihminen ei huomaa. Äänestä on mahdollista poimia yksityiskohtia ja vivahteita, jotka jäävät ihmisen havaintokyvyn ulkopuolelle.

openart-image_sV-hpRZ3_1711455180276_raw

Opettaminen on työläin vaihe

Hakkarainen on tutkaillut muun muassa taloushallinnon järjestelmiä yhtenä mahdollisena tekoälyn soveltamiskohteena. Esimerkiksi palkanlaskentaan liittyy monenlaisia työehtosopimuksia sekä työsopimuksia pitkältä aikajaksolta. Työntekijöiden oikeuksia ja velvollisuuksia ei välttämättä ole kirjattu riittävän hyvin, eikä siten ole selkeää näkymää, miten tämä kaikki vaikuttaa palkanmaksuun.

Usein dataa on kertynyt pitkältä ajalta ja mahdollisesti eri järjestelmistä, eikä data ole yhteismitallista. Nykyisin kirjattava data poikkeaa rakenteeltaan ja sisällöltään aikaisemmista. Tästä aineistosta olisi tutkittava, kuinka monta työntekijää on ollut milläkin hetkellä töissä. Samoin se, moniko on ollut täysi- ja osa-aikaisena, ja millä tehtävänimikkeellä. Tällaisten tietojen selvittäminen ihmisvoimin voi olla hyvinkin työlästä.

Perinteisessä ohjelmoinnissa koodari yrittää kuvata yleiskäsitteisiä sääntöjä ohjelmointikielellä. Koodi sisältää erilaisia päättelyjä ja vaihtoehtoratkaisuja esimerkiksi if-then-else-rakenteina.

Tekoäly muuttaa tilanteen siten, että ohjelmoija ei enää rakenna koodiin ehtolauseita. Aineistoa syötetään tekoälyalgoritmille, joka rakentaa koodin lähdeaineiston ja tuotettavan aineiston välille. Opetusvaiheessa käytettävä lähdeaineisto sisältää säännöt, jotka tekoäly opettelee.

Palkanlaskentaesimerkissä lähdeaineistona toimii iso joukko työsopimuksia, joista haetaan työsuhteeseen liittyviä tietoja. Sovellukselle syötetään koulutusaineistoa ja samalla kerrotaan sille, miten ihminen tulkitsee aineiston tietoja. Tätä tahkotaan niin pitkään, kunnes sovellus alkaa antaa ulos samanlaista lopputulosta kuin ihminen. Tämä vaihe on toistoa toiston perään, ja siihen voi kulua pitkäkin aika – päiviä tai viikkoja samalla mallin asetuksia muutellen.

Eräässä hankkeessamme on menossa selvitys, millaiseen numerollisen datan hyödyntämiseen tekoäly voisi taipua. Tavoite on tuottaa kirjanpitojärjestelmän toimittajan asiakkaille yksilöllisiä sanallisia raportteja tilinpäätöslukujen perusteella. Tekoäly voisi rakentaa halutunlaisen tekstimuotoisen raportin, joka sisältäisi asiakaskohtaisesti oleellisia asioita.

– Tämä on sellaista prosessointia, jonka vaikkapa ChatGPT osaa. Kielestä toiseen vaihtaminenkaan ei ole ongelma, koska eri kielten mallit on sille opetettu, Hakkarainen toteaa.

Toisaalta taas esimerkiksi kirjojen julkaisumaailmassa tekoälyä voisi käyttää vaikkapa kirjojen luokitteluun halutuin tavoin. Kone voisi lukea lähdeaineistoa ja antaa niille tekstien perusteella halutunlaisia määritteitä luokitusta varten. Se, että tekoäly lukee kirjallista materiaalia, on esimerkki luonnollisen kielen käsittelystä tekoälyn avulla.

openart-image_zglpGVQ1_1711456450343_raw

Opetusvaihe vaatii laitteistolta muistia ja tehoa

Kokemus tekoälyalgoritmeista antaa pohjaa arvioida, soveltuuko jokin niistä tiettyyn tarpeeseen. Hakkarainen ei usko, että millään organisaatiolla on kokemusta kaikesta mahdollisesta tekoälyyn liittyvästä. Siksi on tarpeen haarukoida, mistä vastauksia voisi löytyä.

Oleellista on selvittää, onko haluttua sovellusta mahdollista tehdä, ja onko se kannattavaa. Onko asiakkaalla varaa hankkia klusteri tai ostaa verkosta palvelinkapasiteettia tekoälymallin opettamisvaihetta varten? Onko malli kurantti vielä vuoden kuluttua, jos mallin kouluttamista pitää jatkaa pienellä liekillä?

Kun tekoälymallia koulutetaan, tarvitaan kone tai klusteri, jossa on tarpeeksi muistia ja numeronmurskauskykyä. Tekoälymalli on se "olio", johon algoritmi rakentaa opetusaikana sovelluksen tietorakenteen. Kun algoritmi rakentaa oppimisen myötä koodia - suuria määriä if-else-rakenteita, tämä prosessi voi vaatia suuriakin määriä muistia. Todella raskaissa tekoälymalleissa puhutaan tarvittavasta keskusmuistin määrästä teratavuissa.

Tekoälyalgoritmit suorittavat yksinkertaista numeroilla laskentaa, ja tätä tehdään rinnakkain massiivisia määriä. Näytönohjainkortit soveltuvat hyvin juuri tämäntyyppiseen prosessointiin. Vähänkin vaativammissa sovelluksissa tarvitaan kymmenittäin todella tehokkaita näytönohjaimia tai rinnakkaislaskentakiihdyttimiä, jotta opetusvaihe etenisi tehokkaasti.

Toinen vaihtoehto on käyttää pilviresursseja, jolloin yritys ostaa kalliin virtuaalimasiinan, jossa opetusprosessia pyöritetään.

Tekoälymallin koulutukseen tarvitaan 8–10-kertainen määrä keskusmuistia verrattuna sovelluksen käytön aikaiseen tarpeeseen. Käytössä olevaa versiota ei voi kouluttaa, koska kouluttaminen vaatii juuri sen järeämmän koneen. Sovelluksesta on siten yksi versio käytössä, kun samaan aikaan seuraava versio voi olla koulutettavana.

– Kokeilin ottaa käyttöön järeähkön tekoälymallin, mutta sen kanssa oman koneeni 64 gigatavun muisti ei riittänyt mihinkään. Kevyemmät mallit kyllä siinä jo pyörivät. Jotta koulutus etenisi sujuvasti, parasta olisi, että koko malli mahtuu näytönohjainkortin muistiin. Harvoin vain yksittäisestä ohjainkortista löytyy muistia useampia kymmeniä gigoja.

openart-image_KYP2Ca0e_1711454869936_raw

Tekoäly käyttöön – miten ja mistä?

Saatavilla on laaja kattaus erilaisia tekoälyalgoritmeja. Asiantuntemusta tarvitaan, jotta niistä osataan valita juuri oikea. Ylipäätään tietojärjestelmien työkaluja on olemassa moneen käyttöön, eikä yhdellä voi tehdä kaikkea. Sama pätee tekoälymalleihin ja siihen, miten isoja, vaikeita ja monimutkaisia säännöstöjä ne voivat oppia.

Hakkarainen on tutustunut tekoälyalgoritmeihin jo vuodesta 2020 opiskellen laajasti eri tavoin sekä toteuttaen hankkeita niiden aidoissa ympäristöissä eri toimialoille. Hän on todennut ainakin sen, että ala on laaja, ja algoritmeja on tarjolla vähän joka tarpeeseen. Opiskeltavaa riittää.

ChatGPT on nostanut tekoälyhypen uusiin ulottuvuuksiin. Se on yllättänyt monet asiantuntijatkin pystyessään ällistyttäviin asioihin. ChatGPT pohjautuu tutkimukseen vuodelta 2017, ja se oli toteutettuna olemassa jo kolme vuotta myöhemmin.

Kielelliset tekoälyalgoritmit toimivat aiemmin niin, että uutta sanaa etsittiin parin edellisen sanan perusteella. Uutta on se ajattelu, että seuraavan sanan päättely voi perustua kaikkeen aikaisemmin syötettyyn aineistoon. Tämä räjäytti pankin.

Koska aiemmin skooppi, johon voi viitata oli lyhyt, tekoälymallin kasvatus ei tuonut hyötyä. Nykyisin ei ole rajoja, miten pitkälle mallia voi kasvattaa. Teoreettinen raja tulee vastaan siinä, että maailmasta ei enää löytyisi uutta kirjallisuutta ja muuta tekstiaineistoa.

Kun sovellus on opetettu isolla aineistomäärällä, ehkä monikaan ei osaa odottaa, mitä lopulta saa vastaukseksi. Tekoäly alkoi tarjota uskottavampia tuloksia. Samalla tekoälyn oleellinen uusi ulottuvuus on se, että vuorovaikutus sen kanssa tuntuu inhimillisemmältä.

– Kun käytät ja kirjoittelet, on vaikea tunnistaa, että siellä on kone, joka vastaa. Voisi hyvin kuvitella, että linjan päässä on ihminen.

-----------------------

Artikkelin on kirjoittanut Juha Jäntti ja #AtoZtyypit hienosäätäneet sekä kuvittaneet artikkelin AI:n avulla