Uutishuone / Blogit

Tunnistaako tekoäly perheyrityksen?

Kirjoittanut Juhana Peltonen Assistant Professor (Entrepreneurship), Hanken School of Economics

Julkaistu 02.09.2019

Kaikkea perheyritystutkimusta yhdistää kyky erottaa perheyritykset muista yrityksistä tai vähintäänkin luonnehtia yrityksen ”perheyritysmäisyyttä” tietyin kriteerein. Tapaustutkimuksessa asia ratkeaa viimeistään keskustelemalla perheen roolista suoraan yrityksen edustajan kanssa. Tämä metodi ei kuitenkaan sovellu esimerkiksi perheyritysten kansantaloudellisen kontribuution arvioimiseksi, mikä edellyttää suuria satunnaisotoksia.

Määrän myötä laatu helposti myös kärsii. Esimerkiksi eräs tutkijoiden käyttämä perheyritysten tunnistuskeino on laskea yrityksen hallituksista henkilöt, joilla on sama sukunimi. Menetelmä on kieltämättä tehokas, mutta yksikin avioliiton myötä tapahtuva sukunimen muutos saattaa poistaa monisukupolvisen perheyrityksen aineistosta. Toistaiseksi ihmisen tekemän tiedonkeruun arvo on siis säilynyt. Esimerkiksi Perheyritykset Suomessa 2014 -julkaisussa kerättiin laaja kyselyotos suomalaisista yrityksistä hyödyntäen perheyrityksen ns. EU-määritelmää, jonka pohjalta ekstrapoloitiin koko maata koskevia indikaattoreita.

Kyselytutkimuksissakin tosin on haasteensa, sillä vastaajien huomiosta kilpailee kasvava ja paremmin kohdennettu markkinointiviestintäkoneisto. Voidaanko tämä trendi kuitenkin jotenkin kääntää tutkimuksen eduksi? Voidaanhan Facebookin keräämää ainestoa hyödyntäen kehittää algoritmi, joka tietää persoonasi tarkemmin kuin lähisukulaisesi. Voiko siis yrityksen ”perheyritysmäisyyden” päättely lukuisista profiileista ja yrityssivuista olla suuresti haastavampaa?

Analyytikko ei kuitenkaan tarvitse erikoissuhdetta sosiaalisen median jättiläiseen soveltaakseen samoja koneoppimisen periaatteita. Luokittelun suorittavan algoritmin ”kouluttamiseksi” riittää kun tutkijalla on käytössään (i) edustava otos yrityksistä, josta on liputettu perheyritykset sekä (ii) näihin yrityksiin yhdistettyjä mahdollisimman laajoja ja relevantteja aineistoja. Esimerkiksi Tilastokeskuksen nimettömät aineistot täyttävät nämä edellytykset. Näitä aineistoja hyödyntäen olen kouluttanut algoritmin, joka päättelee perheyrityksen oikein 92 % osumatarkkuudella.

Vaihtoehtoisesti laajan yrityskohtaisen aineiston voi kerätä automatisoidusti julkisista verkkodokumenteista olematta itse Google tai Facebook. Mm. tällä lähestymistavalla ETLA on rakentanut trendi-indikaattorin tekoälyä hyödyntävien yritysten määrästä, mikä perustuu ennalta määrättyjen avainsanojen esiintymien laskentaan.

Koneoppiminen ja tekoäly näyttävät siis tuovan uusia työkaluja perheyritystutkimuksen käyttöön. Ihmisen rooli tiedonkeruussa ei ole vielä uhattuna, mutta sopivissa olosuhteissa yhden tutkijan työpanos on mahdollista skaalata moninkertaiseksi kuormittamatta yrityksiä suuremmalla määrällä kyselyjä. Nämä lisääntyvät mahdollisuudet lopulta nostavat laadukkaiden kyselyaineistojen painoarvoa.

Asiasanat