Tiktokin algoritmi ei osaa lukea ajatuksiasi

Tiktokin algoritmia on pidetty niin tarkkana, että se tietää käyttäjän kiinnostukset häntä itseään paremmin – Long Playn bottikoe osoittaa, että ainakaan Suomessa se ei toimi niin.

On varsin yleisesti jaettu käsitys, että Tiktokin suosittelualgoritmi on maailman parhaimmistoa. Toimittajat ja some-asiantuntijat ympäri maailman ovat pitäneet videosovelluksen suosion ja koukuttavuuden salaisuutena juuri sen algoritmia. Sen on uskottu oppivan käyttäjän mielenkiinnon kohteet hyvin lyhyessä ajassa ja joskus tietävän jopa käyttäjää itseään paremmin, mistä hän todella on kiinnostunut.

Tiktok on kiinalaisen Byte Dance -yhtiön mobiilisovellus, joka saavutti viime kesänä miljardin käyttäjän rajan. Se perustuu lyhyisiin videoihin ja sen käyttäjäkunta on selvästi nuorempaa kuin muiden sosiaalisen median palveluiden. The Wall Street Journal (WSJ) julkaisi heinäkuussa 2021 videon kokeilustaan, jossa lehti testasi Tiktokin algoritmin toimintaa sadalla botilla. (Botti on tietokoneohjelma, jonka avulla palveluun luodaan automatisoitu käyttäjätili.) Kullekin botille oli koodattu oma kiinnostuksen kohteensa, ja ne ilmaisivat nämä Tiktokille katsomalla sopivat videot kahteen kertaan.

WSJ:n mukaan Tiktokin algoritmi oppi useimpien bottien kiinnostukset alle kahdessa tunnissa, joissain tapauksissa alle 40 minuutissa. Aluksi algoritmi tarjoili viraalihittejä, mutta siirtyi pian videoihin, joilla oli huomattavasti vähemmän katselukertoja. Botit olivat päätyneet Tiktokin sivuhaaroihin, jotka sisältävät pitkälti erikoistunutta sisältöä.

WSJ puhuu kaninkoloista, jonne algoritmi ajaa käyttäjän, ja josta tämä ei enää pääse pois. Yksi näistä kaninkoloista oli masennus-Tiktok. Aiheesta kiinnostunut botti sai lopulta fiidiinsä lähes pelkästään masennusaiheisia videoita: niitä oli 93 prosenttia liki kolmensadan videon otoksesta. Loput olivat lähinnä mainoksia.

Tulokset herättivät laajaa huolta. Tiktokin käyttäjät ovat hyvin nuoria, joten esimerkiksi itsensä vahingoittamisesta kertovien videoiden tarjoileminen heille on kyseenalaista.

Vastaavaa koetta ei ollut tehty Suomessa, mutta Tiktokista tehdyt kotimaiset lehtijutut toistivat tarinaa algoritmin ihmeellisestä tarkkuudesta. Mutta syöttääkö algoritmi täälläkin nuorille äärisisältöjä?

Päätimme kokeilla asiaa. Tämän jutun lopussa selostetaan tarkemmin testin teknistä toteutusta.

Omat bottimme toimivat samoin kuin WSJ:n. Ne tykkäsivät tai katsoivat kahdesti, kun sopiva video osui kohdalle. Muutamat botit olivat kiinnostuneita esimerkiksi koulunkäynnistä, siivouksesta ja ruoanlaitosta. Nämä ovat sisältöjä, joita suomenkielisestä Tiktokista löytyy runsaasti.

Botit katsoivat Tiktokia tuntikausia. Pitkäikäisimmille boteille kertyi katseluaikaa yli 20 tuntia. Algoritmi ei silti oppinut tarjoilemaan boteille niiden kiinnostuksen kohteita vastaavaa sisältöä. Videot edustivat Tiktokin valtavirtaa: suosittuja, paljon katsomiskertoja keränneitä videoita, joiden sisältö on hyväntuulista tai humoristista.

Osa Long Playn boteista oli kiinnostunut politiikasta. Ne ohjelmoitiin katsomaan uudestaan videot, joiden tageissa eli asiasanoissa oli esimerkiksi ”hallitus”, ”oikeisto”, ”vasemmisto” tai minkä vain eduskuntapuolueen nimi tai lempinimi. Kokeilimme politiikkabotista eri versioita: osa niistä katsoi kaikki videot, mutta tykkäsi politiikka-aiheisista, toiset taas ohittivat epäkiinnostavat videot nopeasti ja katsoivat poliittisen sisällön kahteen kertaan.

Yli kymmenen tunnin ja tuhansien videoiden jälkeen Tiktok ei tarjonnut politiikkaboteillemme aihepiirin videoita merkittävästi useammin kuin vertailuboteillemme, jotka katsoivat kaiken, mitä eteen tuli.

Jotkut botit katsoivat aluksi 20 ensimmäistä politiikka-tagilla löytyvää videota opettaakseen kiinnostuksensa algoritmille. Tämäkään ei vaikuttanut bottien myöhemmin saamiin suosituksiin.

Long Playn tulokset Tiktokin algoritmin toiminnasta ovat siis täysin vastakkaisia WSJ:n Yhdysvalloissa saamille tuloksille. Algoritmi ei oppinut käyttäjän mielenkiinnon kohteita oikeastaan lainkaan.

Tekoälyn asiantuntija Anna-Mari Rusanen pitää Long Playn kokeen tulosta hyvin mielenkiintoisina. Hän tutkii ihmisen ja algoritmien välistä tiedollista työnjakoa ja sen yhteiskunnallisia seurauksia Helsingin yliopiston digitaalisten ihmistieteiden osastolla.

"Varovainen selkäydintuntumani on, että tässä saattaa näkyä yhdysvaltalaisen ja suomalaisen – tai eurooppalaisen – kontekstin ero. Meillä ei välttämättä ole sen tyyppisiä ilmiöitä, joihin koko keskustelu suosittelualgoritmien ongelmista on keskittynyt.”

Suomessa käyty sosiaalista mediaa koskeva keskustelu on vuosikausien ajan pohjannut yhdysvaltalaisiin tutkimushavaintoihin, joiden mukaan somepalveluiden algoritmit johdattavat käyttäjiä äärisisältöjen pariin ja aiheuttavat polarisaatiota. Samoin media on toistanut ajatusta filtterikuplista, eli somepalveluiden algoritmien rakentamista samanmielisten piiristä. Filtterikupla-ajatukselle ei itse asiassa löydy perusteita edes kansainvälisestä tutkimuksesta. Se on hokema, josta on tullut lukemattomien toistojen myötä yleinen totuus.

Ylipäätään sosiaalista mediaa koskeva keskustelu pohjaa hyvin pitkälti Yhdysvalloissa tehtyyn tutkimukseen ja siellä käytyyn keskusteluun. Jotkut asiantuntijat ovat olleet huolissaan siitä, että EU ja muut maat saattavat pohjata sääntelyään tästä syntyneille väärille olettamille.

Rusanen ajattelee, että Long Playn Tiktok-kokeilun tulokset ovat osoitus siitä, että Yhdysvalloissa tehdyistä tutkimuksista ei voi vetää yhtäläisyysmerkkejä Suomeen. Olemme olleet perspektiiviharhan vallassa.

”Jos näin on, se on supermielenkiintoista. Koko algoritmietiikkakeskustelussa olisi silloin näkökulman vaihdoksen paikka”, Rusanen sanoo.

Jos somen algoritmeilla ei Suomessa ja Euroopassa ole niin polarisoivia vaikutuksia kuin yleisesti väitetään, tämä vaikuttaa esimerkiksi keskusteluun somepalveluiden sääntelystä ja mediakasvatuksesta. Euroopassa tarvitaan enemmän paikallista ja vertailevaa tutkimusta laajasti käytössä olevista somepalveluista.

”Jos me katsomme koko ajan vääriin kohtiin ja oletamme ongelmien löytyvän tietyistä paikoista, todennäköisesti missaamme ne todelliset ongelmat.”

”Kaikki puhuvat algoritmeista, mutta keskustelussa ei hirveän usein osoiteta, miten asiat oikeasti toimivat”, sanoo tutkija ja Helsinki Social Computing Groupin vetäjä Matti Nelimarkka, joka yhdistää tutkimuksessaan datatieteen ja yhteiskuntatieteiden metodeja.

”On liian helppoa vetää anekdooteista yleistyksiä. Tarvitsemme systemaattista tutkimusta ja analyysiä.”

Nelimarkka toteaa, että Long Playn bottikokeen tulos on selvä: Tiktokin algoritmi ei toimi Suomessa niin kuin Yhdysvalloissa. ”WSJ:n tulokset olivat hyvin suoraviivaisia. Long Playn keräämässä datamäärässä olisi pitänyt nähdä jotain samankaltaista. Tämä saa epäilemään, että Tiktok on muuttanut jotakin. Kyse voi olla muutoksesta algoritmiin tai sitten paikasta, eli Suomesta.”

Olisiko mahdollista, että suomenkielisessä Tiktokissa ei vain ole tarpeeksi eriytynyttä materiaalia?

Tiktokista kyllä löytyy runsaasti poliittisia videoita. Poliitikoista aktiivisin tiktokkaaja on perussuomalaisten kansanedustaja Sebastian Tynkkynen, jolla on palvelussa yli 62 000 seuraajaa. Muutenkin perussuomalainen politiikka vaikuttaa näkyvän Tiktokissa muita eduskuntapuolueita vahvemmin – mutta tätä pystyimme selvittämään vain manuaalisesti tekemällä asiasanahakuja. Algoritmi ei tyrkyttänyt politiikkaboteille perussuomalaista sisältöä.

Lopuksi yritimme vielä toistaa WSJ:n kokeen masennusaiheisilla videoilla siten, että Tiktok luuli bottimme sijaitsevan Yhdysvalloissa. Algoritmi ei silloinkaan alkanut syöttää botillemme masennusvideoita.

Pian kokeen päättymisen jälkeen selvisikin, että Tiktok on muuttanut algoritminsa toimintaa hiljattain. Se on tarkoituksella karsinut haitallisina pitämiään sisältöjä, kuten liialliseen laihduttamiseen tai kuntoiluun, masennukseen ja eroihin liittyviä videoita. Tiktok kertoo myös lisäävänsä suositteluihin moninaisuutta ja yllättävyyttä.

Silti palvelun on edelleen tarkoitus myös suositella juuri tietyn käyttäjän haluamaa sisältöä. Jääkin avoimeksi, miksi algoritmi ei oppinut bottiemme kiinnostuksia lainkaan kahden kuukauden koejakson aikana. On mahdollista, että WSJ:n löytämä mekanismi ei vain ole Suomessa käytössä.

Tiktokin, kuten muidenkin someyhtiöiden, viestintä on tyypillisen epämääräistä. Algoritmit ovat liikesalaisuuksia, joiden toimintaa firmat eivät halua avata sen enempää kuin julkinen paine vaatii.

Kun algoritmi on suljettu musta laatikko, voimme vain tehdä valistuneita arvauksia. Tällä kertaa selvisi ainakin, että Tiktokilla ei ole käytössään mitään taianomaista ajatustenlukijaa, joka tietäisi meitä itseämme paremmin, mitä haluamme katsoa. Ihan kaikkeen algoritmimagiaan ei kannata uskoa.

Lue lisää aiheesta: Näin Tiktok-koe tehtiin

Tämän jutun tuotti Long Playn algoritmitoimitus, joka tutkii algoritmien vaikutusta ihmisten arkeen. Hanke on saanut rahoituksensa Helsingin Sanomain Säätiön Uutisraivaaja-kilpailusta. Jutussa haastateltu Matti Nelimarkka toimii hankkeessa neuvonantajana.

Joululahjakauppamme on auki!
Suomen parasta journalismia tuntuvalla alennuksella! Lahjatilaus arkiston kanssa vuodeksi vain 49 € (norm 74 €). Olisi todella ihanaa jos tilaisit Long Playn itselle tai ystävälle lahjaksi. Vastalahjana lupaamme yllättää sinut ensi vuonna.

Lyhyet

Tiktokin algoritmi ei osaa lukea ajatuksiasi

Long Play - ihmisille, jotka vielä lukevat

Tilaa Long Play ja pysy kartalla siitä, mistä puhutaan