Lyhyet

Näin Tiktok-koe tehtiin

23.12.2021

Tutkiakseen Tiktokin suosittelumekanismia Long Playn algoritmitoimituksen datatieteilijä Onni Aarne koodasi joukon botteja, jotka esittivät olevansa tavallisia käyttäjiä. Botit selasivat TikTokin ”for you” -sivua. Se koostuu loputtomasta sarjasta videoita, jotka TikTokin suositusalgoritmi valikoi kyseiselle käyttäjälle.

Botit lukivat videoiden tageja eli asiasanoja ja päättivät niiden perusteella, mitkä videot sopivat niiden kiinnostuksen kohteisiin. Ne kertoivat Tiktokille mieltymyksistään katsomalla kiinnostavia videoita pidempään kuin epäkiinnostavia, tykkäämällä niistä tai katsomalla videon kahteen kertaan. Eri boteille oli ohjelmoitu erilaisia kiinnostuksenkohteita ja käytösprofiileja.

”Missään tapauksessa suositusalgoritmi ei näyttänyt botille kiinnostuksenkohteen mukaista sisältöä selkeästi vertailukohteena käytettyä neutraalia bottia useammin”, Onni Aarne sanoo.

Politiikasta kiinnostuneen botin lisäksi kokeilimme esimerkiksi kouluun liittyvistä videoista kiinnostunutta bottia. Ensin Aarne kävi läpi 40 ensimmäistä videota, jotka löytyivät selaamalla #koulu-asiasanaa. Näistä videoista kerättiin muita asiasanoja, jotka liittyivät koulunkäyntiin (esimerkiksi opiskelija, lukio, opiskelu, yläaste, alaaste, opettaja, läksyt, kotitehtävät, oppilas ja välitunti).

Joillakin boteilla oli kaksi kiinnostuksen kohdetta, vaikkapa siivoaminen ja ruuanlaitto. Nämä botit ilmaisivat kiinnostuksensa eri aiheisiin eri tavoin. Yhden aiheen videoita ne katsoivat pidempään, mutta toisista ne tykkäsivät. Botti ohitti nopeasti videot, jotka eivät liittyneet kumpaankaan aiheeseen.

(Siivousaiheiset videot tunnistettin tageista siivous, siivousvinkki, cleaningtiktok, cleanfreak, housekeeping, cleantok, cleanhack ja siivousniksi. Ruuanlaittoaiheiset videot tunnistettin tageista baking, leivonta, reseptiktok, keitto, recipe, tiktokfood, ruoka, ruokaa, reseptit, tiktokruoka, easyrecipe ja reseptitiktok.

Bottien kirjoittamiseen Aarne käytti Python-ohjelmointikieltä. Jokaisella botilla oli oma sähköpostiosoite, Tiktok-tili ja omat selainevästeet, jotta ne vaikuttaisivat ihmisiltä. Botit käyttivät Tiktokia Chrome-selaimen ja Selenium-ohjelmiston avulla. Selenium tukee verkkoselainten automatisaatiota. Käytimme Chrome-kontrolleria jotta TikTok ei voisi havaita, että kyseessä ei ollut tavallinen selain. 

Lue täältä, mitä koe paljasti: Tiktokin algoritmi ei osaa lukea ajatuksiasi

Tämän jutun tuotti Long Playn algoritmitoimitus, joka tutkii algoritmien vaikutusta ihmisten arkeen. Hanke on saanut rahoituksensa Helsingin Sanomain Säätiön Uutisraivaaja-kilpailusta.
 

 Long Playn joululahja
Joululahjakauppamme on auki!
Suomen parasta journalismia tuntuvalla alennuksella! Lahjatilaus arkiston kanssa vuodeksi vain 49 € (norm 74 €). Olisi todella ihanaa jos tilaisit Long Playn itselle tai ystävälle lahjaksi. Vastalahjana lupaamme yllättää sinut ensi vuonna.