
11.2.2026
Essee: Haluan misinformaationi ihmisiltä, kiitos!
Generatiivinen tekoäly ahmii Wikipediaa ja näyttää mullistavan tiedonhaun. Voiko se koitua 25-vuotiaan tietosanakirjan kohtaloksi?
Imeekö tekoäly Wikipedian tyhjiin?
Kysymys nousi mieleen viime vuoden lopulla, kun Wikipediaa pyörittävä Wikimedia-säätiö kertoi kävijämäärien laskeneen kahdeksalla prosentilla verrattuna samoihin kuukausiin edellisvuonna. Laskun taustalla ovat säätiön mukaan etenkin hakukoneiden tarjoamat suorat vastaukset, siis hakutulosten yläpuolelle ilmestyneet, generatiivisen tekoälyn tuottamat tiivistelmät.
Samalla yhä harvempi Wikipediassa vierailevista on ihminen, ja se käy kalliiksi. Tekoälyä varten dataa kaapivat ohjelmat bulkkilukevat myös vähemmän suosittuja sivuja, joiden noutaminen välimuistin sijaan keskitetystä datakeskuksesta maksaa paljon enemmän – vähän samaan tapaan, kuin jos kirjastosta lainaisi samalla kertaa hyllyittäin kirjoja varastosta. Sisältömme on ilmaista, mutta infrastruktuurimme ei sitä ole, Wikimedia-säätiö muistutti.
Näyttää siltä, että generatiivisen tekoälyn yleistyminen voisi horjuttaa Wikipediaa.
VUONNA 2007, kun Wikipedian mainetta piti vielä puolustaa, Kari A. Hintikka kirjoitti Tieteessä tapahtuu -lehdessä Wikipedian tiedon olevan käyttäjilleen tarpeeksi hyvää: ”Jos jokin informaatiolähde on monille ihmisille riittävä, niin mistä silloin varsinaisesti keskustellaan, jos sanotaan, että nämä ihmiset ovat hyödyntämässä ’puutteellista’ tai ’epätarkkaa tietoa’? Pitäisikö käyttö kieltää lailla?”
Huomaan, että samaa voisi sanoa tekoälystä, enkä pidä siitä. On vaikeaa suhtautua tähän analyyttisesti. Osin, koska olen jäävi: toimittajan töiden ohella olen aktiivinen Wikipedia-editori eli yksi niistä, jotka muokkaavat Wikipediaa. Olen muun muassa oikolukenut mieleenpainuvia tekstejä 1500-luvun ranskalaisista munkeista, luonut kymmeniä uusia artikkeleita ja viilannut listaa tunnetuista kouvolalaisista.
”Vitut ChatGPT:stä, olen uskollinen Wikipedialle loppuun asti. Jos minulle syötetään misinformaatiota, niin haluan että se tulee KANSALTA.” Näin kuuluu vapaasti käännettynä twiitti, joka antoi ponnen tälle koko esseelle. Onko loppu todella lähellä? Ja mikä siinä on, että ihmisten tuottama mahdollisesti virheellinen tieto tuntuu paremmalta kuin tekoälyn hallusinaatiot sen päälle?
Tällä on väliä, koska 25 vuotta sitten tammikuussa 2001 perustettu Wikipedia on jo tiedonhaun instituutio. Se keikkuu maailman vieraillumpien nettisivujen listauksissa kärkikymmenikössä. On tultu kauas siitä, kun koulun ATK-tunnilla varoiteltiin Wikipedian käytöstä ja palvelua pidettiin jopa jonkinlaisena vitsinä.
HELSINGIN yliopiston viestinnän, teknologian ja organisaatioiden tutkija Salla-Maaria Laaksonen jakaa videopuhelussa havainnon institutionalisoitumisesta ja lisää: ”Siinäkin mielessä, että sinne mennään miettimättä asiaa. Se on osa koko verkon infraa.”
Wikipedian toimintalogiikka on useimmille niin tuttu, että politiikan toimittaja Timo Haapalan taannoinen havainto siitä, että kuka tahansa voi muokata sivustoa, herätti irvailua. Onko joku taho, joka niiden sivujen perään ylipäätään katsoo, Haapala kysyi.
On: Wikipediaa ja muita wikiprojekteja kuten Wikidataa ja Wikimedia Commonsia pyörittää Wikimedia-säätiö, joka ei tavoittele voittoa. Wikipedia on toisin sanoen jotain muuta kuin jättimäisten korporaatioiden omistamat hakukoneet tai sosiaalisen median alustat. Säätiö ei kuitenkaan tuota palveluiden sisältöä, vaan sen tekevät vapaaehtoiset.
Toimintamalliin liittyy usein toisteltu vitsi: onneksi Wikipedia toimii käytännössä loistavasti, koska sen ei pitäisi toimia teoriassa. Mieleen tulee usein toisteltu väite, jonka mukaan kommunismi on kaunis ajatus, mutta ei toimi käytännössä. Wikipediassa se kuitenkin on toiminut jo 25 vuoden ajan. Vapaasta tietosanakirjasta ei ole vaikeaa vetää yhteyttä työväen perinteisiin yhteismaihin, englanniksi commons – lähtien siitä, että Wikimedian projekteihin kuuluu tietokanta nimeltä Wikimedia Commons. YK tunnusti sen ja Wikipedian viime vuonna ”digitaalisiksi julkishyödykkeiksi”.
Mahdollinen uhka Wikipedialle on siis uhka paitsi instituutiolle myös internetin ”viimeiselle parhaalle paikalle”, kuten Wired-lehti palvelua kuvaili vuonna 2020. Wikipedia on avoimen internetin projekti, ja onnistunut pitämään keskeisen asemansa. Avoimuus on kuitenkin keskeinen syy Wikipedian nykyisille hankaluuksille.
SUURILLE kielimalleille Wikipedia on ollut ”ihan täydellinen aarreaitta”, kuvailee Laaksonen. Hän on tutkinut Wikipedian lisäksi Stack Exchange -sivustoa, joka sekin on päätynyt tekoälyn koulutusmateriaaliksi. Mitään sääntöjä ei ole rikottu, sillä molemmilla alustoilla on avoin lisenssi, eli materiaalia saa lähtökohtaisesti hyödyntää ilman erillistä lupaa.
Sen verran materiaalin käyttö kuitenkin rasittaa, että Wikipedia on yrittänyt saada tekoälyfirmoja maksamaan datankaivelustaan. Kun Wikipedia täytti viime kuussa 25 vuotta, Wikimedia-säätiö ilmoitti solmineensa sopimukset aineiston käytöstä useiden jättifirmojen – muun muassa Amazonin, Metan ja Microsoftin – kanssa. Google oli allekirjoittanut vastaavan sopimuksen jo aiemmin.
Maksamiseen on vaikeaa velvoittaa ennen kaikkea avoimen lisenssin takia. Avoimuus, yhteismaa, on koko palvelun ydinajatus.
Google kiistää tekoälytiivistelmien vieneen nettisivuilta lukijoita ja väittää niiden ohjaavan käyttäjiä suuremmalle kirjolle sivuja. Roimasti vähentyneistä vierailijoista raportoivat tutkimukset ja julkaisijat eivät ole samaa mieltä. Reuters-instituutin tuoreen raportin mukaan mediatalot odottavat, että hakukoneiden kautta uutismedioille ohjautuva liikenne vähenee seuraavien kolmen vuoden aikana 43 prosentilla. Mediat ovat erityisen huolissaan Googlen tekoälytiivistelmistä, mutta niiden osuutta vierailijoiden määrän laskuun on hankalaa osoittaa.
Suomessa suurten kielimallien vaikutukset ovat saaneet viranomaisenkin harkitsemaan teknisiä muutoksia saadakseen välitettyä oikean tiedon kansalaisille. Tilastokeskuksen sivuilla Googlen kautta vierailleiden määrä putosi viime vuonna liki 20 prosentilla, eivätkä suuret kielimallit osaa lukea tilastokantoja.
Tieto pitää optimoida nyt tekoälylle.
”Se on aika iso muutos ja siinä mielessä ehkä verrattavissa siihen, kun hakukoneet tulivat”, Laaksonen sanoo.
Banner placeholder
ON helppo nähdä, miten Wikipedian menettämistä kävijöistä voisi seurata kirottu luuppi. Eräässä viimevuotisessa tutkimuksessa esitetty hypoteesi menee seuraavasti: kun sivuille ohjautuu vähemmän ihmisiä, myös vapaaehtoisia editoreita on vähemmän ja sitä kautta artikkelit kärsivät. Jos artikkeleita ei ylläpidetä, ne alkavat vanhentua ja korruptoitua, mutta botit jatkavat tiedon haravoimista. Tutkimuksen mukaan uhkaa seurata vääjäämätön kierre, jossa Wikipedian taso laskee laskemistaan.
Toisaalta Wikipedia on ollut aina pienen aktiiviporukan projekti. Vuonna 2003 toimintansa aloittaneessa suomenkielisessä Wikipediassa on tällä hetkellä runsaat 600 000 artikkelia. Aktiivisia editoreja eli vähintään viisi muokkausta kuukauden sisällä tehneitä käyttäjiä on ollut keskimäärin vain noin 550, kertovat suomenkielisen Wikipedian alusta joulukuuhun 2025 ulottuvat tilastot.
Häipyisivätkö nämä editorit vierailijoiden vähetessä? Kansainvälisissä kyselyissä he ovat kertoneet pitävänsä enimmäkseen muiden auttamisesta ja uuden oppimisesta. Ei ole olemassa pelkkään järkeen pohjautuvaa selitystä sille, että joskus olen kahdeksantuntisen uutisdeskivuoron jälkeen mennyt kotiin päivittämään Wikipediaa, toisinaan jopa samoista aiheista, joista päivällä kirjoitin.
Wikipedian muokkaajat ovat jo valikoitunut porukka, intohimoisia, obsessiivisia, pedantteja. (Kuvailen itseäni.) Jos Wikipedian asema on uhattuna, se tuskin johtuu editorien lähdöstä.
MAINITSIN aiemmin yhteismaat. Niihin liittyen tunnetaan myös 1960-luvulla esitelty yhteismaan ongelma, joka väittää maksimaalista hyötyä itselleen tavoittelevien ihmisten lopulta tuhoavan yhteismaan ylikulutuksella. Ongelma on pitkälti kuviteltu: yhteismaat toimivat esimerkiksi Englannissa satojen vuosien ajan erilaisten paikallisten kontrollimekanismien avulla. Niitä on myös Wikipediassa.
Aiheesta tietää Wikimedia Suomi ry:n osa-aikainen työntekijä ja pitkän linjan wikipedisti Kimmo Virtanen. Virtanen eli Wikipedia-käyttäjänimi Zache on tehnyt yli 90 000 muokkausta suomenkieliseen Wikipediaan. Osa muokkauksista on kuitenkin automatisoituja, esimerkiksi artikkeleiden luokkien muutoksia, hän täsmentää videopuhelussa. (Itse olen vain yksinäinen rivieditori – en tunne ketään muuta wikipedistiä enkä ole osallistunut Wikimedian toimintaan.)
Ongelma ei ole automaatio sinänsä. Zachella on kokemusta muokkausten seulontaan tarkoitettujen bottien kehittämisestä. Wikipedioissa on jo pitkään automatisoitu kaikenlaista: suomenkielisessä Wikipediassa botit esimerkiksi korjaavat kirjoitusvirheitä ja vanhentuneita linkkejä, englanninkielisessä versiossa koneoppimista hyödyntävä botti kumoaa vandalismiksi katsottuja muokkauksia. Wikimedia-säätiö itsekin ilmoitti viime kesänä kokeilevansa Wikipediassa tekoälytiivistelmiä, ennen kuin perääntyi nopeasti negatiivisen palauteryöpyn jälkeen.
Yhtä kaikki, generatiivinen tekoäly tuo uusia pulmia moderointiin. Tekoälyä voi pyytää muokkaamaan artikkelin tekstiä vaikka viisi prosenttia tupakkayhtiöille myönteisemmäksi, Zache pohtii. ”Se ei ole enää mitään bulkkimuokkaamista tai -tekstintuottamista. On vähän arvoitus, että mitä niiden kanssa pitäisi tehdä, varsinkin kun kielimallit ja työkalut paranevat koko ajan.”
Uudet työkalut mahdollistavat myös isommat tuhot. Eräs esimerkki on grönlanninkielinen Wikipedia, joka päätettiin viime vuonna sulkea kokonaan kuukausien väittelyn päätteeksi. Grönlanninkielinen Wikipedia oli täyttynyt tolkuttomista artikkeleista, kun ilmeisen kielitaidottomat editorit konekäänsivät artikkeleitaan, vaikka käännöstyökalut osaavat noin 60 000 puhujan grönlantia heikosti. Artikkeleissa kerrottiin muun muassa, että Kanadassa on 41 asukasta. Sulkemisesta huolimatta virheet ovat voineet jäädä elämään – MIT Technology Review’n mukaan suuret kielimallit eivät osaa edes laskea kymmeneen grönlanniksi. Suoraa yhteyttä Wikipediaan on vaikea osoittaa, mutta monille pienille kielille tietosanakirja on merkittävä korpus.
Tavallisen käyttäjän kannalta suurten kielimallien tulo voi tuntua vain valinnalta kahden eri lähteistä tietoa yhdistävän vaihtoehdon välillä. Grönlanninkielisen Wikipedian kohtalo tiivistää kuitenkin oleellisen eron: kun suuri kielimalli mättää Wikipedian dataa, virheet voivat alkaa elää omaa elämäänsä. Se johtuu suurten kielimallien perustavasta toimintalogiikasta.
KUN Wikipedian syöttää kielimallille, tekoälyt eivät niitä kehittävien yhtiöiden mukaan säilö Wikipediaa pankkiholviin vaan luovat matemaattisen mallin, jotka päättelevät todennäköisyyksiä materiaalin sisältämien kirjain- ja sanayhdistelmien perusteella. Eivät siis edes yksittäisten sanojen, joiden merkityksistä mallit eivät tajua mitään. Kerran sisään syötettyä ei pitäisi saada samanlaisena ulos – joskin uusi tutkimus kiistää tämän tulkinnan ja sanoo, että ainakin joissain tapauksissa mallit käytännössä tallettavat syömänsä materiaalin.
Salla-Maaria Laaksonen viittaa The New Yorkerin artikkeliin, jossa kielimallien tapaa toistaa oppimaansa materiaalia verrataan pakattuun JPEG-kuvatiedostoon. Pakatessa tiedoston koko pienenee, mutta osa sen sisältämästä tiedosta häviää. JPEG-formaatti on toisin sanoen häviöllinen. Lopputulos on hitusen erilainen ja epätarkempi kuin alkuperäinen.
Materiaalin aukkoja kielimalli täyttää arvaamalla.
”Se ei ole tavallaan mikään tapa tallentaa mitään tietoa tai toistaa sitä, vaan se on ihan eri representaatio siitä kaikesta sanamassasta ja tiedosta, mikä siellä on.”
Sillä ei näytä olevan käyttäjälle niin väliä – myös heikkolaatuisempi JPEG on useimmiten käyttökelpoinen.
Lisäksi keskusteleva tyyli vakuuttaa, vaikka sisällössä huomaisi epätarkkuuksia. Tekoäly saa siitä episteemistä auktoriteettia, Laaksonen sanoo. Toisin sanoen tyylipisteitä.
Nyt jo useat, erityisesti maksulliset kielimallit kykenevät myös nimeämään lähteitä esittämilleen väitteille – joista osaa ei usein ole olemassa. Lähdemerkinnät eivät poista sumuisen tiedon ongelmaa, sillä logiikka lähteyttämisen ja tiedon kuratoinnin taustalla on edelleen täysin hähmäinen, Laaksonen sanoo.
On hyvä muistaa, että myös Google-haussa on paljon hämärää, esimerkiksi hakutulosten priorisoinnin osalta.
”Sekään ei ole ollut mitenkään puolueeton tai välttämättä hyvin ymmärretty ja aina täysin toimiva mekanismi.”
WIKIPEDIASSA vastaavaa ongelmaa ei ole, sillä se on läpinäkyvä. Jokaisen artikkelin kehittymisen voi jäljittää, kun avaa muokkaushistorian. Siinä mielessä Wikipedia on tiedontuotannon muotona aivan eri planeetalta kuin kielimallit, Laaksonen sanoo.
Tekee mieli sanoa, että Wikipedian artikkeleilla on aina myös tekijä, jolla on lusikkansa sopassa. Vaikka kirjoittaja on pitkälti piilossa eikä kyse ole omistajuudesta, kyse on kuitenkin tekijyydestä ja yhteisöön kuulumisesta. Sääntöjen noudattaminen kuuluu asiaan ja oman jäljen asiallisuus on editorille jonkinlainen kunnia-asia.
Sillä on väliä, että palvelussa on joku, jonka kanssa riidellä ja halkoa hiuksia. (Kokemus pedantin Wikipedia-editorin palautteesta muistuttaa itse asiassa usein editoivan toimittajan kanssa keskustelemista.) Yhteismaata muokkaavat ihmiset joutuvat tulemaan toimeen keskenään.
Myönnän olevani tämän suhteen idealisti, vaikka tiedon rakentaminen yhdessä ei aina ole ihanaa. Tarkkailulistallani on useita artikkeleita sen takia, että eräät editorit käyvät usein lisäämässä niihin islamofobista kuonaa.
Ajattelen, että parhaimmillaan Wikipedia voi opettaa sekä tekijöilleen että lukijoilleen jotain yleisesti hyväksytyn, tarpeeksi hyvän tiedon muodostumisesta. Kyse on prosessista, valinnoista ja mielipiteistä, ei tyhjästä ilmestyvästä vastaansanomattomasta totuudesta. Filosofi Tere Vadén kirjoitti Wikipediaa laajasti käsitelleessä Tieteessä tapahtuu -numerossa vuonna 2007: ”Miljoonat ihmiset käyttävät päivittäin tietolähdettä, jonka tietävät epäluotettavaksi (ja muuttuvaksi, historialliseksi, kiistellyksi, ominkin sormin muokattavaksi). Eikö tämä ole radikaali epistemologinen mahdollisuus?”
WIKIPEDIAN tuhoa on ennustettu lukuisat kerrat: ensin varhaisten kilpailijoiden, sittemmin muun muassa älypuhelimien takia. (Wikipedian tuhoon liittyvistä ennustuksista on myös oma artikkelinsa.)
Wikipedian loppu tuskin on nurkan takana tälläkään kertaa, arvioivat sekä Zache että Laaksonen.
Jos ei muuten, niin vähintään kielimallien kouluttamisen takia. Koulutuksiin tarvitaan toistaiseksi ihmisten kuratoimaa tietoa, joka ei synny tyhjästä. Tiedämme, että kielimallien suorituskyky heikkenee, jos niitä koulutetaan tekoälyllä tuotetulla sisällöllä, Laaksonen kertoo.
”Faktan tarkistaminen automaattisesti on ihan mahdoton tehtävä. Tai ei ehkä mahdoton, mutta mahdottoman vaikea. Juuri sen takia se on ihmistyötä ja meillä on faktantarkistajia, ja sen takia Wikipedia vaatii niin paljon manuaalista työtä, että se pysyy kasassa.”
Suuret kielimallit ovat siis toistaiseksi riippuvaisia Wikipedian kaltaisista tietolähteistä.
Laaksosen mielestä merkkejä tekoälyyn kyllästymisestä on ilmassa. Kustannus- ja innovaatiohyötyjä ei koeta saatavan.
Tulevaisuudessa lähteen maineella voi olla nykyistä enemmän merkitystä tiedonhaussa, Laaksonen pohtii.
”Ainakin minä haluan enemmän mennä niille tietyille sivuille, joista tiedän, että löytyy se tieto. Ja minulle Wikipedia on edelleen yksi sellainen”, hän sanoo.
Neljännesvuosisadan jälkeen Wikipedia on jo sellaisessa asemassa, että luultavasti hyvin moni on Laaksosen kanssa samaa mieltä. Tässä tiedonhaun kummallisessa murroshetkessä Wikipedia on merkittävä peluri ja myös erilaisen internetin elävä esimerkki.
Jos Wikipedia onnistuu jatkamaan eloaan, se on tiedon ystävälle parempi uutinen. Tietosanakirjan ja tekoälyn tekemät virheet eivät nimittäin ole tasa-arvoisia.
Ärsyttävän Wikipedia-nörtin virhe on jäljitettävä. Sen voi korjata ja siitä voi kiistellä.
Mennäänkö yhdessä keskustelusivulle tappelemaan?
Juttu jatkuu ilmoituksen jälkeen
Long Play - ihmisille, jotka vielä lukevat
Tämä juttu on ilmainen mutta sen tekeminen ei ollut ilmaista. Long Play on lukijoidensa rahoittama riippumaton media. Tilaajana saat kaiken: tuhansia sivuja laatulukemista. Sivisty, nauti ja tue käsityöläisjournalismia!


