OpenAI:n uusi GPT-3 tekoäly kuohuttaa

Voittoa tavoittelematon OpenAI tekoälylaboratio julkaisi uuden kieligeneraattorinsa GPT-3:n julkiseen mutta rajoitettuun betakäyttöön kesällä 2020.

Lyhenne GPT tulee sanoista Generative Pretrained Transformer, ja kyseessä on siis koneoppiva järjestelmä joka tuottaa järkevää tekstiä hakemalla mallia sille syötetyistä kirjastoista. Järjestelmä ikään kuin ennustaa edellisen sanan perusteella mikä seuraavan sanan kuuluisi olla, toistaen prosessia eteenpäin. Sanat voivat olla tavallisen tekstin ohella vaikkapa ohjelmointikoodia.

Periaate ei sinänsä ole uusi, mutta tämä kolmosversio on hätkähdyttänyt silkalla tehollaan. Järjestelmä pitää sisällään jopa 175 miljardia parametria, useampaa kertaluokkaa enemmän kuin 1,5 mljardin parametrin edeltäjä GPT-2. Järjestelmän treenausmateriaalina on ollut internetistä indeksoitua tekstiä, wikipedia, sekä kaksi eri kirjallisuuskokoelmaa. Tätä materiaalia on ollut 499 miljardia ”tokenia” eli sanaa tai merkkisarjaa kuten numeroa.

Koekäyttäjät ovat innokkaasti testailleet järjestelmän taitoja, ja esitelleet tuloksia internetissä. Hyvä koonti on suomalaisen Kaj Sotalan twitter-ketju:

Kaj Sotalan ylläpitämä GPT-3 twitter-ketju

Yksi kiinnostava kokeilu on Manuel Araozin artikkeli OpenAI’s GPT-3 may be the biggest thing since bitcoin. Jutussa on twisti, jonka tässä spoilaamme: artikkelin on itseasiassa kirjoittanut GPT-3, ei Araoz itse. Tekoäly siis tässä analysoi itseään ja omaa tulevaisuuttaan.

Moni on myös hämmästellyt ohjelman kykyä tuottaa toimivaa koodia kuvailun perusteella. Kuvailemalla GPT-3:lle tietynlaisia elementtejä ohjelma onnistuu tuottamaan funktionaalisia verkkosivuja html/ccs kielillä tai vaikkapa React-appeja. Kielen ohella järjestelmä pystyy täydentämään myös kuvia edeltävien pikseleiden perusteella.

GPT:n ”älykkyys” sinänsä on kyseenalaista. Ohjelma tosiaan tiettyjen matemaattisten prosessien kautta tuottaa kieltä lähdemateriaaliin pohjautuen, eikä sinänsä varsinaisesti ymmärrä tuotoksiaan. Myös täysin virheellistä ja hölynpölyä on joukossa.

Joka tapauksessa potentiaalia varsin huikeisiin sovelluksiin on, sillä yllä olevat esimerkit ovat vain ensimmäisiä kokeiluja. Uhkakuviakin on nähty ja juuri tämän vuoksi käyttäjäjoukkoa on rajattu. GPT-3 nimittäin olisi erinomainen työkalu myös misinformaation eli muun muassa valeuutisten tuottamiseen.