Erilaiset PDF-tulosteet, ja niissä olevien tietojen koostaminen vastaanottajan omaan järjestelmään voivat olla tekoälylle sopiva tehtävä. Erilaisten saapuvien dokumenttien tietojen käsittely on tärkeä taloushallinnon tehtävä, mutta se ei ole liiketoiminalle arvoa tuottavaa työtä. Sinällään yksinkertaiselta kuulostava ja ohjelmistoautomaatiolle, kuten RPA (Robotic Process Automation) tai koneoppiminen (ML, Machine Learning) sopiva tehtävä muuttuu hankalaksi, koska dokumenteilla ei ole yhteistä määrämuotoa. Kansainvälisessä liiketoiminnassa mukaan tulee myös erilaisten termistöjen paljous. Sääntöjä ja logiikoita tai koneoppimisessa tarvittavaa opetusmateriaalia pitäisi rakentaa ja ylläpitää suurelle joukolle erilaisia dokumenttilähteitä. Usein dokumenteissa voi olla myös paljon sellaista sisältöä, joka ei ole varsinaiselle käsittelyprosessille merkityksellistä ja tämä sisältö toimii prosessin kannalta enemmänkin häiriönä ja harhaanjohtajana. PDF-dokumenteissa ihmissilmälle näkyvä visuaalinen rakenteellisuus on todellisuudessa melkoinen ”scriptien sillisalaatti”, jossa tiedot sijaitsevat milloin missäkin kohtaa sisältöä.
Laajaa kielimallia (LLM, Large language model) hyödyntävä tekoäly voi tässä tapauksessa toimia paljon RPA:ta tai ML:ää joustavammin ja tehokkaammin. Kielimalli voi esimerkiksi tunnistaa dokumentissa käytettävän kielen tai lähdemaan ja sitä myötä myös kansallisen termistön. Tekoälyagentille ”ohjelmoitava” tehtävä (kuten ChatGPT:ssä Custom Instruction) laaditaan sanallisesti eli promptataan. Sanallisessa komentokehotteessa ei tarvita ohjelmointiosaamista, mutta hyvän promptin laatiminen vaatii harjoittelua. Tehtävänanto voi olla hybridimuotoinen. Sanallisen ohjeen lisäksi tekoälylle voidaan antaa koodillinen rakennemalli sitä, mihin muotoon dokumentista löydetyt tiedot koostetaan, jotta ne sopivat vastaanottajan tietojärjestelmään ja jatkoprosessointiin.
Hubble Oy kehittää PDF-dokumenttien käsittelyyn liittyvää automatisointia. Yhteistyössä Temotero-hankkeen kanssa kielimallin hyödyntämistä sovellettiin myyntitilausten muuntamisessa PDF-dokumenteista JSON-formaattiin. Teknologian modernisointia tekoälyn avulla toteuttavan hankkeen pilotissa hanketiimi selvitti, saisiko ChatGPT:llä tai vastaavilla työkaluilla toteutettua tarvetta vastaavan promptin. Hubble koosti pilottiin sopivan lähdemateriaalin ja niistä odotetut lopputulemat, ja osallistui osaltaan kielimallin koekäyttöön. Pilotissa hyödynnettiin OpenAI ja Azure OpenAI -rajapintoja.
Hanketiimin huomioissa esiin nousivat komentokehotteen laadinnan merkitys lopputulokseen, erot eri LLM-mallien (GPT3.5, GPT-4 ja GPT-turbo) välillä ja eri rajapintojen suoritusnopeus PDF:ien käsittelyssä. Ongelmia havaittiin laajojen dokumenttien käsittelyyn kuluvassa ajassa. Muutamat pilotissa käytetyt PDF-mallit todettiin todella haastaviksi niin tekoälylle kuin ihmisille (arvojen selitys ja lukujen formaatti).
Hubble Oy:n edustajan Jani Nurmen mukaan pilottiyhteistyön tulokset ovat mielenkiintoisia ja täydentävät hyvin Hubblen tekemien omien kokeilujen tuloksia. Ne vahvistavat ajatuksia kielimallin käytöstä pdf-muotoisten tilausten ja vahvistusten käsittelyssä ja ovat varmasti osa lähitulevaisuudessa kehitettävää entistä helppokäyttöisempää ratkaisua.
Pilotin tulokset (pilotissa käytetyt lähdekoodit) löytyvät myös SEIntS-tutkimusryhmän GitHubista (Otula).
Lisätietoja:
Projektipäällikkö, Petri Rantanen, Tampereen yliopisto (Porin yksikkö), petri.rantanen(at)tuni.fi
Hubble Oy
GitHub
OpenAI
TEMOTERO-hankkeen hankesivut (Avoin Satakunta -sivustolla)
Teknologiayritysten modernisointia tekoälyn ja robotiikan avulla -hankkeen projektikortti (Tampereen yliopiston verkkosivu)
SEIntS -tutkimusryhmä, Tampereen yliopisto
Tampereen yliopiston ja Satakunnan ammattikorkeakoulun yhteinen hankesivusto RoboAI-sivustolla.
Kaikki linkit avautuvat omille välilehdilleen.
Jaa