Avainsana-arkisto: #temotero

TEMOTERO – PDF-tulosteiden muuntaminen rakenteelliseen muotoon

Erilaiset PDF-tulosteet, ja niissä olevien tietojen koostaminen vastaanottajan omaan järjestelmään voivat olla tekoälylle sopiva tehtävä. Erilaisten saapuvien dokumenttien tietojen käsittely on tärkeä taloushallinnon tehtävä, mutta se ei ole liiketoiminalle arvoa tuottavaa työtä. Sinällään yksinkertaiselta kuulostava ja ohjelmistoautomaatiolle, kuten RPA (Robotic Process Automation) tai koneoppiminen (ML, Machine Learning) sopiva tehtävä muuttuu hankalaksi, koska dokumenteilla ei ole yhteistä määrämuotoa. Kansainvälisessä liiketoiminnassa mukaan tulee myös erilaisten termistöjen paljous. Sääntöjä ja logiikoita tai koneoppimisessa tarvittavaa opetusmateriaalia pitäisi rakentaa ja ylläpitää suurelle joukolle erilaisia dokumenttilähteitä. Usein dokumenteissa voi olla myös paljon sellaista sisältöä, joka ei ole varsinaiselle käsittelyprosessille merkityksellistä ja tämä sisältö toimii prosessin kannalta enemmänkin häiriönä ja harhaanjohtajana. PDF-dokumenteissa ihmissilmälle näkyvä visuaalinen rakenteellisuus on todellisuudessa melkoinen ”scriptien sillisalaatti”, jossa tiedot sijaitsevat milloin missäkin kohtaa sisältöä.

Laajaa kielimallia (LLM, Large language model) hyödyntävä tekoäly voi tässä tapauksessa toimia paljon RPA:ta tai ML:ää joustavammin ja tehokkaammin. Kielimalli voi esimerkiksi tunnistaa dokumentissa käytettävän kielen tai lähdemaan ja sitä myötä myös kansallisen termistön. Tekoälyagentille ”ohjelmoitava” tehtävä (kuten ChatGPT:ssä Custom Instruction) laaditaan sanallisesti eli promptataan. Sanallisessa komentokehotteessa ei tarvita ohjelmointiosaamista, mutta hyvän promptin laatiminen vaatii harjoittelua. Tehtävänanto voi olla hybridimuotoinen. Sanallisen ohjeen lisäksi tekoälylle voidaan antaa koodillinen rakennemalli sitä, mihin muotoon dokumentista löydetyt tiedot koostetaan, jotta ne sopivat vastaanottajan tietojärjestelmään ja jatkoprosessointiin.

Hubble Oy kehittää PDF-dokumenttien käsittelyyn liittyvää automatisointia. Yhteistyössä Temotero-hankkeen kanssa kielimallin hyödyntämistä sovellettiin myyntitilausten muuntamisessa PDF-dokumenteista JSON-formaattiin. Teknologian modernisointia tekoälyn avulla toteuttavan hankkeen pilotissa hanketiimi selvitti, saisiko ChatGPT:llä tai vastaavilla työkaluilla toteutettua tarvetta vastaavan promptin. Hubble koosti pilottiin sopivan lähdemateriaalin ja niistä odotetut lopputulemat, ja osallistui osaltaan kielimallin koekäyttöön. Pilotissa hyödynnettiin OpenAI ja Azure OpenAI -rajapintoja.

AI powered system
AI powered system (PDF-tulosteiden muuntaminen rakenteelliseen muotoon)

Hanketiimin huomioissa esiin nousivat komentokehotteen laadinnan merkitys lopputulokseen, erot eri LLM-mallien (GPT3.5, GPT-4 ja GPT-turbo) välillä ja eri rajapintojen suoritusnopeus PDF:ien käsittelyssä. Ongelmia havaittiin laajojen dokumenttien käsittelyyn kuluvassa ajassa. Muutamat pilotissa käytetyt PDF-mallit todettiin todella haastaviksi niin tekoälylle kuin ihmisille (arvojen selitys ja lukujen formaatti).

Hubble Oy:n edustajan Jani Nurmen mukaan pilottiyhteistyön tulokset ovat mielenkiintoisia ja täydentävät hyvin Hubblen tekemien omien kokeilujen tuloksia. Ne vahvistavat ajatuksia kielimallin käytöstä pdf-muotoisten tilausten ja vahvistusten käsittelyssä ja ovat varmasti osa lähitulevaisuudessa kehitettävää entistä helppokäyttöisempää ratkaisua.

Pilotin tulokset (pilotissa käytetyt lähdekoodit) löytyvät myös SEIntS-tutkimusryhmän GitHubista (Otula).

Lisätietoja:
Projektipäällikkö, Petri Rantanen, Tampereen yliopisto (Porin yksikkö), petri.rantanen(at)tuni.fi
Hubble Oy
GitHub
OpenAI
TEMOTERO-hankkeen hankesivut (Avoin Satakunta -sivustolla)
Teknologiayritysten modernisointia tekoälyn ja robotiikan avulla -hankkeen projektikortti (Tampereen yliopiston verkkosivu)
SEIntS -tutkimusryhmä, Tampereen yliopisto
Tampereen yliopiston ja Satakunnan ammattikorkeakoulun yhteinen hankesivusto RoboAI-sivustolla.
Kaikki linkit avautuvat omille välilehdilleen.

Seuraa Facebooktwitter
Jaa Facebooktwitterlinkedinmail
The Report of 85 AI Tools - cover illustration

TEMOTERO – Tekoäly esittelee tekoälytyökaluja

Teknologiayritysten modernisoinnin tueksi TEMOTERO-hanke on tuottanut tekoälytyökaluja käsittelevän raportin, joka avaa lukijalleen pääsyn maailmalla tarjolla oleviin tekoälyä hyödyntäviin sovelluksiin. Raportti analysoi 85 eri aloille tarkoitettua työkalua. Raportti tuo esiin, kuinka generatiivisen tekoälyn (Generative Artificial Intelligence, GenAI) teknologia vaikuttaa sisällön tuottamiseen ja tuotannon automatisointiin. Raportti on suunnattu Satakunnan elinkeinoelämän edustajille sekä muille tekoälyteknologiasta kiinnostuneille auttamaan työkaluihin tutustumista ja löytämään uusia keinoja liiketoiminnan tehostamiseen sekä innovoimaan uusia hyödyntämiskohteita.

Varsinainen työkalujen esittely on koostettu jo vuonna 2023, mutta nyt se on muotoiltu uudelleen tekoälyn avulla! Eli tarjolla on tekoälyä hyödyntäviä sovelluksia tekoälyn esittelemänä.

Hyödynsimme ChatGPT:tä ja sen Custom Instructions -toimintoa luodaksemme automaattisen prosessin (tai proseessin osia), jossa aiemmin tekniseen esitystapaan luotua sisältöä muotoillaan uudelleen elinkeinoelämän edustajien näkökulmaa huomioiden. Raportissa kerrotaan myös ohjausprosessin kehittämisen aikana havaituista haasteista ja rajoituksista.

Pääset Tampereen yliopiton Trepossa julkaistuun raporttiin (PDF, englanninkielinen) alla olevasta napista.

Lisätietoja:
Projektipäällikkö, Petri Rantanen, Tampereen yliopisto (Porin yksikkö), petri.rantanen(at)tuni.fi

TEMOTERO-hankkeen hankesivut (Avoin Satakunta -sivustolla)
Teknologiayritysten modernisointia tekoälyn ja robotiikan avulla -hankkeen projektikortti (Tampereen yliopiston verkkosivu)
SEIntS -tutkimusryhmä, Tampereen yliopisto
Tampereen yliopiston ja Satakunnan ammattikorkeakoulun yhteinen hankesivusto RoboAI-sivustolla.
Kaikki linkit avautuvat omille välilehdilleen.

Seuraa Facebooktwitter
Jaa Facebooktwitterlinkedinmail