Automatiske nyhende
Automatisert nyhendeskriving er i ferd med å verte eit viktig trekk ved nyhendeproduksjonen.
Når oppgåva er å rapportere objektivt om hendingar og resultat i ein fotballkamp, som her mellom Start og Molde i 2015, kan ein algoritme vere like god som reporteren Davy Wathne i TV 2. Men Wathne kan noko ingen algoritme gjer etter han, han kan referere subjektivt.
Foto: Tor Erik Schrøder / NTB
I førre veka kunne VG rapportere frå ein engelsk fotballkamp mellom Derby og Brentford. I sanntidsoppdateringa deira står det: «Mål! Brentford FC får et straffespark som Ivan Toney setter i mål på Pride Park Stadium. Stillingen er dermed 0–1.» Dette ser ut som ein tekst som ein sportsjournalist kunne skrive, men han er faktisk skriven av ein algoritme.
Automatisert nyhendeskriving er i ferd med å verte eit viktig trekk ved nyhendeproduksjonen. Norsk Telegrambyrå (NTB) har truleg kome lengst med slik teknologi i Noreg. Dei har i mange år alt laga automatiserte meldingar om fotballresultat, valresultat og kjøp og sal av eigedom. Men alle dei store mediehusa er i dag med på leiken.
Det trengst ikkje menneskelege journalistar til dette, for skrivearbeidet vert gjort ved hjelp av uttrekk av fakta frå databasar, algoritmar som lagar tekstar, og presentasjonsverktøy som viser rapportane. Rett nok er det menneske som har laga systema, og ein vaktsjef eller redaktør vil ofte sjå gjennom autonyhenda før publisering, men forteljinga vert faktisk sett saman heilt utan hjelp frå menneske.
Denne typen nyhende er vanlegast for sjangrar som sportsreferat, valresultat og eigedomsnytt. Slike tema er i utgangspunktet velordna, og det er relativt lett å lage dataprogram som handterer dette.
Det dreier seg til dømes om 22 fotballspelarar som deltek i ein aktivitet der ein har data om ei avgrensa mengd hendingar (corner, frispark, scoring, utvising etc.) i ei tidsramme som er gitt på førehand (2 x 45 minutt, eventuelt med ekstraomgangar).
Dagens løysingar for slike automatiske nyhende er basert på at dei dataa som vert brukte, er godt strukturerte. All relevant informasjon kan finnast i ein strukturert database der viktige element i det ein vil skrive, er lagra. Til dømes hendingar, tidspunkt og involverte i ein fotballkamp, eller lokasjon, pris, storleik for eit bustadsal. Slike databasar finst offentleg tilgjengeleg for bustadsal, og på kampar som den som vart nemnd over, er det heilt sikkert folk som sit og registrerer viktige hendingar. VG abonnerer nok på slike hendingsdata og kan derfor bruke desse dataa i den automatiske rapporteringa frå kampen.
Illustrasjon 2 viser forskjellen på datamaskin og menneske. Begge sakene er frå VG tysdag 16. mars. Til venstre ser vi eit automatisk referat frå ein engelsk ligakamp. Setningane gjev ingen ny informasjon utover fakta. Det VG gjer, er å bruke malar for korleis dei skal skrive om ulike hendingar, til dømes har dei sikkert 10–20 måtar å rapportere om eit mål eller eit straffespark på. Straffeskyttaren og annan informasjon vert sett inn på rette plassen i malen. Malen i eksempelet var nok «Mål! X får et straffespark som Y setter i mål på Z. Stillingen er dermed W.» For å få variasjon bruker VG ulike malar for kvart straffespark, utan at det eigentleg er meir informasjon for lesaren.
Til høgre ser vi eit referat frå ein Champions League-kamp laga av ein sportsjournalist. «Sergio Ramos kliner ballen i det venstre hjørnet. Sportiello går rett vei, har høyre handske på ballen, men skuddet er så hardt at det går i mål.» Denne teksten gjev oss ei meir levande skildring av dramaet i denne augneblinken. Avisene vil nok gjerne ha slike tekstar automatisk genererte, men då må dei til med kunstig intelligensbaserte analysar av opptak frå fotballkampen, dei må skjønne kva som skjer, og ikkje minst formulere dette som meiningsfulle setningar.
Kunstig intelligens har enno ikkje nådd eit slikt nivå. Framleis er det berre journalistar som kan greie å skrive slike skildringar. Det er elles ein feil i malen til VGs autojournalistikk: «En av mostanderne synder innenfor sekstenmeteren.» Feilen finst følgjeleg i ei lang rekkje fotballreferat. Den skarpe lesaren vil sjå at også den menneskelege journalisten skriv feil, for det står «handske». Neste gong skriv har han kanskje ein heilt annan feil.
Automatiske artiklar om bustadsal er også noko som vi ser avisene i Schibsted-konsernet. Dei har langt meir komplekse og større artiklar, men også desse er baserte på malar for setningar, som så vert sette saman på smarte måtar til ein artikkel basert på dei dataa dei har.
Dei kan til dømes også rapportere om gjennomsnittsprisar på kjøp og sal av eigedom i eit område. Dei malane som avisene bruker til dette, er ganske statiske og gjev ikkje mykje rom for kreativitet. Heile strukturen er regelbunden og gjev ikkje meir informasjon enn det borgaren sjølv kan finne i databasane. Automatisk nyhendeskriving gjer likevel at slik informasjon vert lettare tilgjengeleg, og det er populært stoff.
Automatisert nyhendeskriving gjer at redaksjonar kan spare tid og krefter ved at dei ikkje lenger treng å skrive referat frå fotballkampar eller skildre utviklinga av ein bestemt aksje på aksjemarknaden. Denne teknologien bidreg også til ein auke i volumet av publiserte historier; det kan skrivast ei sak for kvar einaste fotballkamp, kvart einaste eigedomssal og aksje, noko som ikkje gjekk an før.
Fordi produksjonskostnadene er låge, kan avisene tole at det er svært få lesarar på kvar sak. Det er kanskje nok med eit tital lesarar for at saka er verd å lage.
Lars Nyre
og Bjørnar Tessem
Er du abonnent? Logg på her for å lese vidare.
Digital tilgang til DAG OG TID – heilt utan binding
Prøv ein månad for kr 49.
Deretter kr 199 per månad. Stopp når du vil.
I førre veka kunne VG rapportere frå ein engelsk fotballkamp mellom Derby og Brentford. I sanntidsoppdateringa deira står det: «Mål! Brentford FC får et straffespark som Ivan Toney setter i mål på Pride Park Stadium. Stillingen er dermed 0–1.» Dette ser ut som ein tekst som ein sportsjournalist kunne skrive, men han er faktisk skriven av ein algoritme.
Automatisert nyhendeskriving er i ferd med å verte eit viktig trekk ved nyhendeproduksjonen. Norsk Telegrambyrå (NTB) har truleg kome lengst med slik teknologi i Noreg. Dei har i mange år alt laga automatiserte meldingar om fotballresultat, valresultat og kjøp og sal av eigedom. Men alle dei store mediehusa er i dag med på leiken.
Det trengst ikkje menneskelege journalistar til dette, for skrivearbeidet vert gjort ved hjelp av uttrekk av fakta frå databasar, algoritmar som lagar tekstar, og presentasjonsverktøy som viser rapportane. Rett nok er det menneske som har laga systema, og ein vaktsjef eller redaktør vil ofte sjå gjennom autonyhenda før publisering, men forteljinga vert faktisk sett saman heilt utan hjelp frå menneske.
Denne typen nyhende er vanlegast for sjangrar som sportsreferat, valresultat og eigedomsnytt. Slike tema er i utgangspunktet velordna, og det er relativt lett å lage dataprogram som handterer dette.
Det dreier seg til dømes om 22 fotballspelarar som deltek i ein aktivitet der ein har data om ei avgrensa mengd hendingar (corner, frispark, scoring, utvising etc.) i ei tidsramme som er gitt på førehand (2 x 45 minutt, eventuelt med ekstraomgangar).
Dagens løysingar for slike automatiske nyhende er basert på at dei dataa som vert brukte, er godt strukturerte. All relevant informasjon kan finnast i ein strukturert database der viktige element i det ein vil skrive, er lagra. Til dømes hendingar, tidspunkt og involverte i ein fotballkamp, eller lokasjon, pris, storleik for eit bustadsal. Slike databasar finst offentleg tilgjengeleg for bustadsal, og på kampar som den som vart nemnd over, er det heilt sikkert folk som sit og registrerer viktige hendingar. VG abonnerer nok på slike hendingsdata og kan derfor bruke desse dataa i den automatiske rapporteringa frå kampen.
Illustrasjon 2 viser forskjellen på datamaskin og menneske. Begge sakene er frå VG tysdag 16. mars. Til venstre ser vi eit automatisk referat frå ein engelsk ligakamp. Setningane gjev ingen ny informasjon utover fakta. Det VG gjer, er å bruke malar for korleis dei skal skrive om ulike hendingar, til dømes har dei sikkert 10–20 måtar å rapportere om eit mål eller eit straffespark på. Straffeskyttaren og annan informasjon vert sett inn på rette plassen i malen. Malen i eksempelet var nok «Mål! X får et straffespark som Y setter i mål på Z. Stillingen er dermed W.» For å få variasjon bruker VG ulike malar for kvart straffespark, utan at det eigentleg er meir informasjon for lesaren.
Til høgre ser vi eit referat frå ein Champions League-kamp laga av ein sportsjournalist. «Sergio Ramos kliner ballen i det venstre hjørnet. Sportiello går rett vei, har høyre handske på ballen, men skuddet er så hardt at det går i mål.» Denne teksten gjev oss ei meir levande skildring av dramaet i denne augneblinken. Avisene vil nok gjerne ha slike tekstar automatisk genererte, men då må dei til med kunstig intelligensbaserte analysar av opptak frå fotballkampen, dei må skjønne kva som skjer, og ikkje minst formulere dette som meiningsfulle setningar.
Kunstig intelligens har enno ikkje nådd eit slikt nivå. Framleis er det berre journalistar som kan greie å skrive slike skildringar. Det er elles ein feil i malen til VGs autojournalistikk: «En av mostanderne synder innenfor sekstenmeteren.» Feilen finst følgjeleg i ei lang rekkje fotballreferat. Den skarpe lesaren vil sjå at også den menneskelege journalisten skriv feil, for det står «handske». Neste gong skriv har han kanskje ein heilt annan feil.
Automatiske artiklar om bustadsal er også noko som vi ser avisene i Schibsted-konsernet. Dei har langt meir komplekse og større artiklar, men også desse er baserte på malar for setningar, som så vert sette saman på smarte måtar til ein artikkel basert på dei dataa dei har.
Dei kan til dømes også rapportere om gjennomsnittsprisar på kjøp og sal av eigedom i eit område. Dei malane som avisene bruker til dette, er ganske statiske og gjev ikkje mykje rom for kreativitet. Heile strukturen er regelbunden og gjev ikkje meir informasjon enn det borgaren sjølv kan finne i databasane. Automatisk nyhendeskriving gjer likevel at slik informasjon vert lettare tilgjengeleg, og det er populært stoff.
Automatisert nyhendeskriving gjer at redaksjonar kan spare tid og krefter ved at dei ikkje lenger treng å skrive referat frå fotballkampar eller skildre utviklinga av ein bestemt aksje på aksjemarknaden. Denne teknologien bidreg også til ein auke i volumet av publiserte historier; det kan skrivast ei sak for kvar einaste fotballkamp, kvart einaste eigedomssal og aksje, noko som ikkje gjekk an før.
Fordi produksjonskostnadene er låge, kan avisene tole at det er svært få lesarar på kvar sak. Det er kanskje nok med eit tital lesarar for at saka er verd å lage.
Lars Nyre
og Bjørnar Tessem
Automatisert nyhendeskriving er i ferd med å verte eit viktig trekk ved nyhendeproduksjonen.
Fleire artiklar
Keith Jarrett har med seg bassisten Gary Peacock og trommeslagaren Paul Motian.
Foto: Anne Colavito / Arne Reimer / Jimmy Katz / ECM
Peiskos på første klasse
Keith Jarrett byr på fleire perler frå Deer Head Inn.
Små-ulovleg: Godtet er smått, men er denne reklamen retta mot små eller store menneske? Det kan få alt å seie dersom ei ny forskrift vert vedteken.
Foto: Cornelius Poppe / NTB
«Om høyringsinnspela frå Helsedirektoratet vert inkluderte, risikerer ein å kriminalisere heilt vanleg mat.»
To unge mormonmisjonærar, søster Paxton (Sophie Thatcher) og søster Barnes (Chloe East), blir tvinga til å setje trua si på prøve i møtet med herr Reed (Hugh Grant).
Foto: Ymer Media
«Mange av skrekkfilmane no til dags liknar meir på filmar frå syttitalet»
I tillegg til å vere forfattar er Kristina Leganger Iversen også litteraturvitar, samfunnsdebattant og omsetjar.
Foto: Sara Olivia Sanderud
Nedslåande sanning
Kristina Leganger Iversen leverer eit grundig studium av noko som burde vere opplagt for fleire.
Teikning: May Linn Clement