Nytt verkyg trollar fram mer relevant innehåll

Med hjälp av ett utvecklingsprojekt om ordvektorer har man på Yle och NRK försokt hitta framtida verktyg till att rekommendera innehåll för publiken.

Av: Michaela von Kügelgen

Att erbjuda det mest relevanta innehållet, när användaren klickar på en länk, var målet för ett samarbetsprojekt mellan Yle och NRK.”Det var ett research- och utvecklingsprojekt för att testa maskininlärningstekniker för rekommendationslogik”, berättar Trond Johansen från NRK.

På NRK har man jobbat med artiklar och på Yle med radioinnehåll, men i bägge fallen handlar det om att hitta verktyg för att i framtiden kunna rekommendera ännu bättre innehåll för publiken.

Samarbetet har främstfokuserat på ordvektorer, en teknik som utvecklats under 2010-talet och som därför kräver en hel del lärande och testande. Aleksi Rossi från Yle förklarar att ordvektorer ärsom koordinater.

”En vektor är som ett läge i rymden. Alla ord får egna koordinater som placeras på en flerdimensionell karta där liknande ord hamnar nära varandra.

”Vektorerna placerar alltså orden på flera olika axlar och försöker hitta likheter och relevant innehåll. ”Om till exempel en artikel innehåller många räkneord och politiska termer kan man anta att det handlar om ekonomisk politik, och då försöker man med hjälp av vektorerna hitta liknande innehåll”, berättar Rossi.

”IT-världen full avöverraskningar”
Fastän det finns en stark samarbetstradition inom Nordvision ställer det tekniska samarbetet annorlunda krav. Enligt Aleksi Rossi är det viktigt att ha en tydlig plan, men en väldigt spikad plan kan också leda till att man inte kan utforska sådant man stöter på under arbetets gång.

”Ofta finns det en tanke om att vi gör allt så som vi kommit överens om, men IT-världen är full av överraskningar. Därför borde samarbetet bli smidigare”, säger Aleksi Rossi. Han anser ändå att fördelarna med samarbete är större än utmaningarna. ”Det var fint att vi fick testa samarbetet och jag hoppas vi får göra det mycket mer i fortsättningen.

”Allt i projektet gick ändå inte helt friktionsfritt. NRK försökte bland annat utnyttja Yles kod på sin data, vilket visade sig vara komplicerat och tidskrävande. Johansen tycker ändå att erfarenheterna med ordvektortekniken är viktiga med tanke på framtiden.

”Att förstå dess möjligheter och begränsningar och vad som behövs för att kunna ta tekniken i bruk. NRK jobbar med att etablera en produktionslinje för tematiska rekommendationer där den här tekniken utnyttjas, så samarbetsprojektet har varit en nyttig start för oss.”

Aleksi Rossi påpekar att det är tidskrävande att ta fram nya tekniska lösningar men att samarbetet kring ordvektorer var lovande och kan användas också på andra områden än rekommendationer.

”Tekniken kunde vara till nytta för till exempel bättre automatisk moderering av webbkommentarer.”