Flerkärniga processorers betydelse för statistik

Den tekniska utvecklingen har gjort det enkelt att samla in mycket stora datamängder. Några exempel är stormarknadens scannersystem, texter i elektroniska dokument, eller information som vi själva delar med oss via Facebook och Twitter. Det ställs allt större krav på de statistiska beräkningsmetoder som används för att utvinna information ur de nya datamängderna, och samspelet mellan statistik och datavetenskap har blivit allt viktigare. Parallella beräkningar på flerkärniga datorprocessorer används alltmer inom statistiken och den senaste trenden är att utnyttja de 1000-tals processorkärnor som finns i billiga grafikkort till speldatorer.

Mattias Villani, professor i statistik vid Linköpings universitet, undersöker samspelet mellan modern datorteknik och statistik. Hans inriktning mot den så kallade bayesianska statistiken kräver ofta avancerade datorberäkningar och utvecklingen inom multicore-området, omfattande de flerkärniga processorerna, främjar vidareutveckling av beräkningsmetoder som tillämpas i statistik.

Statistiska beräkningsmodeller
Den bayesianska statistiken har fått stor uppmärksamhet på senare år, och många företag förlitar sig på den här typen av information idag. Ett exempel är statistiska metoder som automatiskt rensar bort skärpmejl. Villani tar rankingssystem på internetsidor som ett ytterligare exempel.
– Säg att ett företag som hyr ut film via internet vill skapa ett automatiskt betygssystem eller ett system som klassificerar filmer. Ett sådant system kan t ex använda information från olika expertrecensioner, men även betyg och textkommentarer från vanliga användare. Med tanke på hur många filmer och användare det finns så talar vi här om en stor komplex datamängd, som delvis består av relativt slarvigt skrivna användarkommentarer. Med hjälp av statistiska beräkningsmodeller kan systemet göra en sammanfattande bedömning. De flerkärniga processorerna gör det möjligt att använda avsevärt mer realistiska modeller som leder till bättre betygssättning.

Multidisciplinär forskning och samverkan
Dagens grafikkort kan omfatta tusentals processorkärnor som arbetar samtidigt.
– Det sker en spännande utveckling i gränslandet mellan statistik och datavetenskap med tillämpning inom en rad olika områden, bland andra medicinteknik och sjukvård, säger Mattias Villani, som själv bedriver ett forskningsprojekt med koppling till medicinteknik.
I projektet undersöker Villanis forskargrupp data från magnetkameror som mäter blodförändringar relaterade till hjärnaktivitet. Magnetkameran återger en sekvens av tre-dimensionella bilder på hur hjärnan arbetar då den löser olika typer av problem, exempelvis matematiska. På så vis kan man få en bild av hur olika delar av hjärnan samverkar vid problemlösning. Varje bild består av ungefär 100000 tre-dimensionella bildpixlar vilket ställer enormt stora krav på de statistiska metoder som används när bilderna ska analyseras, speciellt om analysen ska ske i realtid.
– För att lösa detta problem samarbetar vi bland annat med Anders Eklund vid Virginia Tech som är specialist inom medicinsk bildbehandling och programmering av grafikkort. I forskargruppen ingår också professor Hans Knutsson vid institutionen för medicinsk teknik vid Linköpings universitet och Martin Lindquist vid Johns Hopkins University som forskar inom statistiska metoder för neurovetenskap.
Projektet är ett av många bra exempel på multidisciplinär forskning och samverkan som sker vid Institutionen för datavetenskap på Linköpings universitet.


Utbildning SNL 2013-2 - Affärstidningen Näringsliv

Näringsliv 2013-2

Huvudtema: Utbildning
Sverige mot världen?

I princip dagligen kan vi läsa i dagstidningarna om hur outsourcing och nedskärningar hotar våra svenska företag. Det som kanske inte alltid kommer fram är hur en ökad global konkurrens framförallt hotar den långsiktiga tillgången till framstående kompetens i Sverige.

Back to top