Skip to main content

Aktuellt

News item

The Swedish treebank Eukalyptus has been released in a new version

The Swedish treebank Eukalyptus consists of a collection of contemporary Swedish texts from five different genres of close to 100 000 Words. Eukalyptus has now been released in a new version.
News item

Den svenska trädbanken Eukalyptus har släppts i en ny version

Den svenska trädbanken Eukalyptus består av en samling av moderna svenska texter från fem olika genrer om sammanlagt nära 100 000 ord. Eukalyptus har nu släppts i en ny version.
Blog

Om ordklasser för svenska språket

Ordklassindelning används i många språkteknologiska verktyg därför att det är ett sätt att skilja mellan olika användningar av ett ord. Genom ordklasserna kan man enklare söka efter liknande ord och uttryck i stora textmängder, eller skapa en ny text med liknande form.

News item

Läs i Språkbanksbloggen om temamodeller - en av många metoder som finns för att utvinna kunskap eller information ur stora textmängder

Temamodeller är vanliga inom digitala studier av stora textmängder och används flitigt inom digital humaniora, i detta tredje avsnitt om en data-intensiv forskningsmetodologi diskuterar vi möjligheterna och begränsningarna med denna metod som forskningsverktyg.
Blog

En topic modell bland andra – En data-intensiv forskningsmetodologi 3

Temamodeller är vanliga inom digitala studier av stora textmängder och används flitigt inom digital humaniora, i detta avsnitt diskuterar vi möjligheterna och begränsningarna med denna metod.
News item

Referensdata för utvärdering av OCR

Två nya resurser för utvärdering av OCR finns nu tillgängliga för nedladdning hos Språkbanken Text.
News item

Nytt blogginlägg om text som forskningsdata

Nu finns det ett nytt blogginlägg om text som forskningsdata – En data-intensiv forskningsmetodologi 2. I förra avsnittet pratade vi om den data-intensiva forskningsmetodologin. I detta avsnitt fortsätter vi med att prata om stora textmängder som ligger till grund för kunskapsutvinning.
Blog

Text som forskningsdata – En data-intensiv forskningsmetodologi 2

I detta avsnitt pratar vi om stora textmängder som ligger till grund för kunskapsutvinning och vad för typer av frågor som kan besvaras med hjälp av stora digitala textmängder.
News item

Common Pitfalls in the Development of ICALL Applications

Elena Volodina writes about the process of developing NLP-based applications for second language learning in Språkbanksbloggen.
News item

Sommarjobbare ska hjälpa demensforskningen

Dimitrios Kokkinakis, forskare vid Språkbanken, institutionen för svenska språket har tilldelats ett stipendium på 80 000 SEK från Demensförbundet. Stipendiet ska användas till att segmentera och transkribera flera hundra ljudinspelningar. Resultatet kommer att vara underlag för att studera hur man i språket kan upptäcka tidiga tecken på demens. Nu ska ett antal sommarjobbare rekryteras för att genomföra transkriptionerna.
Blog

Common Pitfalls in the Development of ICALL Applications

This blog is a piece of opinion where I sketch the process of developing NLP-based applications for second language learning and look at the process from the point of view of typical (mis)conceptions and challenges, as I have experienced them.

News item

Språkbanken bidrar till nya sätt att tillgängliggöra KB:s samlingar

Tillsammans med Kungliga bibliotekets (KB) nystartade datalabb kommer Språkbanken Text att bidra till att tillgängliggöra delar av KB:s samlingar. – Samarbetet innebär mycket goda nyheter för digital humaniora och samhällsforskning i Sverige, säger Love Börjesson, verksamhetsledare för KB-labb.
News item

Blogginlägg om data-intensiv forskningsmetodologi

Nu finns det ett nytt inlägg på Språkbanksbloggen om data-intensiv forskningsmetodologi.
Blog

En data-intensiv forskningsmetodologi 1

I en värld där AI tar en allt större plats har datadriven forskning blivit orden på allas läppar. I det här blogginlägget tänkte jag prata lite om vad det innebär att forska med hjälp av stora mängder textdata, primärt inom humaniora.

News item

A multilingual corpus of the world's language descriptions

Language descriptions are documents containing valuable information on the world's natural languages and their diversity. In this blog, we report a multilingual corpus of thousands of such documents annotated with a number of meta, lexical, and syntactical attributes.
Blog

A multilingual annotated corpus of world's natural language descriptions

Shafqat Mumtaz Virk, Harald Hammarström, Markus Forsberg, Søren Wichmann

News item

Fula ordboken i Karp

Nu finns Bengt G Dagrins "Fula ordboken" sökbar hos Språkbanken.
News item

Nytt inlägg på bloggen

Zipfs lag, uppkallad efter den amerikanske lingvisten George Kingsley Zipf, säger att ett ords frekvens är omvänt proportionellt mot dess plats i en frekvenslista. Vad innebär det?
Blog

Zipfs lag på svenska

Vad säger Zipfs lag, och hur fungerar den på svenska språket?
News item

Can we bring meaning to words using only the information stored in text?

Nina Tahmasebi, associate Professor at Språkbanken at the University of Gothenburg, writes about "Meaning through sensory data" on Språkbanksbloggen: