Aktuellt

Aktuellt

News item 2020-05-29

The Swedish treebank Eukalyptus has been released in a new version

The Swedish treebank Eukalyptus consists of a collection of contemporary Swedish texts from five different genres of close to 100 000 Words. Eukalyptus has now been released in a new version.

News item 2020-05-29

Den svenska trädbanken Eukalyptus har släppts i en ny version

Den svenska trädbanken Eukalyptus består av en samling av moderna svenska texter från fem olika genrer om sammanlagt nära 100 000 ord. Eukalyptus har nu släppts i en ny version.

Blog 2020-05-29

Om ordklasser för svenska språket

Ordklassindelning används i många språkteknologiska verktyg därför att det är ett sätt att skilja mellan olika användningar av ett ord. Genom ordklasserna kan man enklare söka efter liknande ord och uttryck i stora textmängder, eller skapa en ny text med liknande form.

News item 2020-05-29

Läs i Språkbanksbloggen om temamodeller - en av många metoder som finns för att utvinna kunskap eller information ur stora textmängder

Temamodeller är vanliga inom digitala studier av stora textmängder och används flitigt inom digital humaniora, i detta tredje avsnitt om en data-intensiv forskningsmetodologi diskuterar vi möjligheterna och begränsningarna med denna metod som forskningsverktyg.

Blog 2020-05-28

En topic modell bland andra – En data-intensiv forskningsmetodologi 3

Temamodeller är vanliga inom digitala studier av stora textmängder och används flitigt inom digital humaniora, i detta avsnitt diskuterar vi möjligheterna och begränsningarna med denna metod.

News item 2020-05-28

Referensdata för utvärdering av OCR

Två nya resurser för utvärdering av OCR finns nu tillgängliga för nedladdning hos Språkbanken Text.

News item 2020-05-07

Nytt blogginlägg om text som forskningsdata

Nu finns det ett nytt blogginlägg om text som forskningsdata – En data-intensiv forskningsmetodologi 2. I förra avsnittet pratade vi om den data-intensiva forskningsmetodologin. I detta avsnitt fortsätter vi med att prata om stora textmängder som ligger till grund för kunskapsutvinning.

Blog 2020-05-07

Text som forskningsdata – En data-intensiv forskningsmetodologi 2

I detta avsnitt pratar vi om stora textmängder som ligger till grund för kunskapsutvinning och vad för typer av frågor som kan besvaras med hjälp av stora digitala textmängder.

News item 2020-05-04

Common Pitfalls in the Development of ICALL Applications

Elena Volodina writes about the process of developing NLP-based applications for second language learning in Språkbanksbloggen.

News item 2020-05-04

Sommarjobbare ska hjälpa demensforskningen

Dimitrios Kokkinakis, forskare vid Språkbanken, institutionen för svenska språket har tilldelats ett stipendium på 80 000 SEK från Demensförbundet. Stipendiet ska användas till att segmentera och transkribera flera hundra ljudinspelningar. Resultatet kommer att vara underlag för att studera hur man i språket kan upptäcka tidiga tecken på demens. Nu ska ett antal sommarjobbare rekryteras för att genomföra transkriptionerna.

Blog 2020-04-30

Common Pitfalls in the Development of ICALL Applications

This blog is a piece of opinion where I sketch the process of developing NLP-based applications for second language learning and look at the process from the point of view of typical (mis)conceptions and challenges, as I have experienced them.

News item 2020-04-22

Språkbanken bidrar till nya sätt att tillgängliggöra KB:s samlingar

Tillsammans med Kungliga bibliotekets (KB) nystartade datalabb kommer Språkbanken Text att bidra till att tillgängliggöra delar av KB:s samlingar. – Samarbetet innebär mycket goda nyheter för digital humaniora och samhällsforskning i Sverige, säger Love Börjesson, verksamhetsledare för KB-labb.

News item 2020-04-20

Blogginlägg om data-intensiv forskningsmetodologi

Nu finns det ett nytt inlägg på Språkbanksbloggen om data-intensiv forskningsmetodologi.

Blog 2020-04-20

En data-intensiv forskningsmetodologi 1

I en värld där AI tar en allt större plats har datadriven forskning blivit orden på allas läppar. I det här blogginlägget tänkte jag prata lite om vad det innebär att forska med hjälp av stora mängder textdata, primärt inom humaniora.

News item 2020-04-08

A multilingual corpus of the world's language descriptions

Language descriptions are documents containing valuable information on the world's natural languages and their diversity. In this blog, we report a multilingual corpus of thousands of such documents annotated with a number of meta, lexical, and syntactical attributes.

Blog 2020-04-07

The Swedish treebank Eukalyptus has been released in a new version

Den svenska trädbanken Eukalyptus har släppts i en ny version

Om ordklasser för svenska språket

Läs i Språkbanksbloggen om temamodeller - en av många metoder som finns för att utvinna kunskap eller information ur stora textmängder

En topic modell bland andra – En data-intensiv forskningsmetodologi 3

Referensdata för utvärdering av OCR

Nytt blogginlägg om text som forskningsdata

Text som forskningsdata – En data-intensiv forskningsmetodologi 2

Common Pitfalls in the Development of ICALL Applications

Sommarjobbare ska hjälpa demensforskningen

Common Pitfalls in the Development of ICALL Applications

Språkbanken bidrar till nya sätt att tillgängliggöra KB:s samlingar

Blogginlägg om data-intensiv forskningsmetodologi

En data-intensiv forskningsmetodologi 1

A multilingual corpus of the world's language descriptions

A multilingual annotated corpus of world's natural language descriptions

Fula ordboken i Karp

Nytt inlägg på bloggen

Zipfs lag på svenska

Can we bring meaning to words using only the information stored in text?