Skip to main content

Aktuellt

Blog

How reliable is sense disambiguation in texts by native and non-native speakers?

(This blog is based on a joint research and publication in collaboration with David Alfter, Therese Lindström Tiedemann, Maisa Lauriala and Daniela Piipponen)

News item

Välkommen till Nationella språkbankens höstworkshop

Fredagen den 16 oktober arrangerar Nationella språkbanken sin årliga höstworkshop. Värdskapet cirkulerar och i år är det Språkbanken Text på Göteborgs universitet som står som arrangör. Workshoppen, som har arrangerats sedan 2011, är vid det här laget en väletablerad företeelse och det kommer bli en heldag med språkteknologisk och språkvetenskaplig forskning i fokus.
News item

Workshop on Digital Literacy

Last week, Nina Tahmasebi, Associate Professor in NLP at Språkbanken Text, gave a workshop in digital methods and digital text for the competency development course in Digital Literacy for humanities and social science researchers in Denmark.
News item

Workshop i digitala metoder och digital text

I förra veckan gav Nina Tahmasebi, docent i språkteknologi vid Språkbanken Text, en workshop i digitala metoder och digital text inom ramen för forskarkursen i Digital Literacy för humaniora och samhällsvetenskap.
News item

Så kan språkteknologi stärka små språk

I slutet av augusti arrangerade Isof med hjälp av Språkbanken Sam en digital heldag med föreläsningar om språkteknologi och dess betydelse för de små

Blog

Grierson’s “Linguistic Survey of India” as open-access digital data resource for studying languages of South Asia

Lars Borin, Anju Saxena, Shafqat Mumtaz Virk, Bernard Comrie

South Asia – comprising the seven countries Pakistan, India, Nepal, Bhutan, Bangladesh, Sri Lank

News item

Språkbanken Text deltar i ett projekt om utvärdering av svenska språkmodeller

Språkbanken Text har tillsammans med Kungliga Biblioteket, forskningsinstitutet RISE och AI Innovation of Sweden beviljats projektmedel från Vinnova för projektet "SuperLim: en svensk testmängd för språkmodeller" (2020-2021).
News item

Pretrained models for tagging and parsing Swedish are released

Språkbanken releases pretrained models for POS tagging and dependency parsing of Swedish texts, as well as a list of available Swedish embeddings
News item

Syntaktisk annotering för språkteknologisk och språkvetenskaplig forskning

Läs i vår blogg om en syntaktisk beskrivningsmodell för modern svensk text.
Blog

En syntaktisk beskrivningsmodell för modern svensk text

Sverige har en relativt lång tradition av att skapa en typ av korpus som brukar kallas trädbank. En trädbank är en samling texter som har annoterats (märkts upp) med ordklasser och syntaktisk struktur.

News item

2nd Workshop on Computational Detection of Language Change @SLTC2020 Gothenburg, Sweden

Språkbanken Text is organizing a workshop on computational detection of language change @SLTC2020, Gothenburg, in November.
News item

2nd Workshop on Computational Detection of Language Change @SLTC2020 Gothenburg, Sweden

Språkbanken Text organiserar en workshop om språkförändringar under årets SLTC2020 i Göteborg, i november.
News item

Korp searches in Second Language data

Korp offers a lot of different corpus collections for various types of search (and research). Swedish as a Second Language (L2) is one of the subcategories of the language that can be studied with the help of Korp. At the moment, Korp provides access to five L2 corpora through its interface. Read more in this blog post by NLP researcher Elena Volodina.
Blog

Korp searches in Second Language data

Korp offers a lot of different corpus collections for various types of search (and research). Swedish as a Second Language (L2) is one of the subcategories of the language that can be studied with the help of Korp.

News item

A blogpost about the history of Talbanken

Read our new blogpost about five different versions of Talbanken, one of the most important Swedish corpora, and about how not to confuse them
News item

Språkbanken Texts terminsworkshop

- Kan artificiell intelligens ändra lagstiftningen? Det var en av forskningsfrågorna som presenterades vid Språkbanken Texts interna workshop den 8/6.
Blog

The five lives of Talbanken

This post is about Talbanken, one of the most widely used and important Swedish corpora. There exist at least five versions of this treebank, and the purpose of this post is to reduce ambiguity of the name "Talbanken", which sometimes leads to confusion. I am going to list the five versions, explain the basic differences between them and suggest unambiguous version names.
News item

Snart premiär för ny svensk diakronisk korpus

Svenskan har länge saknat en diakronisk korpus, det vill säga en digitaliserad samling texter som sträcker sig över lång tid. Men nu arbetar Eva Pettersson, datorlingvist vid Uppsala universitet, med att ta fram en textsamling på flera miljarder ord som kommer röra sig från fornsvenska till nutid.