Aktuellt | Språkbanken

Aktuellt

News item 2020-09-30

How reliable is sense disambiguation in texts by native and non-native speakers?

A new blogpost is out.

Blog 2020-09-30

How reliable is sense disambiguation in texts by native and non-native speakers?

(This blog is based on a joint research and publication in collaboration with David Alfter, Therese Lindström Tiedemann, Maisa Lauriala and Daniela Piipponen)

News item 2020-09-29

Välkommen till Nationella språkbankens höstworkshop

Fredagen den 16 oktober arrangerar Nationella språkbanken sin årliga höstworkshop. Värdskapet cirkulerar och i år är det Språkbanken Text på Göteborgs universitet som står som arrangör. Workshoppen, som har arrangerats sedan 2011, är vid det här laget en väletablerad företeelse och det kommer bli en heldag med språkteknologisk och språkvetenskaplig forskning i fokus.

News item 2020-09-15

Workshop on Digital Literacy

Last week, Nina Tahmasebi, Associate Professor in NLP at Språkbanken Text, gave a workshop in digital methods and digital text for the competency development course in Digital Literacy for humanities and social science researchers in Denmark.

News item 2020-09-15

Workshop i digitala metoder och digital text

I förra veckan gav Nina Tahmasebi, docent i språkteknologi vid Språkbanken Text, en workshop i digitala metoder och digital text inom ramen för forskarkursen i Digital Literacy för humaniora och samhällsvetenskap.

News item 2020-09-12

Så kan språkteknologi stärka små språk

I slutet av augusti arrangerade Isof med hjälp av Språkbanken Sam en digital heldag med föreläsningar om språkteknologi och dess betydelse för de små

News item 2020-09-04

New post in our blog: "Grierson’s “Linguistic Survey of India” as open-access digital data resource for studying languages of South Asia"

To Språkbanksbloggen

Blog 2020-09-01

Grierson’s “Linguistic Survey of India” as open-access digital data resource for studying languages of South Asia

Lars Borin, Anju Saxena, Shafqat Mumtaz Virk, Bernard Comrie

South Asia – comprising the seven countries Pakistan, India, Nepal, Bhutan, Bangladesh, Sri Lank

News item 2020-08-14

Språkbanken Text deltar i ett projekt om utvärdering av svenska språkmodeller

Språkbanken Text har tillsammans med Kungliga Biblioteket, forskningsinstitutet RISE och AI Innovation of Sweden beviljats projektmedel från Vinnova för projektet "SuperLim: en svensk testmängd för språkmodeller" (2020-2021).

News item 2020-07-03

Pretrained models for tagging and parsing Swedish are released

Språkbanken releases pretrained models for POS tagging and dependency parsing of Swedish texts, as well as a list of available Swedish embeddings

News item 2020-06-23

Syntaktisk annotering för språkteknologisk och språkvetenskaplig forskning

Läs i vår blogg om en syntaktisk beskrivningsmodell för modern svensk text.

Blog 2020-06-18

En syntaktisk beskrivningsmodell för modern svensk text

Sverige har en relativt lång tradition av att skapa en typ av korpus som brukar kallas trädbank. En trädbank är en samling texter som har annoterats (märkts upp) med ordklasser och syntaktisk struktur.

News item 2020-06-18

2nd Workshop on Computational Detection of Language Change @SLTC2020 Gothenburg, Sweden

Språkbanken Text is organizing a workshop on computational detection of language change @SLTC2020, Gothenburg, in November.

News item 2020-06-18

2nd Workshop on Computational Detection of Language Change @SLTC2020 Gothenburg, Sweden

Språkbanken Text organiserar en workshop om språkförändringar under årets SLTC2020 i Göteborg, i november.

News item 2020-06-18

Korp searches in Second Language data

Korp offers a lot of different corpus collections for various types of search (and research). Swedish as a Second Language (L2) is one of the subcategories of the language that can be studied with the help of Korp. At the moment, Korp provides access to five L2 corpora through its interface. Read more in this blog post by NLP researcher Elena Volodina.

Blog 2020-06-17

Korp searches in Second Language data

News item 2020-06-10

A blogpost about the history of Talbanken

Read our new blogpost about five different versions of Talbanken, one of the most important Swedish corpora, and about how not to confuse them

News item 2020-06-10

Språkbanken Texts terminsworkshop

- Kan artificiell intelligens ändra lagstiftningen? Det var en av forskningsfrågorna som presenterades vid Språkbanken Texts interna workshop den 8/6.

Blog 2020-06-09

The five lives of Talbanken

This post is about Talbanken, one of the most widely used and important Swedish corpora. There exist at least five versions of this treebank, and the purpose of this post is to reduce ambiguity of the name "Talbanken", which sometimes leads to confusion. I am going to list the five versions, explain the basic differences between them and suggest unambiguous version names.

News item 2020-06-08

Snart premiär för ny svensk diakronisk korpus

Svenskan har länge saknat en diakronisk korpus, det vill säga en digitaliserad samling texter som sträcker sig över lång tid. Men nu arbetar Eva Pettersson, datorlingvist vid Uppsala universitet, med att ta fram en textsamling på flera miljarder ord som kommer röra sig från fornsvenska till nutid.