Sonarproject.nl

  • 1.
    Welkom
    Bij SoNaR
  • 2.
    Win een iPad
    Doe mee!

Welkom bij SoNaR

Deze website gaat over het SoNaR corpus (Stevin Nederlandstalig Referentiecorpus). Een corpus is een verzameling taal. Bij SoNaR gaat het om teksten van geschreven Nederlands en Vlaams. Met dit corpus kunnen onderzoekers gemakkelijk aan een grote hoeveelheid tekst komen voor hun onderzoek. Zo hoeft iedere onderzoeker niet opnieuw teksten te verzamelen, ze te bewerken en toestemming te vragen.

 

De winnaars van de iPads zijn

in België: An Desmet

in Nederland: Paul van Gent.
 

Klik hier voor de foto's


 

Win een iPad 2

De actie is afgelopen op 1 december 2011. De komende week worden de iPads 2 (één in Nederland, één in Vlaanderen) verloot. Houd dus deze website goed in de gaten, als je wilt weten wie de winnaars zijn geworden!

 

Taal is behoorlijk ingewikkeld. Ga maar eens na op hoeveel verschillende manieren jij taal gebruikt in allerlei situaties. Je hebt er jaren over gedaan om dat te leren en je leert nog steeds bij. 
Als je taal wilt leren aan een computer, heb je dus ook heel veel taal nodig. Computers leren bijvoorbeeld vertalen (denk aan Google translate), zinnen maken (spraakcomputers) en jouw tekst voorspellen (T9, Swype).

Je kunt je voorstellen dat tekst uit SMS goede leerstof is voor computers. Die verzamelen wij dan ook in dit project! Zo’n verzameling tekst heet een corpus. Vandaar dus het SoNaR SMS Corpus. Hopelijk wil jij meedoen. En… Je maakt daarmee kans op de iPad 2 die we verloten onder alle inzenders*!

(*alleen inwoners van Nederland en Belgie komen in aanmerking voor deelname aan deze actie)

SoNaR SMS Corpus

Om taal te leren aan een computer, heb je veel taal nodig. Computers leren bijvoorbeeld vertalen (denk aan Google Translate), zinnen maken (spraakcomputers) en jouw tekst voorspellen (T9, Swype). Je kunt je voorstellen dat tekst uit SMS goede leerstof is voor computers. Die verzamelen wij dan ook in dit project. Als jij meedoet door je SMS te doneren, maak je kans op een iPad 2!

Info over SoNaR

Nederlandse woordenboeken, Google Translate, het Groene Boekje, spraakcomputers voor mensen die zelf niet kunnen spreken, voorleesapparatuur voor dyslectici: ze zouden allemaal niet kunnen bestaan zonder taalonderzoek met corpora.
Bij SoNaR gaat het om teksten van geschreven Nederlands en Vlaams. Met dit corpus kunnen onderzoekers gemakkelijk aan een grote hoeveelheid tekst komen voor hun onderzoek. Zo hoeft iedere onderzoeker niet opnieuw teksten te verzamelen, ze te bewerken en toestemming te vragen.

Teksten doneren

SoNaR wordt een databank met minimaal 500 miljoen woorden Nederlands, die onderzoekers kunnen gebruiken voor taalonderzoek. Ook jouw teksten kunnen we gebruiken! Kijk daarvoor op onze donatiepagina.
We verzamelen: artikelen, papers, tijdschriften, verhalen, werkstukken, scripties, sms, tweets, e-mails, brieven, jaarverslagen, rapporten, blogs, websiteteksten, boeken, oraties, columns, profielwerkstukken en alle andere teksten waar jij de eigenaar van bent!