Gezocht op tag(s): Woordfrequentie

JASMIN-spraakcorpus Commercieel

Gemaakt op donderdag 14 december 2017   »Lexica

Een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, bestaande uit voorgelezen tekst en mens-machinedialogen.

Details

Autshumato English-Sesotho sa Leboa Parallel Corpora

Gemaakt op woensdag 30 november -0001   »Lexica

English and Sesotho sa Leboa (Sepedi) parallel corpora aligned on sentence level.

Details

BasiLex-lexicon

Gemaakt op woensdag 30 november -0001   »Lexica

Het BasiLex-lexicon bevat alle lemma's uit het BasiLex-corpus met daaraan toegevoegd extra informatie.

Details

CGN-annotaties

Gemaakt op woensdag 30 november -0001   »Lexica

De CGN-annotaties bevatten het volledig geannoteerde corpus in getranscribeerde vorm.

Details

COREA-coreferentieservice

Gemaakt op woensdag 30 november -0001   »Lexica

Een systeem dat automatisch coreferentiële relaties tussen nominale constituenten in teksten op kan lossen.

Details

Corpus Gesproken Nederlands (CGN)

Gemaakt op woensdag 30 november -0001   »Lexica

Een verzameling van ongeveer 900 uur gesproken Standaardnederlands afkomstig van Vlamingen en Nederlanders.

Details

D-TUNA-corpus

Gemaakt op woensdag 30 november -0001   »Lexica

Het D-TUNA-corpus bestaat uit 2400 geschreven en (getranscribeerde) gesproken referentiële expressies.

Details

DPC - Dutch Parallel Corpus (niet-commercieel)

Gemaakt op woensdag 30 november -0001   »Lexica

Een parallel corpus van 10 miljoen woorden voor de taalparen Nederlands-Engels en Nederlands-Frans.

Details

e-Lex

Gemaakt op woensdag 30 november -0001   »Lexica

Lexicon met ruim 200.000 lemma's en ruim 640.000 woordvormen voorzien van o.a. POS-tag, complementatiepatroon, semantisch type en uitspraakinformatie.

Details

Frequentielijsten Corpora

Gemaakt op woensdag 30 november -0001   »Lexica

De 5000 meest voorkomende woorden uit de Miljoenencorpora, het PAROLE-corpus 2004, het CGN, het ANW-corpus, het Eindhoven Corpus, het D-Coi-corpus en het SoNaR-corpus.

Details

IFA-corpus

Gemaakt op woensdag 30 november -0001   »Lexica

Een database voor fonetisch onderzoek die bestaat uit Nederlandse spraakdata van 8 personen; 4 mannelijk en 4 vrouwelijk.

Details

JASMIN-spraakcorpus

Gemaakt op woensdag 30 november -0001   »Lexica

Een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, bestaande uit voorgelezen tekst en mens-machinedialogen.

Details

Lassy Klein-corpus

Gemaakt op woensdag 30 november -0001   »Lexica

Een syntactisch geannoteerd corpus bestaande uit een miljoen woorden.

Details

Lassy Klein-corpus commercieel

Gemaakt op woensdag 30 november -0001   »Lexica

Een syntactisch geannoteerd corpus bestaande uit 772.000 woorden.

Details

Oudnederlands Woordenboek

Gemaakt op woensdag 30 november -0001   »Lexica

SoNaR Groot-corpus commercieel

Gemaakt op woensdag 30 november -0001   »Lexica

Het SoNaR Groot-corpus Commercieel bevat ruim 271 miljoen woorden en het bevat (standaard) Nederlandstalige teksten van na 1954.

Details

SoNaR-corpus

Gemaakt op woensdag 30 november -0001   »Lexica

Het SoNaR-corpus bevat ruim 500 miljoen woorden en het bevat (standaard) Nederlandstalige teksten van na 1954.

Details