Gezocht op tag(s): Corpus

JASMIN-spraakcorpus Commercieel

Gemaakt op donderdag 14 december 2017   »Lexica

Een verzameling van circa 115 uur Nederlandse spraak van jongeren, anderstaligen en senioren, bestaande uit voorgelezen tekst en mens-machinedialogen.

Details

Afrikaans Genre Classification Corpus

Gemaakt op woensdag 30 november -0001   »Lexica

This language resource contains training and testing data for genre classification for Afrikaans.

Details

AUTONOMATA-namencorpus

Gemaakt op woensdag 30 november -0001   »Lexica

Een database van in totaal circa 5.000 voorgelezen voornamen, achternamen, straatnamen, plaatsnamen en controlewoorden.

Details

AUTONOMATA-POI-corpus

Gemaakt op woensdag 30 november -0001   »Lexica

Het corpus is een database van 800 voorgelezen Points-Of-Interest (POI's) uit Nederland en België, bestaande uit namen van restaurants, hotels, campings, cafés etc.

Details

Autshumato Afrikaans-English Translation Memory

Gemaakt op woensdag 30 november -0001   »Lexica

Translation memory from Afrikaans to English (EN-GB), in the government domain for use in the Autshumato ITE application.

Details

Autshumato English-Afrikaans Parallel Corpora

Gemaakt op woensdag 30 november -0001   »Lexica

English and Afrikaans parallel corpora aligned on sentence level.

Details

Autshumato English-Afrikaans Translation Memory

Gemaakt op woensdag 30 november -0001   »Lexica

Translation memory from English (EN-GB) to Afrikaans, in the government domain for use in the Autshumato ITE application.

Details

Autshumato English-isiZulu Parallel Corpora

Gemaakt op woensdag 30 november -0001   »Lexica

English and isiZulu parallel corpora aligned on sentence level.

Details

Autshumato English-isiZulu Translation Memory

Gemaakt op woensdag 30 november -0001   »Lexica

Translation memory from English (EN-GB) to isiZulu, in the government domain for use in the Autshumato ITE application.

Details

Autshumato English-Sesotho sa Leboa Parallel Corpora

Gemaakt op woensdag 30 november -0001   »Lexica

English and Sesotho sa Leboa (Sepedi) parallel corpora aligned on sentence level.

Details

Autshumato isiZulu-English Translation Memory

Gemaakt op woensdag 30 november -0001   »Lexica

Translation memory from IsiZulu to English (EN-GB), in the government domain for use in the Autshumato ITE application.

Details

Autshumato Sesotho sa Leboa-English Translation Memory

Gemaakt op woensdag 30 november -0001   »Lexica

Translation memory from Sesotho sa Leboa to English (EN-GB), in the government domain for use in the Autshumato ITE application.

Details

BasiLex-corpus

Gemaakt op woensdag 30 november -0001   »Lexica

Het BasiLex-corpus is een geannoteerde verzameling van teksten geschreven voor kinderen in de basisschoolleeftijd.

Details

CD-ROM Middelnederlands

Gemaakt op woensdag 30 november -0001   »Lexica

Cd-rom Middelnederlands (verschenen in 1998): bevat het Middelnederlands Woordenboek, de teksten van het Corpus Gysseling en een collectie van bijna 300 rijm- en prozateksten.

Details

CGN-annotaties

Gemaakt op woensdag 30 november -0001   »Lexica

De CGN-annotaties bevatten het volledig geannoteerde corpus in getranscribeerde vorm.

Details

CHOREC-spraakcorpus

Gemaakt op woensdag 30 november -0001   »Lexica

Een verzameling van 130 uur voorgelezen kinderspraak.

Details

COREA-coreferentiecorpus

Gemaakt op woensdag 30 november -0001   »Lexica

Het corpus bestaat uit Nederlandse teksten waarin coreferentierelaties systematisch gemarkeerd zijn.

Details

Corpus Gesproken Nederlands (CGN)

Gemaakt op woensdag 30 november -0001   »Lexica

Een verzameling van ongeveer 900 uur gesproken Standaardnederlands afkomstig van Vlamingen en Nederlanders.

Details

Corpus Gysseling

Gemaakt op woensdag 30 november -0001   »Lexica

Een verzameling van alle dertiende-eeuwse teksten die als bronnenmateriaal hebben gediend voor het Vroegmiddelnederlands Woordenboek.

Details

Corpus Hedendaags Nederlands

Gemaakt op woensdag 30 november -0001   »Lexica

Een tekstverzameling van meer dan 800.000 teksten uit kranten, tijdschriften, journaaluitzendingen en juridisch materiaal (1814-2013). Het corpus is een samenvoeging van het oude 5, 27 en 38 Miljoen Woorden Corpus en het PAROLE Corpus, aangevuld met krant

Details