Notizen, Kassette und weitere Materialien

270.857 Tokens in Sprachkorpora

Kalenderwoche 28
Zum Projekt
Projekt des Monats INEL
INEL im Podcast „Wissenschaft als Kompass“
Zur Reihe "Zahl der Woche"

270.857 ist die Zahl der Tokens (das ist die Bezeichnung für ein Wort im laufenden Text im Korpus), die inzwischen im INEL-Projekt in Sprachkorpora, also Sprachdatensammlungen, veröffentlich wurden – und es werden noch mehr! INEL steht dabei für Indigenous Northern Eurasian Languages – das Langzeitforschungsprojekt der Akademie der Wissenschaften in Hamburg hat zum Ziel, Grammatiken, Korpora und Sprachtechnologie für indigene nordeurasische Sprachen aufzufinden, zu erschließen und vor allem in Form von Sprachkorpora zu veröffentlichen.

Bisher wurden Korpora zum Selkupischen, Kamassischen, Ewenkischen und Dolganischen veröffentlicht. All diese Sprachen wurden oder werden in Nordeurasien gesprochen. Selkupisch und Kamassisch gehören zur uralischen Sprachfamilie, bei Ewenkisch handelt es sich um eine tungusische Sprache und Dolganisch ist eine Turksprache.

Korpora erlauben Forschenden verschiedener Disziplinen sich mit den Daten auseinanderzusetzen und empirisch fundierte Analysen aus variierenden Blickwinkeln unter unterschiedlichsten Fragestellungen durchzuführen.

Akademienunion

Organisation

Ausschreibung

Kontakt

Forschung

Projekt des Monats März | Vom Palmblatt zur Forschungsplattform: Hinduistische Tempellegenden in Südindien

Videoreihe

Kontakt

Veranstaltungen

Aktuell

Veranstaltungen

Kontakt

Publikationen

Aktuelle Stellungnahmen

Kohlenstoffmanagement integriert denken: Anforderungen an eine Gesamtstrategie aus CCS, CCU und CDR

ESYS Publikationen ins Englische übersetzt

Zum Akademienprogramm

Publikation zu musikwissenschaftlichen Projekten im Akademienprogramm

Kontakt

Presse

Aktuell

„Sind wir noch bei Sinnen? - Hören" im Podcast Zeitfragen von Deutschlandfunk Kultur

Newsletter

Presseverteiler

270.857 Tokens in Sprachkorpora

Kalenderwoche 28