Archivo | febrero, 2017

Eslora

5 Feb

Hoy en día, todos los que nos dedicamos al estudio científico de las lenguas y del lenguaje necesitamos, de un modo u otro, poder contar con corpus fiables en los que falsar nuestras hipótesis. Afortunadamente, en la red cada vez hay más recursos, aunque suelen estar más dirigidos a recursos escritos que orales o multimodales.

El corpus que acabo de descubrir  ha sido elaborado por el Grupo de Gramática del Español de la Universidad de Santiago de Compostela y, como ellos mismos afirman en su página web:

contiene 60 horas de entrevistas semidirigidas y 20 horas de conversaciones de hablantes de Galicia grabadas entre los años 2007 y 2015. Los registros sonoros se transcribieron ortográficamente con alineación texto-voz para facilitar el acceso inmediato al audio desde la transcripción. En el proceso de enriquecimiento del corpus se han desarrollado recursos para la lematización y el etiquetado morfosintáctico de los textos que permiten realizar diversos tipos de búsquedas.

Desde aquí les damos la enhorabuena y os animamos a que lo visitéis: http://galvan.usc.es/eslora

Asimismo, os volvemos a recomendar la excelente página de infoling, a partir de la cual nos hemos informado nosotros: http://www.infoling.org/search/recursos/ID/192#.WJdPcvkrLIU

Anuncios