Archivo GELED: Muestra general de audios del cuicateco

Description

Corpus de 3 horas de audio transcrito de diferentes comunidades de habla cuicateca. Respecto de la clasificación del INALI, la muestra cubre de manera más extensa la variante del cuicateco del centro (San Juan Tepeuxila, Santos Reyes Pápalo, San Lorenzo Pápalo), seguida de la del norte (San Andrés Teotilálpam) y en menor medida del oriente (Colonia Constitución). Las transcripciones empleadas siguen una representación fonética estrecha. Los materiales forman pare del archivo recopilado por el Grupo de Estudio de la Lengua Dibaku (GELED).

Specifics

Licensing

Creative Commons Attribution Non Commercial Share Alike 4.0 International (CC-BY-NC-SA-4.0)

https://spdx.org/licenses/CC-BY-NC-SA-4.0.html

Considerations

Restrictions/Special Constraints

Los usuarios no pertenecientes a las comunidades de habla cuicateca que busquen desarrollar tecnologías usando estos datos deberán contactar a los creadores del conjunto de datos para informar sobre el uso que se les dará. Esto facilitará coordinar esfuerzos entorno a los desarrollos prioritarios y el vinculo directo con las comunidades.

El corpus contiene una muestra de la diversidad lingüística del cuicateco en diferentes comunidades de la región Cañada, Oaxaca, en la voz de hablantes de ambos sexos de diferentes rangos etarios. Se compone principalmente de léxico, frases y algunas oraciones.
Los materiales forman parte del archivo recopilado por Grupo de Estudio de la Lengua Dibaku (GELED) del Instituto de Investigaciones Antropológicas, UNAM. De las grabaciones originales en donde se elicitaron listas de palabras, frases y oraciones por traducción directa, se realizó una selección de las emisiones más claras, se transcribieron fonéticamente en PRAAT y se extrajo la transcripción y su fragmento del audio correspondiente.

El conjunto de datos deben procesarse para una normalización ortográfica o fonémica. Dado que es un registro fonético, puede que no se hayan capturado todos los lindes de palabra correspondientes. En una futura versión de este conjunto se incorporará la normalización de las representaciones y se expandirá el numero de horas procesadas.

Archivo GELED: Muestra general de audios del cuicateco

Description

Specifics

Considerations

Processes

Metadata