License:
CC BY-NC-ND 4.0
Steward:
CommunityDataset ID:
cmqt5xc4l07xwnr07l227et8j
Task: NLP
Release Date: 6/25/2026
Format: MOV, TSV
Size: 42.81 GB
Share
La muestra representa la variante de Lengua de Señas Mexicana (LSM) utilizada por una persona sorda usuaria de LSM del estado de Querétaro, México. Los datos fueron obtenidos mediante grabaciones de video de narraciones, experiencias personales, descripciones, temas familiares, escolares, laborales, deportivos y actividades de la vida cotidiana. El material se presenta en formato de video digital acompañado de glosas en español para facilitar su análisis lingüístico. La recopilación fue realizada mediante sesiones de grabación estructuradas con producción espontánea y semiespontánea de enunciados en LSM. Tamaño de la muestra: aproximadamente 5 horas de video grabado y 892 enunciados en glosa y traducción a español.
Licensing
Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International
https://creativecommons.org/licenses/by-nc-nd/4.0/Restrictions/Special Constraints
El conjunto de datos está destinado exclusivamente para fines de investigación, documentación lingüística, educación y desarrollo de tecnologías accesibles relacionadas con la Lengua de Señas Mexicana (LSM). No se autoriza el uso de los datos para fines comerciales, publicitarios, biométricos, de vigilancia, reconocimiento de identidad personal o cualquier otro uso ajeno a los objetivos de investigación y accesibilidad. El acceso al conjunto de datos podrá estar sujeto a autorización previa del responsable del proyecto. Los usuarios deberán respetar los derechos de autor, la privacidad de los participantes y las condiciones de uso establecidas por el repositorio o plataforma de publicación.
Forbidden Usage
- Uso comercial o lucrativo sin autorización expresa del responsable del conjunto de datos. - Venta, redistribución o sublicenciamiento de los archivos originales. - Uso para identificación biométrica, reconocimiento facial o vigilancia de personas. - Uso para actividades discriminatorias, ofensivas o que perjudiquen a la comunidad sorda. - Modificación, alteración o manipulación de los datos que pueda generar interpretaciones engañosas sobre el contenido original. - Publicación o difusión de los videos en plataformas públicas sin autorización correspondiente. - Uso de los datos con fines distintos a la investigación, educación, documentación lingüística o desarrollo de tecnologías accesibles relacionadas con la Lengua de Señas Mexicana (LSM).
Ethical Review
El conjunto de datos fue creado mediante grabaciones originales realizadas por el propio autor, quien participó voluntariamente en todas las sesiones de grabación. Se contó con consentimiento informado para la recopilación, almacenamiento, procesamiento y publicación de los datos con fines de investigación, documentación lingüística, educación y desarrollo de tecnologías accesibles relacionadas con la Lengua de Señas Mexicana (LSM). Durante la recopilación se procuró proteger la integridad de la información, documentar adecuadamente los metadatos y establecer condiciones de uso y licencia para evitar usos no autorizados. No participaron terceros como sujetos de investigación ni se recopilaron datos personales sensibles de otras personas.
Intended Use
- Investigación lingüística sobre la Lengua de Señas Mexicana (LSM). - Documentación y preservación de la LSM y sus variantes regionales. - Elaboración de corpus lingüísticos para estudios académicos. - Desarrollo de tecnologías accesibles para la comunidad sorda. - Entrenamiento y evaluación de sistemas de reconocimiento automático de señas. - Desarrollo de sistemas de traducción entre LSM y español. - Generación de recursos educativos para la enseñanza y aprendizaje de LSM. - Análisis de vocabulario, gramática y estructura discursiva de la LSM. - Creación de materiales de accesibilidad e inclusión. - Desarrollo y evaluación de modelos de inteligencia artificial, visión por computadora y procesamiento de lenguas de señas. - Investigación en interacción humano-computadora aplicada a usuarios de lengua de señas.
Los datos fueron obtenidos mediante grabaciones originales en video realizadas por una persona sorda usuaria de la Lengua de Señas Mexicana (LSM) del estado de Querétaro, México. La recopilación consistió en la producción de enunciados, narraciones, descripciones y experiencias personales sobre diversos temas, incluyendo vida cotidiana, familia, educación, trabajo, deporte, recreación y cultura.
Las grabaciones se realizaron en formato digital de video (MOV), procurando mantener una buena visibilidad de las señas, expresiones faciales y movimientos corporales. Cada video fue asociado a una glosa en español para facilitar su identificación, organización y análisis lingüístico.
Posibles variaciones naturales en la ejecución de las señas debido a diferencias de velocidad, énfasis, expresividad o contexto comunicativo.
Presencia de variación lingüística propia de la Lengua de Señas Mexicana (LSM), incluyendo preferencias personales o regionales.
Diferencias en la duración de los videos y en la complejidad de los enunciados.
Posibles inconsistencias menores en las glosas, derivadas de la interpretación y representación escrita de una lengua viso-gestual.
Variaciones en las condiciones de grabación, tales como iluminación, fondo o posición de la cámara.
El conjunto de datos corresponde principalmente a un solo participante, por lo que no representa toda la diversidad lingüística de la comunidad usuaria de LSM.
Algunos temas pueden estar más representados que otros debido a la naturaleza de las grabaciones realizadas.