ASR para lengua Maya Yucateca (Maayat'aan)

Ajuste fino de facebook/mms-1b-all para reconocimiento automático del habla en Maya Yucateco (Maayat'aan), desarrollado por Enrique Mauricio Carrillo Romero.

Puedes probarlo en el demo de Hugging Face Spaces.

Uso

from transformers import pipeline

asr = pipeline("automatic-speech-recognition", model="mau-cr/mms-maya-yucateco")
result = asr("audio_maya.wav")
print(result["text"])

Se recomienda audio segmentado a nivel de enunciado (2–15 segundos). Para el mejor desempeño, combínalo con el modelo de lenguaje de 3-gramas incluido en el repositorio.

Datos de entrenamiento

El corpus mau-cr/mayan-voice reúne ~ 4 horas de audio en dos subcorpus: grabaciones propias y videos de YouTube (1 hora, mayor diversidad de hablantes) y Narraciones Mayas de Campeche del INALI (3 horas, material narrativo continuo). En total contiene 34,154 palabras, 5,802 únicas, con segmentos de 2 a 15 segundos.

El entrenamiento se hizo de forma incremental, de 20 a 222 minutos en pasos de 20, sobre Google Colab con una A100 SXM4 (80 GB) o RTX PRO 6000 Blackwell.

Resultados

Minutos de entrenamiento WER (sin LM) WER (con LM 3-gramas)
20 ~53% ~24%
120 ~45% ~20%
222 ~40% ~17%

El modelo de lenguaje de 3-gramas aporta hasta 30 puntos porcentuales de mejora, un salto especialmente valioso en escenarios de bajos recursos.

Limitaciones

El corpus tiene un desbalance de género (66.9% voces masculinas, 33.1% femeninas) y el material narrativo está concentrado en pocos hablantes, lo que puede afectar el desempeño en voces femeninas y registros conversacionales.

Recursos

Citación

@misc{carrillo2026maya,
  author      = {Carrillo Romero, Enrique Mauricio},
  title       = {Desarrollo de un corpus de audio en lengua Maya (Maayat'aan) para la implementación de modelos de Inteligencia Artificial orientados a la preservación lingüística},
  year        = {2026},
  institution = {Facultad de Ingeniería, Universidad Autónoma de Yucatán}
}
Downloads last month
100
Safetensors
Model size
1.0B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for mau-cr/mayan_best_model

Finetuned
(413)
this model

Dataset used to train mau-cr/mayan_best_model

Evaluation results