Si bien muchos de los primeros modelos de idiomas grandes se entrenaron predominantemente con datos del idioma inglés, el campo está evolucionando rápidamente. Los modelos más nuevos se entrenan cada vez más en conjuntos de datos multilingües y hay un enfoque cada vez mayor en el desarrollo de modelos específicos para los idiomas del mundo.