Noticias

Nuevo Deliverable iRead4Skills: Corpus anotados por nivel de complejidad para FR, PT y SP
Nos complace anunciar la publicación del Conjunto de datos 2: corpus anotados por nivel de complejidad para francés (FR), portugués (PT) y español (SP). Este conjunto de datos es una colección de textos categorizados por nivel de complejidad y anotados por características de complejidad, presentados en formato Excel (.xlsx). Los corpus se compilaron y anotaron en el marco de iRead4Skills.
El conjunto de datos 2 procede del conjunto de datos 1: Corpora by Level of Complexity for FR, PT, and SP (DOI: 10.5281/zenodo.10055909), publicado anteriormente y compuesto por textos escritos de diversos géneros y niveles de complejidad. Se seleccionó una muestra de textos del conjunto de datos 1 para su clasificación y anotación, lo que proporcionó datos adicionales y conjuntos de pruebas para los sistemas de análisis de la complejidad en las tres lenguas del proyecto.
Proceso de recogida de datos y anotación
Las tareas de clasificación y anotación se llevaron a cabo mediante una metodología estructurada:
– Los textos se distribuyeron a los Centros de Aprendizaje de Adultos (AL) y de Formación Profesional (FP), donde formadores y estudiantes participaron en las tareas de clasificación.
– La clasificación se realizó a través de la plataforma Qualtrics, lo que garantizó un enfoque estandarizado.
– Los participantes asignaron los textos a uno de los cuatro niveles de complejidad siguientes
- Muy Fácil (140 textos) – Fácilmente comprensibles por todos.
- Fácil (140 textos) – Comprensible para quienes tienen menos de 9 años de escolarización.
- Sencillo (140 textos) – Legible a un nivel de 9º curso.
- Más complejo (42 textos) – Desafiante para personas con un nivel de estudios de 9º grado.
Para más información sobre el proceso de anotación, la descripción de los datos y el acuerdo entre anotadores, consulte la documentación disponible en Zenodo.