Skip to main content

Noticias

miércoles, febrero 05, 2025

Nuevo Deliverable iRead4Skills: Corpus anotados por nivel de complejidad para FR, PT y SP

Nos complace anunciar la publicación del Conjunto de datos 2: corpus anotados por nivel de complejidad para francés (FR), portugués (PT) y español (SP). Este conjunto de datos es una colección de textos categorizados por nivel de complejidad y anotados por características de complejidad, presentados en formato Excel (.xlsx). Los corpus se compilaron y anotaron en el marco de iRead4Skills.

El conjunto de datos 2 procede del conjunto de datos 1: Corpora by Level of Complexity for FR, PT, and SP (DOI: 10.5281/zenodo.10055909), publicado anteriormente y compuesto por textos escritos de diversos géneros y niveles de complejidad. Se seleccionó una muestra de textos del conjunto de datos 1 para su clasificación y anotación, lo que proporcionó datos adicionales y conjuntos de pruebas para los sistemas de análisis de la complejidad en las tres lenguas del proyecto.

Proceso de recogida de datos y anotación
Las tareas de clasificación y anotación se llevaron a cabo mediante una metodología estructurada:
– Los textos se distribuyeron a los Centros de Aprendizaje de Adultos (AL) y de Formación Profesional (FP), donde formadores y estudiantes participaron en las tareas de clasificación.
– La clasificación se realizó a través de la plataforma Qualtrics, lo que garantizó un enfoque estandarizado.
– Los participantes asignaron los textos a uno de los cuatro niveles de complejidad siguientes

  • Muy Fácil (140 textos) – Fácilmente comprensibles por todos.
  • Fácil (140 textos) – Comprensible para quienes tienen menos de 9 años de escolarización.
  • Sencillo (140 textos) – Legible a un nivel de 9º curso.
  • Más complejo (42 textos) – Desafiante para personas con un nivel de estudios de 9º grado.

Para más información sobre el proceso de anotación, la descripción de los datos y el acuerdo entre anotadores, consulte la documentación disponible en Zenodo.

Exención de responsabilidad: Los puntos de vista y las opiniones aquí expresados pertenecen únicamente a los autores y no reflejan necesariamente los de la Unión Europea o los de la Agencia Ejecutiva Europea de Investigación. Ni la Unión Europea ni la autoridad otorgante pueden ser considerados responsables de los mismos.

Newsletter
Redes sociales