¿Qué es CLARIN?

CLARIN (Common Language Resources and Technologies) es un proyecto de colaboración europea a gran escala para dar acceso genérico a grandes bancos de datos lingüísticos (textos, grabaciones multimedia, diccionarios, etc.), así como a los instrumentos de análisis y explotación de estos datos (segmentadores, etiquetadores, analizadores sintácticos, etc.), mediante la utilización de tecnologías de la información y las comunicaciones.

Para ello implementará en una estructura de red Grid, y gracias a tecnología de servicios web y de web semántica, una única interfaz de acceso a datos y a los instrumentos de análisis, así como a los procesadores y otros servicios necesarios. Esta interfaz facilitará su uso a investigadores de diferentes ámbitos de humanidades y ciencias sociales sin necesidad de conocimientos sobre las tecnologías implicadas.


Planificación de CLARIN

  • 2008-2010 – Fase preparatoria: planificación detallada con una estimación de costes reales de la infrastructura propuesta; definición de uso de la red; definición de centros, recursos y tecnología que aseguren su mantenimiento de forma estable.
  • 2011-2015 – Construcción de CLARIN: integración de recursos y tecnología, desarrollo de aplicaciones piloto.
  • 2016-... – Mantenimiento y explotación de CLARIN: desarrollo de aplicaciones

Fase preparatoria CLARIN en España

El desarrollo de la fase preparatoria de ámbito español tiene tres grandes objetivos:

  1. Identificación, formación y coordinación de usuarios y proveedores a partir de los cuales se crearán comunidades para la identificación de sus necesidades en España.
  2. Construcción de una maqueta de la infrastructura basada en arquitectura Grid, orientada a servicios (SOA).
  3. Informe de planificación detallada y una evaluación realista de los costes de despliegue de la infrastructura en España.