INSTITUTO CERVANTES
HP dona la tecnología necesaria para el primer buscador panhispánico
Con el proyecto, se creará la mayor base documental viva de la lengua española
EUROPA PRESS
MADRID.-
HP España y el Instituto Cervantes han anunciado la creación del Primer Buscador General Panhispánico para el Centro Virtual Cervantes. Una gran base documental que permitirá, mediante búsquedas 'inteligentes', localizar información cultural de calidad publicada en Internet relacionada con la lengua española.
Gestionada por el personal del Instituto Cervantes y patrocinada por Telefónica, esta fuente de información de la cultura hispana estará disponible para su consulta por parte del público general del Centro Virtual Cervantes en un futuro inmediato.
Para facilitar la ordenación y catalogación de esta información, se desarrollará un potente robot capaz de rastrear en Internet y seleccionar los documentos más relevantes de la cultura y de la lengua española, un sistema para indexar automáticamente los resultados obtenidos y mantener actualizada la información y un sistema para gestionar la clasificación de los contenidos.
Además, como tecnología lingüística de valor añadido, se desarrollarán herramientas para agilizar las búsquedas con filtros semánticos, así como para revisar la morfosintaxis de textos en español y evaluar la calidad del lenguaje en los documentos localizados.
La información catalogada procedente de Internet estará sometida a un proceso constante de actualización y revisión para evitar la presentación de contenidos obsoletos. Además, mediante un sistema de control de versiones, se podrá acceder a datos que, en su día, estuvieron publicados en la Red y después se retiraron.
Módulos
Los principales módulos a desarrollar son un 'metabuscador' o localizador potente de enlaces, que recopilará información relevante incluyendo un sumario de contenidos basado en la propia consulta, que podrá archivarse por el usuario o por tema de catalogación; y una herramienta de catalogación, que facilita las consultas mediante fichas catalográficas, que permite agrupar la información en colecciones y categorías que, según el perfil del usuario, podrá ser copiada, movida, eliminada o dada de alta en el sistema al servicio del gran público.
También habrá un robot o 'crawler' para descargar y actualizar las páginas de cada enlace; y un buscador para atender las consultas de los usuarios del portal que permitirá recuperar información previamente catalogada en el sistema.
Para configurar la infraestructura tecnológica del proyecto del Centro Virtual Cervantes, HP ha donado un potente equipamiento de 'hardware' y 'software' básico asistido por un paquete completo de servicios de soporte. Entre el hardware aportado por HP, destaca un servidor HP Integrity con procesadores Itanium, capaz de ejecutar cuatro sistemas operativos: Windows, Linux, Unix y VMS.
|