«El Centro de Investigación Federal de San Petersburgo
de la Academia Rusa de Ciencias» (CSP ARC)
WiVo
Los especialistas del Instituto de Informática y Automatización de San Petersburgo de la Academia Rusa de Ciencias (http://www.spiiras.nw.ru/, Laboratorio de Automatización de la Investigación https://sial.iias.spb.su) elaboraron un conjunto de bibliotecas de programas informáticos para el procesamiento de textos en lenguaje natural utilizando un enfoque asociativo-ontológico.
Los módulos de software para el procesamiento de textos en lenguaje natural están diseñados para resolver las tareas de:
- la carga única de contenido de los sitios de Internet o la vigilancia continua de los sitios de Internet;
- búsqueda asociativa de textos y clasificación temática de los textos;;
- evaluación de la calidad de los textos, de la filtración de materiales publicitarios y de los textos generados automáticamente;
- construcción de un texto abstracto;
- la construcción de un mapa gráfico de un área temática determinada
- preprocesamiento de los textos en lenguaje natural para resolver problemas de búsqueda de contenidos, formación de un índice de búsqueda y posterior procesamiento en sistemas analíticos.
El principal rasgo distintivo del enfoque asociativo es la organización de la búsqueda de documentos que cumplan la condición de enlaces semánticos en el documento entre todas las palabras de la consulta de búsqueda.
El marco está orientado ante todo a desarrollar los sistemas de búsqueda especializada, los sistemas de vigilancia de noticias y los agregadores de noticias, los sistemas de vigilancia del contenido y la sistemas información e analíticos.
La vigilancia de la Internet permite identificar los recursos del contenido requerido, así como determinar las cuestiones pertinentes, según la comunidad de la Internet.
La vigilancia del flujo de documentos internos permite incluir operativamente todos los documentos de reciente creación en la base de datos de búsqueda para una búsqueda rápida de documentos separados y todos los documentos relacionados con ellos por tema o por enlaces.