Guía para principiantes sobre "Procesamiento de ficheros de textos en python".
Este libro es una guía básica para principiantes que comienzan en el procesamiento de textos con python. Contiene elementos básicos para la manipulación de textos utilizando las bibliotecas estándar de python, trabajo con cadenas de texto, intercambio de datos con formatos CSV, JSON. Además contiene un capítulo completo de expresiones regulares, así como el trabajo con formatos de marcado como HTML. Posee numerosos ejemplos de como escribir la salida de nuestro programa de procesamiento de textos, análisis gramatical y un último capítulo dedicado a la indexación y búsqueda con la biblioteca python-nucular. Está orientado a ejercicios y gran parte del libro se dedica a explicar la solución de los mismos.
Procesamiento de Lenguaje Natural con Python-NLTK
El libro aborda los problemas de NLP más básicos utilizando la biblioteca estándar de python: NLTK. Tiene ejemplos para cada uno de estos problemas. Algunos de los problemas tratados son: división en segmentos o palabras(tokenización), corrección de palabras, creación de corpus lingüísticos personalizados, POS, extracción de fragmentos, transformación de frases y árboles, clasificación de textos, procesamiento de datasets, y análisis de textos HTML.
Procesamiento de Lenguaje Natural
Es un libro de procesamiento de lenguaje natural con python utilizando python-nltk. Los contenidos que trata son: una introducción al procesamiento de textos con python, cómo acceder a corpus y recursos léxicos, procesamiento de textos en formato RAW, nociones para programar de forma estructurada tus proyectos en este tipo de campo científico. Además dedica capítulos por separado a la categorización y el etiquetado, clasificación de textos, extracción de información, análisis de estructura de la oración, análisis semántico de la oración.
Procesamiento de la semántica de las palabras utilizando Hownet.
Este libro comienza con una introducción a los signficados y formas de representarlos. Puntualiza algunos aspectos históricos de este recurso léxico (Hownet) útil para procesar el idioma inglés y chino. Introduce al lector en los 'sememas' (las unidades más pequeñas del significado). Y posteriormente dedica varios capítulos a la Clasificación Conceptual, Roles Semánticos, Taxonomía, Diccionario de Conocimiento Hownet, Base de Datos de Conocimiento Etiquetado, Análisis de Relaciones en Hownet, Navegar en Hownet, Algoritmos y Software Hownet, ... Se los recomiendo por su valor incalculable para comparar resultados con la BD wordnet.
Usted puede contribuir con Libros UCLV, es importante para nosotros su aporte..
Contribuir