PROCESAMIENTO DEL LENGUAJE NATURAL

icono UNAHUR

¿Qué es?

El procesamiento de lenguaje natural es una rama de las ciencias de la computación y la inteligencia artificial que se centra en brindar a las computadoras la capacidad de interpretar, comprender, manipular e interpretar el lenguaje humano.

La lingüística computacional es una ciencia que estudia los aspectos computacionales del lenguaje humano, mientras que el procesamiento de lenguaje natural es una rama que se concentra en construir artefactos computacionales que entiendan, generen o manipulen el lenguaje humano.

Hay dos subcategorías: comprensión del lenguaje natural (NLU) y generación de lenguaje natural (NLG). NLU se centra en entender la intención comunicativa, significado y contexto del texto en vez del significado individual de las palabras mediante del análisis sintáctico y semántico. Por otra parte, NLG se centra en crear salidas (output) en lenguaje natural, haciendo posible la interacción entre computadoras y humanos.

¿Cómo funciona?

El procesamiento de lenguaje natural combina la lingüística computacional con algoritmos de aprendizaje. La lingüística computacional usa ciencia de datos para analizar el idioma y el habla, incluyendo dos tipos de análisis: sintáctico y semántico.

Análisis sintáctico determina el significado de una palabra, frase u oración analizando la sintaxis de las palabras y aplicando reglas gramaticales preestablecidas. El análisis semántico utiliza el resultado sintáctico para extraer el significado de las palabras e interpretar su significado dentro de la estructura de la oración.

 

El análisis puede ser de dos formas: el análisis de dependencia busca las relaciones entre palabras, como identificar sustantivos y verbos, mientras que el análisis de constituyentes arma un árbol sintáctico: una representación ordenada de la estructura sintáctica de la oración, ayudando a la traducción y reconocimiento del habla.

Scroll al inicio