Un mes después ya empezábamos a conocer de cerca las consecuencias... Es sólo un caso de aplicación, muy relevante, de las nuevas posibilidades de obtención de conocimiento a través del llamado Procesamiento del Lenguaje Natural, PLN, o NLP en sus siglas en inglés.

Procesamiento del Lenguaje Natural

El PLN es un subcampo de la inteligencia artificial que se centra en el uso de la informática para procesar y analizar el lenguaje humano. Este tipo de información, denominada "no estructurada", es generada desde muchas fuentes diferentes, y es mucho más compleja de recoger, procesar y almacenar. Y lo cierto es que la mayor parte de la información que manejamos no es numérica precisamente, y por ello las empresas están interesadas en extraer conocimiento de una multitud de fuentes que ahora empiezan a ser muy accesibles. Esto está estimulando el desarrollo de los servicios cognitivos, que no son sino toda una serie de herramientas de tratamiento de información como el texto, pero también la voz, las imágenes, los videos, etc. Los servicios cloud de Amazon, Microsoft y Google ya ofrecen soluciones "paquetizadas" para este tipo de análisis. En el caso del lenguaje, ya resulta sencillo convertir voz en texto, o capturar texto de todo tipo de publicaciones en internet, y procesarlo a gran velocidad con técnicas estadísticas para saber de qué se está hablando. El reciente desarrollo de las técnicas de Deep Learning, entrenadas con grandes silos de información como Wikipedia, está permitiendo el procesamiento en bruto de cualquier conjunto de documentos con resultados sorprendentes tanto en resultados como en capacidad de computación necesaria.

Big-Data y gestión de inversiones

Y es que, si juntamos la explosión del Big Data, es decir, la capacidad de poder gestionar ágilmente grandísimos volúmenes de datos, junto a estas técnicas de análisis estadístico, el potencial de conocimiento aumenta exponencialmente en campos que se nutren precisamente de información la mayoría de las veces cualitativa. Cada año, empresas por todo el mundo generan enormes volúmenes de datos no numéricos, en forma de informes anuales, previsiones trimestrales de beneficio, publicaciones en redes sociales, declaraciones de directivos, valoraciones de clientes, etc. Uniendo las crecientes aplicaciones de PLN en la gestión de inversiones y las técnicas de aprendizaje automático -machine learning-, es relativamente sencillo identificar tendencias, y de ese modo ayudar a los gestores de inversiones a predecir mejor el impacto en empresas específicas y en el mercado en general.

Análisis de sentimiento

Entre las aplicaciones del PLN en gestión de inversiones, una de las más sutiles trata el sentimiento implícito en los textos y su evolución temporal. Se puede analizar tanto la información emitida desde una empresa como los discursos y declaraciones de sus directivos y detectar un cambio en los sentimientos en función del tono de texto o discurso. Por ejemplo, Prattle, una start up estadounidense, proporciona análisis predictivos e informes de investigación automatizados sobre las comunicaciones de unas 3.000 empresas y 15 bancos centrales (incluida la Reserva Federal). Prattle evalúa el lenguaje utilizado por los bancos centrales y los convierte en datos cuantitativos que proyectan los resultados de las políticas. Prattle ha pronosticado resultados a partir del habitual lenguaje sutil del gobernador de un banco central.

Topic Modeling

El Topic Modeling busca resumir un conjunto de textos en unos pocos temas que los humanos pueden comprender fácilmente y que pueden usarse para el análisis en aplicaciones estadísticas y de aprendizaje automático. Por ejemplo, los gestores de cartera en Goldman Sachs usan PLN para analizar qué temas ha tratado la dirección de las empresas en las declaraciones trimestrales de previsión de beneficios de cada trimestre en comparación con los del anterior, y así analizar posibles tendencias o cambios sustanciales que puedan ser significativos en la toma de decisiones de inversión.

Reporting

Las máquinas trabajan con datos para el análisis, pero las personas requieren informes basados en el idioma para comprender ese análisis. El PLN es capaz de reducir esta brecha. Narrative Science es una empresa Chicago que está automatizando la redacción de informes con su software Quill. Este software de generación de lenguaje natural recoge los datos y luego sigue el mismo proceso que tomaría un analista para escribir un informe. Credit Suisse utiliza Quill para mejorar uno de sus productos de investigación de inversiones, HOLT. Quill ha ayudado a Credit Suisse a mejorar la cobertura, la calidad y la coherencia de la investigación de inversiones. Son sólo tres ejemplos de cómo se están utilizando estas técnicas, pero si les resulta un poco sorprendente, vuelvan a probar el traductor automático de su buscador preferido, o fíjense en el asistente de escritura predictiva en su móvil€ Incluso este mismo artículo podría haberse generado con un algoritmo de PLN... ¿podría?.