Un mes després ja començàvem a conèixer de prop les conseqüències… És només un cas d’aplicació, molt rellevant, de les noves possibilitats d’obtenció de coneixement a través de l’anomenat Processament del Llenguatge Natural, PLN, o NLP en les seves sigles en anglès.

Processament del Llenguatge Natural

El PLN és un subcamp de la intel·ligència artificial que se centra en l’ús de la informàtica per processar i analitzar el llenguatge humà. Aquest tipus d’informació, denominada “no estructurada”, és generada des de moltes fonts diferents, i és molt més complexa de recollir, processar i emmagatzemar.

I el cert és que gran part de la informació que fem servir no és numèrica precisament, i per això les empreses estan interessades a extreure coneixement d’una multitud de fonts que ara comencen a

ser molt accessibles.

Això està estimulant el desenvolupament dels serveis cognitius, que no són sinó tota una sèrie d’eines de tractament d’informació com el text, però també la veu, les imatges, els vídeos, etc. Els serveis cloud d’Amazon, Microsoft i Google ja ofereixen solucions “paquetitzades” per a aquest tipus d’anàlisi.

En el cas del llenguatge, ja resulta senzill convertir veu en text, o capturar text de tot tipus de publicacions a internet, i processar-lo a gran velocitat amb tècniques estadístiques per saber de què s’està parlant. El recent desenvolupament de les tècniques de Deep Learning, entrenades amb grans sitges d’informació com la Viquipèdia, està permetent el processament en brut de qualsevol conjunt de documents amb resultats sorprenents tant en resultats com en capacitat de computació necessària.

Big Data i gesti ó d’in versions

I és que, si ajuntem l’explosió del Big Data, és a dir, la capacitat de poder gestionar àgilment grandíssims volums de dades, juntament amb aquestes tècniques d’anàlisi estadística, el potencial de coneixement augmenta exponencialment en camps que es nodreixen precisament d’informació la majoria de les vegades qualitativa.

Cada any, empreses de tot el món generen enormes volums de dades no numèriques, en forma d’informes anuals, previsions trimestrals de benefici, publicacions en xarxes socials, declaracions de directius, valoracions de clients, etc. Unint les creixents aplicacions de PLN en la gestió d’inversions i les tècniques d’aprenentatge automàtic -machine learning-, és relativament senzill identificar tendències, i d’aquesta manera ajudar els gestors d’inversions a predir millor l’impacte en empreses específiques i en el mercat en general.

Anàlisi de sentiment

Entre les aplicacions del PLN en gestió d’inversions, una de les més subtils tracta el sentiment implícit en els textos i la seva evolució temporal. Es pot analitzar tant la informació emesa des d’una empresa com els discursos i declaracions dels seus directius i detectar un canvi en els sentiments en funció del to de text o discurs. Per exemple, Prattle, una start-up nord-americana, proporciona anàlisis predictives i informes d’investigació automatitzats sobre les comunicacions d’unes 3.000 empreses i 15 bancs centrals (inclosa la Reserva Federal). Prattle avalua el llenguatge utilitzat pels bancs centrals i els converteix en dades quantitatives que projecten els resultats de les polítiques. Prattle ha pronosticat resultats a partir de l’habitual llenguatge subtil del governador d’un banc central.

Topic Modeling

El Topic Modeling té l’objectiu de resumir un conjunt de textos en uns quants temes que els humans poden comprendre fàcilment i que poden fer-se servir per a l’anàlisi en aplicacions estadístiques i d’aprenentatge automàtic. Per exemple, els gestors de cartera a Goldman Sachs utilitzen PLN per analitzar quins temes ha tractat la direcció de les empreses en les declaracions trimestrals de previsió de beneficis de cada trimestre en comparació amb els de l’anterior, i d’aquesta manera analitzar possibles tendències o canvis substancials que puguin ser significatius en la presa de decisions d’inversió.

Reporting

Les màquines treballen amb dades per a l’anàlisi, però les persones requereixen informes basats en l’idioma per comprendre aquesta anàlisi. El PLN és capaç de reduir aquesta bretxa. Narrative Science és una empresa de Chicago que està automatitzant la redacció d’informes amb el seu software Quill. Aquest software de generació de llenguatge natural recull les dades i després segueix el mateix procés que prendria un analista per escriure un informe. Credit Suisse utilitza Quill per millorar un dels seus productes d’investigació d’inversions, HOLT. Quill ha ajudat Credit Suisse a millorar la cobertura, la qualitat i la coherència de la investigació d’inversions.

Són només tres exemples de com s’estan utilitzant aquestes tècniques, però si els resulta una mica sorprenent, tornin a provar el traductor automàtic del seu buscador preferit, o fixin-se en l’assistent d’escriptura predictiva en el seu mòbil… Fins i tot aquest mateix article es podria haver generat amb un algoritme de PLN… Es podria?