POR ÁNGEL BARROSO CHICO
SERVICIO DE INFORMÁTICA.
CONSEJERÍA DE DE PRESIDENCIA, ADMINISTRACIÓN PÚBLICA E INTERIOR.
El autor incide en el potencial de los datos que detenta la Administración y defiende la capacidad del capital humano con que cuenta para identificar necesidades y aplicar los resultados de la minería de datos en interés de la ciudadanía
Minería de datos: ¿Qué es?
Hace tiempo – cada vez menos, por aquello del cambio climático y la sobreexplotación – veíamos salir, polvorientas y oxidadas, vagonetas y más vagonetas cargadas con pilas de un negro material llamado carbón (o antracita en su versión más pura). Tras ellas, horas después, una figuras, blanquecinas, agotadas, cansadas, casi famélicas y cubiertas de polvo, salían lenta y apesadumbradamente de esos agujeros oscuros que los conducían al corazón de la madre tierra para extraerla obtener el preciado material que alimentaba los motores, calderas y maquinaria que movía la industria y la economía de su época.
Pues bien, damas y caballeros, esa escena tan costumbrista es precisamente la minería de datos, traslada, salvando las distancias, al moderno mundo digital, el mundo de la cuarta revolución industrial. Si, señores, ni más… ni menos.
Desgranemos ese párrafo trozo a trozo.
En el mundo actual la queramos o no, la información ES poder. Somos unos 46 millones de ciudadanos en España, unos 8,5 millones en Andalucía. Cada uno de nosotros diariamente a lo largo de nuestras interacciones sociales está generando una huella digital bastante numerosa: Interacciones en las redes sociales, interacciones bancarias, interacciones laborales, interacciones sanitarias, interacciones políticas, etc, etc, etc. (he enumerado como poco 5 tipos de interacciones).
Hagamos números: 5 tipos x 365 días x 8,5M de ciudadanos = 15.512,5 millones de interacciones tipo en Andalucía/año como poco, y eso sin considerar que cada tipo de interacción a su vez genera una enorme variedad de información asociada. Dicha información acaba de una manera u otra almacenada en los sistemas informáticos de las distintas entidades con las que interactuamos. En resumen una montaña de datos que procesar.
Esas montañas de antes son ahora los terabytes de datos a procesar que sabemos esconden información fundamental acerca de aspectos importantes y trascendentes para el abanico de múltiples aspectos que interesan a la sociedad.
Los mineros de antaño, polvorientos y tristes, son ahora jóvenes imberbes con aspecto de frikis y ojos saltones, apasionados de la tecla y blancos de no tomar el sol, todo el día delante de una pantalla de ordenador. Las vagonetas de entonces, encargadas de transportar el material extraído, son ahora los sistemas informáticos, computadores y los algoritmos encargados de procesar las enormes bases de datos donde se almacena la información en bruto.
La historia se puede adornar y completar más, pero para no extendernos ni introducir excesiva complejidad en este artículo (les recomiendo la excelente entrada al respecto de la Wikipedia), ciñamonos a una visión más terrenal y pragmática del tema.
Punto de vista del ciudadano.
A estas alturas de la vida estoy absolutamente seguro que todos sabemos que para acceder y utilizar determinadas herramientas de la vida actual debemos dar consentimiento para que determinados sistemas informáticos registren lo que se denomina nuestra “huella digital”. Aún quedan algunas personas, reductos contumaces de una vieja sociedad, que se resiste a concederlo pero, indefectiblemente, tendrán que hacerlo si quieren usar y/o disfrutar de los servicios que la moderna vida digital ofrece (Sanidad, cultura, banca, viajes, prensa, compras, etc).Tanto aceptarlo como no aceptarlo ya indica algo, es registrable, medible y estatizable.
Es sin duda de utilidad para el ciudadano permitir la trazabilidad de sus registros digitales – y lo sabe -. Permite personalizar los contenidos que se les ofrece en función del objetivo que persiguen, y permite a los sistemas informáticos prever ciertas necesidades del mismo. Un ejemplo típico (poner ejemplos permite ilustrar y desmitificar en la práctica el marco teórico/real de algunos conceptos): El hecho estadístico de que en determinadas zonas de costa disfruten de su jubilación personas de cierta edad, permite a los sistemas informáticos de control de almacén (“estocaje” es el término más adecuado, pero… intentemos usar el castellano, por favor) inferir una mayor demanda de medicamentos para el tratamiento de las enfermedades asociadas a dichas zonas, con lo que es posible gestionar con antelación las reservas y/o futuras demandas de ellos. Ello redunda y es percibido como una mejora en la calidad de la atención médica al ciudadano.
A ese mismo ciudadano le consta y tiene la certeza de que cualquiera de sus interacciones sociales deja tras de sí un rastro digital. Sabe de igual forma que es necesario gestionarlo, pero lo que más le preocupa es la confidencialidad del uso y destino de ese rastro, es decir que la información que se registre acerca de su vida y sus intereses sea utilizada tan solo en el ámbito de objeto que se esté registrando, y que dicha información, en muchos aspectos “sensible” no acabe en manos de quien pueda hacer un uso privilegiado de ella si su consentimiento. Tengámoslo muy en cuenta!!!
Por otra parte, en casi todos los casos, los ciudadanos están dispuestos a ceder gratuitamente el uso de sus huellas digitales siempre que se realice anonimizando adecuadamente los parámetros registrados. Todos en alguna ocasión hemos participado en una encuesta digital, pero, sin duda, hemos respondido con más sinceridad y veracidad cuando no se adjunta a ellas nuestros nombres, apellidos, etc, en cuyo caso seguro que ha cruzado por nuestra mente aquello de “¿quién leerá esto?”, “¡tengo que quedar bien!”, lo cual inevitablemente trastoca la “objetividad” (ojo a las comillas, las trataré luego) e imparcialidad de los resultados.
El punto de vista de la administración.
Los organismos especializados en tratamiento de datos estadísticos tienen la capacidad y medios necesarios para procesar la información generada. No está muy lejos del alcance de sus actividades el generar los resultados consecuentes del proceso de minado.
En el artículo “Big Data en la Administración Pública”, y en la línea de lo que he insinuado antes, compañeros de la AA.PP. andaluza avanzan cómo se abre una nueva era de cara a la mejora en la prestación de servicios elaborando modelos predictivos y patrones de comportamiento.
¿En qué se traduce todo ello para la AA.PP? Considero al menos tres aspectos: El político, el técnico y el humano.
El político.
El objetivo de los políticos es o debería ser, conseguir mejorar el estado del bienestar de sus administrados – Una frase muy corta, pero cargada de significado -.
Y, ¿Cómo se consigue ese objetivo?. Pues muy fácil… ¡tomando sabias decisiones!.
Y ¿Cómo se toman sabias decisiones?… Damas, caballeros, ¡ahí está la cuestión!.
Tienen a su alcance las herramientas tecnológicas para la gestión de toma de decisiones basadas en el procedimientos de minería de los datos que ya tienen registrados en sus sistemas informáticos. Ciertamente son sistemas complejos tanto de implementar como de explotar, pero para ello precisamente cuentan con el asesoramiento y personal técnico de los diversos organismos que recopilan la información. Sin embargo es necesario una apuesta firme por ello y por ellos.
Si la toma de decisiones con inteligencia y fundamento (término este último algo culinario pero que bien entendido resulta de lo más útil) se aprovecha de los recursos ya disponibles, fruto de los análisis y resultados obtenidos de los procesos de ingeniería aplicados, todos estamos seguros de que la sociedad percibirá la calidad del servicio que las instituciones públicas les están ofreciendo, lo cual se traduciría, a buen seguro, en un posterior respaldo del electorado.
Eso sí… corresponde al “Político” definir los objetivos, las estrategias, y los enfoques que se les quiera dar al uso dichas herramientas digitales, pues como toda herramienta, carece de utilidad si no se emplea para corregir, reparar y/o mejorar las necesidades del ciudadano. El dato en sí no tiene valor, pero sí su interpretación.
Pero en el gráfico siguiente podemos ver algunos ejemplos del tipos de datos que se podría manejar.
El técnico.
La infraestructura tecnológica que se necesita para el procesamiento de las enormes cantidades de información necesarias para extraer conclusiones de ellos varía en función de los tamaños de las bases de datos a procesar, de la complejidad de las consultas que se pretendan realizar, así como de la velocidad con la que se pretenda elaborar las respuestas.
La elaboración de patrones predictivos a partir de de los enormes volúmenes de datos e información almacenada requiere de herramientas especializadas pero ya las tenemos (RapidMiner, Orange, Kmine, SAS ó IBM Cognos-Analitics), algunas son herramientas de pago pero otras son software libre con lo cual tan solo debemos tomar la decisión de dotarnos de ellas y de la la infraestructura necesaria para su ejecución.
En Andalucía tenemos el entorno ideal para ello en el Centro Informático y Científico de Andalucía (CICA), que dispone de sistemas de computación de alto rendimiento ideales para ello. Un centro bien dotado, en claro proceso de crecimiento y con personal altamente cualificado para proveer de la tecnología software y capacidad de procesamiento imprescindibles para acometer las tareas con solvencia y sin que se les atragante el volumen de información a procesar.
El humano.
Big Data y Minería de datos son una tecnología novedosa y bien fundamentada, pero tras ella están las personas que deben aplicarla y entenderla. Son sin duda herramientas comunes a nivel empresarial que rinden claros beneficios económicos a las estructuras y entidades que se nutren de ella.
Pero es necesario entenderlas, comprenderla e imaginar su potencial alcance. Para ello hay dos opciones: Contratar inteligencia especializada en el mercado externo, o bien – es mi apuesta – formar adecuadamente a los gestores de eso tan comúnmente denominado como “la cosa pública”.
A lo largo de los artículos que ya he publicado vengo insistentemente defendiendo la capacidad humana con la que ya cuenta la administración pública. ¿Quién mejor que los propios gestores de las AA.PP. y su personal adjunto para identificar las necesidades de la administración y sus fuentes de información? ¿Quienes mejor que ellos mismos para entender y aplicar los resultados que la minería de datos produce?.
Muchos de nosotros – mentes inquietas donde las haya – estamos deseosos de contribuir al uso de las nuevas tecnologías en la administración pública. Para ello es sin duda necesario un programa de formación adecuada. Pero más aún a hacer entender a los gestores y políticos que si queremos transformar el modelo productivo Andaluz, tal y como se pregona a los cuatro vientos, es necesario utilizar las herramientas que precisamente se están usando para transformar el mundo (o al menos entender cómo se comporta), después el uso que se haga de esas herramientas está en sus manos.
Es necesario entender que la inversión en cultura y formación a medio plazo redunda en un mejor aprovechamiento de los recursos de cara a la administración de los intereses del ciudadano.
Cabeza???
¿Qué es la cabeza?… ¿Para qué sirve?… son las neuronas, la capacidad de pensar, la capacidad de extraer conclusiones más allá del puro subproducto del arduo trabajo de procesar las montañas de datos necesarios para extraer la mente del yacimiento de los conocimientos.
Allá cada uno con lo que hace con su cabeza y sus pensamientos, pero en el contexto del artículo que estamos tratando, desde el punto de vista de la minería de datos, es… la inteligencia aplicada al cribado y análisis de los enormes flujos de información manejados durante sus procesos implicados.
Se puede resumir en dos palabras: Inteligencia Artificial.
Si, damas y caballeros, cómo usarla es cuestión casi inherente a la minería de datos. Extraer valores estadísticos de la minería es algo relativamente común, pero… lo que el ser humano realiza con relativa facilidad, como inferir conclusiones de ellos e incluso – para mentes privilegiadas – llegar a intuir caminos, recorridos y horizontes, es, para los algoritmos informáticos procesan los datos, una tarea inmensamente compleja.
Para ello se cuenta con la tecnología de las redes neuronales, que entrenadas en el reconocimiento de patrones de datos y alimentadas con la información y dinámicas que interesa tratar para la casuística que se pretende investigar, permite emular el comportamiento de la “mente humana”. Esta, como todos ustedes saben, es capaz de establecer relaciones y crear nuevas ideas, en un proceso casi mágico que ocurre en el interior de nuestros cerebros. Es – la materia gris y sus conexiones y posibilidades – lo que ha hecho evolucionar al ser humano hasta alcanzar el punto en el que nos encontramos ahora, y que trasladado a la la computación electrónica, permite a los ordenadores extraer aquello que entre tanta maraña de datos se nos oculta a la vista, pero que ellos tienen la capacidad de cálculo para procesar y ver, sin la habitual resaca mental que nos produce a los humanos las tareas intensivas de meditación y modelado de respuestas.
Andalucía está poniendo al alcance del interesado diversas iniciativas de formación como los cursos de “Iniciación a Bussiness Intelligence y Big Data” y “Inteligencia Artificial para personas directivas de empresas TIC: Liderando la revolución tecnológica que está transformando la sociedad” de “Andalucía Es Digital”.
¿El Futuro?… Si el cuerpo son los datos y su tratamiento, y la cabeza es la inteligencia artificial, está en combinarlos ambos.
Combinando cuerpo y cabeza.
Creo, mis queridos lectores, que todos ustedes, a estas alturas, son capaces de vislumbrar la incuestionable rentabilidad político/social de mezclar adecuadamente en las proporciones correctas – al estilo de los mejores cocineros de nuestra tierra – la capacidad de procesamiento de los actuales sistemas TIC con la inteligencia bien guiada y entrenada de los algoritmos deductivos que los sistemas de inteligencia artificial ponen a nuestra disposición.
Un ejemplo podría ser “El proyecto Carabela”, que de una colección documental compuesta por 150.000 imágenes (de interés para la arqueología subacuática por el objeto del proyecto) pertenecientes a los fondos del Archivo General de Indias y el Archivo Histórico Provincial de Cádiz, sobre la que se aplicó la nueva metodología de aprendizaje automático que permitió indexar probabilísticamente dentro de los miles de legajos históricos palabras en texto manuscrito, permitiendo, además, realizar búsquedas temáticas sus colecciones masivas de documentos históricos desde diferentes intereses de investigación y/o gestión. De esa manera se pudo, además, localizar e investigar de forma eficaz información sobre los naufragios históricos, así como clasificar los expedientes en base a las diferentes temáticas de su contenido, contribuyendo a proteger ese aspecto de nuestro abundante patrimonio histórico.
Otro interesante proyecto esponsorizado por la Junta de Andalucía y las universidades andaluzas es el que desarrolla la Universidad de Jaén para identificar las emociones en desarrollando un método que reconoce el estado de ánimo de los usuarios de la tan utilizada red social Twitter dirigido a detectar casos de depresión o anorexia (que enlaza con uno de mis artículos previos “Enredando en la Sociedad”), pero que en mi opinión podría extrapolarse para “tomar la temperatura” las emociones de los internautas frente a las propuestas gubernamentales de parlamento andaluz.
Y cómo no mencionar en esta época de pandemia la Convocatoria para proyectos de investigación sobre el SARS-COV-2 y la enfermedad COVID-19, cofinanciados con fondos FEDER, de la Consejería de Transformación Economía, industria, Conocimiento Universidades, que en su apartado f) hace mención explícita del uso de técnicas de inteligencia artificial aplicadas al análisis y control de la enfermedad COVID-19, dado el inmenso volumen de información generada al respecto.
En fin… análisis de patrones económicos, de comportamientos de la masa poblacional turística, de la producción agrícola…Y así cientos de iniciativas que a buen seguro darán los frutos de las combinación inteligente de cuerpo y cabeza.
El Zen de la IA.
La Administración Pública debe buscar sin duda, y con toda certeza mejorar la vida y gobernanza de sus ciudadanos, y para ello cuenta, como he demostrado antes, con la más poderosa herramienta que la tecnología ha puesto a su disposición: La Inteligencia Artificial.
“Comillas”. ¿Antes las mencioné verdad? No crean que lo he olvidado. Hablé de objetividad y de la garantía que la anonimización del dato da el encuestado (tanto a la persona física como jurídica).
Cualquiera cedería sus datos si es para el bien común, pero es igualmente fundamental para conseguir y garantizar con confianza mutua que el administrado o la entidad administrada, origen de la información a tratar, tenga la garantía de que puede ceder sus datos con fines estadísticos sin miedo a ser identificado y señalado como parte del problema, algo que a cualquiera haría sentir, como poco, incómodo – Si… la confianza es algo muy importante para el ser humano.
Para darle un cierre este ensayo, espero haber sido capaz de poner lo suficientemente de manifiesto que, utilizando las herramientas que el cuerpo y la cabeza ponen a nuestra disposición, estas se pueden y deben utilizar para generar políticas y acciones encaminadas a mejorar la interacción mutua para con los ciudadanos, logrando que sean lo más ágiles posibles y den la productividad necesaria y deseada que las nuevas tecnologías pueden facilitar.
Todo lo expuesto en estos párrafo se pude resumir como decía Mahatma Gandi en una frase: “La felicidad se alcanza cuando, lo que uno piensa (IA), lo que uno dice (políticas) y lo que uno hace (datos) están en armonía”
Si te ha gustado este artículo, encontrarás más contenidos interesantes en nuestra sección OPINIÓN.
Y no dejes de ver qué tenemos publicado en los distintos números de EnRed@2.0.