Ingeniero Técnico de Telecomunicaciones e Ingeniero Electrónico por la Universidad de Valladolid, así es Cesar. Lleva desde el año 2000 trabajando junto con Telefónica I+D y es experto en Big Data Technologies: Hadoop, Hive, Sqoop, Flume, Análisis de datos con python, R, Spark, Nutch, Solr
Además, es Co-líder de la Comunidad de Datos Globales de Telefónica (Onlife Data) con más de 2 000 BI inscritos para la transformación de Telefónica en una empresa Data Driven.
¿Cómo se puede rentabilizar el Big Data?
La entrevista
Cuéntanos cómo fueron tus inicios y por qué acabaste trabajando en este sector.
Si te refieres al sector de las Telecomunicaciones, estudié para ello y conseguí terminar la carrera, así que se puede decir que me gustó lo que aprendí. Más adelante tener la oportunidad de entrar a trabajar en Telefónica y además en mi ciudad era cumplir un auténtico sueño desde estudiante, tuve la suerte de cumplirlo y seguir aquí feliz después de casi 18 años. Con respecto al Big Data, pues aquí he de decir que en un principio eligieron por mí. Hace unos diez años surgió una necesidad en mi empresa de conocer más y mejor acerca de nuestros clientes y crearon una pequeña unidad que a lo largo de los años y adaptándose a las nuevas tecnologías de procesamiento de datos derivó después de muchas transformaciones y ampliaciones en nuestra actual oficina del dato.
Y aunque como bien digo, no fue algo que yo pidiera, desde el principio me enganchó y hasta la fecha he disfrutado mucho de ello.
Una de las principales claves del éxito de las plataformas Big Data es la utilización de software libre en sus principales herramientas
Trata de definir con una palabra el término Big Data.
Posibilidad de llegar a tener “Conocimiento” a partir de grandes cantidades de datos e información
¿Cómo es posible la interpretación de tantos datos a través del Big Data?
Esta posibilidad la da la tecnología. Era un paso natural, que no fácil, llegar a almacenar y procesar la información que se genera actualmente a un ritmo tremendo, pero estamos en la era del conocimiento compartido facilitado principalmente por Internet, hay mucha gente en el mundo trabajando para llegar a conseguir un mismo objetivo y en este caso se ha conseguido. Y es que una de las principales claves del éxito de las plataformas Big Data es la utilización de software libre en sus principales herramientas.
Por otra parte ya había un trabajo previo de analítica de datos con técnicas muy potentes desarrolladas durante años y científicos de datos que eran capaz de aplicarlas para obtener modelos predictivos de Machine Learning sobre volúmenes de datos convencionales. Muchos de ellos han sido capaces de adaptarse al Big Data para escalar su trabajo hasta otro nivel posibilitando un aprovechamiento rápido de las nuevas posibilidades que nos ofrece el Big Data.
Se habla que actualmente las empresas manejan demasiada información personal ¿Qué tan espiados estamos? ¿Qué cosas de nosotros se pueden saber de un momento a otro?
En la mayoría de los casos, y estoy hablando de empresas serias, como Telefónica, manejan los datos, que, de una manera u otra, nosotros como usuarios o clientes permitimos. Es bastante corriente, y me incluyo personalmente, no leer lo que estamos concediendo de nuestra información a las compañías con las que tenemos algún tipo de acuerdo, ya sea gratuito o no. En muchas ocasiones probablemente no nos importe, pues nos interesa el servicio que nos ofrecen y es por esto que no prestamos mucha atención a lo que aceptamos.
Por otra parte, no soy partidario de utilizar la palabra espiar pues me parece que tiene connotaciones bastante negativas. Si las compañías son éticas y respetuosas con el tratamiento de los datos que tienen de sus clientes, cuentan con su consentimiento y se ciñen a la utilización de esa información en el contexto de su negocio creo que es una forma de fortalecer y mejorar la relación entre las dos partes en un clima de confianza.
Respondiendo a la última pregunta, más que importarnos que es lo que puedan saber de nosotros creo que habría que preocuparse precisamente del uso que hagan de eso que saben, porque obviamente los avances tecnológicos hacen que la información que se tenga de las personas sea mayor cada vez y sin duda que seguirá creciendo.
El Big Data ofrece la posibilidad de llegar a tener “Conocimiento” a partir de grandes cantidades de datos e información
¿Cuál es el mayor reto tecnológico que afronta el Big Data?
Para mí uno de los retos, no sé si el mayor, es integrar de manera rápida y sencilla los datos con los que ya cuentan las compañías en sistemas antiguos en “data lakes” donde se puedan combinar también con nuevos datos y que se pueda acceder a todo ello de una manera uniforme. Relacionado con esto, es que al calor del Big Data han surgido innumerables empresas (startups sobre todo) ofreciendo cada una sus propias soluciones y aunque en algunos casos hay claros referentes en otros hay demasiada dispersión tecnológica que permita decidirse más o menos fácilmente por las mejores soluciones sin tener que perder mucho tiempo en pruebas.
En un futuro cercano, ¿Cuáles crees que serán los avances en la adquisición, tratamiento y análisis de datos?
Desde un criterio muy personal creo que la adquisición de datos en tiempo real, herramientas de tratamiento y transformación de esos datos adquiridos capaces de ser mucho más automáticas y autónomas en las operaciones de limpieza, formateado, homogenización y normalización de la información y en cuestiones de análisis, algoritmos de Machine Learning distribuidos y Deep Learning sobre hardware que permita procesamiento intensivo (GPUs).
Por último, un consejo para los futuros profesionales del Máster en Big Data.
El consejo es que si les llama la atención este mundo y quieren trabajar en algo relacionado con los datos que se suban a este tren cuanto antes. Ahora es el momento por razones obvias, es la profesión de moda, y cuanto antes comiencen a desempeñar este tipo de tareas, antes empezarán a tomar más conocimiento real de las mismas e irán ganando ese bagaje práctico tan necesario para ir adquiriendo experiencia que les permita irse adaptando con mayor facilidad a los continuos cambios tecnológicos que afectan a esta apasionante profesión de los Científicos de Datos.