Aunque el término ‘científico de datos’ ha sido acuñado para hablar de una nueva ocupación que se destaca por ser una de las mejor pagas, por haber sido considerada la profesión más ‘sexi’ del siglo XXI y la de mayor potencial en el mundo tecnológico de hoy, en realidad los observadores del cielo han estado haciendo big data desde hace miles de años.
Los antiguos astrónomos ya manejaban cantidades de datos denominados catálogos astronómicos. La famosa constelación de Scorpius (el escorpión) fue identificada y bautizada hace más de 5.000 años.
Durante mucho tiempo, el ojo fue el principal instrumento para observar posiciones, movimientos y características de miles de cuerpos en el firmamento.
Hoy, avanzados telescopios y satélites pueden recopilar una abrumadora cantidad de información sobre nuestro entorno cósmico.
Descubrir los secretos del universo implica no solo gran capacidad de observación y recopilación, sino también avanzados algoritmos para analizar la colosal cantidad de información que nos permita hacer estadística, descubrir patrones y llegar a conclusiones sobre el comportamiento del cosmos. Es justamente lo que hace la ciencia de los datos (data science) hoy, algo en lo que empresas de muchos campos han visto un jugoso mercado, a través de los datos que los usuarios comparten por internet.
Si se observa con detenimiento a Scorpius se podrá apreciar una estrella roja brillante en su corazón. Es la estrella supergigante Antares, también conocida por su nombre de origen árabe Kalb al Akrab (el corazón del escorpión.)
Gracias a la información recopilada de estrellas en diferentes etapas evolutivas, de desarrollos matemáticos y de modelos sofisticados, podemos predecir el futuro de esta supergigante: su muerte explosiva en una supernova. El desafío consiste en seguir recopilando y analizando información de diferentes rincones del cosmos, con mejores instrumentos, con algoritmos de análisis más robustos y con computadores más potentes.
La ciencia de los datos, trascendental para nuestra actual sociedad –a diario se generan casi 3 trillones de bytes de datos–lo será también para ahondar en el conocimiento del origen y el destino de nuestro universo.