Ciencia de Datos, Estadística y Otras Bestias.

Hace unos días, mi querida @AnaBayes abrió una interesante conversación sobre lo que representa la ciencia de datos actualmente y su relación con la estadística.

Con bastante razón, esta bayesiana hasta el tuétano se queja amargamente de que ciertos términos se estén utilizando alegremente, por cuestiones más marketinianas que científicas y, por si fuera poco, dejando fuera de la discusión a la materia que ella ama: la estadística.

¿Es justa esa queja? ¿Es un problema mejorable o una tendencia inevitable? ¿Es posible que los conceptos convivan en armonía? (qué fino me ha quedado)

Empecemos por el principio

Yo soy Informático. Ingeniero de Software, para ser más exactos. Todo lo que observo lo termino convirtiendo de manera casi automática en procesos automatizados y flujos de información. Bolitas, cajitas, muñegotes y flechitas. Todo muy determinista y cuadriculado.

Desde hace 15 años, tengo la gran suerte de poder aplicar esos métodos en el ámbito de la investigación científica y biomédica.

Consciente de que la estadística era fundamental para mi desempeño, acepté la oferta de mi querido Joan Guardia primero de unirme a la Societat Catalana d'Estadística y luego de mejorar mi conocimiento en la materia de la mejor forma que puede hacerse: enseñándola en ESADE y en Euncet.

Pero ahí no acaba la cosa: un buen día se me ocurre pegar todas esas piezas para darle una aplicación de negocio clara y, después de formarme en EADA, me da por emprender con Butler Scientifics.

La idea: volcar mi experiencia en investigación científica, mi conocimiento en estadística, informática e ingeniería de software y mi habilidad para comunicar en ayudar a los equipos biomédicos a explorar sus datos de forma más efectiva.

¿Ves por dónde voy?

La especialización y la integración

Ana se define como “Estadística casi por todas partes”. Es una crack. Una experta. Se formó en matemáticas y un día se enamoró de la estadística. Trabaja con equipos multidisciplinares que lo flipas. Es una maravilla y un placer seguirla en su cuenta de Twitter.

Pero hay much@s otros profesionales (entre los que me incluyo) que necesitamos aunar muchas habilidades en la misma persona por cuestiones puramente productivas y de efectividad.

Vale… no somos expertos en todo pero sí en al menos una de las áreas. Y en el resto podemos desempeñar suficientemente bien siempre y cuando:

  • Conozcamos y aceptemos nuestras limitaciones

  • Busquemos el apoyo de expertos (como Ana)

  • Intentemos mejorar de forma continua

Obviamente eso forma parte de la actitud de cada uno y siempre habrá científic@s de datos que se autodenominen como tal aún teniendo un conocimiento muy bajo en todas las áreas.

¡Contra ell@s no debe haber piedad! (vale, me estoy pasando :)

Pero al resto nos gustaría que seguir llamándonos científicos de datos porque justamente combinamos la actitud científica con el expertise en la gestión de datos.

I+D+i … rentable

Estoy seguro de que todos aceptamos ya la idea de que la cadena productiva de la investigación, el desarrollo y la innovación no puede quedarse dentro de las paredes de las universidades y centros públicos.

Ha habido muchas iniciativas para transferir todo ese conocimiento al mercado. Algunas con más éxito que otras.

Creo en la figura del científico de datos como otro de esos mecanismos: una estrategia que pasa por formar a los futuros profesionales en diferentes áreas integradoras para dar soluciones al mundo del negocio y hacerlos más rentables y competitivos.

No es una idea nueva ni será la única que venga en el futuro pero de lo que sí que estoy convencido es que está aquí para quedarse mucho tiempo. Probablemente hasta que haya tanta oferta de profesionales que la ciencia de datos se convierta, otra vez, en una parte de un todo más grande.

Haya paz, amiguit@s

Nos necesitamos todos. Es una cuestión de supervivencia así que … haya paz, amig@s ;)