Durante los últimos cinco años nos encontramos asistiendo a una extendida proliferación de lo que hoy conocemos como Ciencia de Datos, Data Analysis y BigData. Esto se ve favorecido por la digitalización del mundo físico y la huella que nosotros, los humanos, vamos dejando en los servicios digitales generando una cantidad creciente de datos; la mayoría de ellos permiten el análisis del comportamiento humano.
La velocidad de este cambio pone a la ciencia frente a una renovación del herramental metodológico para investigar fenómenos sociales, esto se evidencia en el surgimiento de nuevos softwares, lenguajes de programación dirigidos al procesamiento y análisis de datos y crecientes cursos y certificaciones para competencias en esta nueva área.
En este proceso también comienzan a desarrollarse nuevos campos de análisis y reflexión, ¿pero este nuevo recorrido cómo se vincula con hacer ciencia?
Empecemos por el principio, ¿qué es hacer ciencia? Al menos desde la segunda mitad del siglo XX, hacer ciencia es un modo de pensar y producir conocimiento, basado en una serie de principios básicos, entre los que destacan la observación, el razonamiento lógico, el rechazo del principio de autoridad en sí mismo y también un debate ético, con qué medios y fines se produce el conocimiento.
Estos principios han permitido unificar el ejercicio científico y poner en diálogo a campos de conocimientos tan diversos como por ejemplo la biología y la antropología, las matemáticas con las ciencias sociales, por mencionar algunos extremos.
Ciencia de datos y producción de conocimiento científico
Para hacer ciencia se necesita hacer preguntas dentro de un campo de conocimiento, se debate dentro de un campo teórico, ya sea para refutar o confirmar una teoría, para complementar conocimiento que se considera incompleto y/o para la elaboración de una nueva teoría.
En todos estos casos se necesita de la comunicación de los resultados para ser considerados legítimos, los hallazgos tienen que ponerse en cuestión con la comunidad científica del campo donde se produce. No se hace ciencia en términos individuales, hasta el investigador más solitario comunica sus resultados a los colegas de su campo.
Entonces, ¿qué quiere decir hacer ciencia de datos? Si uno hace una revisión a vuelo de pájaro por internet puede encontrar distintas definiciones, pero suelen coincidir en plantear que se trata del estudio de datos con el fin de extraer información significativa para “empresas”, aunque no exclusivamente.
Se trataría de un enfoque multidisciplinario que combina principios y prácticas del campo de las matemáticas, la estadística, la inteligencia artificial y la ingeniería de computación para analizar grandes cantidades de datos.
El hecho de manipular datos no es en sí mismo “hacer ciencia”, la ciencia se desarrolla en ramas de saber delimitadas por comunidades de investigadores que comparten un conjunto de conceptos, y también creencias, que validan la producción de conocimiento en ese campo.
El Big Data también juega su Mundial
En la ciencia los datos se ponen en contexto y para ello son importantes las teorías. En la actualidad es habitual creer que las teorías son un conjunto de conceptos antojadizos que deberían ser probados, pero en realidad es todo lo contrario, se trata de conocimiento que se basa en evidencia empírica y articula conceptos de modo que es posible explicar distintos tipos de eventos.
Los usos de la ciencia de datos extendida en la actualidad parecen referirse más a un uso instrumental de cierta tecnología, pero en la mayoría de los casos no se hacen preguntas para ampliar el rango de conocimiento de los datos en tanto campo de estudio.
Resulta una técnica para el procesamiento de datos. Lo que aquí queremos plantear es que, para hacer ciencia, los datos son igual de imprescindibles que las formas de interpretación. Son los marcos teóricos los que permiten interpretar lo datos en base a conocimiento ya probado. Sólo procesar datos, aunque sean muchos, puede llevarnos a no advertir procesos o fenómenos que ya han sido analizados y terminar concluyendo cuestiones que ya son obvias o que se encuentran refutadas.
*Director de la escuela de sociología, Universidad del Salvador