Hace diez años, la prestigiosa revista Science publicó un artículo titulado “Computational Social Science”. En él, Noshir Contractor junto a prestigiosos científicos como David Lazer, Alberto László Barabási, Lada Adamic, Sinan Aral, Nicholas Christakis, entre otros, daban cuenta del surgimiento de una nueva forma de hacer ciencias sociales que era posible gracias a la masiva y creciente digitalización de la interacción humana. Es así que, información tan amplia acerca de nosotros mismos, como nuestro consumo, nuestros amigos, nuestros intereses digitales – además de otros datos a gran escala, Big Data -, podía ser digitalizada y estudiada, permitiendo dar respuestas a muchas interrogantes del sistema social humano, usando estos datos anonimizados y agregados.
A comienzos de enero, el profesor Contractor visitó Chile por primera vez y se dio un espacio en su apretada agenda para visitar el CICS y dictar el seminario
“Avances y Proyecciones en Computational Social Sciences”. En la oportunidad, entregó numerosos ejemplos sobre los alcances y desarrollos que han alcanzado las Computational Social Sciences desde aquél artículo en la revista Science. Con la humildad que lo caracteriza para compartir sus conocimientos, el investigador se dio un tiempo para responder nuestras inquietudes.
– Se ha demostrado que la diversidad es importante para la formación y la productividad de un equipo; sin embargo, podrían interactuar otras dimensiones y hacer que la diversidad en los equipos falle. ¿Cuál es el estado del arte en esta área y en donde debiesen poner sus esfuerzos los investigadores?
Lo que sabemos sobre la diversidad en los equipos es algo que mi buen amigo Scott Beach escribió en un libro que se llama “Difference”. Él nos dice que si le das a distintos equipos una tarea que requiere una solución creativa, y unos equipos están compuestos por personas muy similares y otros son muy diversos, puedes ver cuán creativos son o cuán creativa es la solución. Lo que nos gustaría creer, es que los equipos que son más diversos tendrán la solución más creativa y tendrán una puntuación de creatividad del 10 – que considera las habilidades del equipo-, en comparación con otros equipos homogéneos. Pero eso no fue lo que descubrimos: si tienes veinte equipos que son similares y veinte diversos, ambos equipos tienen en promedio una puntuación de 5 en una especialización de 1 a 10. Pero lo que también descubrimos, y ésta es la parte interesante, es que aún cuando ambos equipos tienen una puntuación similar, en el equipo diverso alguien tuvo una puntuación de 10 y alguien obtuvo un 1; en otras palabras, alguien en el equipo diverso lo hizo muy bien y alguien muy mal. En el equipo similar u homogéneo, casi todo el equipo obtuvo una puntuación de 5. Esto quiere decir que, si quieres tener una idea muy creativa, sólo la obtendrás de un equipo creativo, pero tienes que estar consciente de que la mitad del tiempo te dará una idea horrible. En otras palabras, tienes más posibilidades de obtener una buena idea de un equipo diverso, y nunca la obtendrás de un equipo homogéneo. Pero no siempre tendrás una buena idea de un equipo diverso. Entonces, ¿por qué sucede esto? Creo que en lo que más se están enfocando es ver cuáles características son similares o cuáles son diversas, y no todas las similitudes son malas y no todos los tipos de diversidades son necesariamente buenas. Así que una de las cosas en la que las personas han comenzado a pensar, es “¿podemos tener personas que tengan similitudes en algunas áreas que les permita confiar y llevarse bien con los demás, hablar de esas cosas en común, pero que tengan diversidad en el trabajo que realizan?”. Uno podría ser un buen estadista, otro podría ser modelador, otro ser filósofo, porque ellos han creado confianza en aquéllas cosas que les son comunes, y que no necesariamente tienen que ver con el trabajo, sino que con algo personal, como el gusto por algún equipo de fútbol. La hipótesis es que debemos potenciar las similitudes sobre cosas que reúnen a la gente pero que no están relacionadas al trabajo que ellos hacen, lo que les permitirá tener diversidad en las características que son relativas al trabajo que allí realizan. Entonces, para que surja la creatividad, tienes que asegurarte de que esas personas vean algo en común y eso que tienen en común y que es algo que disfrutan pero que no tiene nada ver con el trabajo, es bueno y por qué no usarlo. Es una forma de construir similitudes.
– Tras haber participado en NetSciX y ahora en nuestro Research Camp del CICS, ¿cuál es su impresión sobre el nivel de la ciencia que tenemos en Chile hoy en día?
Una de las razones para participar en el NetSciX, es que me entusiasmaron mucho las propuestas que se presentarían y me pareció que debía apoyarlas y estoy muy feliz de haberlo hecho. Yo estaba en el Consejo de la NetSci Society cuando Leo Ferres (Instituto Data Science) y sus colegas me hicieron la propuesta de realizar el NetSciX en Santiago.
Uno de los asistentes a la charla que realicé en el Research Camp, me comentó que actualmente no hay ningún proyecto de investigación en Ciencias Sociales que cuente con el patrocinio del Gobierno, y eso significa que no se está reflejando lo que se hace hoy en día alrededor del mundo, pues hay mucha gente que está trabajando en esta área.
La cantidad de artículos que se publican ha ido creciendo exponencialmente y muchos de los problemas a los que nos enfrentamos hoy en la sociedad pueden ser abordados, de alguna manera, tomando una perspectiva de redes. Entonces, la razón para haber hecho el NetSciX aquí, fue aumentar la sensibilidad sobre este asunto y no solo eso, sino también crear comunidad en esta área.
En estos días, he visto que en Chile hay personas que están haciendo cosas “solos” y que, con estas actividades, se están dando cuenta de que se pueden juntar y llegar a ser una fuerza. A veces, en las universidades, el “todo es menos que algunas de sus partes” y eso es muy frecuente en relación a personas que están haciendo network science, data science, investigación en complejidad en Chile. Hay un montón de personas inteligentes trabajando en estas áreas, pero que no son vistas como parte de un “todo”, de un grupo. Por eso creo que es muy importante lo que pasó en NetSciX: la creación de Data Science, el área de Ciencia de la UDD y también la participación de Telefónica, además de la Pontificia Universidad Católica y Entel, todos como asociados industriales, que es muy importante en esta área. Todo esto ayuda a que ahora tengamos una masa crítica de personas que pueden instalar una marca en Chile; ya existe en los Estados Unidos, con chilenos muy reconocidos, como César Hidalgo del MIT. La comunidad en Santiago no ha creado una identidad conjunta y eventos como éste, ayudan en ese sentido.
– En esta misma línea, ¿cómo ve el futuro de la Data Science y las Computational Social Sciences a nivel mundial? y ¿cuáles son las principales diferencias entre estas dos disciplinas?
Lo que sucede es que la Data Science es como un tipo de “estadística sucesora”. La gente mira datos, que es lo que hace la estadística, pero hoy hay muchos más datos disponibles y algunas de las metodologías que usamos para analizar estos datos requiere de mucho más poder computacional. La data science está ayudando a gestionar, manipular, analizar e interpretar un gran volumen de datos; ése es el desafío. Hasta hace poco, las estadísticas solo se enfocaban en el análisis, porque muchos de nuestros datos eran pequeños y simples, así que eran puestos en hojas de cálculo; pero ahora, con tal nivel de datos, a los que llamamos no solo Big Data sino Broad Data, -porque es de distintos tipos y tratas de modelarlos y hacer diferentes cosas-, se requiere de mucho más esfuerzo que las estadísticas. Entonces, la data science permite que las personas sean expertos en la recolección de información y la conservación de datos.
Por otro lado, cuando tienes una red de diez personas, es muy fácil realizar algunos cálculos; pero si tienes una red de millones de personas, el mismo enfoque no va a funcionar; ni siquiera pueden hacerlo todos los computadores en el mundo, por lo que debes tener métodos inteligentes que te permitan hacer métodos abreviados, nuevos enfoques, nuevos algoritmos para tratar de obtener esos datos, y luego tienes que aprender a interpretarlos, cómo saber si esa información es buena. Del mismo modo, tienes que hacer predicciones y poder, eventualmente, cambiarlas, además de tener confianza en los datos que tienes. Entonces, hay una visión íntegra de la Data Science, llamada automatización, que significa cómo poder usar la Data Science para proponer modelos alternativos, qué debemos cambiar en lo que estamos haciendo hoy, para que por ejemplo, el cambio climático vaya en una dirección contraria. Eso es Data Science.
Las Computational Social Sciences usan la Data Science para responder preguntas sobre Ciencias Sociales, como psicología, sociología, ciencias políticas, economía. Pero al mismo tiempo, la Data Science puede ser usada para muchas otras cosas que no tienen nada que ver con Ciencias Sociales, como por ejemplo, para construir mejores misiles, o para diseñar un mejor sistema computacional, o para estudiar redes de proteínas. Lo que sucede ahora, es que cada área está aumentando el uso del pensamiento computacional para ir respondiendo distintas interrogantes.
– En relación a las mujeres en la ciencia, ¿cuál es su opinión respecto a la poca cabida o visibilidad que han tenido en esta área y que, quizás, ahora estaría cambiando?
Es una muy buena pregunta, y hay dos caminos para abordar este tema. Uno, es que sí han habido mujeres que han tenido roles muy importantes en la ciencia en general. Cuando vemos que no hay muchas mujeres en la ciencia, es porque la forma en que ha sido escrita la historia ha dejado fuera a un montón de mujeres destacadas que no han recibido ningún crédito por su trabajo. Ahora, muchas personas vuelven a investigar el descubrimiento del ADN o de la computación; o las principales líderes de la misión Apolo 11, o el diseño de misiles en el área militar, y muchas de las personas que fueron realmente importantes en estas áreas fueron, precisamente, mujeres. Entonces, parte de la respuesta no es que las mujeres no están haciendo cosas, sino que lo están haciendo de manera invisible.
También es cierto que no se involucran muchas mujeres. La razón puede ser que las mujeres no conocen muchas historias de éxito. Por ejemplo, cuando conoces a jóvenes que deben decidir lo que quieren hacer, miran estas áreas y no conocen los nombres de las investigadoras porque están escondidos. Entonces, no es un tema de conocimiento, sino también de que las mujeres científicas no están ahí o no aparecen para inspirar a otras jóvenes.
Durante el NetSciX conocí y compartí en una cena con Francisca Varela del Instituto Data Science de la Universidad del Desarrollo, quien me impresionó mucho. Hace dos años aproximadamente, ella recibió un premio muy importante por contribuir a la creación de una ONG para ayudar a las mujeres a hacer programación computacional. Así también, en otros países las mujeres se están integrando a estas áreas.
Hay una investigación que da cuenta de que los equipos de investigación que cuentan con al menos una mujer, les va mejor, porque las mujeres tienen ideas creativas que los hombres no pueden visualizar. Entonces, no solo tienes a mujeres porque tienes que hacerlo, para reducir la disparidad: lo haces porque ayuda a tener un mejor producto. Dicho eso, me gusta ver que, tener mujeres, no es una necesidad: es una oportunidad para ti, para tener un mejor equipo. La ciencia no necesita mujeres porque son mujeres, sino porque brindan oportunidades.
El Doctorado interdisciplinario en Ciencias de la Complejidad Social
– Usted se debe haber reunido con otros estudiantes alrededor del mundo, ¿cuán lejos (o cerca) estamos de lo que ellos están haciendo hoy en día en esta área de las ciencias?
He tenido muchas conversaciones en torno a este tema con estudiantes de muchos países en el mundo: China, India, de países europeos, y diría que siempre será un desafío aprender estas materias en inglés, que no es tu lengua nativa. Estoy muy impresionado con el nivel de fluidez que tienen los estudiantes de este Doctorado, así que el comité que los selecciona hizo un muy buen trabajo al asegurarse de que el éxito no está limitado a una incapacidad de hablar o escribir principalmente, porque en la investigación hablar es importante, pero en las publicaciones más importantes, debes saber escribir bien.
Este grupo de estudiantes tiene un Doctorado interdisciplinar que no es muy común en el mundo. Hay muy pocos así, lo que no significa que en otras universidades los estudiantes no estén haciendo investigación interdisciplinar, pero no lo están haciendo en un programa interdisciplinar como éste: en el área de network science, data science y computational sciences, deben haber unos tres o cuatro en el mundo que yo conozco. Por ejemplo, en Boston hay un doctorado interdisciplinario en network science. La universidad de Janos Kértesz, la Central European University en Budapest, también ofrece un doctorado interdisciplinario en esa misma área.
Lo que tienen los estudiantes acá, es una oportunidad que es muy inusual pero que, al mismo tiempo, veremos de manera muy habitual más adelante. Pero hoy no es muy común.
– ¿Tiene usted alguna sugerencia para la formación en Data Science y Computational Social Sciences en nuestro Doctorado?
No sé suficiente sobre este programa en específico, pero dada la cantidad de conocimiento y avances que ha habido en esta área, no se espera que un estudiante de Doctorado de Data Science, o Network Science o Computational Social Sciences tenga una vasta experiencia en todas estas áreas. En cambio, creo que lo mejor que puede proporcionarle a los estudiantes un programa de Doctorado, es una vasta experiencia en una de estas áreas.
La mayor parte de mi trabajo lo he desarrollado en comprender, desde los puntos de vista de las Ciencias Sociales, por qué hemos creado redes, cómo se forman y cómo se desempeñan. Hay un montón de teorías de Ciencias Sociales sobre eso y ésa es mi experiencia. Si estoy en un programa de Doctorado, necesito continuar construyendo experiencia en el área que elegí, pero necesito saber lo suficiente sobre todos los nuevos enfoques sobre data science y machine learning. Por ejemplo, éste último tiene un montón de enfoques sobre cómo formar modelos con data, tener una nueva matriz sobre cómo crear una buena modelación, y cómo medir un buen modelo desde un mal modelo; todas ésas son cosas que tengo que aprender en un programa de Doctorado, incluso si mi área es otra, ¿por qué? porque si quiero colaborar con personas que están en esas otras áreas, necesito entender lo que están diciendo y no solo eso, necesito dos cosas más: necesito entender lo que dicen y así también los resultados del machine learning, de manera de poder tomarlos y poder contribuir para los avances de la teoría de redes sobre Ciencias Sociales; y, segundo, saber suficiente sobre lo que están haciendo de manera que si tengo una pregunta que ellos no pueden responder con sus métodos, (…) puedo empujarlos a hacer más avances en técnicas, y sus técnicas nos pueden empujar a hacer más avances.
Si un programa de Doctorado crea un contexto en donde cada estudiante es capaz de saber lo suficiente sobre las otras áreas, para mejorar y hacer mejores interrogantes, o responder una pregunta de mejor manera o hacer nuevas preguntas, o responder una pregunta existente en su propia área de competencia, eso sería fantástico y también desafía a las personas en otras áreas.
(…) Sería maravilloso que un Doctorado pudiese profundizar en todas las áreas, pero eso no va a suceder, y para qué lo haríamos si para eso tenemos equipos. Si tú y yo somos parte de un equipo, entonces es mejor que yo sepa más de una área y no suficiente en la tuya, así que puedo trabajar contigo; y tú eres experta en otra área pero no suficiente en la que yo estoy, así que también podemos trabajar juntos.