Qué es la Psicología del Big Data y por qué tus datos son importantes

Qué es la Psicología del Big Data y por qué tus datos son importantes

En el 2014 la universidad de Camdridge presentaba un proyecto muy interesante llamado “You are what you like” a través del cual – y brindando acceso a la actividad y los datos de las páginas que te gustan en la famosa red social – podían sacar un perfil relativamente preciso de personalidad basado en el modelo de los cinco factores (Goldberg et al., 2006). El proyecto es interesante por varios motivos, empezando por la facilidad con la que se desarrolla el proceso, prescindiendo totalmente de cuestionarios; el esfuerzo para construir una base de datos de perfiles de personalidad (6 millones de individuos, según explican en el documento técnico del proyecto) y contrastarlos con la actividad en Facebook de cada sujeto de la muestra y también por crear una API a través de la cual otros investigadores podrían aprovechar los datos para realizar nuevas predicciones. Más allá de lo interesante que es el proyecto, éste también nos permite abrir una serie de preguntas y discusiones sobre el potencial del big data para la investigación en psicología, la predicción del comportamiento, el análisis de data psicológica, las utilidades y herramientas que se pueden desarrollar sobre su base y también sobre cómo las personas pueden ser conscientes o no sobre el uso de sus datos. Antes de empezar, hagamos una revisión de conceptos.

Big Data, investigación y Psicología

Para entender mejor lo que es el Big Data antes debemos conocer lo que es un dato y cuáles pueden ser importantes y utilizados para realizar análisis con resultados que arrojen un mejor conocimiento de las personas. La edad de una persona, su sexo, su estado civil, nacionalidad, profesión; todas esas respuestas son datos que configuran, en parte, la identidad de una persona; es decir, a través de ellos podemos conocerla. Si, además, obetenemos datos de un grupo de personas más grande, como los habitantes de una ciudad, podemos elaborar un perfil demográfico de la misma, saber qué personas la habitan a nivel estadístico. Cada ciencia, según su campo, maneja determinados tipos de datos que le permitan desarrollar y comprobar sus propias teorías; dentro de la Psicología los datos relevantes pueden ser – según sea el caso de estudio – la personalidad, el estado emocional, estilo de aprendizaje, inteligencia, entre otros.

El big data (me permito usar el anglicismo) está caracterizado de acuerdo a Laney (Chien & Wojcik, 2016) por tres factores:

  • Volumen, referente a la abrupta escala de datos que se manejan. No existe concenso sobre la cantidad mínima de datos, por lo que hablamos de big data cuando su procesamiento y análisis excede las capacidades de cómputo del software y hardware normalmente disponibles.
  • Velocidad, refiere a la rapidez con la que los datos son generados, procesados y analizados.
  • Veracidad, que es el desafío de recoger datos fiables o de calidad.

Ya habiendo tipificado lo que es el big data, podemos explorar cómo se conecta con la investigación y la Psicología. Tradicionalmente los estudios dentro de esta ciencia, en lo que a recojo de datos atañe, requieren de una muestra amplia, lo que implica la aplicación de muchos cuestionarios y los problemas que su aplicación conlleva (el tiempo de aplicación, la disposición de los sujetos, su sinceridad al responder la prueba). Además, este proceso se repite según las variables que se quieran medir como pueden ser la inteligencia, la ansiedad o la personalidad. Los datos recogidos, sin embargo, nos permiten conocer mejor a cada persona, relacionar variables, obtener deducciones y predecir futuros comportamientos. En ese sentido el big data abre una nueva ventana de posibilidades a la Psicología al permitirle trabajar más rápido, eficientemente e incluso descubrir cosas que antes no eran posibles.

¿Cómo y de dónde se colectan los datos? Usualmente para este tipo de investigaciones, son recogidos de publicaciones realizadas en redes sociales, comportamientos en redes (compras, búsquedas, páginas visitadas), bases de datos públicas, dispositivos móviles y dispositivos vestibles. Cuando estos datos, recogidos a través de diversas fuentes, pueden ser atribuidos a un sujeto en específico se genera una huella digital. Es así que se pueden obtener perfiles de cada persona respecto a su inteligencia, personalidad, tendencia política y religiosa e intereses como en el caso del proyecto Apply Magic Souce. De manera similar el proyecto Personality Insights de IBM permite tener una aproximación bastante cercana del comportamiento y personalidad de las personas basado en el análisis lingüístico de los textos publicados en redes sociales.

Huella digital de cada usuario

Huella digital dejada por cada usuario en su actividad en redes sociales, imagen extraída del proyecto Apply Magic Sauce

Evidentemente, nos hemos saltado las herramientas y procesos estadísticos a los que son sometidos los datos para obtener dichos resultados (análisis probabilístico, análisis predictivo, algorítmica, aprendizaje profundo, aprendizaje máquina), pero ello puede esperar para otro artículo. Por lo pronto hemos revisado algunas pinceladas de lo que implica para la psicología la gestión de grandes datos para toda una nueva gama de estudios.

Posibilidades y potencial

Ya hemos visualizados algunas de las posibilidades de los grandes datos en la psicología, pero en un afán reflexivo y buscando ser más específicos podemos buscar algunas utilidades a este tipo de estudios.

En marzo del 2017, la BBC reportaba que Facebook empezaría utilizar una inteligencia artificial para identificar a usuarios en riesgo de suicidio. Lo interesante de la noticia, para el tema que tratamos, es que se basa en un estudio realizado por Jessica Ribeyro (Florida State University News, 2016), en el que se utilizó el análisis de datos y el aprendizaje máquina sobre una muestra de records de salud de dos millones de pacientes a través de lo cual se logró desarrollar un algoritmo de predicción del suicidio con un 92% de exactitud. Un gran avance para un problema que afecta a más de ochocientas mil personas al año y que en gran medida es más efectivo a la aplicación de un cuestionario de factores de riesgo al suicidio o preguntarle a la persona cómo se siente.

De manera similar el psicólogo Tal Yarkoni de la Universidad de Texas desarrolló el programa Neurosynth (2016), el cual lleva sintetizando a la fecha más de 11 000 estudios de neuroimagen (fMRI) que abarcan más 400 000 activaciones cerebrales. Entre sus metas más ambiciosas se encuentra el distinguir la actividad cerebral que se asocia con un proceso psicológico particular pero es inespecífico y la actividad cerebral que implica una alta probabilidad de que un proceso psicológico específico esté presente. Las pruebas han demostrado que el programa de Yalkoni funciona tan bien como la investigación manual pero ahorrando grandes cantidades de tiempo y esfuerzo, además de ayudar a los investigadores a prestar atención y analizar datos que de otro modo tomarían una eternidad.

El márketing y la psicología del consumidor son áreas con los usos más comunes y populares del big data. Qué buscas, qué compras, dónde, en qué momento, cuál es tu estado de ánimo, qué vocabulario utilizas y cómo te expresas son algunos de los datos que los proveedores de servicios que normalmente usamos como Google o Facebook saben de nosotros y los cuales serán utilizados con propósitos publicitarios.

El big data permite a los investigadores sociales recoger y analizar una gran cantidad de información conductual de una gran cantidad de usuarios de manera transparente, incluso sin que las personas sean conscientes de ello ya que datos sobre las interacciones sociales, la actividad física, el comportamiento en redes o la ubicación geográfica son continuamente registradas por nuestros dispositivos y servicios en la red que utilizamos.

Algunas cuestiones éticas

A estas alturas del artículo el potencial y posibilidades del big data han quedado claras, sin embargo es importante considerar aspectos como la privacidad de nuestra información o qué tan de acuerdo podemos estar con el uso que se le dé. Por un lado se pueden predecir y prevenir casos de depresión y suicidio, pero por otro ¿estamos dispuestos a que nuestras publicaciones estén siendo analizadas? Y más allá de estar dispuestos ¿asumimos de manera consciente la cesión de nuestros datos?, además ¿se da un uso correcto a nuestros datos?

Algunos casos ilustrativos sobre el debate que implican éste tipo de investigaciones los encontramos en dos estudios realizados por Facebook. El primero, realizado en el 2014, a través del cual se encontró que los estados emocionales, tanto positivos como negativos, pueden ser “contagiados” a través de las publicaciones realizadas por el círculo de contactos de una persona (Kramer, Gillory, & Hancock, 2014). El experimento se realizó manipulando las actualizaciones que eran mostradas a dos grupos de usuarios, a uno se les mostró actualizaciones de estado con connotaciones positivas y a el otro mensajes con connotaciones negativas. Más allá de los resultados, se plantean cuestiones sobre los límites éticos de la investigación. El otro ejemplo, revisado en Xataka, es el desarrollo de un algoritmo capaz de reconocer los estados emocionales negativos de sus usuarios adolescentes (tales como insignificante, ansioso, inseguro, estúpido, estresado, entre otros) y mostrar publicidad acorde a ello.

A inicios de mes el NYT publicaba un artículo en el que evidenciaba algunas prácticas de Uber en el que, utilizando los datos de comportamiento de sus conductores y usuarios, y algunos principios de economía conductual incentivaban a sus conductores a laborar más tiempo, en un horario determinado o circular por zonas determinadas de acuerdo a la demanda. La experiencia sirve de base para reflexionar sobre los límites éticos en la aplicación de la psicologíal y el uso de datos.

Reconocer mejor las emociones de las personas en base a sus gestos, prevenir la depresión, conocer las tendencias políticas y religiosas de las personas, conocer mejor el funcionamiento del cerebro son la evidencia de las posibilidades que el big data abre para la psicología y las ciencias sociales. En tanto también es importante contar con una perspectiva ética en la realización de dichas investigaciones y en la utilización de los datos de las personas, empezando con el consentimiento informado – que evidentemente va más allá de aceptar las políticas y condiciones de uso de un servicio – y por el principio ético de primero no hacer daño.

Referencias

 

Leave a Reply

Your email address will not be published.