Cuidado con los libros: El tonto que llevamos dentro

15 de junio de 2022

El tonto que llevamos dentro

Si Steven Pinker ha hecho una defensa apasionada de la razón en Rationality, el último libro de Daniel Kanehman, Olivier Sibony y Cass R. Sunstein, Noise, A Flaw in Human Judgment, pone el foco en cierto tipo de errores de juicio, hasta tal punto que sólo al final, después de haber casi perdido la fe en nuestras capacidades de análisis, valoración y predicción, se ilumina la esperanza de que, gracias al conocimiento de nuestros límites y defectos, seamos capaces de reducir nuestros muchos errores. En realidad, ambos libros abarcan facetas distintas con puntos en común y un mismo espíritu constructivo. Pinker aborda más la razón en el uso cotidiano sin obviar los muchos errores que cometemos, desde nuestras decisiones personales a nuestras interacciones con otros, y la necesidad de esta para guiarnos en distintas situaciones como un utensilio mejor que las reacciones intuitivas o emocionales, mientras Kanheman se centra en los errores en campos tan específicos como el análisis político y económico, la gestión empresarial o la predicción del tiempo, o con graves consecuencias personales como los diagnósticos médicos o los veredictos de los jueces en los tribunales, en donde una serie de estudios ya venían mostrando en las sentencias disparidades alarmantes y objetivamente injustificables ante delitos similares.

Kanehman y sus compañeros dividen los errores en dos tipos; aquellos que son consecuencia de los sesgos, es decir, cuando los errores recaen siempre del mismo lado, en los cuales se ha puesto la atención en las últimas décadas, y aquellos a los que llaman ruido -concepto que ya aparece en psicología por lo menos desde B. F. Skinner-, de los que no se habla pero que consideran incluso más importantes ya que, en mayor o menor medida, existen siempre que haya humanos emitiendo juicios o predicciones. En parte somos conscientes de que todos cometemos errores de juicio, tanto por sesgos como por ruido, aunque unos más que otros según nuestras capacidades y destrezas, lo cual toleramos porque lo consideramos anecdótico, pero el estudio de los juicios de los expertos revela sorpresas bastante incómodas, capaces de cuestionar nuestra fe en ellos y en nosotros mismos. Ya en Thinking, Fast and Slow (2011), había escrito sobre los muchos errores de los expertos en bolsa, prácticamente negándoles una mejor capacidad de acierto que a cualquier otra persona. Encontrar un experto en bolsa que haya acertado varias veces seguidas no refutaba sus investigaciones, escribía, es simplemente un previsible resultado estadístico dado el número de expertos que existen, ya que alguno entre tantos tenía que acertar en cadena aunque jugaran a los dados.

Según nos recuerdan los autores, el mismo concepto de juicio contiene la aseveración implícita de que nunca puede estarse al cien por cien seguro de que un juicio sea correcto. Kanehman no niega la existencia de gente que, dado su gran conocimiento y experiencia, tiene una capacidad de acierto mayor que la media entre los propios expertos, pero estos son pocos y vienen a confirmar los logros mediocres de los demás. Entre el ruido y los sesgos los autores consideran que el primero produce mayor cantidad de errores. No nos equivocamos mayormente porque seamos malos o buenos, por prejuicios o ideología, sino porque somos torpes o carecemos de información mejor, o de toda la información. Los autores aclaran, además, que los sesgos no se refieren a injusticias sociales, o no siempre, sino a errores estadísticos en la misma dirección. Ambos, el ruido y los sesgos, alteran nuestros resultados, pero si corregimos el ruido podemos tener, paradójicamente, más errores porque el sesgo presiona hacia errores más consistentes mientras que el ruido apunta a distintas direcciones, con lo que estadísticamente puede equilibrar el juicio. Pero aún así, en general, la reducción del ruido produce una reducción de errores y, según el autor, quien empieza reduciendo el ruido o el sesgo se animará a reducir el otro.

Las grandes diferencias en las sentencias ante casos similares, por ejemplo, pueden atribuirse a la rigidez del juez en cuestión, a rasgos de su personalidad o a su ideología, pero también, y mucho, a elementos circunstanciales tales como si le ha ocurrido algo bueno en esos días, si el acusado le recuerda a alguien para bien o para mal, si su equipo de fútbol ha ganado o perdido en los días anteriores, si la temperatura de la sala no es la adecuada, si el juicio es por la tarde o por la mañana, o si el juez tiene hambre o acaba de comer. A muchas de estas conclusiones se llega a través de situaciones simuladas en estudios y a otras a través de estadísticas, como por ejemplo cuando se constata que cada vez que pierde el equipo local hay condenas más estrictas en la ciudad. En cualquier caso, como escriben los autores, estas circunstancias no tienen nada que ver con el inculpado, pero le afectan hasta poner su libertad en peligro, por lo que los autores proponen una tabulación más concreta de los delitos con las condenas, aunque son conscientes de las reticencias que este tipo de medidas despiertan debido a la reducción de la discrecionalidad exigida por los expertos ante lo que consideran una casuística compleja que se escapa a una estricta estipulación.

Las consecuencias de este ruido no solo están en los juzgados sino también en el sistema educativo, en donde aconsejan el uso de pruebas lo más objetivas posibles y tablas de corrección y evaluación, conocidas como rúbricas. El ruido aparece también en cualquier decisión de la vida personal. Hacemos estimaciones constantemente, con mayor o menor repercusión, pero estas varían entre primeras impresiones y otras segundas, más reflexionadas, por lo que para reducir el error debemos hacer algo tan sensato como pensar las cosas dos veces, dejar pasar un tiempo y preguntar a otros sus opiniones al respecto, lo que conecta también con la propuesta principal de Thinking, Fast and Slow, en donde Kanehman hablaba de dos modos distintos de enfrentarse a las problemas, uno inmediato, necesario en ocasiones para tomar una decisión rápida, y otro lento y reflexivo, con menos errores de juicio. La respuesta más acertada suele estar, según los autores, entre esa primera impresión y la reflexión sosegada sobre el asunto. No en vano, el estado de ánimo puede ser determinante, así como la capacidad de recuerdos positivos o negativos asociados a ese estado de ánimo. Son muchos los factores que generan juicios distintos, externos e internos, ya que, además, ni siquiera somos la misma persona todo el tiempo, y nuestro yo lejano es más distinto que el cercano a nuestro yo actual, aunque la diferencia entre nuestro yo actual con el de hace una semana sea menor que con el de otra persona.

Aunque, en general, cuantas más personas estén involucradas en una decisión mejor será el resultado, existen dinámicas de grupos que pueden agregar mucho ruido ya que en nuestros juicios influyen factores como quién toma la palabra primero o quién habla mejor o con más confianza. Hay un experimento al respecto que, por el interés que me despierta el tema del juicio artístico, me ha llamado especialmente la atención: El cambio en una lista de las canciones más famosas, invirtiendo el orden, produjo que la audiencia escuchara más a las que estaban mejor posicionadas en la jerarquía aunque fueran en realidad las menos famosas y, sin embargo, sólo la más popular en origen resurgió a medio o largo plazo como la más tarareada y querida aunque hubiera sido emplazada la última. Esto nos lleva a los muchos fenómenos que existen tras nuestros ruidos: ante situaciones difíciles usamos preguntas fáciles de forma heurística, decidimos lo que pensamos consultando nuestras emociones; el efecto halo generado por algo que nos atrae o destaca y que extendemos a más características de quien nos habla; el efecto anclaje que da ventaja a quien primero habla ya que los demás suelen seguirlo, discutir el tema dentro de ese marco, o las asociaciones por las que deducimos.

Pero por muy bien que interpretemos el presente, las predicciones son parte del futuro, por lo que es muy difícil acertar. Nos cuesta distinguir entre nuestra capacidad de análisis y ser conscientes de las muchas incertidumbres del futuro. En la elección de candidatos a través de entrevistas, por ejemplo, la correlación de éxito es prácticamente nula. Existe sin embargo una superioridad de la estadística sobre la intuición personal, ya que los modelos mejoran en más del noventa por ciento los juicios personales, una cantidad nada desdeñable. Aunque algunas sutilezas son válidas, muchas de ellas vuelven el juicio más complejo y peor, ya que según afirman los autores las reglas simples funcionan mejor. Es, por tanto, mucho más eficiente usar reglas o algoritmos, los cuales están libres de muchos de nuestros errores. Afirman que los aciertos humanos no son mejores que los de cualquier grupo de reglas o algoritmos, aunque cuanto más se afinen estos mejores serán sus resultados. Esto se ve claro al observar que el acierto de los expertos no es mejor que el de los modelos, aunque los peores modelos pueden no ser mejores que los mejores expertos humanos. La conclusión es que los algoritmos comenten errores, pero los humanos aún más.

Debido al exceso de confianza general -el sesgo más encontrado en los errores según señala Kanehman con tanta seriedad como posible ironía-, el mejor predictor de éxito es reconocer la ignorancia propia. Incluso quienes tienen autoridad y capacidad en la toma de decisiones, llevados por su confianza y por una experiencia a la que con frecuencia llaman instinto, se equivocan mucho, aunque, paradoja nada sorprendente, la negación de la ignorancia suele ser mayor cuanto más ignorante se es. Los errores provienen de una combinación de factores transitorios y permanentes. Una misma narración se ve distinta según quién la vea y su experiencia personal, sobre todo si es compleja y tiene muchos aspectos con los que sentirse más o menos identificado. Cuando interpretamos según nuestras profesiones, por ejemplo, es decir según nuestro campo de especialización y sobre los temas que conocemos, las diferencias de juicio son consideradas como variabilidad en conocimientos y perspectivas, y no como errores. Tampoco la personalidad parece guiarnos en estos casos. Existe, en efecto, una correlación entre personalidad y decisiones personales, pero hay situaciones en que todos o casi todos reaccionaríamos con violencia a pesar de nuestras distintas personalidades, de tal forma que nuestra acción se fundamenta en la mezcla entre personalidad y circunstancia, de una manera que no reduce el ruido.

El ruido está siempre presente en donde hay juicio, y hay mucho más ruido del que creemos. Eso sí, existen distintos niveles de ruido. El ruido no está en ninguna parte pero estadísticamente se encuentra por todas partes, por lo que su detección revela errores invisibles. Lo natural es pensar causalmente, como en las narraciones, nos encanta asignar causas a los sucesos, pero pensar estadísticamente requiere de esfuerzo. Asignar causas es un proceso natural, mientras el análisis de estadísticas es difícil, ya que exige esfuerzo y reflexión. El sesgo, por poco que sea, capta nuestra atención, sin embargo, el ruido es como el contexto que lo rodea, en el que no nos fijamos. Nos enfocamos mucho en los sesgos pero no vemos los patrones del ruido. De este ruido a la hora de emitir juicios no se escapan tampoco los médicos, con bastantes errores analizados en los diagnósticos de tuberculosis y cáncer de piel, dos de las enfermedades más mortales, y especialmente en los casos de neumonía. Pero el área con más ruido con diferencia de la medicina es, según los estudios de los autores, la psiquiatría, probablemente porque depende en buena parte del testimonio subjetivo del paciente, pero también por casos llamativos y puntuales de psiquiatras que diagnostican, por ejemplo, muchas ansiedades mientras otros hacen lo mismo pero con muchas depresiones, y son además reticentes a análisis objetivos que sirvan como contraste.

En la vida laboral, por citar un ejemplo que afecta aún a un mayor número de personas, resulta difícil valorar a un trabajador objetivamente por su productividad ya que los valores de su actuación son débiles o, en el mejor de los casos, inciertos, lo que provoca una gran cantidad de ruido. Cuando se juzga a los trabajadores la mayoría obtienen buenas notas o las mejores puntuaciones se asignan a los puestos más altos, que son quienes las ponen y se conocen, antes que a los trabajadores de puestos inferiores. Estas valoraciones pueden resultar, además, más desmotivadoras para el trabajador, y no se gana nada con ellas. Si la meta es realmente mejorar el conjunto, más eficaz para reducir el ruido serían los ranking que posicionan a unos sobre otros, comparando a los trabajadores, pero esto genera tantas tensiones que, con razón, tampoco se utilizan. Un ranking forzado o con escalas mal hechas, además, puede generar aún más ruido, por lo que debe revisarse bien y mejorar las escalas de valores. Lo más práctico, según los autores, es preguntar por muchas dimensiones, ya que esto reduce el efecto halo que existiría si se pregunta por la puntuación general del trabajador, y también inclinarse más por evaluar bien proyectos futuros antes que medir actuaciones pasadas.

Otra fuente de continuos errores son las entrevistas laborales, cuya ubicua implantación convierte sus sesgos y ruido en distorsiones que afectan a muchísima gente. Los autores resaltan la relevancia decisiva del primer juicio, basado mayormente en la extraversión y en cualidades verbales, o en la calidad de un saludo firme con la mano. Una vez cristalizado este primer juicio, los mismos hechos pueden derivar en dos interpretaciones totalmente distintas, incluso antagónicas, debido a esta impresión inicial que suele condicionar el juicio. Por tanto, es mucho mejor usar tests o métodos como el de Google, en el que sólo se miden ciertos aspectos por separados y se les da puntuación en una tabla de evaluación con descriptores. Aunque esto reduce el ruido, este tipo de entrevista se prefiere mucho menos, tanto por entrevistados como por entrevistadores, y genere reticencias. Tal y como nos avisan los autores, lo cual se desprende continuamente de los datos e investigaciones aportados o recogidos en este libro, debemos aprender a sospechar de nuestros procesos de selección y predicción, así como de las grandes decisiones tomadas en las empresas, ya que son demasiado intuitivas.

Llegados a este punto en el que los autores han demostrado la casi nulidad de nuestras capacidades de juicio y de predicción, incluso entre los especialistas, el libro gira en el último tercio, cuando se afirma que los muy expertos, es decir los mejores entre los conocedores de un tema, tienen mejor capacidad de análisis y de predicción que el resto de sus colegas. Hay dos factores claves que nos ayudan a identificar a estos sujetos, por una parte la inteligencia y por otra el estilo cognitivo. De la inteligencia apenas afirma que, aunque en los puestos bajos hay gente con gran inteligencia, cuanto más alto está posicionado alguien laboralmente mucho más difícil resulta que esté por debajo de la media de inteligencia. Los autores se demoran más, eso sí, en describir el estilo cognitivo de la persona que destaca por tener menos ruido y sesgos en su área de conocimiento; se trata de alguien capaz de cambiar de opinión ante datos contrarios a su idea inicial, metódico a la hora de integrar nueva información, disfruta pensando y no tiene miedo a dudar. Quienes son buenos a la hora de acertar en sus predicciones se caracterizan además por un buen pensamiento analítico y probabilístico, ya que no se dejan llevar por la intuición y observan lo general antes de enfocarse en los detalles, son capaces de permanecer con la mente abierta y seleccionan mejor lo importante. Entrenar a gente para este tipo de responsabilidades es posible, tanto con ejercicios individuales como, aún mejor, con trabajo en equipo, aunque la estrategia más eficaz según los autores es seleccionar directamente a los mejores. Por tanto, si lo que queremos es elegir a las personas correctas no basta con que sean inteligentes, también importa, y mucho, su estilo de pensamiento, y en caso de duda quizá sea mejor seguir al más reflexivo y con la mente más abierta, antes que al más listo.

Es muy importante, por tanto, que los líderes tengan un talante abierto a los argumentos opuestos, sin embargo, este tipo de perfil, paradójicamente, no suele ser el elegido ni el admirado, y la gente se decanta por líderes que muestren confianza y seguridad, es decir, lo contrario, afirmación que, otra vez más, inunda al lector de cierto pesimismo ante la naturaleza humana. No en vano, los autores se decantan por el uso de normas o algoritmos y, conscientes de las reticencias que despiertan, subrayan la necesidad de estos como complementos imprescindibles para un juicio mejor, a pesar del miedo que genera en la gente ser considerada como un número o una cosa -el último libro del filósofo Byung-Chul Han, No-cosas, sería quizá un ejemplo de este tipo de reticencias-. Es raro que el algoritmo en sí tenga sesgos, aunque en cualquier caso tendrá menos que los humanos. Aún así, la gente con autoridad no suele aceptar controles a sus decisiones, gran parte de las personas prefieren tomar decisiones intuitivas, otros muchos se quejan de que ese afán por reducir el ruido causa el cese de la creatividad y, en general, todos preferimos estar ante una persona, aunque genere ruido, que ante un algoritmo. Es decir, la tolerancia al ruido puede ser intuitiva y normal, incluso preferible por la gran mayoría, pero, como recalcan los autores, ni es justa ni eficiente.