Atrapar la Verdad: en defensa del Conocimiento Probable

La evolución de la teoría del conocimiento se ha sustentado sobre la eterna discusión entre los que apostaban porque hay verdades, y disponemos de mecanismos eficaces para acceder a ellas, y los escépticos que enfatizaban las enormes dificultades para objetivar conclusión alguna, considerando lo limitado de nuestras capacidades y la complejidad del mundo que tratamos de comprender.

Surfeando en medio de esas dos corrientes, conscientes del debate y engrosando sentimentalmente las filas de uno u otro bando, ha habido siempre defensores muy diversos del conocimiento probable. Carnéades de Cirene, director de esa Academia venida a menos que había abandonado ya a las Ideas platónicas a su suerte, es quizás el padre espiritual de una corriente que en el fondo es la de todos: porque no sabemos si sabemos, pero sí sabemos que lo más sensato es apartarse de las vías del tren si el sonido de locomotora que me transmiten mis falibles sentidos se hace cada vez más ensordecedor.

A esa repetibilidad de la experiencia recurrieron también los estoicos, apelando a las communes notiones de todo ser humano, y hasta David Hume, el indiscutible campeón contra la causalidad (recuerden que es famoso por tratar de convencernos de que no podemos estar seguros, al menos con la certeza de las deducción matemática, de que el sol saldrá cada día), para argumentar que la costumbre y la probabilidad son el fundamento razonable de las decisiones cotidianas.

Hoy, en los tiempos del Data Science, en la era en la que languidecen los expertos como fuente de verdad, lo probabilístico ocupa una posición tan destacada que corremos el riesgo de caer en un nuevo dogmatismo. Así que creo procedente echar un ojo a sus fundamentos, para no olvidar nunca la naturaleza del trabajo de un científico de datos.

Toda la teoría del diseño de experimentos descansa en la probabilidad. Todos los resultados experimentales suelen descansar en un intervalo de confianza: con un 95% de probabilidad, este texto comercial despierta más empatía en los clientes, este precio de producto maximiza los beneficios, o este diseño de producto produce más interés. Pero, ¿de qué estamos hablando cuando hablamos de confianza?

No voy a dar mas que unas pinceladas intuitivas del aparato matemático que hay detrás de ese intervalo, pero básicamente estamos tratando de calcular la probabilidad de que las diferencias en los resultados obtenidos a favor de una u otra de las opciones que evaluamos sean debidas al puro azar; porque es evidente que si hubiéramos experimentado con otra muestra el resultado hubiera sido diferente, y que hay cuasi infinitas combinaciones de individuos que podrían haber participado en nuestro experimento.

La estadística regula con fórmulas matemáticas un par de ideas bastante intuitivas: i) que si repitiéramos el experimento con diferentes muestras, los resultados se concentrarían alrededor del valor real que estamos persiguiendo, es decir, que la realidad de la población estudiada se nos mostraría irremediablemente; y ii) que si la muestra es suficientemente grande, sería mucho más difícil que los resultados del experimento se alejasen mucho de ese valor real, es decir, las posibilidades que le dejamos al azar para que aparezca caprichosamente una muestra con resultados muy alejados de la realidad son mucho más bajas. Sobre esos mimbres se urden los cálculos que nos llevarán a afirmar o no con significatividad estadística (palabro formal para definir el concepto que trato de explicar aquí) las conclusiones del experimento, y la consiguiente decisión.

En suma, aún en una dinámica correcta de trabajo debes ser consciente de que estás jugando a atrapar la verdad entre los estrechos barrotes del intervalo de confianza, pero que ella no siempre se deja capturar. Más allá de la matemática, distribuciones, probabilidades y muestras, si trabajas sobre experimentos debes tener en cuenta que, aunque lo hayas hecho todo muy bien, siempre es posible que el azar haya arruinado tu trabajo. Aunque el experimento tenga sentido, el diseño sea correcto, y hayas elegido cuidadosamente los participantes para dejar trabajar al azar desnudo, sin sesgos, puede que la diosa fortuna esté muerta de la risa viendo cómo tomas decisiones erróneas porque la muestra que te ha tocado en suerte te señaló la dirección equivocada.

La buena noticia es que tu trabajo, en cualquier caso, habrá merecido la pena. Si has construido una cultura de la experimentación continua en tu compañía esos fallos serán esporádicos, solo un paso atrás en una trayectoria de aprendizaje acumulativo, simples experimentos que eventualmente podrás desechar.

Volviendo a los preliminares de este texto, seamos conscientes de que la complejidad del mundo, y nuestras limitaciones cognitivas, nos impiden llegar más allá; pero afirmemos sin ningún género de dudas que el conocimiento probable es conocimiento, alejado de las certezas irrebatibles y, sin embargo, decididamente eficaz.

Ante la exploración de los datos disponibles para la toma de decisiones, hoy ubicua y masiva, habrá quienes pongan siempre el foco en la falibilidad de los algoritmos, bien porque gustan de ejercer un escepticismo juguetón, bien –y estos son más peligrosos- porque están sentados en verdades irrefutables (muchas veces interesadas) que paradójicamente acostumbran a no justificar con rigor.

En cualquier caso, en esa búsqueda de apoyo experimental para tus decisiones, es necesario que tu estrategia se asiente en los cimientos adecuados. No basta con disponer de datos ni con desplegar algoritmos populares. Sobre todo, y como siempre, es necesario trabajar con inteligencia y desde el dominio de tu ámbito de negocio; es preciso modelar bien la realidad compleja de los procesos que estás tratando de optimizar, para recabar los datos que son útiles, para disparar experimentos en base a hipótesis sensatas, y para visualizar los resultados de forma que sean accionables. Es decir, hay que hacer mucho más que acumular datos y delegar el trabajo en mágicas herramientas tecnológicas para que nos digan qué hay de valor en ellos. Recurriendo a un tópico bien conocido, no basta con abrir la jaula y esperar a que el ansiado pajarito tenga a bien posarse dentro de ella.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios .

A %d blogueros les gusta esto: