¿Existe un método avanzado de aprendizaje automático que produzca predicciones interpretables?

No estoy exactamente seguro de lo que quiere decir con “interpretable”, pero puede revisar el modelado analógico. Está pensado para modelar la analogía en humanos, por lo que se utiliza con mayor frecuencia en investigaciones que involucran fenómenos humanos en flujo, principalmente lenguaje. Las predicciones se dan como probabilidades de ocurrencia para un cierto número de clasificaciones. La clasificación con la probabilidad más alta es la única importante si solo necesita una respuesta, pero todas las predicciones son interesantes porque puede ver exactamente qué patrones en los datos de entrenamiento hicieron que aparecieran ciertas predicciones. También puede comparar las predicciones de variación con la variación de la vida real.
Los estudios que utilizan modelos analógicos generalmente informan una precisión basada en las predicciones con la mayor probabilidad, pero también informan qué tipos de errores se cometieron y por qué. Esto se puede comparar con las variaciones en los datos de la vida real. Por ejemplo, los niños tienen menos “datos de entrenamiento” porque tienen menos experiencia lingüística, por lo que es interesante y valioso para su modelo si el modelado analógico, dado un pequeño conjunto de entrenamiento, produce los mismos tipos de errores que los niños. Otro ejemplo involucra el uso de a y an en inglés. La regla que se da en la gramática inglesa es que “a” se usa antes de las consonantes y “an” antes de las vocales, pero en la vida real hay una variación de alrededor del 2% (es posible que escuches a alguien decir una manzana de vez en cuando). El uso clásico del modelado analógico es mostrar los patrones de palabras donde ocurre esta fuga en hablantes nativos de inglés, y se puede hacer sin proporcionar al algoritmo ninguna de las excepciones de tipo manzana a la “regla” gramatical.

Renové el módulo de Perl y lo puse en CPAN: Algorithm :: AM – Clasifique datos con modelado analógico – metacpan.org. Tenga en cuenta que el algoritmo no es muy rápido, aunque debería haber algunas formas de paralelizarlo aún más si alguien está interesado en eso. Puedes pedirme ayuda si así lo deseas.

No sé cuánto necesita un modelo avanzado. Las redes bayesianas, especialmente las dinámicas redes bayesianas, vienen a la mente. Son útiles para construir un modelo de probabilidad explícito sobre un conjunto de variables relacionadas que pueden representar cantidades o eventos significativos.
BN también puede generalizarse para mezclar nodos deterministas (por ejemplo, suma o integral de alguna variable dada) y estocásticos, pero la estimación de parámetros puede volverse desagradable rápidamente.