viernes, 25 de diciembre de 2020

Codificación sobrentendida

Éste podría haber sido un buen día para avanzar en cualquiera de las tres líneas que de desarrollo que vengo desarrollando. Y el caso es que me paro a pensar: ¿es posible que realmente haya tirado la toalla a volver a investigar?

He podido observar cómo la tecnología está avanzando, aun dejándose por el camino unos cuantos puntos. A medida que ponen a entrenar a un supercomputador éste se ve capacitado para hacer una enorme cantidad de tareas por imitación. Sin embargo, más allá de tener que tocar el tema de la empatía, de entrar en el ritmo de la historia del ser humano, se observa otra clase de limitaciones fácilmente asumibles en un humano.

Y eso es debido a que los procesos de reconocimiento, empero, son exponenciales. Se tratan de meras explosiones combinatorias combinadas con cálculos bien definidos que no profundizan del todo. Es decir, si bien todos los lenguajes naturales pueden observarse con una relativa complejidad gramatical, cada uno de ellos se sostienen por sintagmas muy parecidos: a penas cambian algunos detalles poco significativos. Al final es más fácil que se entiendan dos personas que se conozcan más fácilmente que un erudito que se acerque a ellos y conozca su idioma mejor.

Me explico: se dice que en Cartagena no pronunciamos el fonema de la "de" débil, cuando en realidad sí lo hacemos, pero más flojo de lo común. Eso quiere decir que un tercero no lo escucha porque el sonido que usamos para exponerlo es demasiado bajo como para percibirlo. Sin embargo se emite el sonido, de hecho, a los niños pequeños - aprovechando que hay que hablarles más lento y claro - se les increpa para que se aprendan dicho sonido no mudo. Así, con el tiempo aprenderán a emitirlo, que no sea escuchado en ocasiones y, al mismo tiempo, que otro de los mismos clanes crea haberlo escuchado, cuando en realidad es posible que no.

Pues bien, por el momento, esto mismo no lo incorporan las máquinas cuando aprenden a largo plazo dentro de la filosofía conexionista. Puede que con la conectivista sí sea posible, pero entonces muchos logros de la generación de texto que se han conseguido con redes neuronales es posible que no se sepa imitar - o quizá sí. De hecho, me puedo imaginar la estructura interna al más puro estilo conectivista, estableciendo invariantes y explicando paso a paso cómo se procesa cada actividad necesaria para elaborar una buena línea de pensamiento.

Y es que la regla bien podría ser que se debe reconocer la manera ortodoxa de hablar y llevar a cabo ligeras modificaciones de mínima distancia WER y, en virtud del corpus en el que se esté trabajando (analizado mediante n-gramas) adivinar cuál fue la verdadera palabra que se quería poner en su lugar.

La cosa interesante es establecer qué mueve a pensar a una criatura que flexibilizar la ortodoxia le va a llevar por el camino de una mejora en la estética, porqué le iba a beneficiar. Y quizá la respuesta esté en que las criaturas racionales necesitan de un lenguaje compartible con distintos clanes y, al mismo tiempo, suficientemente secreto para tus grupos familiares - y así poder conspirar con el debido secreto. O eso puedo especular.

La relajación del idioma y la capacidad para entender tal relajación debe formar parte de las habilidades del animal capaz de aprender un lenguaje y, al mismo tiempo, debe estructurarse de esa manera la propia evolución de su técnica. En la medida de que el mismo proceso de aprendizaje no incorpora, en apariencia, la capacidad para descomponer las palabras en sílabas, o estudiar su propia composición mediante un metalenguaje, consideraría que los transformers aún están faltos de unos aspectos cruciales antes de rayar la perfección.

Por otro lado, también tenemos cómo la gramática no puede ser capturada a partir de la morfología, sino a partir de la misma semántica; esto es porque la propia gramática parece inducirle a la máquina la inferencia que debe adoptar y, si ésta se basa en la morfología, entonces habra demasiados casos que un humano no cometería el error. Los mecanismos de combinación de términos todo apunta a que deba regirse por un álgebra de Lambek a la hora de ir clasificando tanto la clase a la que pertenece una palabra sino también su polaridad (el sentido emotivo, ya sea positivo como negativo dentro del conjunto de la frase).

Vamos, en definitiva, que se observan aún algunos aspectos importantes que el conexionismo no podrá superar a la conectividad.

No hay comentarios:

Publicar un comentario

Tierra: Día 19/07/24 punto de inflexión

Ayer se produjo el punto de inflexión a escala mundial. Dependiendo de lo que hagan y no hagan los gobiernos tras lo sucedido ayer las dos c...

Entradas populares