lunes, 25 de febrero de 2019

La forma correcta

Existe una forma correcta de hacer las cosas: de relatar, de exponer, de contar las cosas. Hoy querría desahogarme con unos planteamientos básicos. Es como si la máquina pudiera imitar la manera de hacer las cosas, ¿o eso es algo que aún no es capaz de hacer?




Una de las cosas que me habría interesado exponer ahora es tocar la idea del libre albedrío, y la poca exclusividad que tiene nuestras vidas con respecto a ese concepto. Pero como hace frío, salgo un momento a echar una meada y ahora vuelvo...

Uff..., esto ya es otra cosa. Me ha dado tiempo para pensar en el tema musical.

Hace un par de entradas o así, expuse un relato que, en un 99% es real, no me preocupé demasiado por las formas ni por los tiempos..., pero, en esencia exponía la realidad sin filtros especiales o añadidos de carácter exagerado. Por otro lado, ya en este blog, he estado exponiendo relatos que, principalmente, eran falsos en un 99%: Mediante la sobreexposición de sentimientos se van contando hechos que no sucedieron, pero que encajan con nuestros sentimientos.

Por la manera de contar las cosas una misma historia puede llegar o no. No creo que sea una cuestión de ir presentando los distintos arquetipos del género escogido, sino también de encontrar el lenguaje que permita activar tales arquetipos dentro de su medio oportuno.

El documento que yo aseguraba que era real estaba lleno de ironías, y estaba presentado muy en bruto. En ocasiones se generaban ambigüedades en la exposición de los hechos. Era un texto que invitaba más a hacerse preguntas que a obtener respuestas.

Sin embargo, otros textos más cuidados nos ofrecen una exposición muy clara de cuanto sucede amparado bajo una voz por parte del autor más apartada de la historia. Dentro de la intensidad planteada ofrece una gran gama de respuestas que trascienden a cualquier pregunta que tuviéramos de antemano.

El documento real oscurece y el documento falso ilumina, a mi juicio. Tampoco sé si me equivoco mucho al respecto.

A medida que leo ensayos de mis colegas informáticos observo lo errados que están, son como muy cucos. Es un hecho consumado que mis conocimientos están muy limitados en muchas áreas de la informática, y que hay muchos temas en los que hay una gran cantidad de expertos de los que me queda mucho por aprender. Soy torpe, como cualquier humano, en muchos aspectos. Ahora bien, veo que los ensayos también son torpes: y en temas demasiado evidentes. Veré si hoy lo expongo con claridad.

En estos años tanto Google como Facebook están compartiendo una tecnología que permite mejorar la capacidad para entender textos en el lenguaje natural (el lenguaje que usamos las personas para comunicarnos: inglés, castellano, etc). Y, muy acertadamente, como he comentado en este blog se ha encontrado una relación entre la interpretación gráfica y la interpretación de un idioma.

Pues bien, parece que va a ser por estos años cuando un americano (o un británico) descubrirá para nuestra sorpresa (jiji) que las imágenes están regidas por el mismo protolenguaje que usamos para leer textos.

Es decir, habrá que esperar a que alguien que sí es escuchado se marque el tanto, pero la cosa es muy simple: parece que una de esas grandes cuestiones de la filosofía va a ser resuelta de la única manera que puede resolverse - según el caso - encontrando el vínculo existente entre la consciencia y la interpretación de la realidad. Esto es, interpretamos imágenes en la medida de que seamos capaces de incorporar su descripción dentro de un lenguaje; y ese lenguaje es la matriz del lenguaje natural.

Insisto en que negar lo anterior sólo nos llevaría a un cúmulo de contradicciones y despropósitos..., pero ese desarrollo no es el objeto de este documento.

Me imagino yo explicando a un pintor que sus técnicas de pintura reconoce un sujeto, un predicado..., que cada símbolo tiene una morfología y posee un significado pragmático dentro del conjunto según el esquema literario escogido. Me hace gracia pensar cómo me contradiría ese profesional.

Yo, por mi parte, ya estoy empezando a desarrollar las técnicas de clasificación no supervisada..., a ver a qué conclusiones llego a la hora de analizar imágenes. Que podría combinar con la expresión matemática que generé para interpretar el problema de la interpretación gráfica y que, según parece, sólo yo tengo.

Así que he tenido la oportunidad de volver a leer antiguos ensayos que, hoy día, me consta - no están siendo tomados en cuenta. Hablo de ensayos de hace dos décadas y que son muy esclarecedores sobre cómo funciona el lenguaje y, por ende, la interpretación de las imágenes / la realidad.

Fue inteligente por mi parte guardar esos dosieres de "Investigación y Ciencia" que mostraban aspectos bien conocidos por los filólogos y que, por supuesto, los informáticos no sabemos porque nunca nos interesó. Concretamente, el tema clave en cuestión, es sobre la lengua criolla. Es maravilloso pensar que no necesitamos experimentar mucho más de lo que ya se ha experimentado: sólo hay que saber consultar a los expertos adecuados.

Cuando leemos estos documentos increiblemente tecnológicos y muy caros observamos una característica bastante crucial sobre estas máquinas capaces de ganar al más experto jugador de ajedrez, o capaces de dar lecciones a los más expertos inversores financieros. Estas máquinas con capacidad de hacer las más brillantes demostraciones matemáticas, en virtud de cómo son diseñadas por los actuales informáticos, aún no son capaces en su lenguaje de distinguir tres modos en los verbos: tiempo, modalidad y aspecto.

Bueno, cualquiera tiene derecho a echarme en cara lo que considere oportuno: ¿qué se creerá éste sobre lo que son capaces los modelos neuronales y lo que no son capaces de hacer? Sin embargo, cuando leemos un poco sobre esto que acabo de contar, se descubre que hasta las personas menos cultas, las menos capaces, tienen la cualidad nunca mermada de reconocer esos tres modos. Y tales modos son nuestra capacidad para distinguir cuándo una imagen representa a alguien que vino de viajar, alguien que quiere iniciar un viaje y alguien que está viajando. Sin esa capacidad de apreciación es imposible pintar nada. Y, efectivamente, cuando veo el sistema vectorial escogido no observo estas apreciaciones.

Es decir, aún estas supermáquinas tan caras no son capaces de simular o entender el lenguaje que escogen dos personas para desarrollar su comunicación más profunda que versione el idioma que le enseñaron. Y eso, señores, es muy cutre. O, por lo menos, irónico. Es decir, significa que hay algo estructural y demasiado importante que no se está publicando.

¿Es posible que no se publique la verdadera tecnología a la hora de mostrar cómo se ha creado rostros falsos usando el deep learning? Es posible. Es posible que las acciones semánticas se divulguen mermadas para que los investigadores no tengan competidores. O también es posible que esas imágenes sean producto del XAI (explanaible artificial intelligence) que, en realidad, no asume lo que comento y ofrece resultados aparentes. Sigue habiendo problemas con la escalabilidad, que, para mí, conseguí resolver.

Vemos caras de gente que no existe y que se comportan bajo un azar que cumple los parámetros de lo que para nosotros es un rostro válido..., con expresiones que podremos empatizar con ellas. Pero, en el fondo, parecen equivocarse en las redes semánticas. Siguen siendo títeres sin vida.

Me parece interesante estos años que estamos viviendo, porque en cualquier momento a uno de esos a los que sí le dejan ser famoso se le encenderá la bombilla. Entonces veremos a todos esos mentores que tuvo dándose palmaditas en la espalda..., debería de tener envidia de algo así..., no sé qué sensaciones tengo. Habrá que esperar a vivirlo.

En cualquier caso, estos matices son los mismos que estuve explicando sobre cómo se comporta la consciencia. Se trata de establecer las bases para plantear el problema de correspondencia entre el lenguaje de la entrada y el lenguaje de la salida y, como ese problema es irresoluble, ahí ubicamos la libertad del agente para abordar su implementación de manera que su cerebro sobreviva (aplicar el reinforce learning como mecanismo de autocontrol médico).

Es más, a todo esto, ¿puede una máquina confluir con un agente humano un dialectal de manera que se quede en la esencia del lenguaje para apartar los aspectos poco pragmáticos por los roles que desempeñen? Todos sabemos cuál es la respuesta con las máquinas actuales; de hecho, aún muchos siguen sin comprender cómo confluyó el lenguaje criolla, que es el mismo estructuralmente independientemente de si sus orígenes eran ingleses, españoles, holandeses o franceses.

Aquí estaré comiendo palomitas...



Hasta la próxima 
sucedáneos






No hay comentarios:

Publicar un comentario

Tierra: Día 19/07/24 punto de inflexión

Ayer se produjo el punto de inflexión a escala mundial. Dependiendo de lo que hagan y no hagan los gobiernos tras lo sucedido ayer las dos c...

Entradas populares