martes, 2 de enero de 2024

Sociales y nacionalismos

Uno de los más grandes misterios de la educación pública podría ser a quién coño se le ocurrió crear la asignatura de "sociales" tal como está configurada. Es decir, una asignatura que supuestamente tiene que ver con el periodismo, la historia, el derecho, la economía, la psicología..., y resulta que se dedican a obligarle a los niños a tener que recordar en qué localidades se extrae cebada, hay cerdos, oro...

El perfil de una localidad, lo que nos va a ayudar a poder convertir un lugar en un vector, nos ayuda a crearlo la asignatura de sociales. En algunos colegios tuvimos la oportunidad de hacer excursiones a toda la región, para así darle un perfil a cada localidad: que si una empresa de embutidos, que si una catedral, que si un museo... Poco a poco los niños podrían tener una manera de atribuir perfiles a los colectivos.

Si nos damos cuenta esa es una manera natural que tiene el ser humano de pensar; y podríamos especular sobre cualquier animal hasta el punto de suponer que es generalizable. Eso que yo llamo en mi teoría "auditoría" consiste en una manera de codificar una información para darle un tratamiento vectorial. Es decir, se trata de la primera fase que necesita un transformer: una codificación de la información que se le pasa como entrada. Sin una auditoría no es posible constituir una conexión entre los símbolos confeccionados por la sociedad (la simbología de su socioléctica) y una manera de sancionar tales impresiones con un lenguaje superior: el lenguaje del que se valen los LLMs para mejorar y que ninguna sociedad comparte al exterior, las fórmulas de democratización de los usuarios que intentan transmitir sus méritos al producto.

Pero volvamos a la asignatura de sociales: tantos cerdos, tantas ovejas, tantas cabras..., hacemos una auditoría, contamos los habitantes, tomamos en cuenta dónde hay barnearios, minas de oro... Toda esta auditoría conforma espacios vectoriales que el agente tiene que recordar para no suspender la asignatura. Un tarzán no habría tenido que aprender la asignatura, pero fue capaz de recordar la de veces que el puma atacaba a los monos, cuándo el gorila se ponía agresivo y con quiénes..., el tarzán no tuvo una asignatura de sociales, pero aún así tuvo que hacer su propia auditoría.

Ahora bien, le preguntamos al niño de sociales, al tarzán o al transformer cuántas veces ocurrió tal o cual cosa..., y se le ha olvidado. Eso que tenía que recordar lo recordó para el examen, o ese tarzán tomó en cuenta algo que en realidad almacenaba por dentro..., pero no en formato de número. Efectivamente, los transformers funcionan bien, pero no saben contar. No es una paradoja, es un detalle MUY importante.

Tan pronto como decimos que la auditoría exige tener que contabilizar cosas luego aseguro que atribuir naturales es irrelevante ¿Cómo es posible? Pues bien, no hay contradicción si sabemos distinguir entre la contabilización, o la combinatoria, con la atribución de naturales o enteros. Dicho así acabo de decir una completa locura, lo sé, pero hay que darme un poco de margen para explicar mejor las cosas.

Cuando un niño aprende que hay dos ciudades como Torre Pacheco y Archena que tienen perfiles económicos parecidos, luego recordará la Semana Verde de Torre Pacheco - que es una feria donde se reúnen los agricultores para exportar sus productos a escala incluso mundial. Así, uno se percata de que tiene un vector donde las dos localidades son iguales, salvo por el detalle de que una es "mejor" que la otra. De la misma manera, podemos tener Lorca y Murcia, ambas con una catedral. Pero comparativamente la de Lorca es pura fachada con respecto a la murciana. Es decir, tan pronto como se crean unos vectores éstos empiezan a manipularse para que los tókenes se acerquen o se alejen y cumplan mejor su objetivo. Es decir, el objetivo de ese vector no es contabilizar vacas, catedrales, etc..., más bien se vale de ese conteo para combinarlo con otra información ininteligible con el conteo.

Las operaciones que se manejan con vectores y que trascienden a lo enumerable son justamente las que tienen que ver con las relaciones más sociales. Es por ello que si la máquina está bien hecha entonces tan pronto como tiene un vector que contabiliza cosas luego lo que contabiliza no será lo relevante.

Así, primero se crea una definición del término usando n-gramas para ver qué semas se relacionan con qué semas. Acto seguido, un estudio concienzudo nos obliga a cambiar esos n-gramas almacenados para que algunos tókenes estén o más cerca o más lejos según se haya establecido dentro del sistema. Es decir, hay un metalenguaje que fiscaliza a la semántica, básicamente lo que dice es qué se parece a qué, o qué está contenido en qué... Por lo que se tiene que manipular los tókenes para que la función de atención sea lo más acorde con lo que se espera de ella.

Esto nos lleva a los nacionalismos: de cómo se vulneran algunos vectores para intentar favorecer a los de tu grupo. Así, siempre dará la impresión de que "los tuyos" son los mejores: se trata de un sesgo que favorece la defensa de tu grupo, y que se puede hacer patología volviéndose nacionalismo.

Como los LLM's no tienen identidad de grupo no parece que se vayan a volver discriminatorios. Sin embargo, en cuanto se les confiera una idea del yo será ineludible que, en la medida en la que funcionen como se espera, éstos se vean a sí mismos superiores: forma parte de la evolución natural del lenguaje en cualquier ser vivo.

Sea como fuere, el problema de los sesgos es la madre del cordero. Por ello, la capacidad que se tenga para mantener a la máquina dentro de lo "políticamente correcto" coincidirá con su capacidad para ser todo lo creativa que desee: porque se trata de confrontar a las dos máquinas como en un GAN. Es decir, la ética en el lenguaje es ineludible.


No hay comentarios:

Publicar un comentario

Tierra: Día 19/07/24 punto de inflexión

Ayer se produjo el punto de inflexión a escala mundial. Dependiendo de lo que hagan y no hagan los gobiernos tras lo sucedido ayer las dos c...

Entradas populares