miércoles, 13 de febrero de 2019

Ya tengo una teoría completa para el LN

Se ha convertido en algo increiblemente útil los libritos de Chomsky que me he podido agenciar por Internet..., ¡no veáis lo caritos que son y lo difícil que son de conseguir! La razón por la cual no se pueden conseguir fácilmente es porque se trata de libros en inglés para angloparlantes, por lo que las bibliotecas españolas, directamente, no lo incluyen en su catálogo.



El lenguaje natural, así como su procesamiento, ya tengo las estructuras teóricas que pueden justificar su constitución, génesis..., no recuerdo los términos técnicos, los tendré apuntados por ahí... El asunto es que, a falta de probar la capacidad para sintetizar frases, en principio sí parece capaz de introducir todos los contenidos.


Así que, para que sea interesante de leer, iré desglosando algunas ideas que podrían ser de interés.

Para empezar, voy a reconocer un ciclo de vida diferente: el de espiral, espiral hacia adentro. Esto es, aprovechando los ficheros que pueda encontrar, me iré formando un corpus que irá clasificando las distintas frases a partir de su pragmática (algo así como webscrabbing). De esta manera, tendremos dos almacenes más: uno donde se almacena la morfología y otro donde se almacena la sintaxis; ahora bien, la contradicción a lo que me han enseñado es: los almacenes están en paralelo, no se utiliza secuencialmente uno detrás de otro. Es decir, el modelo en espiral entenderá que hacia atrás del corpus se encuentra la morfología y hacia adelante se encuentra la sintaxis.

A partir de las distintas estructuras que hay que presentar para que se almacenen los datos, me veo cómodo tanto trabajando bajo una filosofía simbolista como conexionista, lo que quiere decir que no es ni prescindible ni imprescindible usar redes neuronales. Lo cual es lo segundo que me produce perplegidad.

El cuarto almacén es el semántico, se alimenta de las acciones semánticas reconocidas desde la sintaxis; sin embargo, para sorpresa de tantos y tantos y tantos años estudiando eficiencia en los lenguajes, de cómo reducir la complejidad algorítmica para evitar explosiones combinatorias..., la tercera perplejidad que me llevo (que en realidad fue la primera cronológicamente) es que para constituir este almacén hay que explotar combinatorialmente la sintaxis. Es decir, que no hay que usar algoritmos que predigan el siguiente token ni tablas por el estilo.

Una vez hecho esto, nos adentramos en la cuarta perplejidad: la información debe ser replicada con respecto al corpus, para funcionar con un álgebra completamente independiente (basado en clausuras). Ahora bien, pudiendo introducir un álgebra conceptualmente lo más perfecta posible, resulta más apropiado introducir un álgebra basada en lo tridimensional, y reducir así su capacidad de cómputo, para que le sea más sencillo representar frases sencillas y, al mismo tiempo, que sea más sencillo trabajar con un metalenguaje que corrija la morfología y la sintaxis.

Esto último es debido a que, en el fondo, la aritmética que se constituya se va a convertir en una teoría cuyo número de teoremas siempre va a ser incompleto, por lo que es más práctico obtener inspiración a partir de algo conocido: ¿la experiencia física? De esta manera, ¿se pueden deducir las clausuras suficientemente prácticas a partir de la modelización física de la programación orientada al objeto como he hecho yo? Ejemplo: la instanciación significa dependencia temporal, una clase nominal significa independencia espacial, los mecanismos de codificación representarían mecanismos de serialización de los modelos físicos..., etc. A mí esa manera de trabajar me ha funcionado bastante bien para representar cualquier afirmación del castellano, japonés, inglés..., etc.

Al final, técnicamente, puedo decir que lo he conseguido. A diferencia de otras ocasiones, esta vez no he compilado todo el proyecto. En estos últimos días no he parado de recibir posibles ataques informáticos, o siendo víctima de errores del sistema operativo..., al final se me ha borrado un USB de 32GB con mucha información, código..., nada que sea irrecuperable, pero claro..., te tira para atrás, te hace perder tiempo..., esas cosas.

Lo tengo todo en el cuaderno, estructuras sueltas..., y un proyecto cuyo presupuesto supera mis espectativas personales. Al fin y al cabo, hay que pensarlo fríamente: terminé un proyecto increible con un código maravilloso que era la estructura más eficiente que existía con una potencia capaz de abordar casi cualquier lenguaje científico (todo lo que sea susceptible de ser representado bajo fórmulas booleanas y cuantificadores) y nadie me hace caso. Por eso, si terminara de constituir esta estructura y me creara un traductor entonces, ¿me haría alguien caso tras pegarme la paliza a programar como un auténtico gilipoyas? La parte de diseño ya la tengo hecha, las estructuras sueltas también..., la parte más misteriosa la tengo resuelta. Las dudas que me surgían las tengo desveladas: ¿para qué hacer algo que no voy a sacar provecho y que supondrá una competición contra señores que querrán que no saque el producto?

No hay que olvidar que aún dudo que estas cosas me den de comer; y ese problema, para mí, es un verdadero problemón.

Por otro lado, podría dedicarme a otra cosa: ¿sería interesante que empiece a desarrollar mis conocimientos para la síntesis del ARN? He encontrado un curso (gratuito, por supuesto) y, si estuviera a la altura, bien podría ser compatible con las estructuras que ya he implementado y ofrecer mecanismos innovadores de cara formatos conocidos. Así que aparcaré este proyecto que, muy probablemente, alguien me plagiará a su manera - o le sacará provecho - mientras sigo en el anonimato más absurdo. Ya nos iremos leyendo.



Hasta luego 
sucedáneos







No hay comentarios:

Publicar un comentario

Tierra: Día 19/07/24 punto de inflexión

Ayer se produjo el punto de inflexión a escala mundial. Dependiendo de lo que hagan y no hagan los gobiernos tras lo sucedido ayer las dos c...

Entradas populares