lunes, 20 de abril de 2026

ZX2SB: Otra vuelta atrás

Rediseño del IR en ZX2SB: por qué abandonar el AST y conservar tokens semánticos

Índice de entradas del conversor


Otra vuelta atrás: IR con tokens

Como ha ocurrido otras veces durante el desarrollo del proyecto, cada vez que empiezo a generar código válido aparece un problema no contemplado y me obliga a retroceder un paso más. En este caso ha sido un tema de espacios excesivos.

No sirve de nada generar código como:

LET A ( C + D ) = G ( 3 * 4 )

en lugar de:

LET A(C+D)=G(3*4)

En una máquina con recursos limitados, cada carácter cuenta. Podría parecer sencillo “eliminar espacios”, pero eso llevaría a errores como convertir:

IF A AND B THEN C = 3

en algo no válido como:

IF AANDB THEN C=3

Para usar únicamente los espacios imprescindibles es necesario identificar correctamente palabras reservadas, variables, operadores y separadores. Eso implica que los tokens deben estar disponibles en la fase correcta: el generador. Por simplificar el IR inicial, no los incluí… y ahora solo quedaban dos opciones: volver a tokenizar en el generador (lo cual es absurdo) o generar el IR conservando los tokens.

En esta entrada documento otro de los cambios arquitectónicos realizados en ZX2SB. Tras decidir no usar un AST completo por su complejidad, pasé a un IR lineal simple. Ahora el paso lógico es evolucionar hacia un IR lineal basado en tokens semánticos.

Aunque puede parecer otra “vuelta atrás”, en realidad es una decisión motivada por la naturaleza del lenguaje BASIC, por la experiencia práctica adquirida durante el desarrollo del transpilador y, sobre todo, por la necesidad de generar código SuperBASIC limpio, editable y sin reconstrucciones artificiales.


Índice


¿Qué es el IR en ZX2SB?

Nota auxiliar: Un AST (Abstract Syntax Tree) es una estructura de datos en forma de árbol que representa la organización sintáctica de un programa tras el análisis del parser, eliminando elementos puramente textuales y conservando únicamente su estructura semántica. Cada nodo representa una construcción del lenguaje y se almacena normalmente en memoria como una jerarquía de objetos, aunque también puede serializarse para depuración u otros pasos intermedios del compilador.

En lenguajes más complejos y de estructura libre como C o Pascal, el AST es imprescindible. BASIC, en cambio, es un lenguaje más sencillo y organizado por líneas, lo que permite simplificar su representación interna.

En ZX2SB, el IR (Intermediate Representation) es la forma intermedia generada tras el análisis sintáctico y semántico del ZX BASIC original, y sirve como base para:

  • Renumeración de líneas
  • Reescritura de saltos
  • Optimización estructural
  • Generación del código SuperBASIC final

El IR no es solo texto, pero tampoco es ejecutable: describe la intención del programa sin la complejidad de manejar un árbol completo, y además se puede guardar fácilmente como texto lineal.


El problema del AST completo en BASIC

Un AST clásico es ideal para lenguajes donde la semántica está profundamente anidada y la estructura es jerárquica.

BASIC, y en particular ZX BASIC, tiene características distintas:

  • Sentencias lineales
  • Control de flujo basado en números de línea
  • Expresiones relativamente simples
  • Poca recursividad sintáctica

Mantener un AST completo obligaba a aplanar el árbol para generar código, volver a decidir espaciado y operadores, y en muchos casos reinferir información que ya se conocía.

“¿Por qué tengo que volver a tokenizar o reinterpretar lo que yo mismo ya había parseado?”

Durante un tiempo decidí continuar con el IR simple porque era “suficiente”, pero al final la realidad es que los errores no se mantienen: se refactorizan.


La decisión: IR lineal con tokens semánticos

La solución adoptada es intermedia entre un AST completo y un IR puramente textual:

Un IR lineal, basado en tokens tipados y semánticamente anotados.

Cada sentencia BASIC se representa mediante:

  • Un tipo de sentencia (IF, LET, FOR, PRINT…)
  • Campos estructurales explícitos
  • Expresiones como listas ordenadas de tokens

No existen árboles internos complejos ni se guardan nombres textuales de sentencias, sino identificadores internos, lo que simplifica enormemente el trabajo posterior.


Tokens canónicos y eliminación de ambigüedad

Uno de los problemas recurrentes era usar nombres distintos para el mismo token en distintos módulos. Un simple Par_Ape frente a ParenIzq puede provocar horas de depuración absurda.

La solución fue eliminar completamente:

  • Nombres textuales de tokens
  • Strings mágicos entre módulos
  • Dependencias implícitas entre fases

En su lugar se introdujeron TokenID canónicos:

  • Identificadores numéricos estables
  • Definidos en un único enum
  • Usados por lexer, parser, IR y generador

Ahora todo el sistema habla exactamente el mismo idioma.


Espacios, formato y generación correcta

El nuevo IR resolvió definitivamente el problema del espaciado. La idea clave es simple:

“No eliminamos espacios. Decidimos cuándo ponerlos.”

Al conservar operadores, paréntesis y separadores como tokens reales, el generador puede emitir código compacto o legible, sin ambigüedades y sin depender de parches, y evitando usar expresiones regulares, no se soportan en SuperBASIC y el objetivo final es portar el código de ZX2SB a SuperBASIC.


Ventajas prácticas del nuevo IR

  • No se recompone información ya conocida
  • No se retokeniza texto generado
  • El IR es imprimible y depurable
  • El código SuperBASIC generado es editable
  • El sistema escala sin hackear fases anteriores
“El diseño deja de luchar contra el lenguaje y empieza a trabajar con él.”

Frase muy bonita que solo quiere decir que me auto animo a seguir adelante, a pesar de las peleas que tengo contínuamente con el código, es mi primer "compilado" completo y se nota.


Conclusión

Abandonar un AST completo no significa perder rigor si el IR está bien diseñado. En ZX2SB ha supuesto mayor coherencia, menos fases ficticias y un generador más simple y fiable.

Como suele ocurrir en ingeniería de lenguajes, la solución elegante no fue añadir más estructura, sino conservar solo la estructura que importa.


ZX2SB Project (algún día será un proyecto serio; de momento es una fuente constante de problemas… y un entretenimiento mental bastante divertido)

viernes, 17 de abril de 2026

ZX2SB: El generador de código SuperBASIC

Índice de entradas del conversor


El generador en ZX2SB: diseño, decisiones y límites conscientes

En el proyecto ZX2SB, el generador es el componente encargado de transformar la representación intermedia de un programa ZX BASIC en código SuperBASIC para el Sinclair QL. Aunque pueda parecer que su función consiste únicamente en “emitir líneas de código”, en la práctica es uno de los elementos más importantes y delicados de todo el sistema.

Este artículo describe qué hace realmente el generador, cómo está diseñado, qué problemas resuelve y, sobre todo, qué problemas decide conscientemente no resolver. Esa última decisión resulta clave para entender por qué ZX2SB va más allá de un simple transpilador mecánico .


Índice


1. ¿Qué es el generador?

Conviene recordar una distinción fundamental: un compilador genera un ejecutable, mientras que un transpilador genera código fuente en otro lenguaje, que puede ejecutarse directamente o servir como entrada para otro compilador.

En ZX2SB, el generador actúa como la última fase del transpilador. Recibe una representación intermedia (IR) del programa ZX BASIC, ya validada por el lexer, el parser y el análisis semántico, y produce un programa SuperBASIC funcional y estructurado.

Desde el principio se descartó una traducción línea a línea. El generador trabaja con conocimiento de contexto: estructura, bloques, flujo de control y decisiones previas. No se limita a copiar instrucciones; las reformula

NOTA: 

La “representación intermedia” es una forma neutral de describir el programa una vez entendido sintácticamente, pero antes de decidir cómo escribirlo en el lenguaje de destino. Es como pasar de una frase hablada a su significado real, antes de volver a escribirla en otro idioma.
 

Qué no es ZX2SB

ZX2SB no es un emulador del ZX Spectrum ni una herramienta para ejecutar directamente programas ZX en el Sinclair QL.

Tampoco es un traductor mecánico línea a línea que intente forzar equivalencias entre dos BASIC muy distintos ignorando sus diferencias internas.

ZX2SB es un transpilador consciente: transforma programas ZX BASIC en código SuperBASIC legible, estructurado y extensible, dejando explícitas aquellas partes cuyo comportamiento no puede trasladarse correctamente sin una capa de ejecución adicional.

Su objetivo no es “que funcione como sea”, sino producir código que pueda entenderse, mantenerse y evolucionar en el entorno del QL. 

En esta fase, el objetivo se cumple tal cual, en fases posteriores se puede ampliar para incluir un entorno de simulación del ZXBasic y que el programa se comporte como en un Spectrum en Basic.


2. Generación estructurada de código

Una de las primeras decisiones fue producir código SuperBASIC claramente estructurado, incluso cuando el código ZX original no lo está explícitamente.

En ZX BASIC es habitual encontrar varias sentencias en la misma línea, separadas por dos puntos (:). Por ejemplo:

PRINT A: LET B=B+1 : LET col=col+1
El generador transforma este tipo de líneas en una estructura explícita y mas legible:
  PRINT A
  LET B=B+1
  LET col=col+1

Cada sentencia pasa a ocupar su propia línea. El caso más significativo es el IF. En ZX BASIC no existen ELSE ni END IF, y un IF puede contener múltiples sentencias en una sola línea. El generador transforma esta construcción en un bloque explícito:

  • una línea con la condición IF,
  • una línea por cada sentencia interna,
  • un END IF final.
De esta manera la senténcia
IF A>10: PRINT A: LET B=B+1
genera:
IF A>10 THEN
  PRINT A
  LET B=B+1
END IF

Esta decisión no se tomó por comodidad, sino para garantizar: 

  • Claridad semántica
  • Coherencia estructural
  • Facilidad de mantenimiento
  • Posibilidad de posteriores optimizaciones. 

Muchos programas antiguos funcionan, pero son difíciles de leer incluso para humanos. Aquí el objetivo no es solo “que funcione”, sino que el resultado sea un programa un poco más comprensible y modificable.
 


3. Numeración, control del flujo y bloques

Para poder descomponer líneas múltiples en sentencias independientes, el generador debe modificar la numeración de las líneas.

La estrategia empleada consiste en tomar el número de línea origianl del ZX Basic y añadir un contador de dos dígitos. Así, una línea con varias sentencias se expande de forma determinista.

Por ejemplo, a partir del código ZX:

    150 LET A=3 : LET C=5 : GOTO 532

El generador produce:

    15000 LET A=3
    15001 LET C=5
    15002 GOTO 53200

Estos números no siempre son válidos para el QL (en ZXBasic los números van del 1 al 9999, en SuperBASIC del 1 al 32525), pero esa no es responsabilidad del generador. El renumerador posterior se encargará de normalizarlos.

El generador mantiene contexto suficiente para abrir y cerrar bloques, producir saltos coherentes y dejar el programa en un estado funcional, aunque todavía no directamente cargable.

El generador sí garantiza que:

  • los saltos son coherentes
  • los bloques se abren y cierran correctamente
  • el programa resultante es estructuralmente consistente.

Para el generador la numeración es solo una herramienta provisional. Se usa como andamio mientras se construye el programa final.


4. Instrucciones no portables

ZX BASIC y SuperBASIC difieren profundamente en áreas clave como:

  • Salida de texto (PRINT)
  • Gestión del cursor
  • Colores y atributos
  • Caracteres gráficos
  • Sistema de coordenadas y gráficos

Una traducción directa de estas instrucciones produciría programas que “funcionan”, pero cuyo comportamiento se aleja mucho del ZX Spectrum original.

El generador asume explícitamente que estas instrucciones no son directamente portables y evita resolverlas de forma incorrecta.


5. Convención FN_ y desacoplo

Para manejar instrucciones sin equivalencia directa, el generador adopta una convención clara y sistemática: emitir llamadas a funciones o procedimientos con prefijo FN_

El generador: 

  • No implementa su comportamiento
  • Se limita a transformar el código
  • La semántica se decide posteriormente

Por ejemplo, en lugar de generar directamente:

    BIN 11001101

como el comando BIN no existe en SuperBASIC, el generador produce:

    FN_BIN(11001101)

De este modo, el generador queda completamente desacoplado de la implementación concreta de estas funciones, manteniendo el sistema limpio y extensible.


6. Inicialización e inclusión de funciones FN_

Durante la generación, el sistema mantiene una lista de todas las funciones FN_ que ha utilizado durante el proceso de conversión. Al finalizar la generación, solo se incluyen aquellas funciones que han sido realmente necesarias, evitando así añadir código innecesario al programa final.

Además, el programa resultante se completa con varias secciones fijas, que quedan organizadas de la siguiente manera:

  1. Un bloque de inicio del sistema, que realiza una llamada a la función FN_INIT.
  2. El código convertido desde ZX BASIC a SuperBASIC.
  3. Si es necesario, una línea STOP que marca explícitamente el final del programa ZX.
  4. Las funciones FN_ que han sido detectadas como necesarias durante la generación.
  5. La implementación de FN_INIT

La función FN_INIT se encarga de preparar el entorno de ejecución en el QL: establece el modo de pantalla, crea una ventana de 32×24 caracteres y aplica una configuración básica que permite que el programa se ejecute de forma coherente y predecible.

El STOP final del programa ZX BASIC se añade de forma explícita porque, en BASIC un slto a una línea fuera del rango del programa es válida y provoca implícitamente la finalización del programa. Si se detecta que una línea del programa realzia un salto fuera del rango permitido, se añade esta línea de STOP, cambiando los saltos que existan para que apunten a esta nueva línea. De esta manera:

  • El programa generado se vuelve más determinista y sencillo de manejar
  • Se evitan posibles problemas derivados de que un salto coincida con alguna de las líneas añadidas posteriormente para las funciones FN

7. Qué se obtiene al final

El resultado del generador es un programa SuperBASIC que:

  • Es sintácticamente correcto
  • Preserva la estructura lógica del ZX BASIC original
  • No fuerza equivalencias incorrectas
  • Explicita claramente las dependencias externas

Este programa está listo para ser renumerado, indentado y ejecutado dentro de un entorno controlado.


8. El siguiente paso inmediato

El siguiente paso tras el generador es el renumerador, que ajusta definitivamente la numeración y produce un programa cargable y ejecutable en el QL. Con este proceso de renumerción se cierra la primera fase del proyecto.


9. Más allá del generador

El verdadero reto futuro no está en el generador, sino en lo que rodea a las llamadas FN_....

Para que los programas ZX se comporten de forma reconocible, que parezca que estamos en un gomas real, es necesario proporcionar una capa de ejecución que reproduzca el entorno del Spectrum: pantalla, cursor, colores, caracteres y primitivas gráficas.

Ese componente convierte a ZX2SB en algo más que un transpilador, pero merece un análisis independiente y se abordará en otro momento.


Continuará con el renumerador…

jueves, 16 de abril de 2026

ZX2SB: El Analizador semántico

Qué es un Analizador Semántico y por qué es una pieza clave en el transpilador

En un transpilador o un compilador clásico, el analizador semántico es la fase encargada de comprobar que un programa, además de estar bien escrito desde el punto de vista sintáctico, tiene sentido.

En el proyecto ZX2SB, cuyo objetivo es convertir código ZX BASIC a otro lenguaje, en nuestro caso SuperBASIC del QL, el analizador semántico juega un papel fundamental: es el encargado de interpretar el significado real del programa.


Las fases de un transpilador

Antes de entrar en detalle, conviene situar el analizador semántico dentro del proceso completo:

Código fuente ZX BASIC
        |
        v
  Analizador léxico (Lexer)
        |
        v
 Analizador sintáctico (Parser)
        |
        v
 Analizador semántico (Semantic)
        |
        v
 Generador de código
        |
        v
 Código destino (SuperBASIC)

Cada fase tiene una responsabilidad clara y bien delimitada.

  • Lexer: convierte texto en tokens.
  • Parser: verifica la estructura gramatical.
  • Semantic: verifica el significado del programa.
  • Generator: produce el código destino.

Qué hace exactamente el analizador semántico

El analizador semántico responde a preguntas como:

  • ¿Se usa una variable antes de asignarle un valor?
  • ¿Se asigna una cadena a una variable numérica?
  • ¿Un NEXT corresponde a su FOR?
  • ¿Hay un RETURN sin GOSUB previo?
  • ¿Las instrucciones READ tienen datos DATA suficientes?

En ZX BASIC muchas de estas situaciones están permitidas por el intérprete original, pero al convertir a otros lenguajes conviene detectarlas y, al menos, avisar.


Diseño del analizador semántico en ZX2SB

El analizador semántico de ZX2SB trabaja en dos pasadas sobre un formato intermedio (IR):

  1. Primera pasada: recolección de información.
  2. Segunda pasada: análisis semántico y generación del IR final.

Primera pasada: recolección

En esta fase no se genera código. Se recopila información global:

  • Variables existentes y su tipo (numéricas o de cadena).
  • Uso de instrucciones especiales (PRINT, READ, DATA, AT, etc.).
  • Estructura del programa (FOR/NEXT, GOSUB/RETURN).
  • Mapa de líneas para referencias posteriores.

Esta información se guarda en un contexto semántico que se utiliza en la segunda pasada.

Segunda pasada: análisis y emisión

En la segunda pasada se analiza cada sentencia individualmente:

  • Se validan tipos.
  • Se marcan variables como usadas o asignadas.
  • Se detectan errores y avisos.
  • Se emite el IR normalizado que usará el generador.

Errores y warnings: emisión inmediata

Inicialmente, el analizador semántico acumulaba errores y avisos en listas internas. Sin embargo, en ZX2SB se ha optado por un diseño más simple y coherente:

  • Los errores y warnings se emiten en el momento en que se detectan.
  • La decisión de continuar o abortar se basa en las opciones del usuario.
  • Se eliminan listas auxiliares innecesarias.

Esto unifica el comportamiento con el Lexer, el Parser y el Generator.


Diagrama del flujo del analizador semántico

+-----------------------------+
| Inicializar contexto        |
+-------------+---------------+
              |
              v
+-----------------------------+
| Primera pasada              |
| - Variables                 |
| - DATA / READ               |
| - Estructura                |
+-------------+---------------+
              |
              v
+-----------------------------+
| Segunda pasada              |
| - Analizar sentencias       |
| - Emitir errores/warnings   |
| - Generar IR normalizado    |
+-------------+---------------+
              |
              v
+-----------------------------+
| Resultado semántico         |
+-----------------------------+

Ejemplo de seudocódigo

El siguiente seudocódigo resume el funcionamiento básico:

function EjecutarSemantico():
    inicializar_contexto()

    primera_pasada()
    if error_fatal:
        salir

    segunda_pasada()
    emitir_warnings_variables()

Y el análisis de una sentencia concreta:

function AnalizarLET(sentencia):
    comprobar_formato()
    comprobar_variable()
    comprobar_tipos()
    marcar_asignación()
    emitir_IR()

Por qué es importante esta fase

El analizador semántico es el lugar ideal para:

  • Detectar errores lógicos tempranamente.
  • Dar avisos útiles sin romper compatibilidad con ZX BASIC.
  • Preparar el código para distintos lenguajes destino.
  • Mantener el generador lo más simple posible.

Gracias a esta fase, ZX2SB puede crecer en el futuro hacia nuevos backends (solo cambiando el generador) manteniendo una base sólida.


Conclusión

El analizador semántico es mucho más que una comprobación adicional: es el puente entre la sintaxis y el significado.

En ZX2SB se ha diseñado de forma clara, estructurada y cercana al espíritu de los lenguajes clásicos, facilitando tanto el mantenimiento como la extensión del proyecto.

En próximas entradas profundizaremos en el generador de código y en cómo las decisiones semánticas influyen directamente en el resultado final.

lunes, 13 de abril de 2026

ZX2SB: El Parser o Analizador Sintáctico

Índice de entradas del conversor


El Analizador Sintáctico (Parser) en un Transpilador ZX BASIC

Cómo funciona el Parser en ZX2SB y por qué es una pieza clave en la conversión de ZX BASIC

Índice


¿Qué es el Analizador Sintáctico (Parser)?

En un transpilador o compilador, el analizador sintáctico, normalmente llamado Parser, es la fase encargada de comprobar que un programa fuente está correctamente estructurado según la gramática del lenguaje.

En el proyecto ZX2SB, el Parser se sitúa entre el analizador léxico y el analizador semántico, actuando como un filtro estructural antes de interpretar el significado real del programa.


El flujo general del transpilador

El proceso de traducción o compilación sigue los pasos que ya hemos visto anteriormente, el parser sería el segundo paso del proceso completo:
 
Código fuente ZX BASIC
|
v
  Analizador léxico (Lexer)
|
v
 Analizador sintáctico (Parser)
|
v
 Analizador semántico
|
v
 Generador de código

Cada fase tiene una responsabilidad clara y no solapa funciones con las demás.

  • Lexer: reconoce palabras, números, cadenas y símbolos.
  • Parser: comprueba la estructura de las sentencias.
  • Semantic: valida el significado y los tipos.
  • Generator: produce el código destino.

Qué hace exactamente un Parser

El analizador sintáctico debe responder a preguntas como estas (pero no todas se aplican al BASIC como veremos más adelante):

  • ¿La sentencia IF tiene un THEN?
  • ¿Un FOR tiene su correspondiente NEXT?
  • ¿La forma general de la instrucción es válida?
  • ¿Los separadores y palabras clave están bien posicionados?

Es importante destacar lo que el Parser NO hace:

  • No comprueba tipos de datos (eso lo hace el analizador semántico).
  • No valida el uso de variables ni su significado.
  • No decide si una operación es lógica o correcta.
  • No genera código final.

Su misión es exclusivamente estructural.


ZX BASIC y la necesidad de un Parser tolerante

ZX BASIC es un lenguaje muy permisivo. Muchas construcciones válidas para el intérprete original pueden resultar ambiguas al convertirlas a otros lenguajes.

Por ese motivo, el Parser de ZX2SB está diseñado para:

  • Aceptar la sintaxis original del ZX Spectrum.
  • Detectar errores estructurales claros.
  • Emitir warnings ante estructuras dudosas.
  • No ser excesivamente restrictivo.

Ejemplo de programa sintácticamente válido pero lógicamente erróneo:


10 FOR i=1 TO 10
20   FOR j=1 TO 5
30     PRINT i,j
40   NEXT i
50 NEXT j

10 FOR i=1 TO 10
20   FOR j=1 TO 5 : PRINT i,j
30 NEXT i

Estos programas no genera error en BASIC clásico, pero su comportamiento no es el esperado y puede variar según el intérprete.


Diseño del Parser en ZX2SB

El Parser trabaja sobre los tokens generados por el Lexer y produce un Árbol de Sintaxis Abstracta (AST).

Dado que el objetivo final es portar el sistema a SuperBASIC, donde no existen estructuras de datos complejas, el AST se almacena como una estructura lineal intermedia (IR).

Entrada

  • Secuencia de tokens.
  • Números de línea originales.
  • Contexto mínimo.

Salida

  • Sentencias normalizadas.
  • Estructura explícita del programa.
  • Errores y avisos.

Diagrama del proceso del Parser

+------------------------+
| Tokens del Lexer       |
+-----------+------------+
            |
            v
+------------------------+
| Reconocer sentencias   |
| (IF, LET, FOR, PRINT)  |
+-----------+------------+
            |
            v
+------------------------+
| Verificar estructura   |
+-----------+------------+
            |
            v
+------------------------+
| Emitir IR estructurado |
+------------------------+

Gestión de errores y warnings

  • Errores: la estructura es inválida.
  • Warnings: la estructura es válida pero sospechosa.

La decisión de continuar o abortar depende de las opciones del usuario que se definan, no del Parser.En nuestro sistema, el usuario puede elegir entre parar y preguntar si desea continuar, o bien no parar el proceso y seguir hasta el final, los errores se verán en el fichero de log que se genera.


Ejemplo de seudocódigo

function EjecutarParser(tokens):
    for cada línea:
        identificar sentencia
        validar estructura
        emitir error o aviso
    generar IR

Relación con el Analizador Semántico

El Parser prepara el terreno para el análisis semántico, permitiendo que este se centre exclusivamente en el significado lógico.


Conclusión

El analizador sintáctico es la columna vertebral estructural del transpilador. Sin interpretar significados, garantiza que estos puedan analizarse correctamente más adelante.

En ZX2SB, el Parser respeta la filosofía del ZX BASIC original y prepara el camino para futuras transformaciones a otros lenguajes.

sábado, 4 de abril de 2026

ZX2SB. Vuelta a empezar

Índice de entradas del conversor



¿De transpilador a compilador?

Evolución del proyecto y cambio de enfoque

Cuando empecé el proyecto de transpilación de ZX BASIC a SuperBASIC (QL), el objetivo parecía claro y razonable: traducir programas clásicos del Spectrum a un SuperBASIC moderno, legible y ampliable, respetando en lo posible el espíritu original pero sin arrastrar las limitaciones del intérprete de los años 80.

Al principio pensaba que sería relativamente sencillo: tokenizar el programa y traducirlo a un lenguaje muy similar. Sin embargo, paso a paso el proyecto fue complicándose. Empezaron a aparecer casos especiales, decisiones incómodas y pequeñas incoherencias que, aunque no impedían avanzar, sí dificultaban hacerlo bien.

Sin embargo, como suele ocurrir en los proyectos que merecen la pena, el camino no fue lineal. Lo que empezó como un “simple transpilador” acabó convirtiéndose en algo conceptualmente más ambicioso: una cadena de compilación modular, con fases bien definidas, contratos explícitos y decisiones arquitectónicas conscientes.


El punto de partida: traducir, no reinterpretar

Desde el principio hubo varias decisiones claras:

  • El código generado debía ser SuperBASIC editable, no un artefacto opaco.
  • No se intentaría emular el ZX Spectrum al 100 %:
    • nada de PEEK / POKE
    • nada de trucos de automodificación
  • Las funciones ZX no soportadas se resolverían mediante llamadas a rutinas auxiliares escritas en SuperBASIC.
  • El resultado debía ser extensible, pensando en mejoras futuras.

El transpilador original funcionaba como un bloque monolítico: leer una línea, analizarla, transformarla y generar código QL.

Funcionaba, pero conforme el proyecto crecía, también crecían las dudas.


El generador fue el primer aviso

El proyecto avanzaba, con cambios en el lexer y el parser por el camino, pero fue el generador el que puso el primer escalón incómodo delante del diseño.

Para generar buen SuperBASIC había que responder a preguntas que un “transpilador rápido” no suele plantearse:

  • ¿Cómo se numeran las líneas para facilitar la edición manual?
  • ¿Dónde debe ir la inicialización del entorno gráfico?
  • ¿Cómo se insertan subrutinas (PROC) sin romper el flujo?
  • ¿Qué partes del código son infraestructura y cuáles lógica del programa?

Si el generador necesita un AST claro, el resto del sistema también debería pensarse como un compilador.

Reescribir y replantear no es perder tiempo: es ganar claridad, mantenibilidad y, muchas veces, velocidad.


La ruptura conceptual: dividir en módulos

El diseño monolítico, pensado para optimizar el QL, terminó siendo un error. La decisión clave fue:

Dividir el sistema en módulos independientes, comunicados solo por ficheros.

  1. Director: orquesta el proceso, sin conocer el lenguaje.
  2. Lexer: reconoce ZX BASIC y genera tokens.
  3. Parser: construye el AST.
  4. Semántico: valida y ajusta el AST.
  5. Generador: produce SuperBASIC editable.

Primer paso: el fichero .TOK

El fichero .tok es la frontera definitiva entre fases:

  • texto plano
  • una línea por token
  • LINE, EOL, EOF
  • sin posiciones ni contexto oculto
  • la única fuente de verdad para el parser
LINE 50
Keyword IF
Identifier C
OpMayorIgual >=
Number 20
Keyword THEN
Keyword GOTO
Number 100
EOL

Si algo no está en el .tok, el parser no lo sabe.


El papel del Director: menos es más

El Director no debe saber si el lenguaje es ZX BASIC, C o Pascal.

El lexer reconoce y valida el número de línea. El Director solo coordina.


El resultado: un lexer cerrado

  • Reconoce ZX BASIC correctamente
  • Detecta errores léxicos reales
  • No adelanta semántica
  • Genera un .tok definitivo

Esta fase está cerrada.


Conclusión

El proyecto ya no es solo un transpilador: es una base sólida para un posible compilador real.

El lexer está cerrado, el contrato existe, y el camino es ahora mucho más claro.


Postdata

Este proyecto es complejo y formativo. Revisar, dudar, reescribir y aprender forma parte esencial del proceso.

La ayuda de herramientas como Copilot ha sido clave, siempre revisando, cuestionando y aprendiendo.

viernes, 27 de marzo de 2026

Cuando con 64 KB eras el rey

Redescubriendo el Commodore 64: Historia, Características, Juegos y Legado Retro

Redescubriendo el Commodore 64

Mi pequeña introducción personal

Yo no tuve un Commodore 64. En casa teníamos un ZX Spectrum 48K, un gomas, pero incluso entonces el C64 era el objeto de deseo: gráficos más coloridos, un sonido impresionante, un teclado de verdad, un aire de máquina “seria”. Su precio era mayor, sí, pero también su ambición. Era el ordenador que todos mirábamos con admiración en las revistas de la época.

Un gigante en miniatura

El Commodore 64 es considerado el ordenador doméstico más vendido de un único modelo, con entre 12,5 y 17 millones de unidades vendidas. El ZX Spectrum, en todas sus variantes, vendió unos 5,5 millones. El C64 dominó en Estados Unidos, pero logró difusión mundial, mientras que el Spectrum fue esencialmente europeo.

Las raíces del C64

KIM-1 (1976)

El precursor de todo fue el KIM‑1, una placa de desarrollo popular fabricada por MOS Technology basada en su procesador MOS 6502. Tras la adquisición de MOS por parte de Commodore, esta tecnología se convirtió en el corazón de sus futuros ordenadores.

Commodore PET (1977)

El primer ordenador completo de la compañía fue el Commodore PET, lanzado en 1977. Muy presente en centros educativos, integraba monitor, carcasa y teclado. Su sucesor, el CBM-II (1982), refinó la línea con modelos profesionales y domésticos.

Commodore VIC‑20 (1981)

El VIC‑20 fue el primer ordenador personal en superar el millón de unidades vendidas. Demostró que existía un mercado masivo para la informática doméstica, aunque muchos usuarios pedían algo más potente.

Commodore 16 (1984)

Creado como alternativa económica al VIC‑20, el Commodore 16 —y su versión más barata, el Commodore 116— pasaron bastante desapercibidos.

El proyecto MOS Technology

En 1981, MOS desarrolló dos chips destinados originalmente a recreativas: el VIC‑II (vídeo) y el SID (sonido). En apenas seis semanas estos chips dieron lugar al prototipo funcional del C64.


Nacimiento del Commodore 64 (1982)

El C64 debutó en el CES de enero de 1982, causando enorme impacto por sus capacidades multimedia avanzadas y su precio competitivo, posible gracias a que Commodore fabricaba sus propios chips.


¿Por qué fue tan revolucionario?

La revolución del C64 se basó en dos chips clave:

  • VIC‑II: sprites, scroll por hardware y 16 colores, muy superior a lo habitual en 1982.
  • SID: chip de sonido analógico-digital con tres osciladores, filtros y envolventes.

Además, Commodore distribuyó el C64 en grandes superficies como Sears y K‑Mart, logrando una presencia masiva imposible para sus rivales que usaban tiendas especializadas como la cadena Radio Shark..


Características técnicas del aparato

Aunque famoso por sus 64 KB, el C64 destacaba por un equilibrio muy bien diseñado:

  • CPU: MOS 6510 a 1.02 MHz (PAL) / 0.985 MHz (NTSC).
  • RAM: 64 KB totales, no siempre accesibles simultáneamente por mapeo, dejaba libres 40Kb para el Basic. Aparte disponía de 512Kb para el manejo del color.
  • ROM: 20Kb 
  • Vídeo: VIC‑II (6567/6569), sprites, scroll, multicolor.
  • Sonido: SID 6581/8580, 3 voces, filtros, modulación.
  • Almacenamiento: Cassettes 1530, disqueteras 1541, cartuchos.
  • Puertos: 2 joysticks tipo Atari, puerto de usuario, expansión.

Spectrum/Z80 contra C64/MOS 6510

Es fácil de entender la diferencia entre ambas máquinas: no era solo de marketing, sino de las decisiones de diseño de sus creadores.

🔹 ZX Spectrum (16/48 KB)

  • El procesador Z80 trabajaba a 4 MHz, pero necesitaba varios ciclos por instrucción.
  • Usaba RAM dinámica barata, que debía refrescarse parando ligeramente al procesador; añadir más encarecía demasiado el producto.
  • La misma RAM se usaba para vídeo y programa, simplificando el diseño.
  • Mapa de memoria lineal de 64 KB: ROM + RAM directamente accesibles.
  • No incluía chips dedicados de vídeo o sonido, por lo que sus capacidades eran limitadas.

🔹 Commodore 64 (64 KB)

  • El procesador 6510 trabajaba a ~1 MHz, pero muchas instrucciones eran de un ciclo.
  • Commodore fabricaba su propia RAM, lo que reducía costes.
  • Memoria mapeada mediante bank switching: muy flexible.
  • Acceso a casi toda la RAM efectiva en la mayoría de programas.
  • Disponía de chips dedicados (VIC‑II y SID), por lo que a nivel de gráficos y sonido era imbatible.

Aunque el Z80 trabajaba a 4 MHz y el 6510 a 1 MHz, el rendimiento real era similar por la arquitectura interna: el Z80 necesitaba entre 3 y 5 ciclos por instrucción; el 6510 solía necesitar 1 o 2. En la práctica, cada máquina tenía puntos fuertes distintos.

Resultado: el C64 era más caro y más potente, con mejor sonido y gráficos. El Spectrum tuvo MUCHOS más juegos, más baratos y más fáciles de desarrollar. Cada usuario tiene su favorito: yo reconozco que el C64 era mejor, pero en mi corazón siempre ganará “mi gomas”.


Variantes

El modelo más conocido es el “panera”, pero hubo muchas versiones:

  • Commodore 64 “Panera” (1982): carcasa ancha beige, teclado mecánico.
  • MAX Machine (1982): un predecesor (por pocos meses), muy simplificado con solo 2 KB de RAM, que no triunfó.
  • Commodore Plus/4 (1984): orientado a ofimática, fracaso comercial en USA, mejor visto en Europa. Incluía en ROM el paquete de los 4 programas clasicos (procesador de texto, base de datos, hoja de cálculo y gráficos), de ahí su nombre..
  • Commodore 128 (1985): Con 128 KB de RAM, disponía de un modo C64 para compatibilizarlo.
  • Commodore 64C: Un rediseño más compacto, con la caja similar al C128.
  • SX-64 / DX‑64: versión portátil con pantalla integrada y una disquetera, una grán máquina.
  • Commodore 64GS: consola sin teclado, solo cartuchos, que no triunfó.
  • Educator 64: versión tipo PET para su uso en escuelas, con la pantalla integrada, que no salió de USA.

Variantes modernas, aunque usando emulación:

  • THEC64 Mini y THEC64 de tamaños mini y completo.
  • Nuevas ediciones modernas como la “Ultimate Edition” (2025).

Máquinas que sucedieron al C64

La familia Amiga

El Amiga 1000 (1985) inauguró la era multimedia real: multitarea, sonido estéreo y gráficos avanzados. La gama creción con varios modelos, como el Amiga 500 que fue el modelo más popular, o el Amiga 2000 el orientado a profesionales.


El final de una era

El C64 se produjo hasta 1994, año de la quiebra de Commodore. Con una vida comercial de 12 años, ventas masivas y más de 10.000 programas, es un caso único en la historia.


Los juegos que definieron una época

Clásicos como The Last Ninja, Impossible Mission, Pitstop II o Maniac Mansion demostraron que con talento 64 KB podían convertirse en mundos memorables.

Muchos juegos en cinta incluían mini‑juegos durante la carga, algo muy característico del C64, que amenizaban la espera mientras cargaban.


La escena actual

El C64 fue muy popular, y hoy día sigue siendolo, por eso la escena se mueve bastante hoy día:

  • Demos que exprimen el hardware más allá de lo imaginable.
  • Nuevos juegos, muchos en físico.
  • Restauraciones y hardware moderno compatible.
  • Recreaciones FPGA de alta fidelidad.



Por qué volver al retro hoy

Encender un C64 hoy es viajar atrás en el tiempo. Una experiencia que recuerda que la creatividad importa más que la potencia bruta. En una era de inmediatez, el C64 nos devuelve a una informática más artesanal, directa… y sorprendentemente relajante.


Fuentes consultadas

  • https://en.wikipedia.org/wiki/Commodore_64
  • https://es.wikipedia.org/wiki/Commodore_Educator_64
  • https://en.wikipedia.org/wiki/ZX_Spectrum
  • https://commodoregaming.com/us-en/Vintage+C64/History.aspx
  • https://retrocomputing.stackexchange.com/questions/17255
  • https://www.commodore.ca/text/c64.htm
  • https://gunkies.org/wiki/Commodore_64
  • https://t-lcarchive.org/sinclair-zx-spectrum/
  • https://www.gamedeveloper.com/business/a-history-of-gaming-platforms-the-commodore-64
  • https://www.youtube.com/watch?v=diacznMip8w
  • https://www.itsitio.com/dispositivos/la-mitica-commodore-64-regresa-modernizada-tres-versiones-preventa-global-y-espiritu-retro/

martes, 17 de marzo de 2026

ZX2SB. Cambios en el planteamiento

Transpilador ZX BASIC a SuperBasic

Índice de entradas del conversor

20/03/2026 Cambios en el esquema de directorios en rojo



Transpilador ZX BASIC → SuperBasic
Dos versiones en paralelo: Moderno y QL

En las últimas entradas hemos avanzado en el diseño interno del transpilador ZX BASIC → SuperBasic, definiendo estructuras de datos, el sistema de tokens y un Lexer optimizado para ejecutarse en un Sinclair QL real. Durante ese proceso me ha surgido una idea interesante para quienes quieran usar este proyecto no solo como herramienta, sino también para aprender sobre compiladores.

Vamos a generar dos versiones del transpilador en paralelo

El objetivo es disponer de dos rutas de ejecución simultáneas, una preparada para migrar a SuperBASIC, y la otra usando elementos actuales. Ambas conviven dentro del mismo proyecto. La mayoría de procesos son comunes, por lo que es sencillo ver cómo pasar de una a otra. Además incluyo una pantalla donde puedes seleccionar cuál quieres lanzar.

1) Versión Moderna

Diseñada para:

  • Usar estructuras avanzadas de .NET (List, Dictionary, etc.).
  • Desarrollo más rápido, depuración más cómoda y diagnósticos completos.
  • Actuar como referencia clara del algoritmo general.

2) Versión compatible con SuperBasic

Implementa las estructuras reales que usará la versión final del QL:

  • TokenBuffer como arreglo dinámico de registros empaquetados.
  • Formato big‑endian de 16 bits, igual que el Motorola 68008.
  • Procesos simples y lineales, estilo SuperBasic.

Esta versión sirve como puente entre .NET moderno y la implementación final en un QL real.

¿Por qué dos versiones?

✔ Didáctica

Muestra cómo implementar un compilador moderno y cómo trasladarlo a una plataforma retro con limitaciones reales.

✔ Validación de algoritmos

Al ejecutar ambos motores en paralelo es fácil encontrar divergencias antes de portar código al QL real.

✔ Documentación y mantenimiento

Permite explicar y probar Lexer, Parser, Semántico y Emitter tanto desde un enfoque moderno como desde un enfoque retro.

Pantalla lanzadora

Incluyo una interfaz WinForms que permite seleccionar:

  • Modo: Moderno o QL‑Prep
  • Ruta y nombre del fichero BASIC
  • Modo Verbose

El lanzador invoca automáticamente el director correspondiente con las opciones necesarias.

Arquitectura del proyecto

El proyecto utiliza .NET Framework 4.8 para asegurar compatibilidad con Windows 7/8/10/11 y aprovechar WinForms clásico. Para quienes pidan Windows XP, 95 o 3.11… lo siento, ¡aún no he retrocedido tanto! (Aunque con lo voluble que soy, cualquiera sabe si un día aparece una versión en Turbo‑C o Turbo Pascal 😄). 

He tenido que ajustar otra vez la estructura de directorios del proyecto, ya que no se generaban las cosas en su lugar correcto, he dividido el proyecto en tres, lanzador, moderno y QL, cada uno es un proyecto independiente que genera su propio EXE, así es mas sencillo manejarlo de manera independiente. 

Estructura general del proyecto:

ZX2SB

├── ZX2SB.sln
├── README.md

├── Lanzador
│ ├── Lanzador.vbproj
│ └── src
│ ├── frmLanzador.vb
│ ├── frmLanzador.Designer.vb
│ ├── frmLanzador.resx
│ └── ... otros

├── Moderno
│ ├── Moderno.vbproj
│ └── src
│ ├── 01_Director.vb
└── ... otros
└── QL
├── QL.vbproj
└── src
├── 01_Director.vb
└── ... otros

Conclusión

A partir de ahora el desarrollo continúa en dos líneas paralelas:

  • Moderno: claridad, pruebas y comodidad.
  • QL‑Prep: compatibilidad y preparación para SuperBasic.

Ambas serán documentadas paso a paso en el blog. Por ahora ya está la estructura base en el repositorio GIT del proyecto, y los directores están preparados para llamar a los procesos (que de momento solo muestran un mensaje en pantalla).