Una relación fundamental, en dos disciplinas afines. En lingüística y ontologías, IS-A expresa hiponimia: un término IS-A unidad léxica especializada. Es la estructura con la que taxonomías y grafos de conocimiento organizan el mundo. En informática y programación orientada a objetos, IS-A describe la herencia entre clases: un Dataset IS-A Collection. En ambos casos, IS-A conecta lo específico con lo general —exactamente lo que hace esta herramienta al convertir texto en datos con estructura y significado.
ISA
Instruction Set Architecture. En informática de bajo nivel, ISA es el puente fundamental entre el hardware y el software: define las instrucciones, registros y modos de direccionamiento que un procesador entiende. IS-A-BUILDER actúa de forma análoga —es el puente entre el texto en bruto y los datos estructurados que necesitan los modelos.
ISA
El nombre de quien lo construyó. ISA es también Isabel, la autora de esta herramienta.
BUILDER
Construye. Toma texto en bruto y ensambla el dataset estructurado que necesitas. Como el patrón Builder en programación, configura pieza a pieza —etiquetas, formato, preprocesamiento— hasta producir la salida exacta.
Sobre la autora
Isabel Moyano Moreno es investigadora predoctoral FPU en Lingüística General en la Universidad de Cádiz, adscrita al grupo Semaínein (HUM-147) y al Laboratorio de Lingüística Computacional y Digital del Instituto Universitario de Investigación en Lingüística Aplicada (ILA). Su trabajo se centra en la ingeniería lingüística y la terminología computacional: extracción automática de términos, modelado del lenguaje de especialidad y procesamiento de corpus especializados mediante aprendizaje automático.
Cuenta con experiencia como lingüista computacional en una empresa de inteligencia artificial y está acreditada como correctora profesional. Trabaja también en análisis de autoría desde la lingüística forense y la estilometría, con interés en la detección de textos generados por máquinas.
IS-A-BUILDER: conversor de texto a datos estructurados
En el procesamiento del lenguaje natural (PLN), la calidad de los modelos —desde clasificadores
más clásicos hasta los recientes grandes modelos de lenguaje (LLM)— depende directamente de la compilación,
estructura y limpieza del corpus lingüístico o dataset.
IS-A-BUILDER ha sido diseñado específicamente como un recurso pedagógico para estudiantes y
personas curiosas e interesadas en el PLN. Esta herramienta facilita la transición del texto plano
(.txt) a formatos estructurados (JSON, JSONL, CSV, XML), permitiendo una
preparación de datos acorde a los estándares en PLN.
📂
Haz clic para seleccionar archivos
o arrastra y suelta aquí — archivos .txt, múltiples permitidos
Sube archivos o pega texto para generar el dataset estructurado.