10 de agosto de 2025

Seguimiento de mis propósitos para el 2025 (primer semestrre)

Por Adolfo Sanz De Diego el 10.8.25 Sin comentarios

Mi intención, este 2025, era ir publicando un post cada 3 meses, con el seguimiento de los propósitos que me marqué al iniciar el año, pero finalmente, el primer trimestre me lo salté, así que vamos con el del primer semestre.

General:

[Por ahora, conseguido] Rellenar diariamente mi formulario con el seguimiento de los propósitos de 2025.

(Por ahora, salvo algún día que se me ha olvidado, vengo rellenando diariamente mi formulario con el seguimiento de mis propósitos de 2025, así que, si sigo así, cumpliré mis objetivos a final de año).
[Por ahora, a medias] Escribir un post trimestral con el seguimiento de estos propósitos.

(Como he comentado al inicio de este post la publicación del primer trimestre me lo salté, pero al menos estoy publicando este post de seguimiento semestral).

Salud:

[Por ahora, a medias] Dormir de media al menos 7,5 horas al día.

(Por ahora la media de este 2025 es justo de 7,5 horas al día con tendencia descendente, y aunque en verano subirá, supongo que bajará en el tercer trimestre, así que, aunque justo, espero cumplir mis objetivos a final de año).
[Por ahora, conseguido] Andar de media al menos 7.500 pasos al día.

(Por ahora la media de este 2025 es de 7.700 pasos al día con tendencia ascendente, así que, si sigo así, cumpliré mis objetivos a final de año).
[Por ahora, conseguido] Hacer deporte de media al menos 25 minutos al día.

(Por ahora la media de este 2025 es de 32 minutos al día con tendencia ascendente, así que, si sigo así, cumpliré mis objetivos a final de año).
[Por ahora, no conseguido] Perder grasa corporal con una media diaria de menos de 22 %.

(Por ahora la media de este 2025 está por encima de 23 % al día con tendencia ascendente, así que espero invertir la tendencia para no irme demasiado de mis objetivos a final de año).
[Por ahora, conseguido] Ganar masa muscular con una media diaria de al menos 59 Kg.

(Por ahora la media de este 2025 es de 59 Kg con tendencia ascendente, así que, si sigo así, cumpliré mis objetivos a final de año).
[Por ahora, no conseguido] Reducir la ingesta de alcohol a como mucho una media de 0,5 cervezas al día.

(Por ahora la media de este 2025 está por encima de 1 cerveza al día con tendencia ascendente, así que espero invertir la tendencia para no irme demasiado de mis objetivos a final de año).
[Por ahora, no conseguido] Mantener mi ingesta de calorías de media en menos de 2.100 calorías al día.

(Por ahora la media de este 2025 está por encima de 2.200 calorías al día con tendencia ascendente, así que espero invertir la tendencia para no irme demasiado de mis objetivos a final de año).

Dinero:

[Por ahora, a medias] Cumplir mi horario de trabajo y no trabajar más de 1.700 horas este año.

(Por ahora llevo más de 900 horas trabajadas este 2025, y aunque en verano bajará, espero que, aunque justo, cumpla mis objetivos a final de año).
[Por ahora, no conseguido] Ayudar a mi gran amigo Fernando Redondo al menos 180 horas este año.

(Por ahora a penas he ayudado 20 horas a mi amigo Fernando este 2025 con tendencia descendente, así que espero invertir la tendencia para no irme demasiado de mis objetivos a final de año).
[Por ahora, a medias] Colaborar con Hackathon Lovers al menos 90 horas este año.

(Por ahora a he colaborado más de 20 horas con Hackathon Lovers este 2025 con tendencia descendente, así que espero invertir la tendencia para no irme demasiado de mis objetivos a final de año).
[Por ahora, a medias] Impartir como profesor al menos 60 horas de cursos este año.

(Por ahora he impartido 10 horas de curso este 2025, pero normalmente es en el último trimestre del año cuando más cursos imparto, así que espero cumplir mis objetivos a final de año).
[Por ahora, a medias] Escribir en mi blog o en mi futura obra de ciencia ficción al menos 60 horas este año.

(Por ahora he escrito 30 horas este 2025, así que, si sigo la tendencia, espero cumplir mis objetivos a final de año).
[Por ahora, conseguido] Dedicar a aprender al menos 60 horas este año (DevSecOps, Ciberseguridad, Blockchain, IA, Data Science).

(Por ahora he dedicado 50 horas a aprender algo nuevo este 2025, así que espero cumplir mis objetivos a final de año).
[Por ahora, a medias] Leer libros al menos 60 horas este año.

(Por ahora he leído 30 horas este 2025, así que, si sigo la tendencia, espero cumplir mis objetivos a final de año).

Amor:

[Por ahora, no conseguido] Realizar algo en familia semanalmente.

(Por ahora he contabilizado a penas 20 actividades este 2025, y además mi tendencia es descendente, así que espero invertir la tendencia para no irme demasiado de mis objetivos a final de año).
[Por ahora, a medias] Dedicar a tareas de la casa y/o familiares al menos 10 horas a la semana.

(Por ahora he dedicado más de 250 horas este 2025, así que, si sigo la tendencia, aunque algo justo, espero cumplir mis objetivos a final de año).
[Conseguido] Viajar con mi familia al menos 2 veces al año.

(Por ahora hemos viajado a Berlín y a Tenerife, aunque este último viaje lo debería de haber contabilizado para el segundo semestre).
[Por ahora, conseguido] Llamar a algún familiar y/o amigo al menos 1 vez a la semana.

(Por ahora he contabilizado más de 40 llamadas este 2025, así que, si sigo la tendencia, espero cumplir mis objetivos a final de año).
[Por ahora, no conseguido] Controlar el uso de los móviles de mis hijas al menos 1 vez al mes.

(Estoy muy lejos de cumplir este objetivo, pero espero cambiar la tendencia en el último trimestre del año).
[Por ahora, conseguido] Quedar con algún familiar y/o amigo al menos 1 vez a la semana.

(Por ahora he contabilizado más de 30 quedadas este 2025, así que, si sigo la tendencia, espero cumplir mis objetivos a final de año).
[Conseguido] Asistir a al menos 9 eventos, ya sea como ponente o como participante y hacer networking.
- He asistido como ponente:
- He asistido como participante:

Iconos con licencia Creative Commons: general, salud, dinero y amor.

Comparte: Facebook Twitter

6 de julio de 2025

Mapa de la evolución de la contaminación del aire de Madrid de 2001 a 2024

Por Adolfo Sanz De Diego el 6.7.25 Sin comentarios

Del 12 al 14 de septiembre de 2014, se desarrolló un hackathon global contra el cambio climático en donde participé y en donde a mi se me ocurrió hacer un mapa con la evolución de la contaminación del aire de Madrid 2014.

Ahora, 10 años después lo actualizo. En vez de hacerlo con Bash Shell Script y CartoDB ahora lo he hecho con un cuaderno de Jupyter de Python y con leaflet en HTML, CSS y JS.

¿Cómo lo he hecho?

Búsqueda de datos

Lo primero fue buscar un conjunto de datos sobre la contaminación del aire en Madrid.

Lo encontré en la página web de datos abiertos del Ayuntamiento de Madrid, exactamente en el apartado sobre calidad del aire con datos desde 2001.

Descarga de datos

Desde el último enlace descargué todos los datos que están en la carpeta datos/descargados.

Geo-coordenadas de las estaciones

En los datos del Ayuntamiento de Madrid están los códigos de las estaciones atmosféricas, pero solo las geo-coordenadas de las actuales, no de todas.

Gracias a Félix Pedrera (@fpedrera) encontré las Geo-Coordenadas de las estaciones atmosféricas en AirBase - The European air quality database, exactamente me descargué el fichero estaciones/AirBase_v8_stations.csv.

Una vez filtrados y parseadas los datos nos queda este bonito fichero CSV con las geo-posiciones de las estaciones atmosféricas de Madrid. Con los datos en bruto, tenía que filtrar y parsear los datos de las estaciones atmosféricas.

Procesamiento de datos

Una vez descargados los datos, interpretando los metadatos, filtramos por el Dioxido de Nitrógeno, hacemos la media por meses, y volcamos todo a un bonito fichero JS con los datos que nos hacen falta.

También volcamos esos datos en CSV por si a alguien le interesa.

Visualización de datos

Finalmente creo un fichero HTML, con su CSS y su JS para poder visualizar la evolución de la contaminación del aire de Dioxido de Nitrógeno de Madrid de 2001 hasta 2024.

Comparte: Facebook Twitter

15 de marzo de 2025

Introducción a los Grandes Modelos de Lenguaje (LLM)

Por Adolfo Sanz De Diego el 15.3.25 Sin comentarios

Introducción a los Grandes Modelos de Lenguaje (LLM) [PDF]

¿Qué es un Gran Modelo de Lenguaje (LLM)?

Los Grandes Modelos de Lenguaje (LLM) son sistemas avanzados de inteligencia artificial entrenados con enormes cantidades de texto, capaces de entender y generar lenguaje humano de forma fluida y coherente. Estos modelos están basados en arquitecturas de aprendizaje profundo, principalmente transformers, y utilizan técnicas estadísticas para predecir palabras o frases, generar contenido, responder preguntas o mantener conversaciones naturales. Han revolucionado múltiples áreas, desde asistentes virtuales y traducción automática hasta generación de contenidos creativos, análisis de texto y educación. Sin embargo, su desarrollo implica desafíos éticos relacionados con sesgos, privacidad y responsabilidad en la información generada.

Capacidades de los Grandes Modelos de Lenguaje (LLM)

Generación de lenguaje

La generación de lenguaje implica la creación autónoma de contenidos textuales en respuesta a solicitudes específicas planteadas por los usuarios. Por ejemplo, puede producir artículos completos sobre temas particulares. No obstante, presenta la limitación conocida como “alucinación”, que consiste en la generación de información incorrecta o no fundamentada debido a la insuficiencia de datos o contexto.

Manipulación de lenguaje

Esta capacidad permite a los modelos generativos reestructurar textos, resumir textos extensos, cambiar el tono o el público objetivo de un texto, o traducir un texto a otro idioma o a un lenguaje de programación. La ventaja principal radica en la reducción significativa de alucinaciones al basarse en información previamente suministrada.

Razonamiento lógico básico

Los modelos generativos también pueden resolver problemas que requieran razonamiento lógico sencillo. No obstante, esta capacidad tiene limitaciones claras, especialmente frente a problemas complejos que superan la capacidad inherente del modelo. A pesar de ello, recientes avances tecnológicos han mejorado notablemente esta competencia en modelos de última generación.

Limitaciones de los Grandes Modelos de Lenguaje (LLM)

Inconsistencia en las respuestas

Estos modelos pueden mostrar falta de consistencia, produciendo diferentes resultados ante la misma instrucción o solicitud. Por ejemplo, ante una misma pregunta sencilla pueden ofrecer diversas interpretaciones o respuestas divergentes.

Alucinaciones

Estos modelos pueden producir respuestas erróneas o inventadas cuando carecen de información suficiente. Un caso típico es la creación ficticia de nombres o datos que no tienen base real, como inventar personajes o eventos inexistentes.

Capacidad limitada de memoria

La memoria en los modelos de lenguaje es limitada en términos de contexto y longitud de interacción. Esto significa que no retienen toda la información de una conversación, sólo una parte delimitada por el contexto permitido, y tienen restricciones en la longitud de las respuestas que pueden proporcionar.

Sensibilidad a las instrucciones

Pequeñas modificaciones en las instrucciones dadas al modelo pueden alterar significativamente el resultado obtenido, incluso generando la pérdida de detalles importantes cuando las indicaciones iniciales se vuelven demasiado complejas o confusas.

Dependencia de los datos de entrenamiento

Las respuestas generadas por los modelos están restringidas por el conocimiento disponible en sus conjuntos de datos iniciales. Para temas recientes o específicos, necesitan recurrir constantemente a fuentes externas en Internet o actualizadas de información.

Principales aplicaciones de los Grandes Modelos de Lenguaje (LLM)

Tareas ideales

Las tareas ideales para usar estos modelos son las:

Tareas recurrentes: actividades repetitivas donde la automatización mediante modelos de lenguaje tiene un beneficio claro.
Tareas sencillas: actividades que no requieran interacciones complejas, beneficiándose de instrucciones claras y precisas.
Tareas verificables: actividades cuyo resultado puede ser evaluado fácilmente para asegurar precisión y reducir esfuerzos adicionales de corrección.

Recuperación de información

Los modelos son altamente eficaces para recuperar información siempre que el contenido sea abundante, coherente y consolidado, especialmente en contextos académicos con amplia literatura. No obstante, la presencia de información contradictoria o insuficiente puede conducir a errores o “alucinaciones”.

Procesamiento de textos

Estos modelos son especialmente efectivos en:

Resumir o expandir textos existentes.
Modificar el tono, el interlocutor o adaptar el texto a diferentes audiencias.
Realizar traducciones, incluso hacia lenguajes técnicos o informáticos.
Convertir información textual a diversos formatos como tablas, listas o Markdown.

Ver también

Comparte: Facebook Twitter

14 de marzo de 2025

Herramientas de IA gratuitas (o al menos, en parte)

Por Adolfo Sanz De Diego el 14.3.25 Sin comentarios

La inteligencia artificial generativa ha revolucionado la creatividad y la producción de contenido digital. A continuación, te presentamos algunas de las mejores herramientas de IA gratuitas (o al menos, en parte).

Herramientas de IA Gratuitas (o en parte) [PDF]

Generación y procesamiento de imágenes

DALL·E 3

DALL·E 3 es una excelente opción si buscas una IA potente para crear imágenes a partir de texto. Integrada con ChatGPT, permite generar ilustraciones de alta calidad y cuenta con herramientas avanzadas como el inpainting y outpainting para edición detallada. Su sistema de seguridad ayuda a evitar contenido inapropiado.

Leonardo

Leonardo ofrece modelos especializados en distintos estilos y la posibilidad de entrenar modelos personalizados. Es ideal para diseño de videojuegos y concept art, además de contar con un marketplace donde se pueden vender creaciones.

Ideogram

Ideogram es la IA ideal si necesitas integrar texto en imágenes con gran precisión. Está optimizada para diseño gráfico y permite crear logotipos y elementos tipográficos con una calidad superior en el renderizado de texto.

Freepik

Freepik ofrece una herramienta de IA que transforma bocetos y descripciones en imágenes de alta calidad. Sus presets personalizables permiten ajustar estilos, colores y perspectivas, además de generar múltiples variaciones de una descripción con facilidad.

Generación y procesamiento de vídeos

Kling AI

Kling AI es una opción si buscas un realismo extremo en imágenes y vídeos. Permite generar imágenes en 360° y panorámicas con un nivel de detalle impresionante.

Hailuo AI

Hailuo AI es perfecta para generar videos cortos de alta definición a partir de descripciones textuales o imágenes. Ofrece presets de movimiento de cámara y diferentes modelos de generación, aunque su duración está limitada a 6 segundos en la versión gratuita.

Conversión de texto a audio y viceversa

Eleven Labs

Eleven Labs ofrece voces hiperrealistas indistinguibles de las humanas, con opciones avanzadas para ajustar entonación y estilo emocional. Ideal para quienes buscan un resultado profesional.

TTSMaker

TTSMaker es perfecto para proyectos con menor presupuesto, brindando una interfaz sencilla y la capacidad de ajustar velocidad y tono, con un generoso plan gratuito.

TurboScribe

TurboScribe utiliza modelos avanzados de reconocimiento para obtener transcripciones precisas, soporta múltiples formatos y facilita la sincronización con subtítulos.

Transcripción de videoconferencias

Fireflies

Fireflies AI permite transcribir reuniones en tiempo real, además de ofrecer análisis y resúmenes automáticos, integrado perfectamente con plataformas populares como Zoom y Teams.

Otter

Otter.ai destaca por su sencillez y efectividad en transcribir conversaciones y entrevistas en tiempo real, facilitando la organización y búsqueda de contenidos.

Mejora automática de audio

Auphonic

Auphonic mejora automáticamente la calidad del audio mediante la reducción de ruido, normalización de volumen y optimización espectral, simplificando notablemente el posprocesado.

Adobe Podcast

Adobe Podcast elimina el ruido de fondo para lograr sonido profesional. Está disponible en versiones gratuitas y premium para crear podcasts y locuciones profesionales.

Creación de música

Suno

Suno genera melodías originales con letras contextualizadas, permitiendo personalizar aspectos musicales como tempo y complejidad, ideal para proyectos creativos.

Udio

Udio transforma textos en piezas musicales completas con instrumentos realistas, facilitando la creación musical colaborativa y exportación profesional.

Probar múltiples aplicaciones de IA

Hugging Face Spaces

Hugging Face Spaces es un entorno amigable para alojar y probar aplicaciones basadas en inteligencia artificial. Compatible con frameworks como TensorFlow, PyTorch y JAX, es ideal para desarrolladores e investigadores gracias a su comunidad activa.

Herramientas de idiomas

DeepL Translator

DeepL Translator destaca por su precisión en traducciones automáticas y la conservación del formato original en documentos traducidos, ideal para profesionales y empresas.

Language Tools

Language Tools ofrece herramientas lingüísticas especializadas en idiomas oficiales de la Unión Europea, accesibles para ciudadanos, empresas e instituciones, con un enfoque en calidad y precisión.

Grammarly

Grammarly es un asistente de escritura basado en inteligencia artificial que mejora en tiempo real la gramática, la ortografía y el estilo, perfecto para cualquier tipo de redacción digital.

Pronounce

Pronounce proporciona feedback inmediato sobre pronunciación, gramática y claridad, siendo útil para practicar habilidades comunicativas en entornos laborales o académicos.

Búsqueda y procesamiento académico

Elicit

Elicit funciona como un asistente de investigación, facilitando la revisión rápida y análisis de documentos académicos, agilizando significativamente las tareas investigativas.

Consensus

Consensus permite buscar y resumir rápidamente artículos científicos, ideal para investigadores y estudiantes que requieren precisión y rapidez en búsquedas académicas.

NotebookLM de Google

NotebookLM de Google es un asistente virtual experimental que permite analizar información en documentos de Google Docs, facilitando la integración del análisis en el trabajo diario.

Generación de presentaciones

Slidesgo

Slidesgo es una plataforma de creación y edición de presentaciones mediante inteligencia artificial, con plantillas adaptadas a diversas temáticas, compatible con herramientas populares como PowerPoint y Google Slides.

Markdown Slides Creator

Markdown Slides Creator utiliza IA para facilitar la creación rápida de presentaciones en formato Markdown, aumentando significativamente la productividad.

Creación de mapas mentales y gráficos con IA

Mindmapai

Mindmapai permite crear mapas mentales de manera instantánea a partir de múltiples formatos como texto, PDF, imágenes, audio y video. Destaca por su facilidad de uso y su función de Copilot Chat, que ofrece sugerencias inteligentes en sesiones de lluvia de ideas. Ideal para quienes buscan una herramienta intuitiva con opciones de colaboración efectiva.

Aigraphmaker

Aigraphmaker es una herramienta versátil para crear gráficos automáticamente mediante inteligencia artificial, incluyendo mapas mentales, diagramas de flujo y gráficos estadísticos. Su interfaz sencilla facilita la visualización de datos complejos rápidamente, siendo una excelente opción para usuarios que necesitan gráficos claros y rápidos.

Ayuda en programación

GitHub Copilot

GitHub Copilot ofrece sugerencias inteligentes de código basado en IA, aumentando la productividad y reduciendo errores en múltiples lenguajes de programación.

Codeium

Codeium incrementa la eficiencia de programación con sugerencias contextuales y autocompletado inteligente, compatible con más de 70 lenguajes y diversos IDEs.

Ayuda en análisis de datos

ChatCSV

ChatCSV simplifica el análisis de datos permitiendo realizar preguntas naturales sobre conjuntos de datos CSV y generando gráficos visuales interactivos.

Rows

Rows integra IA en el análisis de datos en tiempo real, ofreciendo automatización y facilitando colaboraciones simultáneas, con múltiples integraciones a plataformas populares.

ChartPixel

ChartPixel permite crear gráficos sencillos y visuales rápidamente, ideal para análisis de datos básicos y educativos mediante inteligencia artificial.

Ver también

Comparte: Facebook Twitter

2 de marzo de 2025

Introducción a la Ingeniería de Prompts

Por Adolfo Sanz De Diego el 2.3.25 Sin comentarios

Introducción a la Ingeniería de Prompts [PDF]

Ingeniería de prompts

Definición

La ingeniería de prompts es una técnica utilizada para diseñar y optimizar las instrucciones proporcionadas a un modelo de inteligencia artificial generativa. Su propósito principal es mejorar la calidad y precisión de las respuestas generadas por el modelo a través del ajuste adecuado de las entradas.

Por ejemplo, la diferencia entre un prompt general y otro más específico puede influir significativamente en los resultados obtenidos. Comparando dos instrucciones:

“Resume el texto.”
“Resume este artículo en tres puntos clave para un público técnico.”

La segunda formulación proporciona un mayor grado de especificidad, lo que puede mejorar la pertinencia de la respuesta generada.

Importancia

Los prompts desempeñan un papel fundamental en la interacción con modelos de inteligencia artificial generativa debido a los siguientes factores:

Impacto en la calidad de los resultados: La precisión y utilidad de la respuesta dependen en gran medida de la claridad y precisión del prompt utilizado.
Optimización del tiempo: Un diseño efectivo del prompt reduce la necesidad de múltiples iteraciones, mejorando la eficiencia en la obtención de resultados deseados.
Adaptabilidad y personalización: Los prompts permiten adaptar la respuesta del modelo a distintos contextos y necesidades específicas, asegurando una mayor flexibilidad en su aplicación.

Elementos claves en la construcción de un prompt

Contexto

El contexto es un elemento crucial para reducir la posibilidad de respuestas incorrectas o fuera de tema. Para mejorar la precisión del modelo, se recomienda:

Proporcionar información relevante y suficiente para que el modelo comprenda el contexto de la solicitud.
Adjuntar enlaces, documentos o imágenes cuando sea necesario.
Utilizar instrucciones claras y directas, evitando formulaciones ambiguas o innecesarias.

Definición del rol

Es recomendable indicar al modelo el rol que debe asumir, como por ejemplo:

Actúa como un profesor de educación primaria, secundaria o universitaria.
Actúa como un experto en una disciplina específica o como un principiante.
Actúa como un profesional de una determinada área (científico, abogado, ingeniero, etc.).

Definición público objetivo

También es recomendable indicar al modelo el público objetivo al que se dirige, como por ejemplo:

Escríbe para que lo entienda un estudiante de primaria, secundaria o universitaria.
Escríbe para que lo entienda un profesional especializado o una persona sin conocimientos previos en el tema.
Escríbe para que lo entienda un audiencia general o técnica, según el propósito de la respuesta.

Acción solicitada

El prompt debe especificar con claridad la acción esperada del modelo. Algunas de las acciones más comunes incluyen:

Generar contenido: escribir, crear, producir.
Procesar información: resumir, expandir, corregir.
Clasificar o analizar: responder preguntas, identificar patrones, categorizar.
Convertir información: traducir, transformar datos en diferentes formatos.

Restricciones o condiciones específicas

Para mejorar la precisión del modelo, se pueden incluir restricciones o condiciones específicas, tales como:

Evitar ciertos términos o temas.
Especificar el idioma de la respuesta.
Indicar que el modelo responda con “No estoy seguro de la respuesta” en caso de duda, en lugar de generar información incorrecta.

Uso de ejemplos

Proporcionar ejemplos de la respuesta esperada puede mejorar considerablemente la calidad de la salida del modelo. Esto permite que la IA comprenda con mayor precisión el tipo de formato, tono o nivel de detalle requerido.

Formato de salida

Es recomendable definir explícitamente el formato en el que se desea recibir la respuesta. Algunas opciones incluyen:

Texto estructurado: lista, tabla, esquema conceptual.
Formatos específicos: Markdown, LaTeX, DOCX.
Datos estructurados: JSON, CSV, HTML.
Código de programación: CSS, JavaScript, Python.

Tono y estilo

Dependiendo del propósito de la respuesta, se puede especificar el tono y el estilo deseados:

Tono: formal, informal, expositivo, persuasivo, crítico, motivacional, humorístico.
Estilo: científico, técnico, argumentativo, literario, periodístico, publicitario.

Longitud de la respuesta

Es recomendable establecer la extensión de la respuesta esperada, especificando:

Número aproximado de caracteres, palabras, frases o párrafos.
Si la respuesta debe ser concisa o detallada, según las necesidades del usuario.

Técnicas avanzadas

Zero-shot Learning

Los modelos de inteligencia artificial han sido entrenados con grandes volúmenes de datos y refuerzo humano, lo que les permite generar respuestas de calidad aceptable sin necesidad de ejemplos previos. Este enfoque se conoce como Zero-shot Learning y permite obtener resultados sin proporcionar ejemplos explícitos.

Few-shot Learning

En situaciones donde se requiere una mayor precisión, es útil emplear el enfoque Few-shot Learning, que consiste en añadir uno o varios ejemplos de la respuesta deseada dentro del prompt. Esto ayuda al modelo a comprender con mayor precisión la estructura y el tipo de contenido esperado.

Cadena de Pensamiento (Chain-of-Thought, CoT)

La técnica Chain-of-Thought (CoT) mejora el razonamiento del modelo al indicarle al modelo que piense paso a paso el resultado asegurandose de que es correcto. Este método es especialmente útil en problemas matemáticos, lógicos y de toma de decisiones complejas.

Cadena de Prompts

Otra técnica avanzada consiste en dividir una tarea compleja en subtareas más pequeñas, permitiendo que el modelo las resuelva de manera progresiva. Este enfoque, conocido como encadenamiento de prompts, permite obtener resultados más estructurados y comprensibles.

Ver también

Comparte: Facebook Twitter

25 de febrero de 2025

Introducción a la Inteligencia Artificial Generativa

Por Adolfo Sanz De Diego el 25.2.25 Sin comentarios

Introducción a la Inteligencia Artificial Generativa [PDF]

La Inteligencia Artificial Generativa

¿Qué es?

La Inteligencia Artificial Generativa comprende sistemas capaces de producir contenidos originales como textos, imágenes, música, vídeos y otros contenidos mediante el uso de modelos avanzados de aprendizaje profundo que aprenden patrones y estructuras a partir de conjuntos de datos existentes.

¿Qué aplicaciones tiene?

La Inteligencia Artificial Generativa tiene diversas aplicaciones prácticas en múltiples sectores, como por ejemplo:

Marketing, entretenimiento y periodismo: creación automatizada de contenidos.
Arte y diseño: herramientas que facilitan la creatividad artística.
Educación personalizada: generación automática de contenidos educativos adaptados a necesidades específicas.
Desarrollo de software y automatización de procesos: generación de código y scripts.

Contexto Histórico

Orígenes de la Inteligencia Artificial

En las décadas de 1950 y 1960, hubo grandes expectativas sobre el potencial de la Inteligencia Artificial. Destacan algunos hitos importantes:

1950: Alan Turing introduce el Test de Turing.
1956: John McCarthy acuña el término “Inteligencia Artificial”.
1964: Aparece ELIZA, el primer chatbot.

Invierno de la Inteligencia Artificial

Durante las décadas de 1970 y 1980, la Inteligencia Artificial experimentó un período conocido como “invierno de la Inteligencia Artificial”, caracterizado por una disminución significativa en la financiación y el interés público debido a expectativas no cumplidas.

Resurgimiento de la Inteligencia Artificial

La década de 1990 marca un resurgimiento de la Inteligencia Artificial con avances en aprendizaje automático, y en la década del 2000 avances en redes neuronales profundas y algoritmos complejos. Entre los eventos más destacados están:

1997: Deep Blue de IBM derrota al campeón mundial de ajedrez Garry Kasparov.
2014: Introducción de las Redes Generativas Antagónicas (GAN) por Ian Goodfellow.
2015: Aparición de modelos de difusión basados en cadenas de Markov.
2017: Publicación del artículo “Attention Is All You Need”, que introduce los transformadores.

La revolución actual de la Inteligencia Artificial Generativa

Desde 2018 hasta el presente, se ha observado una expansión exponencial de la Inteligencia Artificial Generativa:

2018: Lanzamiento del primer modelo GPT por OpenAI.
2021: OpenAI presenta el modelo generativo de imágenes DALL-E.
2023: OpenAI lanza ChatGPT, que populariza ampliamente la tecnología.
2025: Aparición del modelo DeepSeek, un modelo de pesos abiertos con costos significativamente menores en comparación con modelos anteriores.

Modelos generativos fundamentales

Redes Generativas Antagónicas (GANs)

Introducidas por Ian Goodfellow en 2014, las GAN constan de dos redes neuronales que compiten entre sí para mejorar la calidad de las muestras generadas:

Generador: Crea muestras artificiales que se asemejan a las muestras reales.
Discriminador: Evalúa y distingue muestras reales de las generadas artificialmente.

Modelos de difusión

Introducidos en 2015, estos modelos se basan en las cadenas de Markov y transforman datos estructurados en ruido y luego revierten el proceso para generar contenido, tienen pues 2 fases:

Fase Forward (Difusión): Los datos originales se corrompen añadiendo ruido gaussiano en múltiples pasos.
Fase Backward (Reversión): Se aprende a revertir el proceso para generar contenidos originales a partir de datos con ruido.

Transformadores

Introducidos en el artículo “Attention is All You Need” en 2017, estos modelos se basan en mecanismos de atención para mejorar la calidad en la generación y procesamiento de texto mediante:

Codificador: Captura y procesa la información de entrada.
Decodificador: Genera el resultado final a partir de las representaciones creadas por el codificador.

Conceptos clave

Tokens

Son las unidades básicas de procesamiento empleadas por los modelos generativos, incluyendo palabras, subpalabras o símbolos. Por ejemplo, “inteligencia” podría dividirse en varios tokens según el modelo. La utilización de tokens impacta directamente en el costo computacional y económico de las interacciones con los modelos.

https://platform.openai.com/tokenizer

Embeddings

Son representaciones matemáticas que transforman datos complejos en vectores que capturan similitudes y relaciones en un espacio multidimensional. Son esenciales para reducir la complejidad y permitir que los modelos procesen datos de forma eficiente. Se usan en tareas como búsqueda semántica, sistemas de recomendación y clasificación, representando información de manera compacta y útil.

Dos palabras con significados parecidos, tendrán dos embeddings que se sitúen cerca dentro de su mismo espacio multidimensional. Además al ser vectores, si sumamos cada uno de los embeddings de un texto obtendremos otro embedding que nos dará, el significado global de dicho texto, de tal forma que la representación en forma de embedding de dos textos similares se situarán cerca dentro de su mismo espacio multidimensional.

Contexto

Se refiere a la información proporcionada como entrada que guía la generación de respuestas. El contexto incluye el texto previo, las instrucciones específicas y datos relevantes que ayudan al modelo a entender el propósito y mantener coherencia.

Los modelos tienen un límite de tokens de contexto que pueden procesar en una sola interacción, y es algo que hay que tener en cuenta a la hora de interacturar con dichos modelos.

Tipologías de modelos generativos

La Inteligencia Artificial Generativa emplea diversos tipos de modelos, cada uno diseñado para manejar entradas y salidas específicas. Las principales categorías incluyen:

Modelos texto a texto: generan contenido textual a partir de instrucciones o contextos escritos.
Modelos texto a imagen e imagen a texto: generan representaciones visuales a partir de descripciones textuales y viceversa.
Modelos texto a audio y audio a texto: facilitan la conversión de información escrita en formato auditivo, así como la transcripción automática de audio.
Modelos texto a vídeo y vídeo a texto: generan secuencias de vídeo a partir de instrucciones textuales o proporcionan descripciones textuales basadas en contenidos audiovisuales.
Modelos multimodales: integran múltiples formatos de entrada (texto, imagen, audio, vídeo) y generan resultados en diversos formatos.

Beneficios y desafíos

Beneficios

La Inteligencia Artificial Generativa ofrece múltiples beneficios, entre los cuales destacan:

Optimización de procesos creativos y productivos: Permite una significativa aceleración en la generación de ideas y producción de contenidos.
Reducción de costos y tiempos operativos: Facilita la disminución sustancial en los recursos necesarios para producir resultados eficientemente.
Personalización avanzada de contenidos y productos: Capacidad de adaptar resultados específicamente a las necesidades individuales de usuarios o clientes.
Mejora en la experiencia del usuario: Proporciona interacciones más naturales y enriquecedoras con sistemas automatizados y asistentes virtuales.
Expansión del potencial creativo: Abre nuevas posibilidades en la exploración y generación de ideas originales.
Facilitación del descubrimiento y la innovación: Promueve enfoques novedosos y soluciones antes inexploradas.
Accesibilidad mejorada: Genera recursos adaptados para personas con discapacidades, favoreciendo la inclusión y accesibilidad.
Desarrollo avanzado de asistentes virtuales: Estos pueden interactuar de forma más natural, humana y efectiva con los usuarios.

Desafíos

Sin embargo, también enfrenta múltiples desafíos y riesgos que deben considerarse cuidadosamente:

Garantía de precisión y veracidad: La dificultad para asegurar que el contenido generado sea correcto y fiable.
Impacto sobre habilidades creativas humanas: Riesgo potencial de que la dependencia excesiva en la Inteligencia Artificial Generativa reduzca ciertas habilidades creativas humanas.
Riesgo de uso indebido de datos generados: Posible generación y propagación de información falsa o maliciosa (fake news).
Protección de datos personales: Preocupaciones crecientes relacionadas con la privacidad y el uso ético de datos personales.
Derechos de autor y propiedad intelectual: Debate abierto sobre quién posee los derechos de los contenidos generados por Inteligencia Artificial Generativa.
Impacto económico y laboral: Potencial afectación al empleo y cambios significativos en las industrias creativas y laborales.
Amplificación de sesgos existentes: Riesgo de que los modelos generativos reproduzcan y amplifiquen prejuicios y sesgos presentes en los datos usados durante su entrenamiento.
Justicia algorítmica y discriminación: Necesidad crítica de asegurar que los algoritmos operen de forma equitativa y no discriminatoria.

Perspectivas futuras

Retos Éticos

La evolución de la Inteligencia Artificial Generativa presenta importantes consideraciones éticas, tales como:

Sesgos de datos: Posibilidad de perpetuar prejuicios implícitos existentes en los datos de entrenamiento.
Desinformación: Capacidad potencial para generar contenidos falsos extremadamente convincentes, como los llamados deepfakes.
Conflictos sobre propiedad intelectual: Debate continuo sobre la autoría y derechos legales relacionados con contenidos creados por Inteligencia Artificial Generativa.
Impacto ambiental: Alto consumo energético requerido tanto para el entrenamiento como para la operación constante de estos modelos.

Tendencias Tecnológicas

Además, en la evolución de la Inteligencia Artificial Generativa se anticipan diversas tendencias en el desarrollo tecnológico futuro:

Multimodalidad: Desarrollo de modelos que integran múltiples tipos de datos (texto, imagen, audio, vídeo) en sus procesos.
Autoaprendizaje continuo: Capacidad de los modelos para adaptarse y actualizarse continuamente con nuevos datos sin requerir reentrenamiento extenso.
Mayor eficiencia en modelos: Avances que permiten reducir el costo computacional de manera significativa mediante técnicas de optimización.
Hardware especializado: Innovación en la creación de chips dedicados específicamente al procesamiento eficiente de modelos de Inteligencia Artificial Generativa, buscando maximizar rendimiento y reducir el consumo energético.

Ver también

Comparte: Facebook Twitter

BIENVENIDO AL BLOG PERSONAL DE ADOLFO SANZ DE DIEGO

10 de agosto de 2025

6 de julio de 2025

¿Cómo lo he hecho?

Búsqueda de datos

Descarga de datos

Geo-coordenadas de las estaciones

Procesamiento de datos

Visualización de datos

15 de marzo de 2025

¿Qué es un Gran Modelo de Lenguaje (LLM)?

Capacidades de los Grandes Modelos de Lenguaje (LLM)

Generación de lenguaje

Manipulación de lenguaje

Razonamiento lógico básico

Limitaciones de los Grandes Modelos de Lenguaje (LLM)

Inconsistencia en las respuestas

Alucinaciones

Capacidad limitada de memoria

Sensibilidad a las instrucciones

Dependencia de los datos de entrenamiento

Principales aplicaciones de los Grandes Modelos de Lenguaje (LLM)

Tareas ideales

Recuperación de información

Procesamiento de textos

Ver también

14 de marzo de 2025

Generación y procesamiento de imágenes

DALL·E 3

Leonardo

Ideogram

Freepik

Generación y procesamiento de vídeos

Kling AI

Hailuo AI

Conversión de texto a audio y viceversa

Eleven Labs

TTSMaker

TurboScribe

Transcripción de videoconferencias

Fireflies

Otter

Mejora automática de audio

Auphonic

Adobe Podcast

Creación de música

Suno

Udio

Probar múltiples aplicaciones de IA

Hugging Face Spaces

Herramientas de idiomas

DeepL Translator

Language Tools

Grammarly

Pronounce

Búsqueda y procesamiento académico

Elicit

Consensus

NotebookLM de Google

Generación de presentaciones

Slidesgo

Markdown Slides Creator

Creación de mapas mentales y gráficos con IA

Mindmapai

Aigraphmaker

Ayuda en programación

GitHub Copilot

Codeium

Ayuda en análisis de datos

ChatCSV

Rows

ChartPixel

Ver también

2 de marzo de 2025

Ingeniería de prompts

Definición

Importancia

Elementos claves en la construcción de un prompt

Contexto

Definición del rol

BIENVENIDO AL BLOG PERSONAL DE
ADOLFO SANZ DE DIEGO