Qué vas a conseguir
Convierte una simple captura de pantalla en una guía paso a paso explicada automáticamente.
Gemini analizará la interfaz que aparece en la imagen y generará instrucciones claras para replicar ese proceso. Esto es muy útil para crear tutoriales, documentar procesos o entender herramientas nuevas sin tener que escribir explicaciones manualmente.

Cómo hacerlo
El proceso consiste en subir una captura de pantalla a Gemini, pedirle que analice la interfaz y convertir automáticamente lo que aparece en una guía de pasos claros que cualquier persona pueda seguir.
Paso 1 — Haz una captura del proceso que quieras explicar
Primero haz una captura de pantalla del proceso que quieres convertir en tutorial.
Por ejemplo:
- una interfaz de software
- un panel de configuración
- una herramienta online
- una pantalla de edición
Cuanto más clara sea la captura, mejor podrá analizarla Gemini.

Paso 2 — Súbela a Gemini y pide que analice la imagen
Ahora entra en Google AI Studio o Gemini, sube la captura y pídele que analice lo que aparece en la imagen.
Puedes usar un prompt como este:
Analiza esta captura de pantalla de configuración de OBS y explícamela paso a paso.
Describe qué hace cada opción y para qué sirve dentro de una configuración de streaming.
Gemini analizará la interfaz y generará una explicación estructurada del proceso.


Paso 3 — Convierte la explicación en un tutorial claro
Una vez que Gemini haya explicado la configuración, puedes ir un paso más allá y pedirle recomendaciones concretas.
Por ejemplo, puedes pedirle que te sugiera la mejor configuración según tu caso.

Ejemplo de prompt:
De esta forma no solo entenderás la interfaz, sino que también obtendrás una configuración optimizada.

Así puedes usarlo
Este sistema puede aplicarse en muchas situaciones prácticas.
Crear tutoriales de herramientas digitales rápidamente
En lugar de escribir el tutorial desde cero, subes una captura y Gemini genera las instrucciones.
Aprender herramientas nuevas
Si encuentras una interfaz que no entiendes, Gemini puede explicarte qué hace cada parte.
En definitiva puedes adaptar este caso a lo que necesites, ya seas abogado, fontanero o creador de contenido. Imagina un abogado que quiere contrastar algún documento o un fontanero que no entiende las instrucciones de un producto nuevo a instalar. Con esta opción podrás tener un tutorial paso a paso.
Mejoras
Una mejora interesante es pedir a Gemini que también explique la función de cada elemento de la interfaz.
Por ejemplo:
De esta forma no solo tendrás un tutorial, sino también una pequeña guía para entender la herramienta que aparece en la imagen.
