Volver

Analiza ajustes más técnicos con capturas de pantalla en Gemini

Qué vas a conseguir

Convierte una simple captura de pantalla en una guía paso a paso explicada automáticamente.
Gemini analizará la interfaz que aparece en la imagen y generará instrucciones claras para replicar ese proceso. Esto es muy útil para crear tutoriales, documentar procesos o entender herramientas nuevas sin tener que escribir explicaciones manualmente.

Cómo hacerlo

El proceso consiste en subir una captura de pantalla a Gemini, pedirle que analice la interfaz y convertir automáticamente lo que aparece en una guía de pasos claros que cualquier persona pueda seguir.

Paso 1 — Haz una captura del proceso que quieras explicar

Primero haz una captura de pantalla del proceso que quieres convertir en tutorial.

Por ejemplo:

  • una interfaz de software
  • un panel de configuración
  • una herramienta online
  • una pantalla de edición

Cuanto más clara sea la captura, mejor podrá analizarla Gemini.

Paso 2 — Súbela a Gemini y pide que analice la imagen

Ahora entra en Google AI Studio o Gemini, sube la captura y pídele que analice lo que aparece en la imagen.

Puedes usar un prompt como este:

Analiza esta captura de pantalla de configuración de OBS y explícamela paso a paso.
Describe qué hace cada opción y para qué sirve dentro de una configuración de streaming.

Gemini analizará la interfaz y generará una explicación estructurada del proceso.

Añade la captura de pantalla como ves más el prompt de ejemplo (adáptalo a tu necesidad)
Gemini empieza a analizar antes de darnos el resultado

Paso 3 — Convierte la explicación en un tutorial claro

Una vez que Gemini haya explicado la configuración, puedes ir un paso más allá y pedirle recomendaciones concretas.

Por ejemplo, puedes pedirle que te sugiera la mejor configuración según tu caso.

Convertimos la explicación en algo más adaptado para lo que necesitamos

Ejemplo de prompt:

PROMPT
Teniendo en cuenta esta configuración de OBS, recomiéndame los mejores ajustes para grabar vídeos en YouTube a 1080p.

De esta forma no solo entenderás la interfaz, sino que también obtendrás una configuración optimizada.

Resultado adaptando configuración o ajustes a nuestras necesidades, en este caso para YouTube

Así puedes usarlo

Este sistema puede aplicarse en muchas situaciones prácticas.

Crear tutoriales de herramientas digitales rápidamente
En lugar de escribir el tutorial desde cero, subes una captura y Gemini genera las instrucciones.

Aprender herramientas nuevas
Si encuentras una interfaz que no entiendes, Gemini puede explicarte qué hace cada parte.

En definitiva puedes adaptar este caso a lo que necesites, ya seas abogado, fontanero o creador de contenido. Imagina un abogado que quiere contrastar algún documento o un fontanero que no entiende las instrucciones de un producto nuevo a instalar. Con esta opción podrás tener un tutorial paso a paso.

Mejoras

Una mejora interesante es pedir a Gemini que también explique la función de cada elemento de la interfaz.

Por ejemplo:

PROMPT
Además de los pasos, explica para qué sirve cada botón o sección de la interfaz de forma más gráfica o simplificada

De esta forma no solo tendrás un tutorial, sino también una pequeña guía para entender la herramienta que aparece en la imagen.

Resultado de las funciones de forma sencilla