Modo retrato: cómo tu teléfono crea ese desenfoque de fondo profesional

El modo retrato usa detección de profundidad e IA para desenfocar el fondo de las fotos, imitando el aspecto de una cámara profesional. Aprende cómo funciona, sus limitaciones y cómo obtener los mejores resultados.

¿Qué es el modo retrato?

El modo retrato es una función de cámara —presente en prácticamente todos los smartphones modernos y algunas cámaras dedicadas— que desenfoca artificialmente el fondo de una foto manteniendo el sujeto nítido y enfocado. Este efecto imita la escasa profundidad de campo que los fotógrafos profesionales consiguen con cámaras de sensor grande y objetivos rápidos, donde el sujeto destaca sobre un fondo cremoso y desenfocado (conocido como “bokeh”). En un smartphone, donde el diminuto sensor y el pequeño objetivo normalmente mantendrían todo en foco, el modo retrato usa una combinación de detección de profundidad, IA y fotografía computacional para recrear este efecto digitalmente.

El resultado, cuando funciona bien, es una foto que parece tomada con una cámara dedicada que cuesta muchas veces más. El sujeto destaca claramente mientras los fondos que distraen se disuelven en un desenfoque suave. Es la función de fotografía computacional más popular en los smartphones, y ha mejorado notablemente en los últimos años.

Por qué las cámaras de teléfono no pueden hacer esto de forma natural

El desenfoque de fondo (bokeh) es función de tres factores físicos:

  • Tamaño del sensor: los sensores más grandes producen menor profundidad de campo. Los sensores de smartphone son diminutos comparados con las cámaras de fotograma completo o incluso APS-C.
  • Apertura (número f): las aperturas más amplias producen más desenfoque. Los objetivos de teléfono tienen típicamente aperturas de f/1,7-f/2,2, lo que suena rápido, pero la longitud focal extremadamente corta niega gran parte del efecto.
  • Distancia del sujeto y longitud focal: las longitudes focales más largas y las distancias de sujeto más cortas producen más desenfoque.

Dado que los sensores de smartphone son tan pequeños (típicamente alrededor de 1/1,3" a 1/2,5"), la física simplemente no permite un desenfoque de fondo óptico significativo en la mayoría de los escenarios de disparo. El modo retrato existe para salvar esta brecha computacionalmente.

Cómo el modo retrato crea el desenfoque

Los sistemas de modo retrato modernos usan un proceso de varios pasos:

Paso 1: Mapa de profundidad

La cámara necesita averiguar qué es el sujeto (primer plano) y qué es el fondo. Lo hace usando uno o más métodos:

  • Visión estereoscópica de doble cámara: dos cámaras ligeramente separadas (como los ojos humanos) capturan la escena desde perspectivas ligeramente diferentes. Analizando la diferencia entre las dos imágenes, el teléfono calcula la distancia a cada parte de la escena.
  • Sensor de tiempo de vuelo (ToF): un sensor dedicado emite pulsos de luz infrarroja y mide cuánto tiempo tardan en rebotar, creando un mapa de profundidad preciso.
  • Escáner LiDAR: similar al ToF pero más preciso, usando patrones de puntos láser. Presente en algunos smartphones premium.
  • Estimación de profundidad basada en IA: una red neuronal entrenada con millones de imágenes estima la profundidad desde una sola cámara, basándose en señales visuales como el desenfoque de enfoque, el tamaño, la textura y el contexto.

Paso 2: Segmentación del sujeto

El mapa de profundidad solo no es suficiente. El sistema también usa la segmentación semántica por IA para identificar qué tipo de objeto está en primer plano (una persona, una mascota, comida) y refinar el límite entre el sujeto y el fondo.

Paso 3: Simulación del desenfoque

Una vez que el mapa de profundidad y la máscara de segmentación están listos, el software aplica un desenfoque simulado que varía en intensidad según la distancia desde el punto de enfoque. Las implementaciones avanzadas simulan las características ópticas del desenfoque real de los objetivos, incluida la forma de los reflejos de bokeh.

Dónde el modo retrato tiene dificultades

A pesar de las enormes mejoras, el modo retrato sigue teniendo puntos débiles:

Cabello y bordes finos: los mechones de cabello, el pelo y otros detalles finos en el límite del sujeto son los elementos más difíciles de separar. Los modos retrato antiguos a menudo desenfocaban a través del cabello. La IA moderna es mucho mejor, pero no es perfecta.

Objetos transparentes y reflectantes: las gafas, copas de vino, tejidos de malla y otros objetos transparentes o semitransparentes confunden los algoritmos de estimación de profundidad y segmentación.

Múltiples sujetos a diferentes profundidades: si dos personas están de pie a diferentes distancias, el sistema puede desenfocar a la persona más alejada o tener dificultades para gestionar la transición de profundidad entre ellas.

Mascotas y sujetos no humanos: la segmentación por IA está entrenada principalmente en sujetos humanos. Si bien la detección de animales ha mejorado significativamente, los resultados pueden ser inconsistentes.

El deslizador de apertura ajustable

Muchos modos retrato permiten ajustar la intensidad del desenfoque de fondo usando un deslizador de apertura virtual, típicamente de aproximadamente f/1,4 (desenfoque máximo) a f/16 (desenfoque mínimo). Este es puramente un control de software. A veces un desenfoque sutil parece más natural y creíble que el ajuste máximo de “f/1,4”, que puede hacer que el efecto parezca obviamente artificial, especialmente si la detección de bordes no es perfecta.

Modo retrato para vídeo

El vídeo en modo retrato (a veces llamado “Modo Cinemático” o “Bokeh de Vídeo”) aplica el mismo mapeo de profundidad y simulación de desenfoque al vídeo en tiempo real. Esto es significativamente más difícil que las fotos fijas porque el mapa de profundidad debe recalcularse para cada fotograma, la segmentación del sujeto debe rastrear a la persona mientras se mueve y el desenfoque debe transicionar suavemente entre fotogramas.

Los resultados han mejorado dramáticamente en los últimos años, con algunos teléfonos insignia produciendo bokeh de vídeo que genuinamente se asemeja a metraje de una cámara de cine.

Modo retrato frente a bokeh real

AspectoModo retratoBokeh natural
Precisión de bordesBuena pero imperfecta; artefactos ocasionalesPerfecta: es física
Calidad del bokehSimulada; puede parecer ligeramente sintéticaNatural; suave y orgánica
Transición de profundidadA veces abrupta entre sujeto y fondoGradual y continua
ConsistenciaDepende de la complejidad de la escenaSiempre funciona
CosteIncluido con tu teléfonoRequiere cámara dedicada + objetivo rápido

La brecha se reduce con cada generación, pero los fotógrafos experimentados aún pueden detectar el desenfoque computacional, particularmente en la zona de transición entre áreas nítidas y desenfocadas.

Conclusión práctica

El modo retrato es fotografía computacional en su máxima expresión. Supera la limitación física fundamental de los diminutos sensores de smartphone para entregar un desenfoque de fondo que antes requería cámaras dedicadas caras. Las mejores implementaciones son ahora genuinamente convincentes, con detección precisa de bordes, bokeh de aspecto natural e intensidad de desenfoque ajustable. Al elegir un dispositivo, concéntrate en la calidad de detección de bordes y el hardware de detección de profundidad, no solo en las afirmaciones de marketing, y no tengas miedo de reducir la intensidad del desenfoque para obtener los resultados más naturales.