¿Cómo funciona el reconocimiento facial?

El reconocimiento facial es un tipo de tecnología biométrica que identifica o verifica a una persona analizando las características únicas de su rostro. Los sistemas modernos de reconocimiento facial funcionan detectando un rostro en una imagen, mapeando puntos de referencia faciales clave (como la distancia entre los ojos, la forma de la mandíbula y la posición de la nariz), y convirtiendo esas mediciones en una representación numérica llamada descriptor facial o embedding. Este vector compacto captura la esencia de la geometría del rostro de una manera que puede compararse matemáticamente con otros descriptores.

Cuando se comparan dos descriptores faciales, el sistema calcula la distancia euclidiana entre ellos — una medida de qué tan separados están los dos vectores en el espacio de alta dimensionalidad. Una distancia pequeña indica alta similitud, sugiriendo que los rostros probablemente pertenecen a la misma persona, mientras que una distancia grande sugiere individuos diferentes. Un umbral configurable determina el punto de corte entre una coincidencia y una no coincidencia.

Descripción de la herramienta

Esta herramienta te permite comparar dos fotos de rostros lado a lado para determinar si pertenecen a la misma persona. Utiliza un modelo de aprendizaje profundo preentrenado (SSD MobileNet v1) para la detección de rostros y una red de reconocimiento facial dedicada para generar descriptores faciales de 128 dimensiones. Todo el proceso — desde la carga del modelo hasta la detección de rostros y la comparación — se ejecuta localmente en tu navegador usando aceleración WebGL. Las imágenes o datos nunca se cargan en un servidor, lo que la convierte en una herramienta de verificación facial completamente privada.

Cómo funciona

  1. Carga del modelo — En el primer uso, la herramienta descarga modelos de redes neuronales ligeros (detector de rostros, predictor de puntos de referencia y red de reconocimiento) y los almacena en caché en el navegador.
  2. Detección de rostros — Cada imagen cargada se escanea usando el detector SSD MobileNet v1 para localizar un rostro y extraer 68 puntos de referencia faciales.
  3. Extracción de descriptores — La región del rostro alineada con los puntos de referencia se pasa a través de una red de reconocimiento que produce un vector descriptor de 128 dimensiones.
  4. Cálculo de distancia — Se calcula la distancia euclidiana entre los dos descriptores. Una distancia por debajo del umbral indica una coincidencia; por encima indica personas diferentes.
  5. Retroalimentación visual — Los rostros detectados se resaltan con cuadros delimitadores en ambas imágenes, y se muestra el porcentaje de similitud y la distancia sin procesar.

Ejemplos

Escenario Resultado esperado
Dos selfis de la misma persona tomados en días diferentes Alta similitud (85–99%), coincidencia
Foto de la persona A vs. foto de la persona B Baja similitud (20–50%), sin coincidencia
Misma persona con y sin gafas Generalmente sigue siendo una coincidencia si el rostro es claramente visible
Misma persona en edades significativamente diferentes Puede no coincidir si la estructura facial cambió sustancialmente

Características

  • 100% basado en navegador — todo el procesamiento ocurre localmente usando WebGL; sin cargas en servidor, sin APIs en la nube
  • Umbral de coincidencia ajustable — ajusta la sensibilidad con un control deslizante que va de 0.1 a 1.0 (predeterminado: 0.6)
  • Superposición visual de detección de rostros — se dibujan cuadros delimitadores alrededor de los rostros detectados en ambas imágenes
  • Métricas detalladas — muestra tanto el porcentaje de similitud como la distancia euclidiana sin procesar para transparencia
  • Múltiples formatos de imagen — admite cargas en JPEG, PNG y WebP

Casos de uso

  • Verificación de identidad — verifica rápidamente si dos fotos muestran al mismo individuo, útil para revisión de documentos o verificación de perfil
  • Organización de fotos — determina qué fotos en una colección pertenecen a la misma persona antes de ordenarlas en álbumes
  • Auditoría de seguridad — compara una foto en vivo contra una imagen de referencia para control de acceso o confirmación de asistencia

Opciones explicadas

Opción Descripción Predeterminado
Umbral de coincidencia Controla qué tan estricta es la comparación. Los valores más bajos requieren que los rostros sean más similares para contar como una coincidencia. Los valores más altos son más permisivos. 0.6

Un umbral de 0.6 funciona bien para la mayoría de los casos. Si obtienes falsos positivos (personas diferentes marcadas como iguales), baja el umbral. Si obtienes falsos negativos (misma persona marcada como diferente), súbelo.

Limitaciones

  • Solo se analiza un rostro por imagen. Si una imagen contiene múltiples rostros, solo se detecta el más prominente.
  • Las imágenes de muy baja resolución, oclusión pesada (máscaras, bufandas) o ángulos extremos pueden impedir la detección de rostros.
  • El modelo funciona mejor en poses de rostro frontal o casi frontal con iluminación adecuada.
  • La carga inicial del modelo puede tardar algunos segundos dependiendo de la velocidad de la red y el rendimiento del dispositivo.
  • Los resultados son probabilísticos, no definitivos — esta herramienta no es adecuada para identificación legal o forense.

Preguntas frecuentes

¿Mis datos están seguros? Sí. La herramienta se ejecuta completamente en tu navegador. Tus imágenes nunca se cargan en ningún servidor. Toda la lógica de detección y comparación de rostros se ejecuta localmente usando WebGL.

¿Por qué dice "No se detectó rostro"? La imagen puede ser demasiado pequeña, demasiado oscura, muy obstruida o tomada desde un ángulo extremo. Intenta con una foto más clara, de frente y con buena iluminación.

¿Qué significa distancia euclidiana aquí? Es una medida numérica de qué tan diferentes son dos descriptores faciales. Los valores más cercanos a 0 indican rostros casi idénticos; los valores por encima del umbral sugieren personas diferentes.

¿Puedo comparar rostros de diferentes grupos de edad? La herramienta puede manejar diferencias de edad moderadas, pero el envejecimiento significativo (por ejemplo, niño vs. anciano) puede reducir la precisión ya que la estructura facial cambia con el tiempo.