चेहरे की पहचान कैसे काम करती है?

चेहरे की पहचान एक प्रकार की बायोमेट्रिक तकनीक है जो किसी व्यक्ति के चेहरे की अनन्य विशेषताओं का विश्लेषण करके उसकी पहचान करती है या सत्यापित करती है। आधुनिक चेहरे की पहचान प्रणालियाँ एक छवि में चेहरे का पता लगाकर, मुख्य चेहरे के स्थलों को मैप करके (जैसे आँखों के बीच की दूरी, जबड़े की आकृति, और नाक की स्थिति), और उन मापों को एक संख्यात्मक प्रतिनिधित्व में परिवर्तित करके काम करती हैं जिसे चेहरे का विवरणक या एम्बेडिंग कहा जाता है। यह कॉम्पैक्ट वेक्टर चेहरे की ज्यामिति के सार को इस तरह से कैप्चर करता है कि इसकी तुलना अन्य विवरणकों के साथ गणितीय रूप से की जा सकती है।

जब दो चेहरे के विवरणकों की तुलना की जाती है, तो सिस्टम उनके बीच यूक्लिडियन दूरी की गणना करता है — यह एक माप है कि दोनों वेक्टर उच्च-आयामी स्थान में कितनी दूर हैं। एक छोटी दूरी उच्च समानता का संकेत देती है, जिससे पता चलता है कि चेहरे संभवतः एक ही व्यक्ति के हैं, जबकि एक बड़ी दूरी विभिन्न व्यक्तियों का सुझाव देती है। एक कॉन्फ़िगर करने योग्य थ्रेशोल्ड मेल और गैर-मेल के बीच कटऑफ निर्धारित करता है।

उपकरण विवरण

यह उपकरण आपको दो चेहरे की फ़ोटो को साथ-साथ तुलना करने देता है ताकि यह निर्धारित किया जा सके कि वे एक ही व्यक्ति के हैं या नहीं। यह चेहरे की पहचान के लिए एक पूर्व-प्रशिक्षित गहन शिक्षण मॉडल (SSD MobileNet v1) का उपयोग करता है और 128-आयामी चेहरे के विवरणक उत्पन्न करने के लिए एक समर्पित चेहरे की पहचान नेटवर्क का उपयोग करता है। पूरी प्रक्रिया — मॉडल लोडिंग से लेकर चेहरे की पहचान और तुलना तक — WebGL त्वरण का उपयोग करके आपके ब्राउज़र में स्थानीय रूप से चलती है। कोई भी छवि या डेटा कभी भी सर्वर पर अपलोड नहीं किया जाता है, जिससे यह एक पूरी तरह से निजी चेहरे की सत्यापन उपकरण बन जाता है।

यह कैसे काम करता है

  1. मॉडल लोडिंग — पहली बार उपयोग पर, उपकरण हल्के वजन वाले तंत्रिका नेटवर्क मॉडल (चेहरे का डिटेक्टर, स्थलचिह्न भविष्यवक्ता, और पहचान नेटवर्क) डाउनलोड करता है और उन्हें ब्राउज़र में cache करता है।
  2. चेहरे की पहचान — प्रत्येक अपलोड की गई छवि को SSD MobileNet v1 डिटेक्टर का उपयोग करके स्कैन किया जाता है ताकि एक चेहरे का पता लगाया जा सके और 68 चेहरे के स्थलचिह्न निकाले जा सकें।
  3. विवरणक निष्कर्षण — स्थलचिह्न-संरेखित चेहरे का क्षेत्र एक पहचान नेटवर्क के माध्यम से पारित किया जाता है जो एक 128-आयामी विवरणक वेक्टर उत्पन्न करता है।
  4. दूरी की गणना — दोनों विवरणकों के बीच यूक्लिडियन दूरी की गणना की जाती है। थ्रेशोल्ड से नीचे की दूरी एक मेल का संकेत देती है; इससे ऊपर विभिन्न लोगों का संकेत देता है।
  5. दृश्य प्रतिक्रिया — पहचाने गए चेहरों को दोनों छवियों पर बाउंडिंग बॉक्स के साथ हाइलाइट किया जाता है, और समानता प्रतिशत और कच्ची दूरी प्रदर्शित की जाती है।

उदाहरण

परिदृश्य अपेक्षित परिणाम
एक ही व्यक्ति की दो सेल्फी अलग-अलग दिनों पर ली गई उच्च समानता (85–99%), मेल
व्यक्ति A की फ़ोटो बनाम व्यक्ति B की फ़ोटो कम समानता (20–50%), कोई मेल नहीं
एक ही व्यक्ति चश्मे के साथ और बिना आमतौर पर अभी भी मेल यदि चेहरा स्पष्ट रूप से दिखाई दे
एक ही व्यक्ति काफी अलग उम्र में यदि चेहरे की संरचना में काफी परिवर्तन हुआ है तो मेल नहीं हो सकता

विशेषताएँ

  • 100% ब्राउज़र-आधारित — सभी प्रसंस्करण WebGL का उपयोग करके स्थानीय रूप से होता है; कोई सर्वर अपलोड नहीं, कोई cloud API नहीं
  • समायोज्य मेल थ्रेशोल्ड — 0.1 से 1.0 तक की रेंज वाले स्लाइडर के साथ संवेदनशीलता को ठीक करें (डिफ़ॉल्ट: 0.6)
  • दृश्य चेहरे की पहचान ओवरले — दोनों छवियों पर पहचाने गए चेहरों के चारों ओर बाउंडिंग बॉक्स खींचे जाते हैं
  • विस्तृत मेट्रिक्स — पारदर्शिता के लिए समानता प्रतिशत और कच्ची यूक्लिडियन दूरी दोनों प्रदर्शित करता है
  • कई छवि प्रारूप — JPEG, PNG, और WebP अपलोड का समर्थन करता है

उपयोग के मामले

  • पहचान सत्यापन — जल्दी से जांचें कि क्या दो फ़ोटो एक ही व्यक्ति को दिखाती हैं, दस्तावेज़ समीक्षा या प्रोफ़ाइल सत्यापन के लिए उपयोगी
  • फ़ोटो संगठन — निर्धारित करें कि संग्रह में कौन सी फ़ोटो एक ही व्यक्ति से संबंधित हैं उन्हें एल्बम में सॉर्ट करने से पहले
  • सुरक्षा ऑडिटिंग — एक्सेस नियंत्रण या उपस्थिति पुष्टि के लिए एक संदर्भ छवि के विरुद्ध एक लाइव फ़ोटो की तुलना करें

विकल्प समझाया गया

विकल्प विवरण डिफ़ॉल्ट
मेल थ्रेशोल्ड तुलना कितनी सख्त है यह नियंत्रित करता है। कम मान के लिए चेहरों को मेल के रूप में गिनने के लिए अधिक समान होना आवश्यक है। उच्च मान अधिक उदार हैं। 0.6

0.6 की थ्रेशोल्ड अधिकांश मामलों के लिए अच्छी तरह से काम करती है। यदि आप झूठी सकारात्मकता प्राप्त कर रहे हैं (विभिन्न लोगों को समान के रूप में चिह्नित किया गया), तो थ्रेशोल्ड को कम करें। यदि आप झूठी नकारात्मकता प्राप्त कर रहे हैं (एक ही व्यक्ति को विभिन्न के रूप में चिह्नित किया गया), तो इसे बढ़ाएं।

सीमाएँ

  • प्रति छवि केवल एक चेहरे का विश्लेषण किया जाता है। यदि किसी छवि में कई चेहरे हैं, तो केवल सबसे प्रमुख चेहरे का पता लगाया जाता है।
  • बहुत कम रिज़ॉल्यूशन वाली छवियाँ, भारी अवरोध (मास्क, स्कार्फ), या चरम कोण चेहरे की पहचान को रोक सकते हैं।
  • मॉडल सामने या लगभग सामने के चेहरे की मुद्रा के साथ पर्याप्त प्रकाश व्यवस्था पर सर्वश्रेष्ठ प्रदर्शन करता है।
  • प्रारंभिक मॉडल लोडिंग नेटवर्क गति और डिवाइस प्रदर्शन के आधार पर कुछ सेकंड ले सकती है।
  • परिणाम संभाव्य हैं, निश्चित नहीं — यह उपकरण कानूनी या फोरेंसिक पहचान के लिए उपयुक्त नहीं है।

अक्सर पूछे जाने वाले प्रश्न

क्या मेरा डेटा सुरक्षित है? हाँ। उपकरण पूरी तरह से आपके ब्राउज़र में चलता है। आपकी छवियाँ कभी भी किसी सर्वर पर अपलोड नहीं की जाती हैं। सभी चेहरे की पहचान और तुलना तर्क WebGL का उपयोग करके स्थानीय रूप से निष्पादित होता है।

यह "कोई चेहरा नहीं मिला" क्यों कहता है? छवि बहुत छोटी, बहुत अंधेरी, भारी रूप से अस्पष्ट, या एक चरम कोण से ली गई हो सकती है। अच्छी प्रकाश व्यवस्था के साथ एक स्पष्ट, सामने की ओर की फ़ोटो आजमाएँ।

यूक्लिडियन दूरी यहाँ क्या मायने रखती है? यह एक संख्यात्मक माप है कि दो चेहरे के विवरणक कितने भिन्न हैं। 0 के करीब मान लगभग समान चेहरों का संकेत देते हैं; थ्रेशोल्ड से ऊपर के मान विभिन्न लोगों का सुझाव देते हैं।

क्या मैं विभिन्न आयु समूहों के चेहरों की तुलना कर सकता हूँ? उपकरण मध्यम आयु के अंतर को संभाल सकता है, लेकिन महत्वपूर्ण उम्र बढ़ना (जैसे बच्चा बनाम बुजुर्ग) सटीकता को कम कर सकता है क्योंकि समय के साथ चेहरे की संरचना बदलती है।