تکنولوژی تشخیص چهره بسیار ساده است
پیش از آنکه وارد لایههای عمیق این تکنولوژی شویم مهم است که روند کار این فناوری را بفهمیم. در ادامه سه کاربرد مختلف برای تشخیص چهره را معرفی خواهیم کرد و توضیح مختصر و سادهای از نحوهی عملکرد تکنولوژی تشخیص چهره بسیار ساده است ارائه میدهیم:
- تشخیص چهرههای معمولی که در Animoji و فیلترهای اینستاگرام مورد استفاده قرار میگیرد. دوربین گوشی شما به دنبال حجمی شبیه به صورت انسان میگردد؛ حجمی که دو چشم، یک بینی و یک دهان داشته باشد. سپس با استفاده از الگوریتمهایی نسبتا پیچیده تلاش میکند جهت صورت را تشخیص دهد و حتی ببیند که آیا دهان فرد باز است یا نه. بد نیست به این موضوع هم اشاره کنیم که این گونه نرم افزارها وظیفهی تشخیص چهره را بر عهده ندارند و تنها به دنبال صورت انسان میگردند.
- Face ID و نرم افزارهای مشابه عکسی از صورتتان میگیرند و مشخص میکنند که فاصلهی هرکدام از بخشهای صورت شما با هم چه قدر است. سپس هر زمان که بخواهید گوشیتان را باز کنید این اپلیکیشن بررسی میکند که آیا فاصلهی المانهای صورتتان با عکس اولیه یکسان هست یا خیر. در صورت تطبیق قفل گوشی باز خواهد شد.
- تشخیص چهرهی یک غریبه عموما در شرکتهای بزرگ و امنیتی انجام میشود. در این سازمانها -به منظور حفظ امنیت و یا حتی با هداف تبلیغاتی- تلاش میشود تا چهرهی هرکدام از افراد با تعداد زیادی از چهرههای از پیش ذخیره شده در پایگاه دادهای غنی مقایسه شود. این فرآیند تا حد زیادی شبیه به Face ID اپل است اما در ابعادی گستردهتر انجام میگیرد. روی کاغذ هر پایگاه دادهای (پایگاه دادهی کارت ملی، حساب کاربری فیسبوک و …) میتواند برای این کار مورد استفاده قرار بگیرد اما ایده آل ترین گزینه استفاده از پایگاه دادهی تصاویری واضح از چهرهی افراد است.
حالا زمان آن رسیده که کمی بحث را پیچیده تر کنیم. تشخیص چهرهی مورد استفاده در فیلتر اینستاگرام بسیار ساده است و میتوان گفت فرآیند آن عملا آسیبی به افراد نمیرساند. در این مطلب قصد داریم تمرکزمان روی تشخیص چهره و تکنولوژیهایی باشد که میتوان از آنها برای تشخیص هویت افراد استفاده کرد.
بیشتر تشخیص چهرهها از تصاویر دو بعدی استفاده میکنند
همانطور که احتمالا انتظار دارید بیشتر نرم افزارهای تشخیص چهره روی تصاویر دو بعدی متمرکز هستند. البته این موضوع به دلیل دقیقتر بودن پردازش تصاویر دو بعدی نیست، بلکه به خاطر راحتی کار است. بیشتر دوربینهای مورد استفاده تصاویر را بدون عمق ثبت میکنند و از طرفی تصاویر ذخیره شده در پایگاه دادههای بزرگ عمدتا به صورت دو بعدی هستند.