هوش مصنوعی با شبیهسازی ضربان قلب ابزارهای تشخیص «جعل عمیق» را دور میزند!
اقتصاد روز
بزرگنمايي:
ایران پرسمان - ایسنا /محققانی که به دنبال کشف جعل عمیق یا دیپفیکها بودند، مدتها به یک روش تشخیصی به ظاهر بیعیب و نقص متکی بودند و آن این بود که هوش مصنوعی نمیتوانست تغییرات ظریف در رنگ پوست را که ناشی از نبض افراد است، جعل کند. این قطعیت اکنون از بین رفته است، زیرا دانشمندان کشف کردهاند که جعلهای عمیق مدرن سهوا الگوهای ضربان قلب را از ویدئوهای منبع خود حفظ میکنند و باعث میشوند که معتبرترین ابزارهای تشخیص ما ناگهان به گزینههایی غیرقابل اعتماد تبدیل شوند. به نظر میرسد این همزادهای دیجیتالی ما، به تازگی قادر به شبیهسازی نبض شدهاند.
سالها، کارشناسان امنیت سایبری بر این باور بودند که توانایی تشخیص جعل عمیق را دارند. از آنجایی که هوش مصنوعی برای شبیهسازی تغییرات ظریف در رنگ پوست انسان که ناشی از جریان خون است، برنامهریزی نشده بود، محققان معتقد بودند که ویدئوهای جعلی فاقد این نشانههای فیزیولوژیکی هستند. اما طبق یک مطالعه بینالمللی جدید، این راه گزینه از دست رفته است.
به نقل از اساف، تحقیقات قبلی نشان داده است که فرآیندهای ایجاد جعل عمیق، سیگنالهای ظریف مربوط به ضربان قلب را در ویدئوها پاک میکنند و آنها را به ابزاری قابل اعتماد برای تشخیص تبدیل میکنند. با این حال، این مطالعه این ایده را به چالش کشیده است و نشان میدهد که فرآیندهای جعل عمیق مدرن دیگر این نشانهها را حذف نمیکنند.
این بدان معناست که بسیاری از ابزارهای تشخیص جعل عمیق موجود ممکن است کمتر از آنچه پیش از این تصور میشد، مؤثر عمل کنند. تکیه بر تشخیص نبض به عنوان سپری در برابر جعل عمیق ممکن است دیگر یک گزینه مناسب به شمار نرود.
چگونه میتوان ضربان قلب را در یک ویدئو تشخیص داد؟
از آن جا که خون در رگهای نزدیک به سطح پوست جریان مییابد، ضربان قلب ما باعث ایجاد تغییرات رنگی ظریفی در پوست میشود. این پدیده که با چشم غیرمسلح قابل مشاهده نیست، میتواند با استفاده از روشی به نام تغییر حجمسنجی نوری یا فوتوپلتیسموگرام از راه دور (rPPG) تشخیص داده شود.
فوتوپلتیسموگرام از راه دور را به عنوان یک روش بدون تماس برای اندازهگیری نبض فرد از طریق ویدئو در نظر بگیرید. الگوریتمهای ویژه، تغییرات رنگ تقریبا نامحسوس در پوست صورت را برای استخراج اطلاعات ضربان قلب تجزیه و تحلیل میکنند. تاکنون، این روش به عنوان یکی از امیدوارکنندهترین روشها برای شناسایی جعل عمیق در نظر گرفته میشد.
محققان برای مطالعه خود، یک مسیر ایجاد کردند که به طور خاص برای استخراج این سیگنالهای فیزیولوژیکی از ویدئوها طراحی شده است. آنها هم ویدئوهای واقعی و هم جعل عمیق را تجزیه و تحلیل کردند و بر سیگنالهای مرتبط با ضربان قلب که معمولا بین 0.7 هرتز و سه هرتز (معادل 42-180 ضربان در دقیقه) رخ میدهند، تمرکز کردند.
این گروه ویدئوهایی از دوازده شرکتکننده متنوع را در شرایط کنترلشده با نور یکنواخت ضبط کردند. در طول هر جلسه، شرکتکنندگان فعالیتهای مختلفی مانند صحبت کردن، خواندن و تعامل با سرپرست ضبط انجام دادند. نکته مهم این است که محققان همچنین ضربان قلب واقعی شرکتکنندگان انتخابشده را با استفاده از حسگرهای الکتروکاردیوگرام (ECG) و فوتوپلتیسموگرام(PPG) اندازهگیری کردند تا دادههای واقعی را ایجاد کنند.
تکامل جعل عمیق
محققان با استفاده از این موارد ضبط شده، جعلهای عمیق خود را با استفاده از چندین روش تولید کردند. در یک روش از یک سیستم ویژه استفاده شد که دو سیستم رمزگشا را برای ایجاد ویدئوهای جعل عمیق واقعگرایانه با هم ترکیب میکند و در نتیجه 858 ویدئو از افراد مختلف و 156 ویدئوی اصلی و بدون ویرایش ایجاد شد. آنها همچنین با استفاده از یک ابزار منبع باز به نام DeepFaceLive که تعویض چهره را در لحظه انجام میدهد، جعلهای عمیق بیشتری ایجاد کردند.
جعلهای عمیق تولید شده به طرز چشمگیری با کیفیت بودند و از اشتباهات رایجی که نسلهای قبلی ویدئوهای جعلی به آنها دچار میشدند، اجتناب کردند.
وقتی محققان جعلهای عمیق را تجزیه و تحلیل کردند، متوجه شدند که ویدئوهای جعلی حاوی سیگنالهای ضربان قلب معتبری هستند که با ویدئوهای منبع اصلی مطابقت نزدیکی دارند. این همبستگی بهویژه در ویدئوهای جعلی تولیدشده توسط DeepFaceLive قوی بود.
این بدان معناست که فناوری جعل عمیق ناخواسته سیگنالهای فیزیولوژیکی را از ویدئوهای منبع حفظ میکند و عملا «امضای ضربان قلب» را به ویدئوهای جعلی منتقل میکند.

بسیاری از محققان سیستمهای تشخیصی را با این فرض ساخته بودند که جعلهای عمیق نمیتوانند این سیگنالهای زیستی ظریف را شبیهسازی کنند. اکنون، این سیستمها ممکن است نیاز به طراحی مجدد کامل داشته باشند.
یک نکته مثبت هم وجود دارد. در حالی که جعلهای عمیق سیگنالهای ضربان قلب را حفظ میکردند، این سیگنالها عموما ضعیفتر از ویدئوهای اصلی بودند. میانگین نسبت سیگنال به نویز برای ویدئوهای اصلی -1.97 دسیبل در مقایسه با -3.35 دسیبل برای جعلهای عمیق بود که نشان میدهد سیگنال ضربان در جعلهای عمیق، اگرچه وجود دارند اما از کیفیت پایینتری برخوردارند.
این موضوع چه تاثیری بر توانایی ما در شناسایی ویدئوهای جعلی دارد؟ به گفته محققان، ما باید از جستجوی صرف وجود یا عدم وجود سیگنالهای ضربان قلب فاصله بگیریم. در عوض، روشهای تشخیص آینده باید نحوه توزیع این سیگنالها در صورت را تجزیه و تحلیل کنند.
مسئله فقط وجود نبض در ویدئو نیست، بلکه این است که آیا آن نبض در نواحی مختلف صورت به طور طبیعی رفتار میکند یا خیر. ویدئوهای واقعی الگوهای خاصی از جریان خون را نشان میدهند که جعلهای عمیق ممکن است با وجود ثبت ضربان کلی قلب، به طور کامل آن را شبیهسازی نکنند.
رقابت بین سازندگان و فناوری تشخیص آغاز شده است. جعلهای عمیق از آنچه پیشبینی میکردیم، در حال پیچیدهتر شدن هستند و روشهای تشخیص ما باید به همان سرعت خود جعلهای عمیق تکامل یابند.
لینک کوتاه:
https://www.iranporseman.ir/Fa/News/1247578/