امروزه مرزهای تکنولوژی و فناوری خیلی فراتر از آنچه تصور میشود گسترده شده است. اگر در گذشته تنها ممکن بود عکستان توسط نرم افزارهای مختلف گرافیکی دستکاری شده و چیزی خلاف واقعیت را به بیننده نشان دهد، امروزه با فناوری خطرناک تری روبه رو هستیم که می تواند چهره و صدای شما را به طرز شگفت آوری تقلید کرده و در قالب ویدیوهای غیر واقعی منتشر کند. Deep fake فناوری جدیدی بر مبنای هوش مصنوعی است که به واسطه آن تصاویر و ویدیوهای دروغین اما واقع گرایانه درست می شود و میتواند هر بیننده ای را تحت تأثیر خود قرار دهد، در این مقاله سعی برآن است که به بررسی این فناوری بپردازیم.
آشنایی با تکنیک Deep fake
تکنولوژی دیپ فیک یا به زبان ساده جعل عمیق به مفهومی گفته میشود که از علم Deep Learning گرفته شده است. یادگیری عمیق اساس شکل گیری دیپ فیک و فناوری آن است که الگوریتم های آن ، قدرت یادگیری خودکار و به صورت مصنوعی را دارند و در ارائه جواب های دقیق و بسیار نزدیک به ایده آل ما را یاری خواهند کرد. تکنولوژی دیپ فیک محصولی از هوش مصنوعی است که شاید بسیاری از متخصصان از کاربردهای آن واهمه داشته باشند. همه ما امروزه درگیر دنیای تکنولوژی شده ایم و خواسته یا ناخواسته زندگی ما توام با زندگی دیجیتالی است که شاید این قابلیت مضراتی را نیز برایمان داشته باشد. از جمله مسائلی که امروزه مورد بحث فعالان و متخصصان هوش مصنوعی است، وجود آسیب های احتمالی این فناوری روی زندگی واقعی مردم است که می توان دیپ فیک را نیز جزء این موارد برشمرد.
برنامه دیپ فیک براساس یکسری تکنولوژی های روز انجام گرفته است که نمونه آنرا بیشتر در فیلم های اکشن دیده ایم که با تغییر دادن چهره برخی افراد قصد در نفوذ به ساختمان های مختلف را دارند که امروزه این رویا به واقعیت تبدیل شده است زیرا با استفاده از نرم افزار دیپ فیک میتوانید به ساختار کلی چهره خود و دوستان دسترسی داشته باشید. تلفیق تصاویر و فیلم های موجود با منبع مورد نظر ویدئویی به نحوی صورت میگیرد که گویی ترکیب هر دو تصویر یا هر دو فیلم یکی است و در یک صحنه رخ می دهد. این ترکیب پیچیده به طور مثال می تواند یک فرد یا افراد را به گفتن چیزها و یا انجام اقداماتی نشان دهد که هرگز در واقعیت رخ نداده اند. چنین فیلم های جعلی می تواند بدین شکل ایجاد گردند که حضور شخصی را در فیلم های غیر اخلاقی نمایش دهند به طوری که هرگز فرد در آن فیلم حضور نداشته است. این ویدئوها حتی می توانند تصویر فرد را در رویدادهای سیاسی و مجرمانه از جمله صحنه های قتل، سرقت و غیره قرار دهند.
فناوری دیپ فیک یا جعل عمیق در سال 2014 برای اولین بار توسط یک دانشجوی مقطع دکترا به نام ایان گودفلو اختراع شد. گفتنی است گودفلو در حال حاضر در شرکت اپل مشغول به کار است. دیپ فیک از ترکیب دو واژه Deep به معنای عمیق و Fake به معنای جعلی و دروغین تشکیل شده است و براساس هوش مصنوعی قادر است تصاویر انسان را به صورت واقع گرایانه تولید و سنتز کند. در فناوری دیپ فیک یا همان جعل عمیق، از دسته خاصی از الگوریتم یادگیری ماشین با نام شبکه های مولد تخاصمی یا Generative Adversarial Networks استفاده میشود تا تصاویر یا ویدیو های موجود روی مجموعه ای از تصاویر و ویدیوهای منبع، ترکیب و برهم نهی شود. دیپ فیک مبتنی بر روش یادگیری عمیق است و از شبکه های مولد تخاصمی که به اختصار به آن ها شبکه های GAN گفته میشود، استفاده میکند. الگوریتم های GAN از دو مدل هوش مصنوعی تشکیل میشوند، در این سیستم وظیفه یکی از مدل ها تولید محتوا یعنی تولید تصاویر افراد و وظیفه مدل رقیب، تشخیص واقعی بودن و یا جعلی بودن عکس تولید شده است. گفتنی است در ابتدای کار مدل هوش مصنوعی رقیب قادر است به راحتی عکس جعلی را از عکس واقعی تشخیص دهد اما با گذشت زمان دقت و عملکرد مدل هوش مصنوعی تولید کننده به قدری افزایش می یابد که تشخیص جعلی بودن محتوای تولید شده برای مدل رقیب بسیار سخت میشود.
اخیراً این فناوری کاربردهای بسیار مفیدی پیدا کرده است و میتوان از پیشرفت الگوریتم های دیپ فیک در حوزه های مختلف علم و فناوری استفاده کرد. استفاده از تکنولوژی دیپ فیک در ساخت بازی های ویدیویی امروزی یکی از بهترین کاربردهای آن است که میتوان با آن صحنه های خلاقانه و منحصر به فردی را در بازی های ویدیویی تولید کرد. در کنار این موضوع، چندی پیش بود که دانشمندان و محققان بیماری های مغزی اعلام کردند که موفق شده اند با این فناوری تومورهای مغزی را در تصاویر MRI پزشکی تشخیص دهند. از دیگر کاربردهای این فناوری استفاده از آن در تولید پیام های تبلیغاتی با چهره های مشهور است که اهمیت زیادی برای برندها و شرکت های تبلیغاتی دارد.
در فرایند ساخت نرم افزارهای دیپ فیک ابتدا حجم بسیار گسترده ای از اطلاعات در اختیار آن ها قرار می گیرد و نرم افزار از این اطلاعات برای ساخت محتوا بر مبنای اطلاعات جدیدی که خودش ایجاد کرده است، استفاده می کند. این اطلاعات عمدتاً بر پایه شبکه های عصبی مصنوعی خودرمزگذار یا Autoencoder و گاهی اوقات هم بر پایه Generative Adversarial Networks به اختصار GAN یا شبکه زایای دشمن گونه ایجاد می شوند:
1. Autoencoder
شبکه های عصبی مصنوعی خودرمزگذار در حقیقت مجموعه ای از شبکه های عصبی خود نظارتی هستند که اساساً بر پایه کاهش ابعاد عمل می کنند و همچنین یاد میگیرند که داده ایجاد شده توسط خودشان را کپی کنند. این شبکه ها داده محور هستند؛ یعنی می توانند داده ها را مشابه آنچه که برای آن آموزش داده شده اند، فشرده سازی کنند. علاوه بر این، خروجی شبکه عصبی خودرمزگذار دقیقاً مانند ورودی آن است. این شبکه از سه قسمت تشکیل شده که شامل یک encoder یا رمزگذار، یک کد و یک decoder یا رمزگشا می باشد. رمزگذار داده ورودی را فشرده سازی میکند و پس از اینکه رمزگشا داده فشرده شده را بر اساس کد رمزگشایی کرد، کد ایجاد میشود. انواع مختلفی از شبکه های عصبی خودرمزگذار وجود دارد که از میان آنها میتوان به شبکه های خودرمزگذار حذف نویز یا Convolutional Autoencoders، شبکه خودرمزگذار عمیق یا Deep Autoencoders، شبکه خودرمزگذار عمیق یا Deep Autoencoders شبکه خودرمزگذار انقباضی یا Contractive Autoencoders و شبکه خودرمزگذار هم گشتی یا کانولوشنال همان Convolutional Autoencoders و سایر موارد اشاره کرد. در حقیقت این شبکه ها در حین فرایند ساخت تصاویر و ویدیوهای جعلی، برای حذف نویزهای تصویر و فیلم ها، به حداقل رساندن خطا در هنگام بازآفرینی تصاویر یا ویدیوها با استفاده از فیلترهای مختلف، فشرده سازی تصاویر و ویدیوها، رمزگذاری داده ها و درنهایت ایجاد تصاویر و فیلم ها به کار گرفته میشوند.
2. GAN یا شبکه زایای دشمن گونه
شبکه های دشمن گونه برای ایجاد مدل از مجموعه داده های ورودی استفاده می شوند. این شبکه ها اطلاعاتی را از داده های ورودی فرا میگیرند که از آنها برای ایجاد داده های جدید استفاده می کنند. این شبکه که در واقع یک سیستم محسوب می شود، توسط دو شبکه عصبی مجزا آموزش می بیند که شامل یک ایجادکننده یعنی Generator و یک تشخیص دهنده یعنی Discriminator میشود. ایجادکننده قوانین و الگوهای موجود در مجموعه داده های ورودی را استخراج می کند و برای بازآفرینی آنها آموزش خواهد دید، داده ایجاد شده توسط ایجادکننده همراه با داده واقعی برای تشخیص دهنده جهت ارزیابی ارسال می شود. در واقع هدف ایجادکننده فریب الگوریتم تشخیص دهنده است.
در فرایند ایجاد محتوای ساختگی با این روش باید آموزش تا جایی ادامه پیدا کند که الگوریتم تشخیص دهنده دیگر نتواند داده ساختگی را از داده واقعی تشخیص دهد. افزایش دشواری تشخیص داده ساختگی از داده واقعی به معنای بهتر شدن سطح آموزش سیستم است البته در کل استفاده از شبکه زایای دشمن گونه در مقایسه با شبکه عصبی مصنوعی رمزنگار برای ساخت محتوای جعلی و ساختگی دشوارتر و نیازمند منابع بیشتری است و اغلب برای ساخت تصاویر استفاده میشود.
فناوری دیپ فیک یا همان جعل عمیق در طول ظهور و پیدایش خود، نه تنها جامعه بازیگران و سلبریتی ها را هدف گرفته بلکه به حریم چهره های بزرگ سیاستمدار نیز تجاوز کرده است. به عنوان مثال چندی پیش ویدیویی از باراک اوباما منتشر شد که در آن دونالد ترامپ را فردی حقیر و غیرمنطقی خطاب می کرد. اگرچه این ویدیو صحت نداشت و کاملا غیر واقعی بود اما افراد زیادی در ابتدا آن را باورد کردند و دست به انتشار آن در فضای مجازی زدند. در همین راستا رئیس جمهور سابق آمریکا، باراک اوباما، در خصوص تکنولوژی دیپ فیک اظهار نظر کرده و ابراز کرده است در دنیایی که می توانند به سادگی صحبت ها و ویدیوهای غیرواقعی از من ساخته و منتشر کنند، به مرحله ای خواهیم رسید که تشخیص مرز بین واقعیت و دروغ بسیار مشکل خواهد شد و این مطمئناً بر پایه های دموکراسی ما که بر مبنای حقیقت است، تاثیر خواهد گذاشت.
در حقیقت از آنجا که این فناوری بر مبنای هوش مصنوعی است و نیازی به دخالت مستقیم انسان ندارد، هر فردی می تواند از طریق Deep fake، ویدیوی جعلی و در عین حال واقع گرایانه تولید کند. در نتیجه متاسفانه افراد با اهداف خصمانه می توانند فیلم های غیراخلاقی از چهره های مشهور تهیه و تولید کنند و زندگی شخصی آنها را به راحتی به خطر بیندازند. گفتنی است این فناوری سبب کسب درآمد نیز شده است و افراد بسیاری در انجمن های اینترنتی مختلفی وجود دارند که حاضرند برای ساخت یک ویدیوی دیپ فیک و غیراخلاقی از فرد موردنظرشان پول زیادی پرداخت کنند.
نکته مهم این است که در دنیای مجازی بهتر است کمی شکاک عمل کنیم. در چنین فضایی که روزانه میلیون ها محتوا تولید شده و به راحتی به اشتراک گذاشته می شود، مطمئناً محتوای غیر واقعی نیز بسیار است. فناوری همواره در حال به روز شدن است و در این مسیر ما نیز باید اطلاعاتمان را روز به روز جدیدتر کنیم. تکنولوژی دیپ فیک نیز از جمله قابلیت های فناوری است که بسیاری از کاربردهای مفید برای آن تعریف شده است و شاید جنبه های منفی نیز داشته باشد.
البته وب سایت ها و سرویس های مرجع ویدیویی و تصویری فیلترهای قدرتمندی دارند که به سرعت این گونه محتوا را تشخیص داده و آن را حذف خواهند کرد، یا در نهایت کاربر را از غیر واقعی بودن محتوا با خبر می کنند. امروزه در تمامی زمینه ها و بخش های تجاری و سرگرمی، می توانیم کاربرد هوش مصنوعی را مشاهده کنیم. شاید اگر این فناوری وجود نداشت شما نمی توانستید اکنون از انجام بازی های بسیار با کیفیت کامپیوتری لذت ببرید. تولید فیلم های سینمایی جذاب نیز به نوعی مدیون هوش مصنوعی است و در بسیاری از بخش های تولیدی و کمپانی های بزرگ، ابزارهای رباتیک براساس این فناوری ساخته شده و توسعه داده شده اند.