ডিপফেক বনাম নির্বাচন: আস্থার সংকটে গণতন্ত্র
ডিপফেক এখন কেবল ভিজ্যুয়াল কারসাজি নয়; এটি একটি পূর্ণাঙ্গ জেনারেটিভ মিডিয়া ইকোসিস্টেম। আধুনিক ডিপফেক সিস্টেম ডিফিউশন মডেল, ট্রান্সফরমার-ভিত্তিক আর্কিটেকচার এবং উন্নত ভয়েস সিন্থেসিস ব্যবহার করে উচ্চমাত্রার রিয়ালিজম তৈরি করছে। কয়েক মিনিটের অডিও স্যাম্পল থেকেই নিউরাল ভয়েস ক্লোনিং সম্ভব; স্বল্পসংখ্যক (few-shot) পরিষ্কার ছবি ব্যবহার করেই এখন আইডেন্টিটি-ভিত্তিক মুখ-প্রতিস্থাপন বা ফেস রিএনাক্টমেন্ট ভিডিও তৈরি করা যায়। ওপেন-সোর্স টুল যেমন FaceSwap বা DeepFaceLab, এবং বাণিজ্যিক প্ল্যাটফর্মের উন্নত টেক্সট-টু-ভিডিও ও ভয়েস জেনারেশন সেবা—ডিপফেক উৎপাদনকে কার্যত গণতান্ত্রিক করেছে। প্রবেশ-বাধা কমেছে, স্কেল বেড়েছে।
নির্বাচনী প্রেক্ষাপটে ঝুঁকিটি কেবল ভুয়া কনটেন্ট তৈরি নয়; এটি একটি সংগঠিত তথ্যপ্রবাহ কৌশলের অংশ। পরিকল্পিত ডিপফেক অভিযান সাধারণত কয়েকটি ধাপে পরিচালিত হয়: (১) নির্দিষ্ট ভোটারগোষ্ঠীকে লক্ষ্য করে বিভ্রান্তিকর বার্তা তৈরি, (২) আবেগনির্ভর কনটেন্টকে দ্রুত ভাইরাল করা, এবং (৩) নির্বাচন প্রক্রিয়া ও প্রার্থীদের প্রতি আস্থা ক্ষয় করা। এখানে misinformation ও disinformation সমান্তরালভাবে কাজ করে। ভুলতথ্য অনেক সময় অনিচ্ছাকৃতভাবে ছড়িয়ে পড়ে এবং অরগানিক রিচ তৈরি করে; আর অপতথ্য হয় কৌশলগত—উদ্দেশ্যমূলকভাবে তৈরি ও সময়মতো প্রচারিত। ডিপফেক এই দুই প্রবাহকে একত্রিত করে নির্বাচন-সংক্রান্ত ন্যারেটিভকে প্রভাবিত করতে পারে, সরাসরি ফলাফল না বদলালেও সিদ্ধান্তগ্রহণের পরিবেশকে পরিবর্তন করতে সক্ষম।
বাংলাদেশের তথ্যপরিবেশে এই ঝুঁকি বিশেষভাবে প্রাসঙ্গিক। সামাজিক যোগাযোগমাধ্যম-নির্ভর জনমত, সীমিত ডিজিটাল সাক্ষরতা এবং দ্রুত শেয়ারিং সংস্কৃতি—এই তিনের সমন্বয়ে ডিপফেক একটি উচ্চ-প্রভাব “লো-কস্ট অ্যাটাক ভেক্টর” হয়ে উঠতে পারে। নির্বাচনের শেষ পর্যায়—বিশেষত ভোটের আগের ২৪–৪৮ ঘণ্টা—এক ধরনের “late-stage narrative injection window” তৈরি করে। এই সময়ে ইচ্ছাকৃতভাবে বিভ্রান্তিকর কনটেন্ট ছড়ালে যাচাই, অপসারণ বা প্রাতিষ্ঠানিক ব্যাখ্যার জন্য কার্যত খুব কম সময় থাকে; ফলে প্রভাব তুলনামূলকভাবে বেশি হয়। প্রার্থীর নামে উসকানিমূলক বক্তব্য, নির্বাচন স্থগিতের ভুয়া ঘোষণা, বা প্রশাসনিক সিদ্ধান্তের জাল ভিডিও—এসব কেবল বিভ্রান্তি নয়; এগুলো সামাজিক উত্তেজনা ও বাজার অস্থিরতা তৈরি করতে সক্ষম।
প্রযুক্তিগতভাবে শনাক্তকরণও চ্যালেঞ্জিং। এআই-ভিত্তিক ডিটেকশন মডেলগুলো ফ্রিকোয়েন্সি অ্যানালাইসিস, ফেসিয়াল ল্যান্ডমার্ক ইনকনসিস্টেন্সি, ব্লিঙ্ক প্যাটার্ন, ভয়েস স্পেকট্রাল অস্বাভাবিকতা ইত্যাদি শনাক্ত করতে পারে। Deepware Scanner বা Reality Defender-এর মতো সিস্টেম সম্ভাব্য এআই-জেনারেটেড কনটেন্ট ফ্ল্যাগ করতে পারে। InVID-এর মতো টুল ফ্রেম-বাই-ফ্রেম বিশ্লেষণে সহায়ক। তবে সমস্যা হলো—জেনারেশন প্রযুক্তি যেমন দ্রুত উন্নত হচ্ছে, শনাক্তকরণ প্রযুক্তিও তেমনি প্রতিনিয়ত চ্যালেঞ্জের মুখে পড়ছে। এটি এক ধরনের “অস্ত্র প্রতিযোগিতা”।
এই প্রেক্ষাপটে ব্যবহারকারীর আচরণ একটি গুরুত্বপূর্ণ সাইবার ডিফেন্স লেয়ার। সন্দেহজনক ভিডিও বা অডিও যাচাই না করে শেয়ার না করা, উৎস ও টাইমস্ট্যাম্প পরীক্ষা করা, রিভার্স ইমেজ সার্চ ব্যবহার করা—এসবই প্রাথমিক প্রতিরক্ষা। কিন্তু এর পাশাপাশি প্রয়োজন প্রাতিষ্ঠানিক প্রস্তুতি: দ্রুত প্রতিক্রিয়া প্রোটোকল, অফিসিয়াল চ্যানেলে তাৎক্ষণিক ব্যাখ্যা, এবং নির্বাচনকেন্দ্রিক ইনফরমেশন ইন্টেগ্রিটি কৌশল।
ডিপফেকের যুগে নির্বাচন নিরাপত্তা আর শুধু সার্ভার, নেটওয়ার্ক বা ডেটাবেস সুরক্ষার বিষয় নয়; এটি তথ্যের ইন্টেগ্রিটি ও কন্সিস্টেন্সির রক্ষার লড়াই। ইনফ্রাকে ঠিক রেখে, সিস্টেমকে অপব্যবহার করে যদি জনমতকে ডিজিটালি বিকৃত করা যায়, তবে গণতন্ত্রের নতুন যুগের হুমকি। এখন প্রশ্ন কেবল প্রযুক্তিগত সক্ষমতার নয়; প্রশ্ন হলো—আমরা কি এই তথ্য-যুদ্ধকে বাস্তব হুমকি হিসেবে স্বীকার করছি, এবং সেই অনুযায়ী নীতি, প্রযুক্তি ও সচেতনতায় প্রস্তুত হচ্ছি?
লেখকঃ তথ্য-প্রযুক্তিবিদ; যুগ্ম সাধারণ সম্পাদক, বাংলাদেশ সিস্টেম অ্যাডমিনিস্ট্রেটরস ফোরাম



