ডিপফেক বনাম নির্বাচন: আস্থার সংকটে গণতন্ত্র

১০ ফেব্রুয়ারি, ২০২৬ ১১:৩৮

ডিপফেক এখন কেবল ভিজ্যুয়াল কারসাজি নয়; এটি একটি পূর্ণাঙ্গ জেনারেটিভ মিডিয়া ইকোসিস্টেম। আধুনিক ডিপফেক সিস্টেম ডিফিউশন মডেল, ট্রান্সফরমার-ভিত্তিক আর্কিটেকচার এবং উন্নত ভয়েস সিন্থেসিস ব্যবহার করে উচ্চমাত্রার রিয়ালিজম তৈরি করছে। কয়েক মিনিটের অডিও স্যাম্পল থেকেই নিউরাল ভয়েস ক্লোনিং সম্ভব; স্বল্পসংখ্যক (few-shot) পরিষ্কার ছবি ব্যবহার করেই এখন আইডেন্টিটি-ভিত্তিক মুখ-প্রতিস্থাপন বা ফেস রিএনাক্টমেন্ট ভিডিও তৈরি করা যায়। ওপেন-সোর্স টুল যেমন FaceSwap বা DeepFaceLab, এবং বাণিজ্যিক প্ল্যাটফর্মের উন্নত টেক্সট-টু-ভিডিও ও ভয়েস জেনারেশন সেবা—ডিপফেক উৎপাদনকে কার্যত গণতান্ত্রিক করেছে। প্রবেশ-বাধা কমেছে, স্কেল বেড়েছে।

নির্বাচনী প্রেক্ষাপটে ঝুঁকিটি কেবল ভুয়া কনটেন্ট তৈরি নয়; এটি একটি সংগঠিত তথ্যপ্রবাহ কৌশলের অংশ। পরিকল্পিত ডিপফেক অভিযান সাধারণত কয়েকটি ধাপে পরিচালিত হয়: (১) নির্দিষ্ট ভোটারগোষ্ঠীকে লক্ষ্য করে বিভ্রান্তিকর বার্তা তৈরি, (২) আবেগনির্ভর কনটেন্টকে দ্রুত ভাইরাল করা, এবং (৩) নির্বাচন প্রক্রিয়া ও প্রার্থীদের প্রতি আস্থা ক্ষয় করা। এখানে misinformation ও disinformation সমান্তরালভাবে কাজ করে। ভুলতথ্য অনেক সময় অনিচ্ছাকৃতভাবে ছড়িয়ে পড়ে এবং অরগানিক রিচ তৈরি করে; আর অপতথ্য হয় কৌশলগত—উদ্দেশ্যমূলকভাবে তৈরি ও সময়মতো প্রচারিত। ডিপফেক এই দুই প্রবাহকে একত্রিত করে নির্বাচন-সংক্রান্ত ন্যারেটিভকে প্রভাবিত করতে পারে, সরাসরি ফলাফল না বদলালেও সিদ্ধান্তগ্রহণের পরিবেশকে পরিবর্তন করতে সক্ষম।

বাংলাদেশের তথ্যপরিবেশে এই ঝুঁকি বিশেষভাবে প্রাসঙ্গিক। সামাজিক যোগাযোগমাধ্যম-নির্ভর জনমত, সীমিত ডিজিটাল সাক্ষরতা এবং দ্রুত শেয়ারিং সংস্কৃতি—এই তিনের সমন্বয়ে ডিপফেক একটি উচ্চ-প্রভাব “লো-কস্ট অ্যাটাক ভেক্টর” হয়ে উঠতে পারে। নির্বাচনের শেষ পর্যায়—বিশেষত ভোটের আগের ২৪–৪৮ ঘণ্টা—এক ধরনের “late-stage narrative injection window” তৈরি করে। এই সময়ে ইচ্ছাকৃতভাবে বিভ্রান্তিকর কনটেন্ট ছড়ালে যাচাই, অপসারণ বা প্রাতিষ্ঠানিক ব্যাখ্যার জন্য কার্যত খুব কম সময় থাকে; ফলে প্রভাব তুলনামূলকভাবে বেশি হয়। প্রার্থীর নামে উসকানিমূলক বক্তব্য, নির্বাচন স্থগিতের ভুয়া ঘোষণা, বা প্রশাসনিক সিদ্ধান্তের জাল ভিডিও—এসব কেবল বিভ্রান্তি নয়; এগুলো সামাজিক উত্তেজনা ও বাজার অস্থিরতা তৈরি করতে সক্ষম।

প্রযুক্তিগতভাবে শনাক্তকরণও চ্যালেঞ্জিং। এআই-ভিত্তিক ডিটেকশন মডেলগুলো ফ্রিকোয়েন্সি অ্যানালাইসিস, ফেসিয়াল ল্যান্ডমার্ক ইনকনসিস্টেন্সি, ব্লিঙ্ক প্যাটার্ন, ভয়েস স্পেকট্রাল অস্বাভাবিকতা ইত্যাদি শনাক্ত করতে পারে। Deepware Scanner বা Reality Defender-এর মতো সিস্টেম সম্ভাব্য এআই-জেনারেটেড কনটেন্ট ফ্ল্যাগ করতে পারে। InVID-এর মতো টুল ফ্রেম-বাই-ফ্রেম বিশ্লেষণে সহায়ক। তবে সমস্যা হলো—জেনারেশন প্রযুক্তি যেমন দ্রুত উন্নত হচ্ছে, শনাক্তকরণ প্রযুক্তিও তেমনি প্রতিনিয়ত চ্যালেঞ্জের মুখে পড়ছে। এটি এক ধরনের “অস্ত্র প্রতিযোগিতা”।

এই প্রেক্ষাপটে ব্যবহারকারীর আচরণ একটি গুরুত্বপূর্ণ সাইবার ডিফেন্স লেয়ার। সন্দেহজনক ভিডিও বা অডিও যাচাই না করে শেয়ার না করা, উৎস ও টাইমস্ট্যাম্প পরীক্ষা করা, রিভার্স ইমেজ সার্চ ব্যবহার করা—এসবই প্রাথমিক প্রতিরক্ষা। কিন্তু এর পাশাপাশি প্রয়োজন প্রাতিষ্ঠানিক প্রস্তুতি: দ্রুত প্রতিক্রিয়া প্রোটোকল, অফিসিয়াল চ্যানেলে তাৎক্ষণিক ব্যাখ্যা, এবং নির্বাচনকেন্দ্রিক ইনফরমেশন ইন্টেগ্রিটি কৌশল।

ডিপফেকের যুগে নির্বাচন নিরাপত্তা আর শুধু সার্ভার, নেটওয়ার্ক বা ডেটাবেস সুরক্ষার বিষয় নয়; এটি তথ্যের ইন্টেগ্রিটি ও কন্সিস্টেন্সির রক্ষার লড়াই। ইনফ্রাকে ঠিক রেখে, সিস্টেমকে অপব্যবহার করে যদি জনমতকে ডিজিটালি বিকৃত করা যায়, তবে গণতন্ত্রের নতুন যুগের হুমকি। এখন প্রশ্ন কেবল প্রযুক্তিগত সক্ষমতার নয়; প্রশ্ন হলো—আমরা কি এই তথ্য-যুদ্ধকে বাস্তব হুমকি হিসেবে স্বীকার করছি, এবং সেই অনুযায়ী নীতি, প্রযুক্তি ও সচেতনতায় প্রস্তুত হচ্ছি?

লেখকঃ তথ্য-প্রযুক্তিবিদ; যুগ্ম সাধারণ সম্পাদক, বাংলাদেশ সিস্টেম অ্যাডমিনিস্ট্রেটরস ফোরাম

দ্রষ্টব্য: অভিমত-এ প্রকাশিত পুরো মতামত লেখকের নিজের। এর সঙ্গে ডিজিটাল বাংলা মিডিয়া কর্তৃপক্ষের কোনো সংশ্লিষ্টতা নেই। বহুমতের প্রতিফলন গণমাধ্যমের অন্যতম সূচক হিসেবে নীতিগত কোনো সম্পাদনা ছাড়াই এই লেখা প্রকাশ করা হয়। এতে কেউ সংক্ষুব্ধ বা উত্তেজিত হলে তা তার একান্ত ব্যক্তিগত বিষয়।