দেশে এআই উন্নয়নে বড় বাধা বাংলা ভাষার উন্মুক্ত ডেটাসেটের ঘাটতি

দেশে এআই উন্নয়নে বড় বাধা বাংলা ভাষার উন্মুক্ত ডেটাসেটের ঘাটতি
২১ নভেম্বর, ২০২৫ ০০:১৬  

প্রযুক্তির দ্রুত পরিবর্তনশীল দুনিয়ায় হাঁটি হাঁটি পায়ে এগিয়ে চলছে বাংলাদেশ। এই পথে নতুন উদ্দীপনা হিসেবে যুক্ত হয়েছে কৃত্রিমবুদ্ধিমত্তা-এআই। ইতিমধ্যেই স্টার্টআপ বাংলাদেশের সহায়তায় দেশে ৩০টির বেশি প্রতিষ্ঠান এআই ব্যবহার করছে। সিলেটের মতো শহরগুলোতে ছোট-খাটো এআই-নির্ভর ব্যবসা গড়ে উঠছে। তারপরও খুব কম প্রতিষ্ঠান নিজস্ব এআই সিস্টেম তৈরি করছে। এর ওপর রয়েছে বাংলা ভাষার জন্য ওপেন ডেটাসেটের ব্যাপক ঘাটতি। একইভাবে দেশের  স্কুল–কলেজে ডিজিটাল শিক্ষা প্রসারে সরকারের দীক্ষা, টিচার্স পোর্টাল ও মুক্তপেঠো মতো নানা উদ্যোগ থাকলেও এআই নির্ভর শিক্ষা এখনও ‘পরীক্ষামূলক’ পর্যায়ে।

তবে  স্বাস্থ্য, শিক্ষা, কৃষি, প্রশাসনসহ বিভিন্ন খাতে এআই প্রয়োগ বাড়াতে হলে নীতিমালার পাশাপাশি ওসিআর, স্পেল চেকার, সেন্টিমেন্ট অ্যানালাইসিস এর মতো ভাষা প্রযুক্তি ডেটা সেট উন্মুক্ত করণের গুরুত্ব এড়িয়ে যাওয়ার উপায় নেই। সঙ্গত কারণেই বাংলাদেশের এআই বিকাশে সর্বাধিক গুরুত্ব পেয়েছে নৈতিক, নিরাপদ ও সবার জন্য অন্তর্ভুক্তিমূলক এআই ব্যবহারের বিষয়ে।

সদ্য প্রকাশিত ইউনেসকোর বাংলাদেশ আর্টিফিশিয়্যাল ইন্টিলিজেন্স রেডিনেস অ্যাসেসমেন্ট রিপোর্ট-২০১৫ বলছে, বাংলা ভাষার জন্য প্রযুক্তি থাকলেও ওপেন ডেটাসেটের ঘাটতি ব্যাপক। আইসিটি বিভাগের অধীন গবেষণা ও উন্নয়নের মাধ্যমে তথ্যপ্রযুক্তিতে বাংলাভাষা সমৃদ্ধকরণ (EBLICT) প্রকল্প বানিয়েছে স্পেল চেকার, ওসিআর, সেন্টিমেন্ট অ্যানালাইজার। কিন্তু এর ডেটাসেটগুলো উন্মুক্ত নয়। অন্যদিকে, দেশজ ভাষাগুলোর অবস্থা আরও নাজুক। অনেক ভাষার লিখিত রূপ নেই, ফন্ট নেই, ডেটাসেট নেই। তাই এআই টুল তৈরি তো দূরের কথা, সংরক্ষণ কাজও টিকে আছে সীমিত পরিসরে। আন্তর্জাতিক মাতৃভাষা ইনস্টিটিউট (IMLI) কিছু উদ্যোগ নিলেও বিশেষজ্ঞদের মতে, “বাংলাদেশের সংস্কৃতি ও ভাষার বৈচিত্র্য যদি এআই–এর ডেটাসেটে না থাকে, তাহলে ভবিষ্যতের ডিজিটাল দুনিয়ায় আমাদের উপস্থিতি ঝুঁকির মুখে পড়বে।”

ইউনিসেফের এই প্রতিবদন অনুযায়ী, দেশের ৭৫ শতাংশের বেশি মাধ্যমিক স্কুলে কম্পিউটার আছে। কিন্তু ইন্টারনেট আছে মাত্র ৫৩ শতাংশ স্কুলে। ২০২১ সালে প্রায় ২,০০০ এআই গবেষণা প্রকাশ হলেও  বাস্তবে একটি গণিত বই এআই ব্যবহার করে ইংরেজিতে অনুবাদ করা হলে দেখা যায়- অনুবাদ ছিল ভুলে ভরা এবং জীবনাচারের সঙ্গে অপ্রাসঙ্গিক। অর্থাৎ বাংলাদেশের শিক্ষা খাতে এআই এর ব্যাপক সম্ভাবনা থাকলেও প্রয়োগ সীমিত। ফলে শিক্ষক প্রশিক্ষণ ও ডিজিটাল ক্লাসরুম বাড়লেও এআই নির্ভর পাঠদান বা নৈতিক এআই শিক্ষা এখনো পূর্ণাঙ্গভাবে অন্তর্ভুক্ত হয়নি। ফলে আন্তর্জাতিক এআই মডেলগুলো স্থানীয় বাস্তবতার সঙ্গে টেকসই না হলে শিক্ষা খাতে ঝুঁকি বাড়তে পারে।

পরিসংখ্যান বলছে, বাংলাদেশে মোবাইল ফোনের সংখ্যা বাড়লেও ইন্টারনেট ব্যবহার মাত্র ৪৪.৫ শতাংশ মানুষের মধ্যে সীমাবদ্ধ। এছাড়াও শহরে ইন্টারনেট ব্যবহার করেন ৬৬.৮ শতাংশ নাগরিক। আর গ্রামে মাত্র ২৯.৭ শতাংশ। ফলে এআই ব্যবহারের জন্য প্রয়োজনীয় বড় অবকাঠামো- ডেটা সেন্টার, স্থিতিশীল বিদ্যুৎ, দ্রুতগতির ইন্টারনেট এর অভাব প্রকট। বর্তমানে দেশে মাত্র ৮টি ডেটা সেন্টার আছে, এবং আন্তর্জাতিক র্যাংকিংয়ে এর অবস্থান বেশ নিচে। টেলিনর এশিয়ার সর্বশেষ সার্ভে অনুযায়ী, বাংলাদেশের ৪৪ শতাংশ কর্মক্ষেত্রে এআই ব্যবহৃত হয়। এর মধ্যে মোট এআই ব্যবহারকারী ৬৮ মিলিয়ন এবং কর্মক্ষেত্রে এআই ব্যবহারকারী ৩৩ মিলিয়ন। আর দেশের মোট ইন্টারনেট ব্যবহারকারীর মধ্যে ৪৭ শতাংশ পুরুষ  ৩৭ শতাংশ নারী কর্মক্ষেত্রে এআই ব্যবহার করেন।

টেলিনর ও ইউনেস্কো আরএএম- এর বাংলাদেশ বিষয়ক প্রতিবেদন বলছে, সোশ্যাল মিডিয়া কন্টেন্ট বা ভিডিও সাজেশন, ক্যাপশন, ফিল্টার, কনটেন্ট জেনারেশনে ৪৮ শতাংশ এআই ব্যবহার করেন। আর কর্মক্ষেত্রের ৪৪ শতাংশ চ্যাটবট, ডেটা অ্যানালিটিক্স, ইমেইল ড্রাফট, কোডিং ব্যবহার করেন। সংগীত/মুভি সাজেশন, এআই গেমিং ব্যবহার করেন দেশের মোট এআই ব্যবহারকারীদের ৩৯ শতাংশ। এছাড়াও সহকারী অ্যাপ, অনুবাদ, সময় ব্যবস্থাপনায় ৩০ শতাংশ; বিল পেমেন্ট, ঝুঁকি বিশ্লেষণ, স্কোরিং-এ ২২ শতাংশ; ২২ শতাংশ ডায়াগনস্টিক টুল, মানসিক সহায়তা বট ব্যবহার করেন। একইভাবে অনলাইন শপিংয়ে রিকমেন্ডেশন ও দামের তুলনায় ১৯ শতাংশ এবং ভ্রমণ পরিকল্পনায় ট্রিপ সাজেশন, বুকিং অটোমেশনে ২০ শতাংশ নাগরিক এআই ব্যবহার করেন। 

বৈশ্বিক এসব পরিসংখ্যান প্রতিবেন বিশ্লেষণ করে বলা যায়, বাংলাদেশে আনুমানিক ৬৮ মিলিয়ন মানুষ এআই ব্যবহার করছে, যার মধ্যে ৩৩ মিলিয়ন কর্মক্ষেত্রে। সবচেয়ে বেশি ব্যবহার হচ্ছে সোশ্যাল মিডিয়া, অফিসিয়াল কাজ, বিনোদন ও ফাইন্যান্সে। পুরুষদের এআই ব্যবহার নারীদের তুলনায় অনেক বেশি। বাংলাদেশ দক্ষিণ এশিয়ায় দ্রুত-বর্ধমান এআই ব্যবহারকারী বাজার, তবে শিল্প ও অবকাঠামো উন্নয়নে পিছিয়ে রয়েছে। এআই অর্থনীতির আকার বিষয়ে সরকারিভাবে প্রকাশিত কোনো অফিসিয়াল সংখ্যা নেই; বেসরকারি রিপোর্টে প্রবৃদ্ধির পূর্বাভাস রয়েছে।

এমন বাস্তবতায় বাংলাদেশের এআই সম্ভাবনা ও চ্যালেঞ্জ বিষয়ক প্রতিবেদনের শেষে ১৫টি সুস্পষ্ট দিকনির্দেশনা দিয়ছে ইউনেস্কো। তিনটি শ্রেণীতে দেওয়া নির্দেশনাগুলো হলো- এআই নীতি দ্রুত চূড়ান্ত করণ; ডেটা সুরক্ষা ও সাইবার নিরাপত্তা শক্তিশালী করা, সরকারি এআই-ক্রয়ে স্বচ্ছ নীতিমালা প্রণয়ন, তথ্য অধিকার আইন হালনাগাদ করণ এবং বৈচিত্র্যমূলক ডেটা সংগ্রহ নিশ্চিত করা। 

প্রাতিষ্ঠানিক কাঠামো সংস্কারের মধ্যে রয়েছে- কেন্দ্রীয় এআই গভর্নেন্স অফিস স্থাপন, জাতীয় মাল্টিস্টেকহোল্ডার কমিটি গঠন এবং 
স্বাধীন ডেটা সুরক্ষা কর্তৃপক্ষ প্রতিষ্ঠা। একইসঙ্গে এআই ভেন্ডর সার্টিফিকেশন, বাংলা ও জাতিগত ভাষায় ডেটাসেট উন্নয়ন ও 
স্থানীয় কমিউনিটিকে সক্ষম করে তোলার ওপর জোর দেয়া হয়েছে। এছাড়াও সাধারণ মানুষের এআই সচেতনতা, মেয়েদের অংশগ্রহণে জোর দিয়ে এআই শিক্ষা প্রণয়ন, ভবিষ্যৎ কর্মশক্তির দক্ষতা উন্নয়ন এবং দীর্ঘমেয়াদি গবেষণা ও অবকাঠামো বিনিয়োগের মাধ্যমে সক্ষমতা বৃদ্ধিতি গুরুত্বারোপ করা হয়েছে।
ডিবিটেক/আইএইচ/ওআর