১৫ ডিসেম্বর পূর্ণাঙ্গ বাংলা ফন্ট ‘জুলাই’; আসছে কাগজ .এআই
স্বয়ংক্রিয়ভাবে লিখে দেবে মুখে উচ্চারিত বাংলা। কম্পিউটার পড়ে শোনাবে লিখিত টেক্সট। মুদ্রিত বই-দলিল দ্রুত সফটকপিতে রূপান্তরিত হবে। বাংলা ভাষার সঠিক যান্ত্রিক অনুবাদ পাওয়া যাবে গুগল ছাড়াই। এভাবেই বাংলা ভাষার বিশাল মৌখিক ও লিখিত নমুনা (করপাস) গড়ে উঠবে।
এমন স্বপ্ন নিয়েই ২০১৬ সাল থেকে ১৬টি কম্পোনেন্ট তৈরির কাজ করছে গবেষণা ও উন্নয়নের মাধ্যমে তথ্য প্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ প্রকল্প। এর মেয়াদ দুই দফায় বাড়িয়ে ১৫৯ কোটি থেকে ব্যয় বাড়ানো হয় ৮৫৫ কোটি ৪৮ লাখ টাকায়। চলতি ডিসেম্বরে এই প্রকল্পের মেয়াদ শেষ হবার কথা।
প্রকল্প মেয়াদের দশক পূর্তীর প্রাক্কালে জানা গেলো- এরই মধ্যে তৈরি হয়েছে বাংলা ওসিআর, স্পিচ রিকগ্নিশন সফ্টওয়্যার ও স্পেল চেকার, বাংলা থেকে ইংরেজিতে অনুবাদ, টেক্সট টু স্পিচ ও টেক্সট ট্রান্সক্রাইবার টুলস। এগুলোর উন্নত সংস্করণের পাশাপাশি নতুন একটি পূর্ণাঙ্গ বাংলা ফন্ট ‘জুলাই’ অবমুক্ত হতে যাচ্ছে আগামী ১৫ ডিসেম্বর। পাশাপাশি প্রকল্পের পরবর্তী ধাপে মাল্টিমোডাল (স্পিচ, টেক্সট, ইমেজ) বাংলা লার্জ ল্যাংগুয়েজ মডেল (এলএলএম) তৈরির জন্য ফিজিবিলিটি স্ট্যাডি চলছে। একইসঙ্গে এই উদ্যোগের সহায়ক হিসেবে জাতীয় ক্লাউড কম্পিউটিং ফ্যাসিলিটি তৈরির উদ্যোগ নেয়া হয়েছে।
এমনটাই জানিয়েছেন ডাক, টেলিযোগাযোগ ও তথ্য প্রযুক্তি মন্ত্রণালয়ে দায়িত্বপ্রাপ্ত প্রধান উপদেষ্টার বিশেষ সহকারী ফয়েজ আহমদ তৈয়্যব। তিনি বলেছেন, জুলাই ফন্ট বাংলা এবং ইংরেজি মধ্যে স্পেস সমন্বয় করে বিভিন্ন ধরনের যুক্তবর্ণ সহ স্বর ও ব্যঞ্জনবর্ণের স্পেসিং নিখুঁত করার চেষ্টা করা হয়েছে।
তিনি বলেছেন, বাংলা ভাষাকে সাইবার ও ডিজিটাল স্পেইসে সমৃদ্ধকরণের লক্ষ্যে আইসিটি বিভাগের তত্ত্বাবধানে ও বাংলাদেশ কম্পিউটার কাউন্সিলের অধীন প্রকল্পটির অধীনে এরইমধ্যে একটি ইন্টিগ্রেটেড প্লাটফর্ম kagoj.ai তৈরি করা হয়েছে। এটি হবে এআই সহায়ক সফটওয়্যার ইন্ডাস্ট্রির জন্য একটি কমন এলএলএম ট্রেনিং এবং ইনফারেন্স প্ল্যাটফর্ম।
এই পোর্টালটি ভিজিট করে দেখা গেছে, সেখানে রয়েছে ছয়টি মডিউল। এগুলো হলো বাংলা অডিও ট্রান্সক্রাইব করা যায়। সেখান থেকেই সনাক্ত করা ভুল বানান সংশোধন, বাংলা থেকে ইংরেজিতে অনুবাদ ও লেখাকে পড়ে শোনাতে পারে। ছবির ছাপা বাংলা অক্ষর টাইপ করে দিতে পারে। সব কিছুতেই আছে ১০০-২০০ শব্দের লিমিটেড সুবিধা। ফাইল আপলোডের ক্ষেত্রে টেক্সট ফরম্যাট গ্রহণ করে না। একইভাবে ভয়েস থেকে টেক্সটে এর অ্যাকুউরেসি হার এখনও সন্তোষজনক পর্যায়ে নেই। তবে এ বিষয়ে মতামত দেয়ার জন্য রয়েছে ‘ফিডব্যাক’ অপশন।
তবে কর্তৃপক্ষ আশাবাদ ব্যক্ত করেছে, প্রস্তুতকৃত বাংলা ওসিআর- এর মাধ্যমে সরকারি ও বেসরকারি খাতের ডকুমেন্টেশন ডিজিটাল করা, আর্কাইভ করা, পুরানো বই ও ফাইল ডক ফাইলে আনা এবং পেপারলেস অফিসের কাজ চালানো যাবে।
প্রসঙ্গত, কাগজ এআই প্ল্যাটফর্মে এখন এক হাজার ক্রেডিট ওয়ার্ক ফ্রি দেয়া হচ্ছে। ১০০০ ক্রেডিট মানে ১ ঘণ্টা স্পিচ ট্রান্সক্রিপশন অথবা ৫০০০ শব্দের টিটিএস/ স্পেল চেক অথবা ৫০টি ছবি/পাতা ওসিআর করতে পারবে প্রতি মাসে। তবে গবেষণা সংশ্লিষ্ট প্রয়োজনে অতিরিক্ত ক্রেডিটের জন্য আবেদন করা যাবে।
এর এপিআই প্রতিষ্ঠানগুলোর জন্য উন্মুক্ত করে দেয়া হবে বলে জানিয়েছেন ফয়েজ আহমদ তৈয়্যব। তার ভাষ্য মতে, বাংলা স্ট্রিমিং এবং নন স্ট্রিমিং স্পিচ রিকগ্নিশন এর সফ্টওয়্যার ডেভেলপ করা হয়েছে। এর মাধ্যমে কথা থেকে লেখা (Speech to text) এবং লেখা থেকে কথায় (Text to Speech) রূপান্তর সম্ভব। ইতোমধ্যেই স্পিচ টু টেক্সট সফ্টওয়্যারটি সরকারের ইলেকট্রনিক ফাইলিং ব্যবস্থা ডি-নথি-তে (D-Nothi) সফলভাবে পাইলট করা হয়েছে। বর্তমানে ডি-নথির প্লাগ-ইন টুল হিসেবে এটি ইন্টিগ্রেটেড করা আছে। বিজয় দিবস উপলক্ষে বাংলা ভাষা নিয়ে কাজ করা সকল প্রতিষ্ঠানের জন্য এর এপিআই উন্মুক্ত করে দেওয়া হবে।
ডিবিটেক/এমইউএম/ইকে







