বাংলা, আমাদের মাতৃভাষা, যার সম্মান বাঁচাতে প্রাণ বাজি রেখেছিলেন ভাষাশহিদেরা। প্রতিবেশী বাংলাদেশের সেই ভাষা আন্দোলন পৃথিবীকে নতুনভাবে ভাবতে শিখিয়েছিল। ভাষা আন্দোলনের কথা উঠলে আমাদের দেশের বরাক উপত্যকার নামও উঠে আসে এক সারিতে। নানা ভাষা নানা মতের মিলনভূমি ভারতবর্ষ, যার সংবিধান স্বীকৃত ভাষার সংখ্যাই ২২। আমাদের ক্ষুদ্র নৃগোষ্ঠীরও আছে ৪০টি ভাষা। দেশের নানা প্রান্তে ছড়িয়ে থাকা এমনই অজস্র মাতৃভাষা নিয়ে ভাষা-প্রযুক্তির মাধ্যমে পৃথিবীর বিভিন্ন দেশকে নতুন করে ভাবতে শেখাচ্ছে আমাদের দেশ। প্রযুক্তিকে হাতিয়ার করে গড়ে তুলছে বিশ্বজনীন আন্দোলন।
বাংলাদেশের একটি সরকারি প্রতিষ্ঠান, বাংলাদেশ কম্পিউটার কাউন্সিল (বিসিসি) বাংলা কি-বোর্ড, ওসিআর সফ্টওয়্যার এবং অন্যান্য ভাষা-প্রযুক্তি সরঞ্জামগুলির বিকাশে গুরুত্বপূর্ণ ভূমিকা পালন করেছে। আন্তর্জাতিক মাতৃভাষা দিবসে বুধবার কৃত্রিম বুদ্ধিমত্তাসম্পন্ন বাংলা ভাষাভিত্তিক তিনটি সফটওয়্যার উন্মুক্ত করলো সরকারের আইসিটি বিভাগের অধীন এই সংস্থাটি। এগুলো হলো বাংলা টেক্সট টু স্পিচ ‘উচ্চারণ’, বাংলা স্পিচ টু টেক্সট ‘কথা’ এবং বাংলা ওসিআর ‘বর্ণ’। নতুন বাংলা ফন্টটির নাম ‘পূর্ণ’। বাংলাদেশ সরকারের তথ্য ও যোগাযোগ প্রযুক্তি বিভাগের আওতাধীন বাংলাদেশ কম্পিউটার কাউন্সিল কর্তৃক বাস্তবায়নাধীন ‘গবেষণা ও উন্নয়নের মাধ্যমে তথ্য প্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ (১ম সংশোধিত)’ প্রকল্পের মাধ্যমে এ সফটওয়্যারটির তৈরি করা হয়েছে। এবার পরিচিত হওয়া যাক প্রযুক্তিবান্ধব এই সেবাগুলোর সঙ্গে।
উচ্চারণ বাংলা টেক্সট টু স্পিচ
লেখাকে ম্যাশিনের মাধ্যমে উচ্চারিত কথায় রূপান্তর করার প্রযুক্তিকে টিটিএস বা টেক্সট টু স্পিচ অ্যাপ্লিকেশন বলা হয়ে থাকে। টিটিএস ডকুমেন্ট, ওয়েবসাইট, স্ক্রিনের উইন্ডোতে থাকা টেক্সট পড়ে শোনাতে পারে। একই সঙ্গে তা দৃষ্টি প্রতিবন্ধী ব্যক্তির জন্য উপযোগী হয়ে পড়ে শোনাতে পারে। আমাদের তৈরি উচ্চারণ টিটিএস সফটওয়্যারটিতে মহিলা ও পুরুষ কণ্ঠ রয়েছে। বর্তমানে এই ঠিকানা থেকে সফটওয়্যারটি ব্যবহার করা যাবে।
কথা বাংলা স্পিচ টু টেক্সট
মুখের কথার মাধ্যমে কম্পিউটারে লেখার প্রযুক্তি হলো ভয়েস টাইপিং বা ‘স্পিচ টু টেক্সট’। আমাদের তৈরি বাংলা ভয়েস টাইপিং সফটওয়্যারটির নাম ‘কথা’। এটি প্রমিত স্পষ্ট ও নীরব পরিবেশে উচ্চারিত বাংলা কথাকে লেখায় রূপান্তর করতে পারে। সফটওয়্যারটির চূড়ান্ত ভার্সন বাংলা প্রধান বিরামচিহ্নগুলোকে লিপিবদ্ধ করতে পারে। ব্রাউজার থেকে একটি ওয়েব অ্যাপ্লিকেশন হিসেবে এই ঠিকানা থেকে সফটওয়্যারটি ব্যবহার করা যাবে। এছাড়াও প্রকল্পের তৈরি কিউবোর্ড অ্যান্ড্রয়েড অ্যাপের মাধ্যমেও এই ভয়েস টাইপিং সার্ভিসটি ব্যবহার করার সুযোগ রয়েছে।
বর্ণ বাংলা ওসিআর
ওসিআর-এর সাহায্যে কম্পিউটারের অপরিবর্তনযোগ্য ডকুমেন্টের লেখাকে এডিটেবল টেক্সটে রূপান্তর করা যায়। ওসিআর হলো পিডিএফ বা জেপেগ ফাইলের লেখাকে পরিবর্তনযোগ্য লেখায় রূপান্তর করা। আমাদের তৈরি বর্ণ ওসিআরটি বাংলা লেখাকে কম্পোজকৃত লেখার অনুরূপ টেক্সটে রূপান্তর করে থাকে। অর্থাত্কোনো ডকুমেন্টকে ছবি তুলে বা স্ক্যান করে ওসিআর করলে তা কম্পোজড হয়ে যায়। বর্ণ ওসিআরটি বেশ কিছু বৈশিষ্ট্য রয়েছে। এটি কম্পিউটার কম্পোজ ডকুমেন্ট বিশেষ করে সরকারি পত্র, বিজ্ঞপ্তি ওসিআর করতে পারে। এর মাধ্যমে টেবিল, কমন ইংরেজি শব্দ ও প্রতিষ্ঠানের নাম, সরকারি প্রতিষ্ঠানের লোগো শনাক্ত করা যায়। এছাড়াও পুরনো টাইপরাইটার ডকুমেন্ট ও লেটারপ্রেস বইও ওসিআর করতে পারে অ্যাপ্লিকেশনটি। ওয়েব অ্যাপ্লিকেশন হিসেবে যেকোনো ব্রাউজার থেকে এই ঠিকানা লিখে সফটওয়্যারটি ব্যবহার করা যায়।
পূর্ণ বাংলা ফন্ট
পূর্ণ ফন্ট একটি অনন্য সাধারণ বাংলা ইউনিকোড ফন্ট। এটি ফন্ট সংক্রান্ত সমস্যাগুলো চিহ্নিত করার পর ডিজাইন ও ডেভেলপ করা হয়েছে। এর মধ্যে রয়েছে বাংলা প্রকাশনায় প্রয়োজনীয় সকল টাইপোগ্রাফিক ফিচার। একই সঙ্গে বাংলা ভাষার বৈশিষ্ট্যকেও যথাযথভাবে প্রকাশ করছে এই ফন্ট। প্রাতিষ্ঠানিক ব্যবহার ছাড়াও এই ফন্ট মুদ্রণ কাজে এবং ওয়েবে ব্যবহার উপযোগী। ফন্টে স্বরবর্ণ, ব্যঞ্জনবর্ণ, বিরাম চিহ্ন, ইংরেজি বর্ণ, গাণিতিক চিহ্ন, অসমীয়া স্বতন্ত্র সেট, ইন্ডিক-বাংলা সমর্থনকারী গ্লিফ, হোমোগ্রাফ, জনপ্রিয় আইকন/লোগোসহ প্রয়োজনীয় সকল গ্লিফ রয়েছে। ইত্যাদি ফন্টটি কিছু বৈশিষ্ট্যে রয়েছে। যেমন, স্বতন্ত্র ভিজুয়াল রূপ, একাধিক অ্যালোগ্রাফ, ল্যাটিন গ্লিফের সমতুল্য উচ্চতা, স্ট্যান্ডার্ড লাইন স্পেস এবং আকার এবং অপ্টিমাইজ করা গ্লিফ নম্বর, স্বচ্ছ ও সনাতন যুক্তবর্ণ উভয়ের সংযুক্তি ইত্যাদি।ফন্টটির স্বাভাবিক ভার্সন ছাড়াও বোল্ড, ইটালিক রূপ রয়েছে। এখানে ক্লিক করে ফন্টটি ডাউনলোড করে নিতে পারবেন।
সূত্রমতে, এর আগে বাংলা বানানের শুদ্ধতা যাচাইয়ে সঠিক, আবেগ প্রকাশের অ্যাপ অনুভূতি উদ্বোধন করেন প্রধানমন্ত্রী শেখ হাসিনা। এ বছরের মধ্যে ক্ষুদ্র নৃগোষ্ঠীদের জন্য একটি অ্যাপ ও ইশারা সফটওয়্যার উন্মোচন করবে বিসিসি। প্রকল্প দুটির ৩৭ শতাংশ কাজ শেষ হয়েছে ইতিমধ্যেই। মূলত এসব ক্ষেত্রে জাতীয় মান নির্ধারণে এই প্রকল্প বাস্তবায়নে ধীর গতি হয়েছে বলে জানাগেছে।
প্রসঙ্গত, বিসিসি ছাড়াও বাংলাদেশের আরও একটি সংস্থা ‘সেন্টার ফর রিসার্চ অন বাংলা ল্যাঙ্গুয়েজ প্রসেসিং’ (সিআরবিএলপি) বাংলা বাক্যের পদ-চিহ্নকারী (Part-of-speech tagger), নামবাচক-শব্দ-সনাক্তকরণ (Named-Entity-Recognition) এবং মনোভাব নির্দেশক (sentiment analyzer) ইত্যাদি বিভিন্ন টুল তৈরি করেছে। এছাড়া ইন্টারন্যাশনাল সেন্টার ফর কম্পিউটার রিসোর্সেস অ্যান্ড ডেভেলপমেন্ট (ICCRD), মার্কিন যুক্তরাষ্ট্র ভিত্তিক একটি সংস্থা (বাংলা OCR সফটওয়্যার তৈরির সাথে জড়িত) এবং বাংলাদেশ অ্যাসোসিয়েশন অফ সফটওয়্যার অ্যান্ড ইনফরমেশন সার্ভিসেস (বেসিস) বাংলা ভাষার প্রযুক্তির উন্নয়নে গুরুত্বপূর্ণ ভূমিকা পালন করেছে।
আর এসবের অন্তরালে কাজ করছে বাংলাদেশ ইন্টারনেট গভর্নেন্স ফোরাম (বিআইজিএফ)। ইন্টারনেট কর্পোরেশন ফর অ্যাসাইনড নেমস অ্যান্ড নাম্বার (আইক্যান) এর সঙ্গে যৌথভাবে প্রযুক্তিতে বাংলা ভাষার বিশ্বজয় নিয়ে সাইবার জগতে বাংলা অক্ষরের ব্যবহার নিশ্চিত করার জন্য বিআইজিএফ ২০০৯-২০১৬ সালে ডট বাংলা টপ লেভেল ডোমেইন অর্জনে অবদান রাখে। ২০১৬-২০২০ সালে বাংলা এলজিআর ডকুমেন্ট তৈরি ও ডট বাংলা এবং ইমেইল আইডিতে বাংলা হরফ সর্বজনীন গ্রহণযোগ্যতার জন্য কাজ করে যাচ্ছে। বাংলায় সেকেন্ড লেভেল ডোমেইন’র জন্যে সংগঠনটি এরইমধ্যে একটি ককাসও করেছে।