ছোট ডেভেলপারদের জন্য এআই ডেটা সহজ করছে উইকিমিডিয়া

তথ্যভান্ডারকে কৃত্রিম বুদ্ধিমত্তার (এআই) জন্য আরও ব্যবহারবান্ধব করার উদ্যোগ নিয়েছে উইকিমিডিয়া ফাউন্ডেশন। এর অংশ হিসেবে তারা চালু করেছে ‘উইকিডাটা এম্বেডিং প্রকল্প’। উইকিমিডিয়ার দাবি, এর ফলে ছোট এআই ডেভেলপাররাও বিশাল জ্ঞানভান্ডারের ভেক্টরাইজড ডেটা সহজে ব্যবহার করতে পারবে, যা আগে কেবল বড় প্রযুক্তি কোম্পানির জন্য সম্ভব ছিল।
এই প্রকল্পে উইকিডাটার প্রায় ১২ কোটি তথ্যবিন্দু (ডেটা পয়েন্ট) সংখ্যাগত ভেক্টরে বা এম্বেডিংসে রূপান্তর করা হচ্ছে। ফলে এ তথ্যগুলো সহজে ব্যবহার করতে পারবে বড় ভাষা মডেল (এলএলএম) এবং অন্যান্য এআই সিস্টেম।
যদিও উইকিডাটা আগে থেকেই মেশিন-রিডেবল, কিন্তু সেটি জেনারেটিভ এআইয়ের জন্য সরাসরি উপযোগী নয়। নতুন এম্বেডিং প্রক্রিয়ায় সম্পর্কিত ধারণাগুলো (যেমন ‘কুকুর’ ও ‘ছানা কুকুর’) ভেক্টর স্পেসে কাছাকাছি অবস্থান করবে। এতে এআই সিস্টেমগুলো আরও স্বাভাবিকভাবে সম্পর্ক বুঝতে পারবে।,
প্রসঙ্গত, এ ঘোষণাটি এসেছে এমন সময়ে যখন টেসলার সিইও ইলন মাস্ক ‘গ্রোকিপিডিয়া’ নামে উইকিপিডিয়ার প্রতিদ্বন্দ্বী একটি প্ল্যাটফর্ম চালুর ঘোষণা দিয়েছেন। ফলে অনেকেই এটিকে জ্ঞানের উন্মুক্ত ব্যবহার নিশ্চিত করার কৌশলগত পদক্ষেপ হিসেবে দেখছেন।