গবেষকদের জন্য ‘ডেটাসেট সার্চ’ (
https://datasetsearch.research.google.com/) উন্মুক্ত করলো গুগল। শুরুতে প্রায় আড়াই কোটি ডেটাসেট ব্যবহারের জন্য উন্মুক্ত করে দেয়া হয়েছে। বিষয় ভিত্তিক ডেটা খোঁজার এই ডোমেইনে ধীরে ধীরে আরও নানান ডেটাসেট যুক্ত করা হবে বলে জানিয়েছে বিশ্বখ্যাত এই সার্চ ইঞ্জিন।
উন্মুক্ত করা এই ডেটাসেটগুলো ব্যবহার উপযোগী ফরম্যাটে পাওয়া যাচ্ছে। তবে এটি উন্মুক্ত করতে আমাজনের ওপেন ডেটা রেজিস্ট্রির মতো কাজটি করেনি গুগল। এর পরিবর্তে ডেটাসেট পাবলিশারদের ব্যবহৃত মেটাডেটা ব্যবহারের মাধ্যমে ডেটাসেট উন্মুক্ত করেছে। পরবর্তী সময়ে ডেটাগুলো মেটাডেটা অনুসরণ করে সার্চেবল আকারে ইনডেক্স করা হয়েছে।
ডেটাসেটের মধ্যে বিভিন্ন সরকারি ও গবেষণা প্রতিষ্ঠানের ডেটা যেমন রয়েছে, তেমনই ব্যবহারকারীদের কাজে লাগে এমন ডেটাও রাখা হয়েছে। শুরুতে বেটা সংস্করণ চালু হলেও রোববার (২৭ জানুয়ারি) থেকে পূর্ণাঙ্গভাবে ডেটাসেট উন্মুক্ত হয়েছে।
গুগলের তথ্যানুযায়ী, ডেটাসেটে তিন ধরনের ডেটার প্রাধান্য রয়েছে। এর মধ্যে উল্লেখযোগ্য ‘জিয়োসায়েন্স’, ‘বায়োলজি’ ও ‘এগ্রিকালচার’। বর্তমানে ডেটাসেট ব্যবহারের জন্য গুগল আলাদা কোনও এপিআই দিচ্ছে না।
গুগলের ডেটাসেট থেকে ফিল্টারের মাধ্যমে আলাদাভাবে টেবিল, ইমেজ ও টেক্সট বের করার সুযোগ রয়েছে। পুরো ডেটাসেটেই ওপেন স্ট্যান্ডার্ড নীতিমালা অনুসরণ করা হয়েছে।