বর্ণ আবিষ্কারের পর পেরিয়ে গেছে হাজার হাজার বছর। এখন মানুষ ঝুঁকছে আর্টিফিশিয়াল ইন্টেলিজেন্স বা কৃত্রিম বুদ্ধিমত্তার দিকে। এই কৃত্রিম বুদ্ধিমত্তা কাজে লাগিয়ে এখন লেখা থেকেই আঁকা হচ্ছে ছবি। এ কাজের যে কারিগর, তাঁর নাম ‘দাল-ই’।
শিল্পী সালভাদর দালির ‘দাল’ এবং পিক্সারের জনপ্রিয় অ্যানিমেশন ওয়াল-ই থেকে ‘ই’ নিয়ে এর নাম রাখা হয়েছে ‘দাল-ই’।
এই দাল-ই, ভাষার বর্ণনা থেকে বাস্তবসম্মত ছবি তৈরি করতে পারে। বিখ্যাত কারও চিত্রশিল্পের অনুপ্রেরণায় ছবি আঁকতে চাইলে ওই ছবির মূল ক্যানভাসে যা আছে তার থেকেও বিস্তৃত পরিসরে ছবি এঁকে দেয়। লিখিত ক্যাপশন থেকে তৈরি হওয়া চিত্রগুলোকে সম্পাদনা করতে পারে বাস্তবের মতো। ছায়া, প্রতিফলন, টেক্সচারকে চিত্রের উপাদান বা মাধ্যমগুলোকে সংযুক্ত এবং অপসারণও করতে পারে। এমনকি ফটো গ্যালারি থেকে ছবি নিয়ে মূল ছবির আদল ঠিক রেখেও পরবর্তী ছবিটিতে ভিন্নতা আনতে পারে।
সম্প্রতি দাল-ইর দ্বিতীয় সংস্করণ ‘দাল-ই-২’-এর মোড়ক উন্মোচন করেছে নির্মাতা প্রতিষ্ঠান ওপেনএআই। এরপর প্রযুক্তিটি সবার জন্য উন্মুক্ত করে দেয়।
সবার জন্য উন্মুক্ত করে দেওয়ার আগে থেকে দাল-ই ব্যবহারকারীর সংখ্যা ছিল প্রায় ১৫ লাখ । আর তারা প্রতিদিন তৈরি করত ২০ লাখেরও বেশি ছবি। ইতিমধ্যে ১১৮টি দেশের ৩ হাজার শিল্পী নিয়মিত ব্যবহার করছেন। এমনকি এ ধরনের মেশিন-বুদ্ধিমত্তা ব্যবহার করে গ্রাফিক নভেলও প্রকাশিত হচ্ছে।
দাল-ই সিস্টেমে ছবি এঁকে সম্প্রতি পুরস্কার জিতে নিয়েছেন জেসন অ্যালেন নামের একজন প্রোগ্রামার। তাঁর আঁকা ‘থিয়েটার ডি অপেরা স্পেশাল’ নামে ছবিটি লাসভেগাসের একটি প্রতিযোগিতায় ডিজিটাল ক্যাটাগরিতে প্রথম পুরস্কার জিতেছে।
অবশ্য দাল-ইতে আপাতত বেশ কিছু আপত্তিকর শব্দ ফিল্টার করার ব্যবস্থা রাখা আছে। তা ছাড়া এর মাধ্যমে চাইলেই কোনো ব্যক্তির ছবি দিয়ে কেউ ব্যঙ্গচিত্র বানাতে পারবে না।
কম্পিউটার বিজ্ঞানীরা মনে করছেন, এই প্রযুক্তির কারণে যারা বইপত্র বা ডিজিটাল ইলাস্ট্রেশন করেন, ভবিষ্যতে তাঁদের ক্যারিয়ার কিছুটা হুমকিতে পড়তে পারে।
বছর চারেক আগে লেখা দেখেই ছবি আঁকবে এমন ‘বট’ তৈরির কথা জানিয়েছিলো মাইক্রোসফট। মাইক্রোসফট-এর গবেষণাগার-এর শিয়াওডং হি জানিয়েছিলেন, মানুষের দেওয়া বর্ণনায় কোনো তথ্যের ঘাটতি থাকলেও পুরো ছবি আঁকতে সক্ষম এই বট। এই বট-এ ব্যবহার করা মূল প্রযুক্তি ‘জেনারেটিভ অ্যাডভারসারিয়াল নেটওয়ার্ক’ বা জিএএন নামে পরিচিত। এই প্রযুক্তি নেটওয়ার্কে দুটি মেশিন লার্নিং মডেল ব্যবহার করা হয়েছে- একটি বর্ণনা থেকে ছবি বানাবে আর অন্যটি লিখিত বর্ণনা যাচাই করবে।
অর্থাৎ আপনি যদি বিংয়ে যান আর কোনো পাখির জন্য সার্চ করেন তবে আপনি একটি পাখির ছবি পাবেন। কিন্তু এখানে ছবিগুলো কম্পিউটারের বানানো, পিক্সেল হিসেব করে। এই পাখিগুলো বাস্তব দুনিয়ায় হয়তো নেই- এগুলো শুধুই আমাদের কম্পিউটারের কল্পনা করা পাখিগুলো থেকে আসা।