টেক্সট লিখলেই ছবির বস্তু গুনবে AI, ত্রুটি অর্ধেক!
প্রথমবারের মতো, একটি AI মডেল শুধুমাত্র টেক্সট প্রম্পট ব্যবহার করে যেকোনো ছবির বস্তু গণনা করতে পারে। এটি আগের সিস্টেমের তুলনায় ত্রুটির হার অর্ধেকে নামিয়ে এনেছে। তবে ঘন বস্তু ও অস্পষ্ট শব্দের ক্ষেত্রে মডেলটির সীমাবদ্ধতা রয়েছে।
প্রথমবারের মতো, একটি AI মডেল শুধুমাত্র টেক্সট প্রম্পট ব্যবহার করে যেকোনো ছবির বস্তু গণনা করতে পারে। এটি আগের সিস্টেমের তুলনায় ত্রুটির হার অর্ধেকে নামিয়ে এনেছে। তবে ঘন বস্তু ও অস্পষ্ট শব্দের ক্ষেত্রে মডেলটির সীমাবদ্ধতা রয়েছে।
প্রযুক্তি বিশ্বে যুগান্তকারী এক সংবাদ এসেছে। 'কাউন্ট এনিথিং' নামের একটি নতুন AI মডেল তৈরি করা হয়েছে যা যেকোনো ছবির বস্তু গণনা করতে পারে। এটি শুধুমাত্র একটি টেক্সট প্রম্পটের মাধ্যমেই কাজ করে। দ্য ডিকোডারের প্রতিবেদন অনুযায়ী, এটি প্রথম AI মডেল যা ভিড় থেকে শুরু করে মাইক্রোস্কোপের নিচে কোষ পর্যন্ত সব ধরনের ছবিতে বস্তু গণনা করতে সক্ষম।
এই মডেলটির সবচেয়ে বড় সাফল্য হলো এর নির্ভুলতা। তুলনামূলক পরীক্ষায় দেখা গেছে, 'কাউন্ট এনিথিং' আগের সিস্টেমগুলোর তুলনায় ত্রুটির হার অর্ধেকে কমিয়ে এনেছে। এর মানে হলো, এটি অনেক বেশি সঠিকভাবে গণনা করতে পারে। প্রযুক্তি বিশেষজ্ঞরা বলছেন, এটি কম্পিউটার ভিশনের ক্ষেত্রে একটি বড় অগ্রগতি।
তবে মডেলটির কিছু সীমাবদ্ধতাও আছে। এটি অত্যন্ত ঘন বস্তুতে ভরা ছবি এবং অস্পষ্ট শব্দের ক্ষেত্রে এখনও সমস্যায় পড়ে। যেমন একটি ছবিতে যদি হাজার হাজার পিঁপড়ে থাকে, তাহলে সঠিক সংখ্যা বলা কঠিন হয়ে পড়ে। আবার 'গোলাকার জিনিস' বা 'লাল বস্তু'র মতো অস্পষ্ট নির্দেশ দিলেও এটি দ্বিধায় পড়ে যায়।
এই প্রযুক্তি কীভাবে কাজ করে? এটি মূলত একটি বিশেষ ধরনের নিউরাল নেটওয়ার্ক ব্যবহার করে। মডেলটি ছবির প্রতিটি অংশ স্ক্যান করে এবং প্রম্পটের সাথে মিলিয়ে দেখে। তারপর এটি একটি নির্দিষ্ট সংখ্যা আউটপুট হিসেবে দেয়। গবেষকরা বলছেন, ভবিষ্যতে মডেলটিকে আরও উন্নত করা হবে।
বাংলাদেশের প্রেক্ষাপটে এই মডেলটির গুরুত্ব অনেক। স্থানীয় ডেভেলপার ও ফ্রিল্যান্সাররা এই AI টুল ব্যবহার করে বিভিন্ন কাজ করতে পারবেন। যেমন একটি কারখানার উৎপাদন লাইনে পণ্য গণনা করা, অথবা একটি চিকিৎসা গবেষণাগারে কোষের সংখ্যা নির্ণয় করা। শিক্ষার্থীরাও এই মডেল ব্যবহার করে জটিল গবেষণা প্রকল্পে কাজ করতে পারবে।
ব্যবসায়িক ক্ষেত্রেও এর প্রয়োগ সম্ভব। একটি দোকানের সিসি টিভি ফুটেজ থেকে গ্রাহক সংখ্যা গণনা করা যেতে পারে। অথবা একটি মাঠের ফসলের পরিমাণ অনুমান করা যেতে পারে। এটি সময় ও শ্রম দুটোই বাঁচাবে।
গবেষকরা এখন মডেলটির সীমাবদ্ধতা কাটিয়ে ওঠার চেষ্টা করছেন। তারা ঘন বস্তু ও অস্পষ্ট শব্দের জন্য বিশেষ অ্যালগরিদম তৈরি করছেন। আশা করা যাচ্ছে, আগামী কয়েক মাসের মধ্যে আরও উন্নত সংস্করণ আসবে।
'কাউন্ট এনিথিং' প্রমাণ করেছে যে AI এখন শুধু ছবি চিনতে পারে না, বরং সঠিকভাবে গণনাও করতে পারে। এটি কম্পিউটার ভিশনের জগতে একটি নতুন দিগন্ত উন্মোচন করল। প্রযুক্তিপ্রেমী ও পেশাদারদের জন্য এটি একটি অত্যন্ত গুরুত্বপূর্ণ ও সময়োপযোগী আবিষ্কার।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: The Decoder
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...