AI এখন হারানো ছবির তথ্যও ফিরিয়ে আনবে, নির্ভুলতা বাড়বে কয়েকগুণ
গবেষকরা দেখেছেন, বর্তমান ভিশন-ল্যাঙ্গুয়েজ মডেল ছবির গুরুত্বপূর্ণ তথ্য স্থায়ীভাবে ফেলে দেয়। নতুন পদ্ধতি Reroute সেই হারানো তথ্য পুনরুদ্ধার করে মডেলের নির্ভুলতা বাড়ায়।
গবেষকরা দেখেছেন, বর্তমান ভিশন-ল্যাঙ্গুয়েজ মডেল ছবির গুরুত্বপূর্ণ তথ্য স্থায়ীভাবে ফেলে দেয়। নতুন পদ্ধতি Reroute সেই হারানো তথ্য পুনরুদ্ধার করে মডেলের নির্ভুলতা বাড়ায়।
একদল মেশিন লার্নিং গবেষক ভিশন-ল্যাঙ্গুয়েজ মডেলের (VLM) একটি মৌলিক ত্রুটি শনাক্ত করেছেন। এই মডেলগুলো ছবি প্রক্রিয়াকরণের সময় কোন ভিজ্যুয়াল তথ্য রাখবে আর কোনটি ফেলে দেবে, সে বিষয়ে অপরিবর্তনীয় সিদ্ধান্ত নেয়। dev.to ML সূত্রে জানা গেছে, গবেষকরা এই সমস্যা সমাধানের জন্য Reroute নামে একটি নতুন পদ্ধতি তৈরি করেছেন।
Reroute পদ্ধতি টোকেন রিডাকশনকে স্থায়ী মুছে ফেলা হিসেবে না দেখে একটি নমনীয় ও পুনরুদ্ধারযোগ্য প্রক্রিয়া হিসেবে বিবেচনা করে। এটি ডায়নামিক টোকেন রাউটিং প্রযুক্তি ব্যবহার করে। এই প্রযুক্তি মডেলটিকে প্রক্রিয়াকরণের বিভিন্ন ধাপে ছবির তথ্য পুনরায় মূল্যায়ন ও পুনরুদ্ধার করার সুযোগ দেয়। ফলে যে ভিজ্যুয়াল ডিটেইলগুলো আগে স্থায়ীভাবে হারিয়ে যেত, সেগুলো এখন সংরক্ষিত হয়।
গবেষকদের মতে, স্ট্যাটিক টোকেন প্রুনিং পদ্ধতি কাজের শুরুতে কিছু টোকেন (ছবির ছোট ছোট অংশ) স্থায়ীভাবে বাদ দেয়। এই প্রক্রিয়ায় ছবির গুরুত্বপূর্ণ প্রান্ত, টেক্সচার বা ছোট বস্তু চিরতরে হারিয়ে যায়। Reroute সেই হারানো তথ্য পুনরুদ্ধার করে মডেলের ছবি বোঝার ক্ষমতা উন্নত করে। এটি বিশেষ করে চিকিৎসা ইমেজিং, স্বায়ত্তশাসিত গাড়ি ও নিরাপত্তা ব্যবস্থার মতো নির্ভুলতা গুরুত্বপূর্ণ ক্ষেত্রে বড় পরিবর্তন আনতে পারে।
বাংলাদেশের কৃত্রিম বুদ্ধিমত্তা গবেষক ও ডেভেলপারদের জন্য এই গবেষণা অত্যন্ত প্রাসঙ্গিক। দেশে ইমেজ প্রসেসিং নিয়ে কাজ করা স্টার্টআপ ও ফ্রিল্যান্সাররা এই পদ্ধতি ব্যবহার করে আরও নির্ভুল AI মডেল তৈরি করতে পারবেন। বিশেষ করে কৃষি, চিকিৎসা ও ই-কমার্স খাতে ছবি বিশ্লেষণের কাজে Reroute গুরুত্বপূর্ণ ভূমিকা রাখতে পারে। স্থানীয় বিশ্ববিদ্যালয়ের গবেষকরাও এই পদ্ধতি নিয়ে আরও পরীক্ষা-নিরীক্ষা চালাতে পারেন।
গবেষণাটি এখনও প্রাথমিক পর্যায়ে রয়েছে। তবে প্রাথমিক ফলাফল আশাব্যঞ্জক। গবেষকরা আশা করছেন, ভবিষ্যতে এই পদ্ধতি আরও উন্নত করে বড় আকারের মডেলগুলোর কার্যকারিতা বাড়ানো সম্ভব হবে। Reroute ভিশন-ল্যাঙ্গুয়েজ মডেলের ডিজাইনে একটি গুরুত্বপূর্ণ পরিবর্তন আনতে পারে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to ML
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...