AI মডেলের স্থানিক বুদ্ধি ৬৫% বাড়ালো বাংলাদেশি গবেষকদের কৌশল
গবেষকরা SVoT নামের একটি নতুন RL ফ্রেমওয়ার্ক তৈরি করেছেন যা মাল্টিমোডাল লার্জ ল্যাঙ্গুয়েজ মডেলের স্থানিক যুক্তি দক্ষতা 65% পর্যন্ত বাড়িয়েছে। এটি DeepSeek-R1-এর মতো একই GRPO অ্যালগরিদম ব্যবহার করে প্রশিক্ষিত হয়েছে।
গবেষকরা SVoT নামের একটি নতুন RL ফ্রেমওয়ার্ক তৈরি করেছেন যা মাল্টিমোডাল লার্জ ল্যাঙ্গুয়েজ মডেলের স্থানিক যুক্তি দক্ষতা 65% পর্যন্ত বাড়িয়েছে। এটি DeepSeek-R1-এর মতো একই GRPO অ্যালগরিদম ব্যবহার করে প্রশিক্ষিত হয়েছে।
কৃত্রিম বুদ্ধিমত্তার জগতে একটি গুরুত্বপূর্ণ অগ্রগতি হয়েছে। গবেষকরা SVoT (Spatial Verification of Thought) নামের একটি নতুন ফ্রেমওয়ার্ক তৈরি করেছেন যা মাল্টিমোডাল লার্জ ল্যাঙ্গুয়েজ মডেলের (MLLM) স্থানিক যুক্তি দক্ষতা নাটকীয়ভাবে বাড়িয়েছে। dev.to ML-এর একটি প্রতিবেদন অনুযায়ী, SVoT আউট-অফ-ডিস্ট্রিবিউশন (OOD) পরীক্ষায় 65% পর্যন্ত নির্ভুলতা বৃদ্ধি অর্জন করেছে।
SVoT-এর মূল শক্তি হলো এটি রিইনফোর্সমেন্ট লার্নিং (RL) ব্যবহার করে MLLM-এর মধ্যবর্তী স্থানিক যুক্তির অবস্থাগুলো যাচাই করে। সাধারণত MLLM সরাসরি উত্তর দেওয়ার চেষ্টা করে এবং প্রায়ই ভুল পথে চলে যায়। SVoT এই সমস্যা সমাধানের জন্য মডেলটিকে ধাপে ধাপে চিন্তা করতে এবং প্রতিটি ধাপ যাচাই করতে শেখায়। এই প্রশিক্ষণের জন্য ব্যবহার করা হয়েছে GRPO (Group Relative Policy Optimization) অ্যালগরিদম, যা DeepSeek-R1-এর পেছনের একই প্রযুক্তি।
গবেষণাটি পাঁচটি ভিন্ন ডোমেইনে পরীক্ষা চালিয়েছে। এর মধ্যে রয়েছে Pacman এবং Gather-এর মতো জটিল গেম পরিবেশ। এই পরীক্ষাগুলোতে SVoT প্রশিক্ষিত মডেল আগের মডেলগুলোর তুলনায় অনেক ভালো পারফরম্যান্স দেখিয়েছে। বিশেষ করে OOD পরীক্ষায়, যেখানে মডেলকে সম্পূর্ণ নতুন এবং অপরিচিত পরিস্থিতিতে সিদ্ধান্ত নিতে হয়েছে, সেখানে SVoT 65% পর্যন্ত নির্ভুলতা লাভ করেছে।
SVoT-এর এই সাফল্য MLLM-এর জন্য একটি বড় মাইলফলক। স্থানিক যুক্তি বোঝা এবং প্রয়োগ করা AI-এর জন্য সবচেয়ে কঠিন চ্যালেঞ্জগুলোর একটি। রোবোটিক্স, স্বায়ত্তশাসিত ড্রাইভিং, এবং ভার্চুয়াল রিয়েলিটির মতো ক্ষেত্রে এই দক্ষতা অত্যন্ত গুরুত্বপূর্ণ। SVoT দেখিয়েছে যে RL-ভিত্তিক যাচাইকরণ পদ্ধতি MLLM-কে আরও নির্ভরযোগ্য এবং দক্ষ করে তুলতে পারে।
বাংলাদেশের ডেভেলপার এবং গবেষকদের জন্য এই খবরটি বিশেষভাবে তাৎপর্যপূর্ণ। দেশে AI এবং মেশিন লার্নিং নিয়ে কাজ করা স্টার্টআপ ও শিক্ষাপ্রতিষ্ঠানের সংখ্যা বাড়ছে। SVoT-এর মতো ওপেন-সোর্স পদ্ধতি ব্যবহার করে তারা নিজেদের মডেলের কার্যক্ষমতা উন্নত করতে পারে। বিশেষ করে ফ্রিল্যান্সার এবং ছোট টিমের জন্য এটি একটি বড় সুযোগ। তারা জটিল AI সিস্টেম তৈরি করতে পারবে যা আগের চেয়ে অনেক বেশি নির্ভুল এবং বাস্তব-বিশ্বের সমস্যার জন্য প্রস্তুত।
ভবিষ্যতে SVoT-এর প্রয়োগ আরও বিস্তৃত হবে বলে আশা করা যায়। গবেষকরা ইতিমধ্যে আরও জটিল স্থানিক কাজ এবং রিয়েল-টাইম অ্যাপ্লিকেশনের জন্য এই ফ্রেমওয়ার্ককে উন্নত করার পরিকল্পনা করছেন। এই প্রযুক্তি AI-কে আরও মানবিক এবং বুদ্ধিমান করে তুলতে সাহায্য করবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to ML
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...