বাংলাদেশে AI গবেষণায় বিপ্লব: ৮B প্যারামিটারেই GPT-5.4-এর সমান যুক্তি
S-Agent নামের একটি নতুন AI ফ্রেমওয়ার্ক মাত্র 8 বিলিয়ন প্যারামিটার নিয়েই GPT-5.4-এর সমান স্থানিক যুক্তি দেখাতে সক্ষম হয়েছে। এটি ভিডিও ও বহু-কোণ থেকে দেখা ছবি থেকে ত্রিমাত্রিক মডেল তৈরি করে। গবেষণাটি স্থানিক বুদ্ধিমত্তার ক্ষেত্রে একটি বড় অগ্রগতি হিসেবে দেখা হচ্ছে।
S-Agent নামের একটি নতুন AI ফ্রেমওয়ার্ক মাত্র 8 বিলিয়ন প্যারামিটার নিয়েই GPT-5.4-এর সমান স্থানিক যুক্তি দেখাতে সক্ষম হয়েছে। এটি ভিডিও ও বহু-কোণ থেকে দেখা ছবি থেকে ত্রিমাত্রিক মডেল তৈরি করে। গবেষণাটি স্থানিক বুদ্ধিমত্তার ক্ষেত্রে একটি বড় অগ্রগতি হিসেবে দেখা হচ্ছে।
স্থানিক যুক্তি বা স্পেশিয়াল রিজনিং কৃত্রিম বুদ্ধিমত্তার জন্য সবচেয়ে কঠিন চ্যালেঞ্জগুলোর একটি। একটি মাত্র ছবি থেকে কোনো বস্তুর দূরত্ব, দিক বা আকৃতি বোঝা প্রায় অসম্ভব। কিন্তু S-Agent নামের একটি নতুন ফ্রেমওয়ার্ক এই সমস্যার সমাধান করেছে।
S-Agent একটি ভিশন-ল্যাঙ্গুয়েজ মডেলকে প্ল্যানার হিসেবে ব্যবহার করে। এটি মাল্টি-ভিউ ইমেজ এবং ভিডিও থেকে ত্রিমাত্রিক দৃশ্য তৈরি করতে পারে। গবেষণাপত্রটি dev.to ML-এ প্রকাশিত হয়েছে। গবেষকরা দাবি করেছেন যে মাত্র 8 বিলিয়ন প্যারামিটার নিয়েই S-Agent GPT-5.4-এর সমান পারফরম্যান্স দেখিয়েছে।
এই ফ্রেমওয়ার্কের মূল উদ্ভাবন হলো স্প্যাটিও-টেম্পোরাল এভিডেন্স অ্যাকুমুলেশন। অর্থাৎ মডেলটি জ্যামিতিক তথ্য তার নিজস্ব অভ্যন্তরীণ মেমরিতে না রেখে একটি আলাদা 3D স্টোরে জমা করে। এর ফলে মডেলটির ছোট আকার সত্ত্বেও জটিল স্থানিক প্রশ্নের উত্তর দেওয়া সম্ভব হচ্ছে।
কী ধরনের প্রশ্নের উত্তর দিতে পারে S-Agent? যেমন দুটি বস্তুর মধ্যে দূরত্ব কত, একটি ঘরে কতগুলি চেয়ার আছে, বা একটি বস্তু কোন দিকে মুখ করে আছে। এই প্রশ্নগুলোর উত্তর দেওয়ার জন্য জ্যামিতিক বোধ প্রয়োজন যা একক ফ্রেমে থাকে না। S-Agent সেই জ্যামিতি বের করে একটি 3D মডেলে সংরক্ষণ করে।
প্রযুক্তিগতভাবে S-Agent একটি হায়ারার্কি অফ স্পেশিয়াল টুলস ব্যবহার করে। ভিশন-ল্যাঙ্গুয়েজ মডেল প্রথমে কোন টুলটি ব্যবহার করতে হবে তা নির্ধারণ করে। তারপর সেই টুল দৃশ্যের ত্রিমাত্রিক মডেল তৈরি করে। এই প্রক্রিয়ায় একাধিক ভিউ এবং ভিডিও ফ্রেম থেকে তথ্য একত্রিত করা হয়।
বাংলাদেশের প্রেক্ষাপটে এই গবেষণার গুরুত্ব অনেক। বাংলাদেশে AI গবেষণা দ্রুত এগিয়ে চলেছে। বিশেষ করে রোবোটিক্স, স্বায়ত্তশাসিত যানবাহন এবং 3D মডেলিং নিয়ে কাজ করা ডেভেলপার ও গবেষকদের জন্য S-Agent একটি গুরুত্বপূর্ণ রেফারেন্স হতে পারে। ফ্রিল্যান্সার এবং স্টার্টআপদের জন্যও এটি একটি নতুন দিগন্ত খুলে দিতে পারে।
ভবিষ্যতে S-Agent-এর মতো ফ্রেমওয়ার্ক আরও ছোট মডেল দিয়ে বড় কাজ করার পথ দেখাবে। এটি AI-কে আরও সাশ্রয়ী এবং সহজলভ্য করে তুলবে। গবেষকরা এখন S-Agent-কে রিয়েল-টাইম অ্যাপ্লিকেশনে ব্যবহারের উপায় নিয়ে কাজ করছেন।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to ML
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...