বাংলাদেশের রোবটিকসে বিপ্লব: ওপেন সোর্স মডেল Wall-OSS-0.5 ফাইন-টিউনিং ছাড়াই কাজ করবে
বেশিরভাগ রোবট ফাউন্ডেশন মডেলের চমকপ্রদ পারফরম্যান্স আসে টাস্ক-নির্দিষ্ট ফাইন-টিউনিংয়ের পর। X Square Robot-এর নতুন ওপেন সোর্স VLA মডেল Wall-OSS-0.5 সেই দৃষ্টিভঙ্গি বদলাতে চায়। এটি প্রিট্রেইনড অবস্থায় কতটা কাজ করতে পারে, সেটাই প্রথমে মাপার চেষ্টা করছে।
বেশিরভাগ রোবট ফাউন্ডেশন মডেলের চমকপ্রদ পারফরম্যান্স আসে টাস্ক-নির্দিষ্ট ফাইন-টিউনিংয়ের পর। X Square Robot-এর নতুন ওপেন সোর্স VLA মডেল Wall-OSS-0.5 সেই দৃষ্টিভঙ্গি বদলাতে চায়। এটি প্রিট্রেইনড অবস্থায় কতটা কাজ করতে পারে, সেটাই প্রথমে মাপার চেষ্টা করছে।
রোবটিকসের জগতে ফাউন্ডেশন মডেল নিয়ে যত ডেমো দেখা যায়, তার বেশিরভাগই বিভ্রান্তিকর। কারণ সেই ডেমোগুলোর впечатляющий পারফরম্যান্স সাধারণত টাস্ক-নির্দিষ্ট ফাইন-টিউনিংয়ের পর আসে। অর্থাৎ মডেলটিকে আগে নির্দিষ্ট একটি কাজের জন্য বিশেষভাবে শেখানো হয়, তারপর তার সক্ষমতা দেখানো হয়।
এবার সেই ধারা ভাঙতে এসেছে X Square Robot-এর নতুন ওপেন সোর্স মডেল Wall-OSS-0.5। এটি একটি Vision-Language-Action বা VLA মডেল। সহজ ভাষায়, এটি দেখতে পারে, ভাষা বুঝতে পারে এবং শারীরিক কাজ করতে পারে। এই মডেলের বিশেষত্ব হলো, এর রিপোর্টে প্রিট্রেইনড চেকপয়েন্টের পারফরম্যান্স প্রথমে মাপা হয়েছে। অর্থাৎ অতিরিক্ত কোনো ফাইন-টিউনিং ছাড়াই মডেলটি কতটা সক্ষম, সেটাই প্রথমে দেখার চেষ্টা করা হয়েছে।
প্রযুক্তিগত দিক থেকে Wall-OSS-0.5 তৈরি হয়েছে 4 বিলিয়ন প্যারামিটারের VLA আর্কিটেকচারের ওপর। এর ভিতরে আছে 3 বিলিয়ন প্যারামিটারের একটি VLM বা Vision-Language Model ব্যাকবোন। এই ব্যাকবোনের ওপর যুক্ত করা হয়েছে অ্যাকশন-জেনারেশন কম্পোনেন্ট। অর্থাৎ মডেলটি প্রথমে ছবি ও ভাষা বুঝে, তারপর সেই অনুযায়ী শারীরিক কাজ করার নির্দেশ তৈরি করে।
এই পদ্ধতির গুরুত্ব বোঝার জন্য একটি উদাহরণ দেখা যাক। ধরুন একটি রোবট হাতকে কাপ তোলার কাজ শেখানো হচ্ছে। সাধারণত মডেলটিকে প্রথমে হাজার হাজার কাপ তোলার ভিডিও দেখিয়ে প্রশিক্ষণ দেওয়া হয়। তারপর ফাইন-টিউনিং করে শেখানো হয় ঠিক কোন কোণে হাত নাড়তে হবে। কিন্তু Wall-OSS-0.5-এর পদ্ধতিতে দেখা হয়, প্রিট্রেইনড অবস্থায় মডেলটি কতটা ভালোভাবে কাপ চিনতে পারে এবং হাত নাড়ানোর বেসিক মুভমেন্ট জানে কিনা।
বাংলাদেশের প্রেক্ষাপটে এই খবরটি বিশেষ গুরুত্বপূর্ণ। দেশে রোবটিকস ও AI নিয়ে কাজ করা স্টার্টআপ ও গবেষকদের সংখ্যা বাড়ছে। ওপেন সোর্স মডেল পাওয়া গেলে তারা নিজেদের প্রয়োজন অনুযায়ী ফাইন-টিউনিং করতে পারবে। কিন্তু এখন পর্যন্ত বেশিরভাগ ওপেন সোর্স মডেলের বেস পারফরম্যান্স সম্পর্কে পরিষ্কার ধারণা পাওয়া যেত না। Wall-OSS-0.5 সেই জায়গায় স্বচ্ছতা আনছে।
তবে এখনই বড় কোন বিপ্লব আশা করা ঠিক হবে না। এটি একটি গবেষণা মডেল এবং এর প্রকৃত সক্ষমতা এখনো প্রমাণিত হয়নি। কিন্তু তথ্যভিত্তিক ও বিশ্বাসযোগ্য পদ্ধতি অনুসরণ করায় এটি ভবিষ্যতের মডেল তৈরির জন্য একটি ভালো উদাহরণ তৈরি করছে। X Square Robot জানিয়েছে, তারা এই পথে আরও কাজ করতে আগ্রহী।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: Reddit r/artificial
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...