৩ বিলিয়ন প্যারামিটারের AI মডেল এখন বড় মডেলের সমান পারফরম্যান্স দিচ্ছে
মাত্র 3 বিলিয়ন প্যারামিটারের নতুন AI মডেল VibeThinker-3B বড় মডেলগুলোর সঙ্গে পাল্লা দিচ্ছে। এটি Qwen2.5-Coder-3B-এর ওপর তৈরি এবং MIT লাইসেন্সে উন্মুক্ত।
মাত্র 3 বিলিয়ন প্যারামিটারের নতুন AI মডেল VibeThinker-3B বড় মডেলগুলোর সঙ্গে পাল্লা দিচ্ছে। এটি Qwen2.5-Coder-3B-এর ওপর তৈরি এবং MIT লাইসেন্সে উন্মুক্ত।
প্রযুক্তি জগতে একটি চমকপ্রদ সংবাদ এসেছে। VibeThinker-3B নামের একটি নতুন রিজনিং মডেল প্রকাশিত হয়েছে যা মাত্র 3 বিলিয়ন প্যারামিটার নিয়েই DeepSeek V3.2 এবং Kimi K2.5-এর মতো বড় মডেলের সমান পারফরম্যান্স দেখাচ্ছে। MarkTechPost এই খবরটি প্রথম প্রকাশ করেছে।
এই মডেলটি সম্পূর্ণ MIT লাইসেন্সের আওতায় উন্মুক্ত। অর্থাৎ ডেভেলপার, গবেষক এবং কোম্পানিগুলো বিনা খরচে এটি ব্যবহার, পরিবর্তন এবং বিতরণ করতে পারবে। এটি একটি উল্লেখযোগ্য অগ্রগতি কারণ সাধারণত এত ছোট মডেল এত ভালো ফল দেয় না।
VibeThinker-3B তৈরি করা হয়েছে Alibaba-এর Qwen2.5-Coder-3B মডেলের ওপর ভিত্তি করে। এখানে একটি বিশেষ পদ্ধতি ব্যবহার করা হয়েছে যার নাম Spectrum-to-Signal পোস্ট-ট্রেনিং পাইপলাইন। এই পদ্ধতি মডেলটিকে ছোট আকারে রেখেই জটিল যুক্তি ও সমস্যা সমাধানের ক্ষমতা দিয়েছে।
মডেলটির সবচেয়ে বড় বৈশিষ্ট্য হলো এটি ভেরিফায়েবল বেঞ্চমার্কে DeepSeek V3.2 এবং Kimi K2.5-এর সমান স্কোর করেছে। ভেরিফায়েবল বেঞ্চমার্ক মানে এমন পরীক্ষা যেখানে সঠিক উত্তর জানা থাকে এবং মডেলের উত্তর যাচাই করা যায়। এটি গণিত, কোডিং এবং লজিকের মতো ক্ষেত্রে মডেলের দক্ষতা প্রমাণ করে।
বাংলাদেশের জন্য এই খবর অত্যন্ত গুরুত্বপূর্ণ। স্থানীয় ডেভেলপার এবং স্টার্টআপরা এখন খুব কম খরচে একটি শক্তিশালী AI মডেল পেতে পারে। ফ্রিল্যান্সার এবং শিক্ষার্থীরাও এই মডেল ব্যবহার করে নিজেদের প্রকল্পে উন্নতি করতে পারবে। বিশেষ করে যারা কোডিং অ্যাসিস্ট্যান্ট বা অটোমেশন টুল তৈরি করে, তাদের জন্য এটি একটি বড় সুযোগ।
এই মডেলের সবচেয়ে বড় সুবিধা হলো এটি চালানোর জন্য খুব বেশি কম্পিউটিং পাওয়ার লাগে না। একটি সাধারণ GPU বা এমনকি কিছু ক্ষেত্রে CPU-তেও এটি চালানো সম্ভব। ফলে ব্যক্তিগত কম্পিউটার থেকেই AI ডেভেলপমেন্ট সম্ভব হচ্ছে।
VibeThinker-3B-এর মুক্তি প্রমাণ করে যে ছোট মডেলগুলোও বড় মডেলের বিকল্প হতে পারে। ভবিষ্যতে আরও ছোট এবং দ্রুত মডেল আসবে যা AI প্রযুক্তিকে আরও সহজলভ্য করে তুলবে। বাংলাদেশের ডেভেলপারদের এখনই এই মডেল নিয়ে কাজ শুরু করা উচিত।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: MarkTechPost
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...