গুগলের নতুন ওপেন মডেল Gemma 4, নিজের ডিভাইসেই চালান
গুগল তাদের নতুন ওপেন-সোর্স মডেল Gemma 4 12B ঘোষণা করেছে। এটি একটি এনকোডার-ফ্রি মাল্টিমোডাল মডেল যা টেক্সট ও ইমেজ প্রক্রিয়াকরণে সক্ষম। ছোট আকারের কারণে এটি ডেভেলপারদের নিজস্ব ডিভাইসে চালানোর জন্য উপযুক্ত।
গুগল তাদের নতুন ওপেন-সোর্স মডেল Gemma 4 12B ঘোষণা করেছে। এটি একটি এনকোডার-ফ্রি মাল্টিমোডাল মডেল যা টেক্সট ও ইমেজ প্রক্রিয়াকরণে সক্ষম। ছোট আকারের কারণে এটি ডেভেলপারদের নিজস্ব ডিভাইসে চালানোর জন্য উপযুক্ত।
গুগল তাদের ওপেন-সোর্স মডেল পরিবারের নতুন সদস্য Gemma 4 12B উন্মোচন করেছে। এই মডেলটি একটি এনকোডার-ফ্রি মাল্টিমোডাল মডেল যা টেক্সট এবং ইমেজ উভয় ধরনের ডেটা প্রক্রিয়া করতে পারে। রেডডিটের r/LocalLLaMA সাবরেডিটে এই খবরটি প্রথম প্রকাশিত হয়েছে।
Gemma 4 12B মডেলটির সবচেয়ে বড় বৈশিষ্ট্য হলো এর এনকোডার-ফ্রি ডিজাইন। আগের মাল্টিমোডাল মডেলগুলিতে ইমেজ প্রক্রিয়াকরণের জন্য আলাদা ভিজ্যুয়াল এনকোডার থাকত। কিন্তু এই মডেলটি ভিজ্যুয়াল এবং ল্যাঙ্গুয়েজ প্রক্রিয়াকরণকে একীভূত করেছে। ফলে মডেলটি আরও দ্রুত এবং কম মেমোরি ব্যবহার করে কাজ করতে পারে।
মডেলটির প্যারামিটার সংখ্যা মাত্র 12 বিলিয়ন। এটি বর্তমান বাজারে থাকা বড় মডেলগুলোর তুলনায় অনেক ছোট। উদাহরণস্বরূপ, GPT-4 বা Claude-3 এর প্যারামিটার সংখ্যা শত শত বিলিয়ন। এই ছোট আকারের কারণে Gemma 4 12B সহজেই একটি সাধারণ GPU বা এমনকি CPU-তে চালানো সম্ভব। ডেভেলপাররা এটি তাদের নিজস্ব ডিভাইসে ডাউনলোড করে ব্যবহার করতে পারবেন।
এনকোডার-ফ্রি ডিজাইন মডেলটিকে আরও কার্যকরী করে তুলেছে। ঐতিহ্যবাহী মাল্টিমোডাল মডেলগুলিতে ইমেজ এনকোডার এবং টেক্সট ডিকোডার আলাদাভাবে কাজ করে। Gemma 4 12B এই দুটি প্রক্রিয়াকে একীভূত করে একটি ইউনিফাইড আর্কিটেকচার তৈরি করেছে। এর ফলে মডেলটি ইমেজ এবং টেক্সটের মধ্যে সম্পর্ক আরও ভালোভাবে বুঝতে পারে।
বাংলাদেশের ডেভেলপার এবং ফ্রিল্যান্সারদের জন্য এই মডেলটি একটি গুরুত্বপূর্ণ সুযোগ তৈরি করবে। ছোট আকারের কারণে এটি ক্লাউড সার্ভিসের উপর নির্ভরতা কমিয়ে দেবে। স্থানীয় ডিভাইসে চালানো যায় বলে ডেটা গোপনীয়তা নিয়েও চিন্তা করতে হবে না। শিক্ষার্থী এবং গবেষকরা বড় বাজেট ছাড়াই উন্নত AI মডেল নিয়ে পরীক্ষা-নিরীক্ষা করতে পারবেন।
গুগল ঘোষণা করেছে যে মডেলটি ওপেন-সোর্স লাইসেন্সের অধীনে প্রকাশিত হবে। এর মানে যে কেউ এটি ডাউনলোড করে ব্যবহার করতে এবং পরিবর্তন করতে পারবেন। তবে এখনও অফিসিয়াল রিলিজ ডেট ঘোষণা করা হয়নি। ডেভেলপাররা গিটহাব এবং হাগিং ফেসে মডেলটির জন্য অপেক্ষা করতে পারেন।
Gemma 4 12B মডেলটি ছোট আকার এবং এনকোডার-ফ্রি ডিজাইনের কারণে লোকাল AI ডিপ্লয়মেন্টের জন্য একটি শক্তিশালী বিকল্প হয়ে উঠতে পারে। এটি প্রমাণ করে যে ছোট মডেলও বড় কাজ করতে পারে। ভবিষ্যতে আরও ছোট এবং কার্যকরী মডেল বাজারে আসতে পারে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: Reddit r/LocalLLaMA
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...