Google DeepMind-এর নতুন মডেল DiffusionGemma: প্রতি সেকেন্ডে ১০০০ টোকেন গতি, ফ্রিল্যান্সারদের জন্য বড় সুযোগ
Google DeepMind নতুন ওপেন-ওয়েট মডেল DiffusionGemma প্রকাশ করেছে। এটি ২৬ বিলিয়ন প্যারামিটার নিয়ে প্রতি সেকেন্ডে ১০০০ টোকেন গতিতে টেক্সট জেনারেট করতে পারে। মডেলটি ইমেজ জেনারেশনের মতো সমান্তরালভাবে টোকেন ডিনয়েজ করে কাজ করে।
Google DeepMind নতুন ওপেন-ওয়েট মডেল DiffusionGemma প্রকাশ করেছে। এটি ২৬ বিলিয়ন প্যারামিটার নিয়ে প্রতি সেকেন্ডে ১০০০ টোকেন গতিতে টেক্সট জেনারেট করতে পারে। মডেলটি ইমেজ জেনারেশনের মতো সমান্তরালভাবে টোকেন ডিনয়েজ করে কাজ করে।
গুগল ডিপমাইন্ড (Google DeepMind) নীরবে একটি বড় মাইলফলক স্থাপন করেছে। একই সপ্তাহে যখন অ্যানথ্রপিক (Anthropic) তাদের সবচেয়ে শক্তিশালী মডেল ক্লদ ফেবল ৫ (Claude Fable 5) চালু করেছে, তখন ডিপমাইন্ড প্রকাশ করেছে DiffusionGemma। এটি একটি ২৬ বিলিয়ন প্যারামিটার (26-billion-parameter) ওপেন-ওয়েট মডেল।
মডেলটি টেক্সট জেনারেট করে ইমেজ মডেলের মতো করে। অর্থাৎ এটি টোকেনগুলোকে একের পর এক প্রেডিক্ট না করে পুরো ক্যানভাসকে সমান্তরালভাবে ডিনয়েজ (denoising) করে। এই পদ্ধতি মডেলটিকে অসাধারণ গতি দিয়েছে। প্রতি সেকেন্ডে এটি ১০০০ টোকেন (1000 tokens per second) জেনারেট করতে পারে।
প্রথাগত বড় ভাষার মডেল (LLM) টেক্সট জেনারেট করে একের পর এক টোকেন প্রেডিক্ট করে। এই প্রক্রিয়ায় ধাপে ধাপে সময় লাগে। DiffusionGemma পুরো টেক্সট ক্যানভাস একসঙ্গে নিয়ে নয়েজ দূর করে। এটি ইমেজ জেনারেশনের ডিফিউশন মডেলের মতো কাজ করে। ফলে গতি অনেক বেড়ে যায়।
মডেলটির আর্কিটেকচার এবং প্রশিক্ষণ পদ্ধতি এখনো পুরোপুরি প্রকাশিত হয়নি। তবে ডিপমাইন্ড জানিয়েছে যে এটি তাদের জেমা (Gemma) পরিবারের একটি নতুন সংযোজন। ওপেন-ওয়েট হওয়ায় ডেভেলপাররা মডেলটি ডাউনলোড করে নিজেদের হার্ডওয়্যরে চালাতে পারবেন। এটি গবেষণা এবং অ্যাপ্লিকেশন তৈরির জন্য বড় সুযোগ তৈরি করবে।
বাংলাদেশের ডেভেলপার এবং ফ্রিল্যান্সারদের জন্য এই মডেল বিশেষ গুরুত্ব বহন করে। ওপেন-ওয়েট মডেল হওয়ায় এটি ক্লাউড API-এর ওপর নির্ভরতা কমিয়ে দেবে। ডেভেলপাররা নিজেদের GPU বা ল্যাপটপে মডেলটি চালিয়ে রিয়েল-টাইম অ্যাপ্লিকেশন তৈরি করতে পারবেন। চ্যাটবট, কন্টেন্ট জেনারেশন, এবং অটোমেশন টুল তৈরিতে এটি দ্রুত ও সাশ্রয়ী সমাধান দেবে।
তবে মডেলটির সীমাবদ্ধতাও আছে। ২৬ বিলিয়ন প্যারামিটার চালানোর জন্য শক্তিশালী হার্ডওয়্যার প্রয়োজন। সাধারণ ল্যাপটপে এটি চালানো সম্ভব নাও হতে পারে। তবুও ক্লাউড রিসোর্স বা কমিউনিটি GPU-তে এটি ব্যবহার করা যাবে।
ডিপমাইন্ডের এই পদক্ষেপ দেখায় যে ওপেন-ওয়েট মডেলের ভবিষ্যৎ উজ্জ্বল। আগামী দিনে আরও দ্রুত এবং সাশ্রয়ী মডেল আসবে। ডেভেলপারদের জন্য এটি নতুন দিগন্ত খুলে দিয়েছে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to ML
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...