DiffusionGemma কীভাবে কাজ করে?

এটি ইমেজ জেনারেশনের ডিফিউশন মডেলের মতো টেক্সট জেনারেট করে। পুরো টেক্সট ক্যানভাসকে একসঙ্গে ডিনয়েজ করে সমান্তরালভাবে টোকেন তৈরি করে, যা ঐতিহ্যবাহী মডেলের চেয়ে অনেক দ্রুত।

মডেলটি কী বিনামূল্যে ব্যবহার করা যাবে?

হ্যাঁ, এটি ওপেন-ওয়েট মডেল। ডেভেলপাররা ডিপমাইন্ডের অফিসিয়াল রিপোজিটরি থেকে মডেলটি ডাউনলোড করে নিজেদের হার্ডওয়্যরে চালাতে পারবেন।

বাংলাদেশের ডেভেলপাররা কীভাবে এটি ব্যবহার করতে পারবেন?

তারা মডেলটি ডাউনলোড করে ক্লাউড GPU বা স্থানীয় শক্তিশালী কম্পিউটারে চালিয়ে চ্যাটবট, কন্টেন্ট জেনারেশন, এবং অটোমেশন টুল তৈরি করতে পারবেন। এটি API নির্ভরতা কমিয়ে সাশ্রয়ী সমাধান দেবে।

হোম/নিউজ/মডেল

মডেল৫ মিনিট পড়া

Google DeepMind-এর নতুন মডেল DiffusionGemma: প্রতি সেকেন্ডে ১০০০ টোকেন গতি, ফ্রিল্যান্সারদের জন্য বড় সুযোগ

Google DeepMind নতুন ওপেন-ওয়েট মডেল DiffusionGemma প্রকাশ করেছে। এটি ২৬ বিলিয়ন প্যারামিটার নিয়ে প্রতি সেকেন্ডে ১০০০ টোকেন গতিতে টেক্সট জেনারেট করতে পারে। মডেলটি ইমেজ জেনারেশনের মতো সমান্তরালভাবে টোকেন ডিনয়েজ করে কাজ করে।

সম্পাদকীয় টিম

স্টাফ রিপোর্টার · ৪৫ দিন আগে · সূত্র: dev.to ML

Google DeepMind-এর নতুন মডেল DiffusionGemma: প্রতি সেকেন্ডে ১০০০ টোকেন গতি, ফ্রিল্যান্সারদের জন্য বড় সুযোগ

গুগল ডিপমাইন্ড (Google DeepMind) নীরবে একটি বড় মাইলফলক স্থাপন করেছে। একই সপ্তাহে যখন অ্যানথ্রপিক (Anthropic) তাদের সবচেয়ে শক্তিশালী মডেল ক্লদ ফেবল ৫ (Claude Fable 5) চালু করেছে, তখন ডিপমাইন্ড প্রকাশ করেছে DiffusionGemma। এটি একটি ২৬ বিলিয়ন প্যারামিটার (26-billion-parameter) ওপেন-ওয়েট মডেল।

মডেলটি টেক্সট জেনারেট করে ইমেজ মডেলের মতো করে। অর্থাৎ এটি টোকেনগুলোকে একের পর এক প্রেডিক্ট না করে পুরো ক্যানভাসকে সমান্তরালভাবে ডিনয়েজ (denoising) করে। এই পদ্ধতি মডেলটিকে অসাধারণ গতি দিয়েছে। প্রতি সেকেন্ডে এটি ১০০০ টোকেন (1000 tokens per second) জেনারেট করতে পারে।

প্রথাগত বড় ভাষার মডেল (LLM) টেক্সট জেনারেট করে একের পর এক টোকেন প্রেডিক্ট করে। এই প্রক্রিয়ায় ধাপে ধাপে সময় লাগে। DiffusionGemma পুরো টেক্সট ক্যানভাস একসঙ্গে নিয়ে নয়েজ দূর করে। এটি ইমেজ জেনারেশনের ডিফিউশন মডেলের মতো কাজ করে। ফলে গতি অনেক বেড়ে যায়।

মডেলটির আর্কিটেকচার এবং প্রশিক্ষণ পদ্ধতি এখনো পুরোপুরি প্রকাশিত হয়নি। তবে ডিপমাইন্ড জানিয়েছে যে এটি তাদের জেমা (Gemma) পরিবারের একটি নতুন সংযোজন। ওপেন-ওয়েট হওয়ায় ডেভেলপাররা মডেলটি ডাউনলোড করে নিজেদের হার্ডওয়্যরে চালাতে পারবেন। এটি গবেষণা এবং অ্যাপ্লিকেশন তৈরির জন্য বড় সুযোগ তৈরি করবে।

বাংলাদেশের ডেভেলপার এবং ফ্রিল্যান্সারদের জন্য এই মডেল বিশেষ গুরুত্ব বহন করে। ওপেন-ওয়েট মডেল হওয়ায় এটি ক্লাউড API-এর ওপর নির্ভরতা কমিয়ে দেবে। ডেভেলপাররা নিজেদের GPU বা ল্যাপটপে মডেলটি চালিয়ে রিয়েল-টাইম অ্যাপ্লিকেশন তৈরি করতে পারবেন। চ্যাটবট, কন্টেন্ট জেনারেশন, এবং অটোমেশন টুল তৈরিতে এটি দ্রুত ও সাশ্রয়ী সমাধান দেবে।

তবে মডেলটির সীমাবদ্ধতাও আছে। ২৬ বিলিয়ন প্যারামিটার চালানোর জন্য শক্তিশালী হার্ডওয়্যার প্রয়োজন। সাধারণ ল্যাপটপে এটি চালানো সম্ভব নাও হতে পারে। তবুও ক্লাউড রিসোর্স বা কমিউনিটি GPU-তে এটি ব্যবহার করা যাবে।

ডিপমাইন্ডের এই পদক্ষেপ দেখায় যে ওপেন-ওয়েট মডেলের ভবিষ্যৎ উজ্জ্বল। আগামী দিনে আরও দ্রুত এবং সাশ্রয়ী মডেল আসবে। ডেভেলপারদের জন্য এটি নতুন দিগন্ত খুলে দিয়েছে।

Google DeepMind-এর নতুন মডেল DiffusionGemma: প্রতি সেকেন্ডে ১০০০ টোকেন গতি, ফ্রিল্যান্সারদের জন্য বড় সুযোগ

আরও পড়ুন

AI নিউজ সরাসরি ইমেইলে পান

মন্তব্য০