গুগলের নতুন AI মডেল DiffusionGemma, টেক্সট জেনারেশনে ১০০০ টোকেন প্রতি সেকেন্ডে
গুগল ডিপমাইন্ডের নতুন মডেল DiffusionGemma টেক্সট জেনারেশনে বৈপ্লবিক পরিবর্তন এনেছে। ইমেজ জেনারেশনের ডিনয়েজিং প্রক্রিয়া ব্যবহার করে এটি প্রতি সেকেন্ডে ১০০০ টোকেন তৈরি করতে পারে। এই গতি প্রচলিত অটোরিগ্রেসিভ মডেলের চেয়ে কয়েকগুণ বেশি।
গুগল ডিপমাইন্ডের নতুন মডেল DiffusionGemma টেক্সট জেনারেশনে বৈপ্লবিক পরিবর্তন এনেছে। ইমেজ জেনারেশনের ডিনয়েজিং প্রক্রিয়া ব্যবহার করে এটি প্রতি সেকেন্ডে ১০০০ টোকেন তৈরি করতে পারে। এই গতি প্রচলিত অটোরিগ্রেসিভ মডেলের চেয়ে কয়েকগুণ বেশি।
গুগল ডিপমাইন্ড তাদের নতুন টেক্সট জেনারেশন মডেল DiffusionGemma প্রকাশ করেছে। এটি ২০২৬ সালের ১০ জুন উন্মুক্ত করা হয়। এই মডেলটি টেক্সট জেনারেশনের গতি ও দক্ষতায় এক নতুন মানদণ্ড স্থাপন করেছে।
DiffusionGemma প্রতি সেকেন্ডে ১০০০ টোকেন তৈরি করতে সক্ষম। টোকেন হলো ভাষার ক্ষুদ্রতম একক, যেমন একটি শব্দ বা অক্ষর। এই গতি প্রচলিত অটোরিগ্রেসিভ মডেলের তুলনায় কয়েকগুণ বেশি। GPT-4 বা অন্যান্য বড় ভাষার মডেল একই কাজ করতে অনেক বেশি সময় নেয়।
এই মডেলের মূল উদ্ভাবন হলো টেক্সট জেনারেশনে ইমেজ জেনারেশনের ডিনয়েজিং প্রক্রিয়া ব্যবহার করা। প্রচলিত মডেলগুলো একের পর এক টোকেন তৈরি করে, বাম থেকে ডানে। এই পদ্ধতিতে প্রতিটি টোকেন আগের টোকেনের ওপর নির্ভর করে। ফলে গতি সীমিত হয়।
DiffusionGemma সম্পূর্ণ ভিন্ন পথ বেছে নিয়েছে। এটি একটি নয়েজ বা গোলমালপূর্ণ অবস্থা থেকে শুরু করে ধীরে ধীরে সেই নয়েজ দূর করে অর্থপূর্ণ টেক্সট তৈরি করে। এই প্রক্রিয়ায় পুরো টেক্সট ব্লক একসঙ্গে তৈরি হয়। ফলে গতি অনেক বেড়ে যায়।
এই মডেল মেমোরি ব্যান্ডউইডথের সীমাবদ্ধতা অতিক্রম করেছে। অটোরিগ্রেসিভ মডেলে মেমোরি ব্যান্ডউইডথই প্রধান বাধা। DiffusionGemma সেই বাধা সরিয়ে ফেলেছে। এটি একই সঙ্গে অনেক টোকেন প্রক্রিয়া করতে পারে।
বাংলাদেশের ডেভেলপার, ফ্রিল্যান্সার ও শিক্ষার্থীদের জন্য এই মডেল বড় সুযোগ এনে দিতে পারে। দ্রুত টেক্সট জেনারেশন মানে দ্রুত কোড লেখা, দ্রুত কন্টেন্ট তৈরি এবং দ্রুত ডেটা বিশ্লেষণ। এটি চ্যাটবট, ভার্চুয়াল অ্যাসিস্ট্যান্ট এবং অটোমেশন টুল তৈরিতে বিপ্লব ঘটাতে পারে।
বাংলাদেশের স্টার্টআপ ও প্রযুক্তি প্রতিষ্ঠানগুলো এই মডেল ব্যবহার করে তাদের পণ্যের গতি ও দক্ষতা বাড়াতে পারে। ফ্রিল্যান্সাররা দ্রুত ও উন্নত মানের কন্টেন্ট তৈরি করে আন্তর্জাতিক বাজারে প্রতিযোগিতা করতে পারবেন। শিক্ষার্থীরা গবেষণা ও প্রকল্পে এই মডেল ব্যবহার করে দ্রুত ফলাফল পেতে পারেন।
গুগল ডিপমাইন্ড জানিয়েছে, DiffusionGemma এখন গবেষণার জন্য উন্মুক্ত। ভবিষ্যতে এটি বাণিজ্যিক ব্যবহারের জন্যও পাওয়া যাবে। এই মডেল টেক্সট জেনারেশনের ভবিষ্যৎ পরিবর্তন করে দেবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to ML
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...