১৫ গুণ দ্রুত AI! ব্ল্যাকওয়েলে DFlash আনছে ইউসি সান ডিয়েগো
ইউসি সান ডিয়েগোর গবেষকরা DFlash নামের একটি নতুন পদ্ধতি তৈরি করেছে। এটি বড় ভাষার মডেলের অনুমান প্রক্রিয়াকে ১৫ গুণ পর্যন্ত দ্রুত করতে পারে। NVIDIA-র ব্ল্যাকওয়েল আর্কিটেকচারে এই প্রযুক্তি পরীক্ষা করে দেখা হয়েছে।
ইউসি সান ডিয়েগোর গবেষকরা DFlash নামের একটি নতুন পদ্ধতি তৈরি করেছে। এটি বড় ভাষার মডেলের অনুমান প্রক্রিয়াকে ১৫ গুণ পর্যন্ত দ্রুত করতে পারে। NVIDIA-র ব্ল্যাকওয়েল আর্কিটেকচারে এই প্রযুক্তি পরীক্ষা করে দেখা হয়েছে।
ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, সান ডিয়েগোর গবেষকরা একটি নতুন পদ্ধতি তৈরি করেছে যা বড় ভাষার মডেলের (LLM) গতি নাটকীয়ভাবে বাড়িয়ে দিতে পারে। DFlash নামের এই পদ্ধতি বর্তমানের ধীরগতির টোকেন তৈরির প্রক্রিয়াকে পুরোপুরি বদলে দিচ্ছে। এটি সরাসরি একটি সম্পূর্ণ টোকেন ব্লককে একবারেই তৈরি করে ফেলতে পারে।
DFlash-এর মূল উদ্ভাবন হলো এটি একটি লাইটওয়েট ব্লক ডিফিউশন মডেল ব্যবহার করে। সাধারণ স্পেকুলেটিভ ডিকোডিং পদ্ধতি একটির পর একটি টোকেন তৈরি করে। কিন্তু DFlash একটি সম্পূর্ণ ব্লককে সমান্তরালভাবে (parallel) ড্রাফট করে। এই কারণে এটি প্রতি ফরওয়ার্ড পাসে পুরো একটি টোকেন ব্লক তৈরি করতে পারে।
গবেষণাপত্রে জানানো হয়েছে, DFlash Qwen3-8B মডেলে 6.08 গুণ পর্যন্ত লসলেস স্পিডআপ অর্জন করেছে। অন্যদিকে, NVIDIA তাদের ব্ল্যাকওয়েল আর্কিটেকচারে এই পদ্ধতি পরীক্ষা করে দেখেছে যে নির্দিষ্ট ইন্টারঅ্যাকটিভিটি লেভেলে থ্রুপুট ১৫ গুণ পর্যন্ত বেড়ে গেছে। এর মানে হলো একই সময়ে অনেক বেশি ব্যবহারকারীকে দ্রুত সেবা দেওয়া সম্ভব হবে।
DFlash মূলত টার্গেট মডেলের হিডেন ফিচারের ওপর কন্ডিশন করে। এটি KV ইনজেকশন নামের একটি কৌশল ব্যবহার করে। এই কৌশলের মাধ্যমে ড্রাফট মডেল টার্গেট মডেলের প্রসঙ্গ সম্পর্কে আগে থেকেই জানতে পারে। ফলে ড্রাফট করা টোকেনগুলোর গ্রহণযোগ্যতা অনেক বেশি হয়।
এই প্রযুক্তি বর্তমানে তিনটি জনপ্রিয় ইনফারেন্স ইঞ্জিনের সঙ্গে কাজ করে। এগুলো হলো SGLang, vLLM এবং TensorRT-LLM। গবেষকরা ইতিমধ্যে ২০টি প্রি-ট্রেইন্ড চেকপয়েন্ট প্রকাশ করেছেন। যেকোনো ডেভেলপার এই চেকপয়েন্টগুলো ব্যবহার করে নিজেদের মডেলে DFlash প্রয়োগ করতে পারবেন।
বাংলাদেশের জন্য এই প্রযুক্তির গুরুত্ব অপরিসীম। দেশের স্টার্টআপ ও ডেভেলপাররা বর্তমানে বড় ভাষার মডেল ব্যবহার করে নানা ধরনের অ্যাপ্লিকেশন তৈরি করছে। DFlash ব্যবহার করলে তারা অনেক কম কম্পিউটিং খরচে বেশি ব্যবহারকারীকে সেবা দিতে পারবে। বিশেষ করে ফ্রিল্যান্সার ও ছোট দলের ডেভেলপারদের জন্য এটি বড় একটি সুযোগ।
ভবিষ্যতে DFlash আরও বেশি মডেল ও প্ল্যাটফর্মে সমর্থন পাওয়ার সম্ভাবনা রয়েছে। গবেষকরা ইতিমধ্যে এই পদ্ধতিকে আরও স্কেল করার পরিকল্পনা করছেন। এটি বড় ভাষার মডেলের ব্যবহারকে আরও গণতান্ত্রিক ও সাশ্রয়ী করে তুলতে পারে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: MarkTechPost
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...