DFlash কী এবং এটি কীভাবে কাজ করে?

DFlash হলো একটি নতুন স্পেকুলেটিভ ডিকোডিং পদ্ধতি। এটি একটি লাইটওয়েট ব্লক ডিফিউশন মডেল ব্যবহার করে সম্পূর্ণ টোকেন ব্লককে একবারেই সমান্তরালভাবে তৈরি করে। এর ফলে মডেলের অনুমান প্রক্রিয়া অনেক দ্রুত হয়।

DFlash ব্যবহার করে কত গুণ গতি বাড়ানো সম্ভব?

গবেষণায় দেখা গেছে, Qwen3-8B মডেলে এটি 6.08 গুণ পর্যন্ত লসলেস স্পিডআপ দিতে পারে। NVIDIA-র ব্ল্যাকওয়েল আর্কিটেকচারে এটি ১৫ গুণ পর্যন্ত থ্রুপুট বাড়াতে সক্ষম।

বাংলাদেশের ডেভেলপাররা কীভাবে DFlash ব্যবহার করতে পারবেন?

DFlash বর্তমানে SGLang, vLLM এবং TensorRT-LLM ইঞ্জিনকে সমর্থন করে। গবেষকরা ২০টি প্রি-ট্রেইন্ড চেকপয়েন্ট প্রকাশ করেছেন। ডেভেলপাররা এই চেকপয়েন্ট ব্যবহার করে নিজেদের মডেলে সহজেই DFlash প্রয়োগ করতে পারবেন।

হোম/নিউজ/রিসার্চ

রিসার্চ৫ মিনিট পড়া

১৫ গুণ দ্রুত AI! ব্ল্যাকওয়েলে DFlash আনছে ইউসি সান ডিয়েগো

ইউসি সান ডিয়েগোর গবেষকরা DFlash নামের একটি নতুন পদ্ধতি তৈরি করেছে। এটি বড় ভাষার মডেলের অনুমান প্রক্রিয়াকে ১৫ গুণ পর্যন্ত দ্রুত করতে পারে। NVIDIA-র ব্ল্যাকওয়েল আর্কিটেকচারে এই প্রযুক্তি পরীক্ষা করে দেখা হয়েছে।

সম্পাদকীয় টিম

স্টাফ রিপোর্টার · ৩ ঘণ্টা আগে · সূত্র: MarkTechPost

১৫ গুণ দ্রুত AI! ব্ল্যাকওয়েলে DFlash আনছে ইউসি সান ডিয়েগো

ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, সান ডিয়েগোর গবেষকরা একটি নতুন পদ্ধতি তৈরি করেছে যা বড় ভাষার মডেলের (LLM) গতি নাটকীয়ভাবে বাড়িয়ে দিতে পারে। DFlash নামের এই পদ্ধতি বর্তমানের ধীরগতির টোকেন তৈরির প্রক্রিয়াকে পুরোপুরি বদলে দিচ্ছে। এটি সরাসরি একটি সম্পূর্ণ টোকেন ব্লককে একবারেই তৈরি করে ফেলতে পারে।

DFlash-এর মূল উদ্ভাবন হলো এটি একটি লাইটওয়েট ব্লক ডিফিউশন মডেল ব্যবহার করে। সাধারণ স্পেকুলেটিভ ডিকোডিং পদ্ধতি একটির পর একটি টোকেন তৈরি করে। কিন্তু DFlash একটি সম্পূর্ণ ব্লককে সমান্তরালভাবে (parallel) ড্রাফট করে। এই কারণে এটি প্রতি ফরওয়ার্ড পাসে পুরো একটি টোকেন ব্লক তৈরি করতে পারে।

গবেষণাপত্রে জানানো হয়েছে, DFlash Qwen3-8B মডেলে 6.08 গুণ পর্যন্ত লসলেস স্পিডআপ অর্জন করেছে। অন্যদিকে, NVIDIA তাদের ব্ল্যাকওয়েল আর্কিটেকচারে এই পদ্ধতি পরীক্ষা করে দেখেছে যে নির্দিষ্ট ইন্টারঅ্যাকটিভিটি লেভেলে থ্রুপুট ১৫ গুণ পর্যন্ত বেড়ে গেছে। এর মানে হলো একই সময়ে অনেক বেশি ব্যবহারকারীকে দ্রুত সেবা দেওয়া সম্ভব হবে।

DFlash মূলত টার্গেট মডেলের হিডেন ফিচারের ওপর কন্ডিশন করে। এটি KV ইনজেকশন নামের একটি কৌশল ব্যবহার করে। এই কৌশলের মাধ্যমে ড্রাফট মডেল টার্গেট মডেলের প্রসঙ্গ সম্পর্কে আগে থেকেই জানতে পারে। ফলে ড্রাফট করা টোকেনগুলোর গ্রহণযোগ্যতা অনেক বেশি হয়।

এই প্রযুক্তি বর্তমানে তিনটি জনপ্রিয় ইনফারেন্স ইঞ্জিনের সঙ্গে কাজ করে। এগুলো হলো SGLang, vLLM এবং TensorRT-LLM। গবেষকরা ইতিমধ্যে ২০টি প্রি-ট্রেইন্ড চেকপয়েন্ট প্রকাশ করেছেন। যেকোনো ডেভেলপার এই চেকপয়েন্টগুলো ব্যবহার করে নিজেদের মডেলে DFlash প্রয়োগ করতে পারবেন।

বাংলাদেশের জন্য এই প্রযুক্তির গুরুত্ব অপরিসীম। দেশের স্টার্টআপ ও ডেভেলপাররা বর্তমানে বড় ভাষার মডেল ব্যবহার করে নানা ধরনের অ্যাপ্লিকেশন তৈরি করছে। DFlash ব্যবহার করলে তারা অনেক কম কম্পিউটিং খরচে বেশি ব্যবহারকারীকে সেবা দিতে পারবে। বিশেষ করে ফ্রিল্যান্সার ও ছোট দলের ডেভেলপারদের জন্য এটি বড় একটি সুযোগ।

ভবিষ্যতে DFlash আরও বেশি মডেল ও প্ল্যাটফর্মে সমর্থন পাওয়ার সম্ভাবনা রয়েছে। গবেষকরা ইতিমধ্যে এই পদ্ধতিকে আরও স্কেল করার পরিকল্পনা করছেন। এটি বড় ভাষার মডেলের ব্যবহারকে আরও গণতান্ত্রিক ও সাশ্রয়ী করে তুলতে পারে।

১৫ গুণ দ্রুত AI! ব্ল্যাকওয়েলে DFlash আনছে ইউসি সান ডিয়েগো

আরও পড়ুন

AI নিউজ সরাসরি ইমেইলে পান

মন্তব্য০