AI মডেলের গতি ৩ গুণ বাড়িয়ে দেবে ইউসি সান দিয়েগোর DFlash
স্পেকুলেটিভ ডিকোডিংয়ের সবচেয়ে বড় বাধা ছিল ড্রাফটিং ধাপের সিকোয়েন্সিয়াল প্রকৃতি। ইউসি সান দিয়েগোর জেড ল্যাবের গবেষকরা ডিএফল্যাশ নামের একটি ফ্রেমওয়ার্ক তৈরি করেছেন যা অটোরিগ্রেসিভ ড্রাফটারকে ব্লক ডিফিউশন মডেল দিয়ে প্রতিস্থাপন করে। ফলে এলএলএম ইনফারেন্স অনেক দ্রুত ও দক্ষ হয়েছে।
স্পেকুলেটিভ ডিকোডিংয়ের সবচেয়ে বড় বাধা ছিল ড্রাফটিং ধাপের সিকোয়েন্সিয়াল প্রকৃতি। ইউসি সান দিয়েগোর জেড ল্যাবের গবেষকরা ডিএফল্যাশ নামের একটি ফ্রেমওয়ার্ক তৈরি করেছেন যা অটোরিগ্রেসিভ ড্রাফটারকে ব্লক ডিফিউশন মডেল দিয়ে প্রতিস্থাপন করে। ফলে এলএলএম ইনফারেন্স অনেক দ্রুত ও দক্ষ হয়েছে।
কৃত্রিম বুদ্ধিমত্তার বড় ভাষার মডেলগুলো (LLM) প্রতিটি শব্দ তৈরি করতে আগের শব্দের ওপর নির্ভর করে। এই সিকোয়েন্সিয়াল প্রক্রিয়াটি মডেলের গতি সীমিত করে দেয়। স্পেকুলেটিভ ডিকোডিং নামের একটি কৌশল এই সমস্যা সমাধানের চেষ্টা করেছিল, কিন্তু সেখানেও ড্রাফটিং ধাপটি ছিল ধীর ও সিরিয়াল।
ইউনিভার্সিটি অব ক্যালিফোর্নিয়া, সান দিয়েগোর জেড ল্যাবের গবেষকরা এই বাধা ভাঙতে ডিএফল্যাশ (DFlash) নামের একটি নতুন ফ্রেমওয়ার্ক তৈরি করেছেন। ডিএফল্যাশ অটোরিগ্রেসিভ ড্রাফটারকে সরিয়ে একটি ব্লক ডিফিউশন মডেল ব্যবহার করে। এই মডেল একসঙ্গে পুরো একটি ব্লক বা চাঙ্ক প্রস্তাব করতে পারে, যা ড্রাফটিং ধাপকে সমান্তরাল করে তোলে।
ডিএফল্যাশের মূল উদ্ভাবন হলো ব্লক ডিফিউশন। সাধারণ ডিফিউশন মডেল ছবি তৈরি করে ধাপে ধাপে নয়েজ পরিষ্কার করে। ডিএফল্যাশ একই নীতি টোকেন প্রস্তাবে প্রয়োগ করে। এটি একটি ছোট ডিফিউশন মডেলকে প্রশিক্ষণ দেয় যা দ্রুত একটি সম্পূর্ণ ব্লকের টোকেন প্রস্তাব করতে পারে। তারপর বড় টার্গেট মডেল সেই ব্লকটি সমান্তরালভাবে যাচাই করে।
এই পদ্ধতি স্পেকুলেটিভ ডিকোডিংয়ের প্রধান বাধা দূর করে। আগের পদ্ধতিতে ড্রাফটিং ধাপে প্রতি টোকেনের জন্য সময় লাগত। ডিএফল্যাশ পুরো ব্লক একবারেই তৈরি করে ফেলে। ফলে মডেলের আউটপুট স্পিড আগের চেয়ে ৩ গুণ পর্যন্ত বেড়ে যেতে পারে। গবেষকরা ডিএফল্যাশকে বিভিন্ন বড় মডেলের ওপর পরীক্ষা করেছেন এবং ফলাফল ইতিবাচক হয়েছে।
বাংলাদেশের ডেভেলপার ও এআই গবেষকদের জন্য এই খবর গুরুত্বপূর্ণ। বর্তমানে ক্লাউডে এলএলএম চালানোর খরচ অনেক বেশি। ডিএফল্যাশ দ্রুত ইনফারেন্সের মাধ্যমে প্রতি অনুরোধের সময় ও খরচ কমিয়ে দেবে। বাংলাদেশের স্টার্টআপগুলো নিজেদের চ্যাটবট বা এআই টুল তৈরি করতে এই প্রযুক্তি ব্যবহার করতে পারে। ফ্রিল্যান্সার ও শিক্ষার্থীরাও কম শক্তিশালী হার্ডওয়্যার দিয়ে বড় মডেল চালানোর সুযোগ পাবে।
ডিএফল্যাশ এখনো গবেষণার পর্যায়ে আছে। তবে জেড ল্যাবের দল ওপেন সোর্স হিসেবে কোড প্রকাশের পরিকল্পনা করছে। এটি বাংলাদেশের এআই কমিউনিটির জন্য একটি বড় সুযোগ। স্থানীয় ডেভেলপাররা এই ফ্রেমওয়ার্ক নিয়ে পরীক্ষা-নিরীক্ষা করে নিজেদের প্রজেক্টে প্রয়োগ করতে পারবেন। ভবিষ্যতে ডিএফল্যাশ এলএলএম ইনফারেন্সের মানদণ্ড বদলে দিতে পারে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to ML
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...