মাইক্রোসফটের নতুন AI পদ্ধতি NextLat, ইনফারেন্স ৩.৩ গুণ দ্রুত করবে
মাইক্রোসফট রিসার্চ নতুন সেলফ-সুপারভাইজড লার্নিং পদ্ধতি Next-Latent Prediction (NextLat) চালু করেছে। এটি ট্রান্সফরমারকে নিজের পরবর্তী লেটেন্ট স্টেট অনুমান করতে শেখায়, ফলে মডেল ছোট ও দ্রুত হয় এবং ইনফারেন্স ৩.৩ গুণ পর্যন্ত গতি পায়।
মাইক্রোসফট রিসার্চ নতুন সেলফ-সুপারভাইজড লার্নিং পদ্ধতি Next-Latent Prediction (NextLat) চালু করেছে। এটি ট্রান্সফরমারকে নিজের পরবর্তী লেটেন্ট স্টেট অনুমান করতে শেখায়, ফলে মডেল ছোট ও দ্রুত হয় এবং ইনফারেন্স ৩.৩ গুণ পর্যন্ত গতি পায়।
মাইক্রোসফট রিসার্চ একটি যুগান্তকারী গবেষণাপত্র প্রকাশ করেছে যেখানে তারা Next-Latent Prediction বা NextLat নামের একটি নতুন সেলফ-সুপারভাইজড লার্নিং পদ্ধতি উপস্থাপন করেছে। এই পদ্ধতি ট্রান্সফরমার মডেলকে কেবল পরবর্তী টোকেন নয়, বরং নিজের পরবর্তী লেটেন্ট স্টেট বা অভ্যন্তরীণ অবস্থা অনুমান করতে শেখায়। গবেষণাটি সম্প্রতি Reddit-এর r/MachineLearning ফোরামে আলোচিত হয়েছে এবং প্রযুক্তি জগতে ব্যাপক সাড়া ফেলেছে।
বর্তমানের অধিকাংশ লার্জ ল্যাঙ্গুয়েজ মডেল (LLM) নেক্সট-টোকেন প্রেডিকশনের ওপর নির্ভর করে। এই পদ্ধতিতে মডেল প্রতিবার একটি করে শব্দ বা টোকেন অনুমান করে, যা দীর্ঘমেয়াদী যুক্তি ও পরিকল্পনার জন্য যথেষ্ট নয়। মাইক্রোসফটের গবেষকরা বলছেন, এই পদ্ধতি অদূরদর্শী বা মায়োপিক। NextLat এই সীমাবদ্ধতা কাটিয়ে ওঠে।
NextLat পদ্ধতিতে ট্রান্সফরমারকে প্রশিক্ষণ দেওয়া হয় যাতে এটি তার নিজের বর্তমান লেটেন্ট স্টেট থেকে পরবর্তী লেটেন্ট স্টেট অনুমান করতে পারে। লেটেন্ট স্টেট হলো মডেলের অভ্যন্তরীণ উপস্থাপনা যা এটি একটি ইনপুট প্রক্রিয়াকরণের সময় তৈরি করে। এই অভ্যন্তরীণ উপস্থাপনা অনুমান করতে শেখার মাধ্যমে মডেলটি বিশ্বের একটি কম্প্যাক্ট মডেল বা সংক্ষিপ্ত প্রতিরূপ তৈরি করতে সক্ষম হয়। এই কম্প্যাক্ট ওয়ার্ল্ড মডেল জটিল যুক্তি ও পরিকল্পনার কাজে ব্যবহার করা যায়।
গবেষণাপত্র অনুযায়ী, NextLat প্রশিক্ষিত মডেল সেলফ-স্পেকুলেটিভ ডিকোডিং নামের একটি কৌশল ব্যবহার করে ইনফারেন্সের সময় ৩.৩ গুণ পর্যন্ত দ্রুত কাজ করতে পারে। সেলফ-স্পেকুলেটিভ ডিকোডিংয়ে মডেল প্রথমে তার নিজের লেটেন্ট স্টেট প্রেডিকশন ব্যবহার করে দ্রুত একাধিক সম্ভাব্য আউটপুট তৈরি করে এবং পরে সেগুলো যাচাই করে। এই প্রক্রিয়া প্রচলিত অটোরিগ্রেসিভ ডিকোডিংয়ের চেয়ে অনেক বেশি কার্যকর।
বাংলাদেশের কৃত্রিম বুদ্ধিমত্তা গবেষক, ডেভেলপার ও ফ্রিল্যান্সারদের জন্য এই গবেষণা বিশেষ গুরুত্বপূর্ণ। বর্তমানে বড় ভাষার মডেল চালানোর জন্য অত্যন্ত শক্তিশালী GPU প্রয়োজন, যা বাংলাদেশের অনেক গবেষকের জন্য সীমিত। NextLat পদ্ধতি মডেলকে আরও কার্যকর করে তোলে, ফলে তুলনামূলকভাবে কম শক্তির কম্পিউটারেও উন্নত AI মডেল চালানো সম্ভব হবে। বাংলাদেশের স্টার্টআপ ও প্রযুক্তি কোম্পানিগুলো এই পদ্ধতি ব্যবহার করে নিজেদের চাহিদামাফিক ছোট ও দ্রুত AI মডেল তৈরি করতে পারে।
বাংলাদেশের বিশ্ববিদ্যালয়ের শিক্ষার্থী ও গবেষকরা NextLat পদ্ধতি ব্যবহার করে ভাষা প্রক্রিয়াকরণ, ইমেজ জেনারেশন ও রোবোটিকসের মতো ক্ষেত্রে নতুন গবেষণা করতে পারেন। এই পদ্ধতি ওপেন-সোর্স না হলেও মাইক্রোসফটের গবেষণাপত্র থেকে বিস্তারিত জানা সম্ভব। স্থানীয় AI কমিউনিটির জন্য এটি একটি বড় সুযোগ।
NextLat গবেষণা এখনও প্রাথমিক পর্যায়ে রয়েছে। মাইক্রোসফট গবেষকরা আশা করছেন ভবিষ্যতে এই পদ্ধতি আরও উন্নত হবে এবং বাণিজ্যিক AI মডেলের অংশ হয়ে উঠবে। এই পদ্ধতি AI-কে আরও মানবিক ও কার্যকর করে তুলতে পারে, কারণ এটি মডেলকে দীর্ঘমেয়াদী পরিকল্পনা ও যুক্তি করতে শেখায়।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: Reddit r/MachineLearning
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...