Next-Latent Prediction (NextLat) কী?

এটি মাইক্রোসফট রিসার্চের একটি নতুন সেলফ-সুপারভাইজড লার্নিং পদ্ধতি যা ট্রান্সফরমার মডেলকে নিজের পরবর্তী অভ্যন্তরীণ অবস্থা অনুমান করতে শেখায়। এর ফলে মডেল একটি কম্প্যাক্ট ওয়ার্ল্ড মডেল তৈরি করে যা যুক্তি ও পরিকল্পনার কাজে ব্যবহার করা যায়।

NextLat কীভাবে ইনফারেন্সের গতি বাড়ায়?

NextLat সেলফ-স্পেকুলেটিভ ডিকোডিং কৌশল ব্যবহার করে। এতে মডেল প্রথমে তার নিজের লেটেন্ট স্টেট প্রেডিকশন থেকে দ্রুত একাধিক সম্ভাব্য আউটপুট তৈরি করে এবং পরে সেগুলো যাচাই করে। এই প্রক্রিয়া প্রচলিত পদ্ধতির চেয়ে ৩.৩ গুণ পর্যন্ত দ্রুত।

বাংলাদেশের ডেভেলপাররা কীভাবে NextLat থেকে উপকৃত হতে পারে?

NextLat মডেলকে আরও কার্যকর করে, ফলে কম শক্তির কম্পিউটারেও উন্নত AI মডেল চালানো সম্ভব। বাংলাদেশের গবেষক, ফ্রিল্যান্সার ও স্টার্টআপরা এই পদ্ধতি ব্যবহার করে নিজেদের প্রয়োজন অনুযায়ী ছোট ও দ্রুত AI মডেল তৈরি করতে পারে।

হোম/নিউজ/রিসার্চ

রিসার্চ৫ মিনিট পড়া

মাইক্রোসফটের নতুন AI পদ্ধতি NextLat, ইনফারেন্স ৩.৩ গুণ দ্রুত করবে

মাইক্রোসফট রিসার্চ নতুন সেলফ-সুপারভাইজড লার্নিং পদ্ধতি Next-Latent Prediction (NextLat) চালু করেছে। এটি ট্রান্সফরমারকে নিজের পরবর্তী লেটেন্ট স্টেট অনুমান করতে শেখায়, ফলে মডেল ছোট ও দ্রুত হয় এবং ইনফারেন্স ৩.৩ গুণ পর্যন্ত গতি পায়।

সম্পাদকীয় টিম

স্টাফ রিপোর্টার · ৪৬ দিন আগে · সূত্র: Reddit r/MachineLearning

মাইক্রোসফটের নতুন AI পদ্ধতি NextLat, ইনফারেন্স ৩.৩ গুণ দ্রুত করবে

মাইক্রোসফট রিসার্চ একটি যুগান্তকারী গবেষণাপত্র প্রকাশ করেছে যেখানে তারা Next-Latent Prediction বা NextLat নামের একটি নতুন সেলফ-সুপারভাইজড লার্নিং পদ্ধতি উপস্থাপন করেছে। এই পদ্ধতি ট্রান্সফরমার মডেলকে কেবল পরবর্তী টোকেন নয়, বরং নিজের পরবর্তী লেটেন্ট স্টেট বা অভ্যন্তরীণ অবস্থা অনুমান করতে শেখায়। গবেষণাটি সম্প্রতি Reddit-এর r/MachineLearning ফোরামে আলোচিত হয়েছে এবং প্রযুক্তি জগতে ব্যাপক সাড়া ফেলেছে।

বর্তমানের অধিকাংশ লার্জ ল্যাঙ্গুয়েজ মডেল (LLM) নেক্সট-টোকেন প্রেডিকশনের ওপর নির্ভর করে। এই পদ্ধতিতে মডেল প্রতিবার একটি করে শব্দ বা টোকেন অনুমান করে, যা দীর্ঘমেয়াদী যুক্তি ও পরিকল্পনার জন্য যথেষ্ট নয়। মাইক্রোসফটের গবেষকরা বলছেন, এই পদ্ধতি অদূরদর্শী বা মায়োপিক। NextLat এই সীমাবদ্ধতা কাটিয়ে ওঠে।

NextLat পদ্ধতিতে ট্রান্সফরমারকে প্রশিক্ষণ দেওয়া হয় যাতে এটি তার নিজের বর্তমান লেটেন্ট স্টেট থেকে পরবর্তী লেটেন্ট স্টেট অনুমান করতে পারে। লেটেন্ট স্টেট হলো মডেলের অভ্যন্তরীণ উপস্থাপনা যা এটি একটি ইনপুট প্রক্রিয়াকরণের সময় তৈরি করে। এই অভ্যন্তরীণ উপস্থাপনা অনুমান করতে শেখার মাধ্যমে মডেলটি বিশ্বের একটি কম্প্যাক্ট মডেল বা সংক্ষিপ্ত প্রতিরূপ তৈরি করতে সক্ষম হয়। এই কম্প্যাক্ট ওয়ার্ল্ড মডেল জটিল যুক্তি ও পরিকল্পনার কাজে ব্যবহার করা যায়।

গবেষণাপত্র অনুযায়ী, NextLat প্রশিক্ষিত মডেল সেলফ-স্পেকুলেটিভ ডিকোডিং নামের একটি কৌশল ব্যবহার করে ইনফারেন্সের সময় ৩.৩ গুণ পর্যন্ত দ্রুত কাজ করতে পারে। সেলফ-স্পেকুলেটিভ ডিকোডিংয়ে মডেল প্রথমে তার নিজের লেটেন্ট স্টেট প্রেডিকশন ব্যবহার করে দ্রুত একাধিক সম্ভাব্য আউটপুট তৈরি করে এবং পরে সেগুলো যাচাই করে। এই প্রক্রিয়া প্রচলিত অটোরিগ্রেসিভ ডিকোডিংয়ের চেয়ে অনেক বেশি কার্যকর।

বাংলাদেশের কৃত্রিম বুদ্ধিমত্তা গবেষক, ডেভেলপার ও ফ্রিল্যান্সারদের জন্য এই গবেষণা বিশেষ গুরুত্বপূর্ণ। বর্তমানে বড় ভাষার মডেল চালানোর জন্য অত্যন্ত শক্তিশালী GPU প্রয়োজন, যা বাংলাদেশের অনেক গবেষকের জন্য সীমিত। NextLat পদ্ধতি মডেলকে আরও কার্যকর করে তোলে, ফলে তুলনামূলকভাবে কম শক্তির কম্পিউটারেও উন্নত AI মডেল চালানো সম্ভব হবে। বাংলাদেশের স্টার্টআপ ও প্রযুক্তি কোম্পানিগুলো এই পদ্ধতি ব্যবহার করে নিজেদের চাহিদামাফিক ছোট ও দ্রুত AI মডেল তৈরি করতে পারে।

বাংলাদেশের বিশ্ববিদ্যালয়ের শিক্ষার্থী ও গবেষকরা NextLat পদ্ধতি ব্যবহার করে ভাষা প্রক্রিয়াকরণ, ইমেজ জেনারেশন ও রোবোটিকসের মতো ক্ষেত্রে নতুন গবেষণা করতে পারেন। এই পদ্ধতি ওপেন-সোর্স না হলেও মাইক্রোসফটের গবেষণাপত্র থেকে বিস্তারিত জানা সম্ভব। স্থানীয় AI কমিউনিটির জন্য এটি একটি বড় সুযোগ।

NextLat গবেষণা এখনও প্রাথমিক পর্যায়ে রয়েছে। মাইক্রোসফট গবেষকরা আশা করছেন ভবিষ্যতে এই পদ্ধতি আরও উন্নত হবে এবং বাণিজ্যিক AI মডেলের অংশ হয়ে উঠবে। এই পদ্ধতি AI-কে আরও মানবিক ও কার্যকর করে তুলতে পারে, কারণ এটি মডেলকে দীর্ঘমেয়াদী পরিকল্পনা ও যুক্তি করতে শেখায়।

মাইক্রোসফটের নতুন AI পদ্ধতি NextLat, ইনফারেন্স ৩.৩ গুণ দ্রুত করবে

আরও পড়ুন

AI নিউজ সরাসরি ইমেইলে পান

মন্তব্য০