NVIDIA-র X-Token: আপনার AI মডেলের নির্ভুলতা ৬ গুণ বাড়ানোর নতুন উপায়
NVIDIA-র গবেষকরা X-Token নামক একটি নতুন পদ্ধতি উদ্ভাবন করেছে যা জ্ঞান আহরণ প্রক্রিয়ায় GOLD-এর কাঠামোগত ত্রুটিগুলো দূর করে। এই পদ্ধতি Llama-3.2-1B মডেলে GSM8k নির্ভুলতা 2.56 থেকে 15.54-এ উন্নীত করেছে এবং GOLD-এর চেয়ে গড়ে 3.82 পয়েন্ট বেশি পারফর্ম করেছে।
NVIDIA-র গবেষকরা X-Token নামক একটি নতুন পদ্ধতি উদ্ভাবন করেছে যা জ্ঞান আহরণ প্রক্রিয়ায় GOLD-এর কাঠামোগত ত্রুটিগুলো দূর করে। এই পদ্ধতি Llama-3.2-1B মডেলে GSM8k নির্ভুলতা 2.56 থেকে 15.54-এ উন্নীত করেছে এবং GOLD-এর চেয়ে গড়ে 3.82 পয়েন্ট বেশি পারফর্ম করেছে।
কৃত্রিম বুদ্ধিমত্তার জগতে মডেল প্রশিক্ষণের একটি গুরুত্বপূর্ণ অংশ হলো জ্ঞান আহরণ বা Knowledge Distillation। এই প্রক্রিয়ায় একটি বড় এবং শক্তিশালী মডেল থেকে একটি ছোট এবং দ্রুত মডেলে জ্ঞান স্থানান্তর করা হয়। সম্প্রতি NVIDIA-র গবেষকরা এই ক্ষেত্রে একটি যুগান্তকারী পদ্ধতি চালু করেছে যার নাম X-Token।
X-Token পদ্ধতি GOLD নামক বিদ্যমান একটি জনপ্রিয় জ্ঞান আহরণ কৌশলের দুটি কাঠামোগত ত্রুটি সমাধান করে। GOLD পদ্ধতিতে শিক্ষক মডেলের আউটপুট এবং ছাত্র মডেলের আউটপুটের মধ্যে ভাষাগত অমিল থাকলে জ্ঞান স্থানান্তর ব্যাহত হয়। X-Token এই সমস্যা দূর করতে প্রজেকশন-গাইডেড ক্রস-টোকেনাইজার কৌশল ব্যবহার করে।
NVIDIA-র গবেষণা দল Llama-3.2-1B নামক ছোট মডেলের উপর X-Token পরীক্ষা করেছে। ফলাফল ছিল চমকপ্রদ। GSM8k নামক গণিত সমস্যা সমাধানের বেঞ্চমার্কে মডেলটির নির্ভুলতা 2.56 শতাংশ থেকে বেড়ে 15.54 শতাংশে পৌঁছেছে। এটি প্রায় 6 গুণ উন্নতি। তুলনামূলকভাবে GOLD পদ্ধতি ব্যবহার করে একই মডেলের নির্ভুলতা অনেক কম ছিল।
গবেষণাপত্রটি MarkTechPost-এ প্রকাশিত হয়েছে। সেখানে বলা হয়েছে, X-Token GOLD-এর চেয়ে গড়ে 3.82 পয়েন্ট বেশি পারফর্ম করেছে। এটি ক্রস-টোকেনাইজার জ্ঞান আহরণের ক্ষেত্রে একটি বড় অগ্রগতি। X-Token মূলত দুটি সমস্যা সমাধান করে। প্রথমত, এটি নিশ্চিত করে যে শিক্ষক এবং ছাত্র মডেলের টোকেনাইজার একই রকম আউটপুট তৈরি করে। দ্বিতীয়ত, এটি একটি প্রজেকশন স্তর ব্যবহার করে যা ছাত্র মডেলকে শিক্ষক মডেলের জ্ঞান আরও নির্ভুলভাবে শোষণ করতে সাহায্য করে।
বাংলাদেশের প্রযুক্তি খাতের জন্য এই গবেষণার গুরুত্ব অনেক। স্থানীয় স্টার্টআপ এবং ডেভেলপাররা ছোট মডেল ব্যবহার করে মোবাইল অ্যাপ বা ওয়েব অ্যাপ্লিকেশন তৈরি করে। X-Token পদ্ধতি তাদেরকে কম্পিউটেশনাল রিসোর্স কম খরচ করে উচ্চমানের AI মডেল তৈরি করতে সাহায্য করবে। ফ্রিল্যান্সার এবং শিক্ষার্থীরাও এই পদ্ধতি ব্যবহার করে নিজেদের প্রকল্পে উন্নত AI সমাধান যুক্ত করতে পারবে।
ভবিষ্যতে X-Token পদ্ধতি আরও বড় মডেল এবং বিভিন্ন ভাষায় পরীক্ষা করা হবে বলে আশা করা যায়। NVIDIA ইতিমধ্যে জানিয়েছে যে তারা এই পদ্ধতিকে ওপেন সোর্স হিসেবে প্রকাশ করার পরিকল্পনা করছে। এটি AI গবেষণার জগতে একটি নতুন দিগন্ত খুলে দেবে বলে বিশেষজ্ঞরা মনে করছেন।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: MarkTechPost
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...