AI-এর ভুল ধরা এখন সহজ, নতুন পদ্ধতি দেবে সঠিক উত্তর
গবেষকরা দেখেছেন, বড় ভাষার মডেল (LLM) সঠিক ও ভুল উত্তরের মধ্যে পার্থক্য করতে পারে, কিন্তু সরাসরি জিজ্ঞাসা করলে ৯৯% আত্মবিশ্বাস দেখায়। একটি নতুন ফাইন-টিউনিং পদ্ধতি মডেলটিকে তার প্রকৃত জ্ঞান প্রকাশ করতে শেখায়।
গবেষকরা দেখেছেন, বড় ভাষার মডেল (LLM) সঠিক ও ভুল উত্তরের মধ্যে পার্থক্য করতে পারে, কিন্তু সরাসরি জিজ্ঞাসা করলে ৯৯% আত্মবিশ্বাস দেখায়। একটি নতুন ফাইন-টিউনিং পদ্ধতি মডেলটিকে তার প্রকৃত জ্ঞান প্রকাশ করতে শেখায়।
বড় ভাষার মডেল (LLM) তার ভেতরে সঠিক ও ভুল উত্তরের মধ্যে পার্থক্য করতে পারে, কিন্তু সরাসরি জিজ্ঞাসা করলে প্রায় সব ক্ষেত্রেই ৯৯% আত্মবিশ্বাস দেখায়। Reddit-এর r/MachineLearning ফোরামে প্রকাশিত এক গবেষণায় এই সমস্যার সমাধান পাওয়া গেছে। গবেষকরা একটি নতুন পদ্ধতি তৈরি করেছেন, যার নাম প্রোব-টার্গেটেড ফাইন-টিউনিং।
এই গবেষণায় দেখা গেছে, ইনস্ট্রাক্ট-টিউন করা LLM-এর লুকানো স্তর (hidden states) পরীক্ষা করলে মডেলটি ০.৭৬ থেকে ০.৮৮ AUROC স্কোর নিয়ে সঠিক ও ভুল উত্তর শনাক্ত করতে পারে। AUROC হলো একটি পরিসংখ্যানিক মাপকাঠি যা মডেলের ভবিষ্যদ্বাণীর নির্ভুলতা বোঝায়। কিন্তু মডেলটিকে যখন সরাসরি জিজ্ঞাসা করা হয়, তখন এটি প্রায় ৯৯% আত্মবিশ্বাস নিয়ে উত্তর দেয়, এমনকি ভুল উত্তরেও।
গবেষকরা সমস্যার মূল চিহ্নিত করেছেন। মডেলটি ভেতরে জানে যে উত্তরটি সঠিক নাকি ভুল, কিন্তু তা প্রকাশ করে না। এই সমস্যা সমাধানের জন্য তারা একটি বিশেষ কৌশল ব্যবহার করেছেন। তারা প্রথমে মডেলের লুকানো স্তর থেকে একটি প্রোব (probe) তৈরি করেছেন। প্রোব হলো একটি ছোট নিউরাল নেটওয়ার্ক যা মডেলের অভ্যন্তরীণ অবস্থা পড়তে পারে।
তারপর তারা এই প্রোবের আউটপুটকে ফাইন-টিউনিংয়ের টার্গেট হিসেবে ব্যবহার করেছেন। এই পদ্ধতিতে তারা LoRa (Low-Rank Adaptation) নামক একটি কৌশল প্রয়োগ করেছেন। LoRa হলো একটি হালকা ফাইন-টিউনিং পদ্ধতি যা সম্পূর্ণ মডেল পরিবর্তন না করেই নির্দিষ্ট অংশ আপডেট করে। ফলস্বরূপ, মডেলটি তার প্রকৃত জ্ঞান মৌখিকভাবে প্রকাশ করতে শিখেছে।
এই গবেষণার সবচেয়ে বড় সাফল্য হলো মডেলের আত্মবিশ্বাসের ক্রমাঙ্কন (calibration)। আগের চেয়ে মডেলটি এখন অনেক বেশি বাস্তবসম্মত আত্মবিশ্বাসের মাত্রা দেখায়। উদাহরণস্বরূপ, যদি মডেলটি ৭০% আত্মবিশ্বাস নিয়ে কোনো উত্তর দেয়, তাহলে সেটি সত্যিই ৭০% সময় সঠিক হয়। এটি ব্যবহারকারীদের জন্য অত্যন্ত গুরুত্বপূর্ণ, কারণ তারা এখন জানতে পারবেন কখন মডেলের উত্তর বিশ্বাস করা উচিত।
বাংলাদেশের প্রযুক্তি ও AI সম্প্রদায়ের জন্য এই গবেষণার বিশেষ তাৎপর্য রয়েছে। বাংলাদেশে ফ্রিল্যান্সার, ডেভেলপার ও গবেষকরা বিভিন্ন AI সরঞ্জাম ব্যবহার করেন। এই পদ্ধতি তাদেরকে আরও নির্ভরযোগ্য AI অ্যাপ্লিকেশন তৈরি করতে সাহায্য করবে। বিশেষ করে শিক্ষা, স্বাস্থ্য ও ব্যবসায়িক সিদ্ধান্ত গ্রহণের ক্ষেত্রে মডেলের আত্মবিশ্বাসের সঠিক মাত্রা জানা অত্যন্ত জরুরি।
ভবিষ্যতে এই পদ্ধতি আরও উন্নত করা সম্ভব। গবেষকরা মনে করছেন, বড় মডেলগুলোর জন্য এই কৌশল আরও স্কেল করা যেতে পারে। এছাড়া বিভিন্ন ভাষা ও ডোমেনের জন্য আলাদাভাবে প্রোব তৈরি করা সম্ভব। এই গবেষণা AI-এর স্বচ্ছতা ও বিশ্বাসযোগ্যতা বাড়ানোর একটি গুরুত্বপূর্ণ পদক্ষেপ।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: Reddit r/MachineLearning
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...