AI ভুলের আসল কারণ জানুন: মডেল নয়, বিষয়বস্তুই দায়ী
একটি নতুন তত্ত্ব দাবি করছে যে বড় ভাষার মডেলের (LLM) অনিশ্চয়তা বা ভুল উত্তর দেওয়ার প্রবণতা মডেল বা প্রম্পটের ওপর নয়, বরং বিষয়বস্তুর অন্তর্নিহিত বৈশিষ্ট্যের ওপর নির্ভর করে। এই তত্ত্ব হ্যালুসিনেশন, নলেজ কনফ্লিক্ট এবং ক্যালিব্রেশন failure-এর মতো পৃথক গবেষণাকে একক সূত্রে বেঁধে ফেলতে পারে।
একটি নতুন তত্ত্ব দাবি করছে যে বড় ভাষার মডেলের (LLM) অনিশ্চয়তা বা ভুল উত্তর দেওয়ার প্রবণতা মডেল বা প্রম্পটের ওপর নয়, বরং বিষয়বস্তুর অন্তর্নিহিত বৈশিষ্ট্যের ওপর নির্ভর করে। এই তত্ত্ব হ্যালুসিনেশন, নলেজ কনফ্লিক্ট এবং ক্যালিব্রেশন failure-এর মতো পৃথক গবেষণাকে একক সূত্রে বেঁধে ফেলতে পারে।
একটি যুগান্তকারী গবেষণা দাবি করছে যে বড় ভাষার মডেলের (LLM) অনিশ্চয়তা নির্ধারণ করে মডেল নয়, বরং বিষয়বস্তু নিজেই। রেডিটের r/artificial ফোরামে প্রকাশিত ‘কনভারজেন্স পয়েন্ট থিওরি’ নামক এই তত্ত্বটি এলএলএম-এর ভুল উত্তর দেওয়ার পেছনে একটি সাধারণ কারণ খুঁজে বের করার চেষ্টা করছে।
এখন পর্যন্ত হ্যালুসিনেশন, নলেজ কনফ্লিক্ট, আরএলএইচএফ-এর সীমাবদ্ধতা, প্রম্পট সেনসিটিভিটি এবং ক্যালিব্রেশন ফেইলিওর—এগুলো সবই আলাদা আলাদা সমস্যা হিসেবে গবেষণা করা হয়েছে। গবেষকরা মনে করছেন যে এই সমস্যাগুলোর মূল কারণ মডেলের ভেতরে বা ব্যবহারকারীর দেওয়া প্রম্পটে নেই। এটি বরং বিষয়বস্তুর একটি অন্তর্নিহিত বৈশিষ্ট্য যা তারা ‘কনভারজেন্স পয়েন্ট’ নাম দিয়েছেন।
কনভারজেন্স পয়েন্ট হলো সেই বিন্দু যেখানে বিভিন্ন তথ্যসূত্র এবং মডেলের প্রশিক্ষণ ডেটা মিলিত হয়। যদি কোনো বিষয়ে তথ্যের উৎসগুলো পরস্পরবিরোধী হয় বা ডেটা অপর্যাপ্ত হয়, তাহলে মডেলের পক্ষে একটি নির্দিষ্ট ও সঠিক উত্তর দেওয়া কঠিন হয়ে পড়ে। এই তত্ত্ব অনুযায়ী, মডেল যত বড়ই হোক না কেন, কোনো বিষয় যদি স্বাভাবিকভাবেই অনিশ্চিত হয়, তাহলে মডেলও সেই অনিশ্চয়তা কাটিয়ে উঠতে পারবে না।
গবেষকরা বিভিন্ন এলএলএম নিয়ে পরীক্ষা চালিয়ে দেখেছেন যে একই বিষয়ে বিভিন্ন মডেল একই ধরনের অনিশ্চয়তা দেখিয়েছে। এটি প্রমাণ করে যে অনিশ্চয়তা মডেল নির্ভর নয়, বরং বিষয় নির্ভর। উদাহরণস্বরূপ, একটি অত্যন্ত বিতর্কিত ঐতিহাসিক ঘটনা নিয়ে প্রশ্ন করলে GPT-4, Claude এবং Llama- সবাই একই ধরনের অস্পষ্ট বা ভুল উত্তর দিয়েছে।
বাংলাদেশের ডেভেলপার, গবেষক এবং ফ্রিল্যান্সারদের জন্য এই তত্ত্বের বাস্তব প্রভাব রয়েছে। যারা এলএলএম ব্যবহার করে অ্যাপ্লিকেশন তৈরি করেন, তারা এখন বুঝতে পারবেন যে কোনো নির্দিষ্ট বিষয়ে মডেলের উত্তর কেন নির্ভরযোগ্য নয়। এটি তাদেরকে আরও ভালো প্রম্পট ইঞ্জিনিয়ারিং এবং আউটপুট ভ্যালিডেশন সিস্টেম তৈরি করতে সাহায্য করবে। শিক্ষার্থীদের জন্যও এটি গুরুত্বপূর্ণ, কারণ তারা জানবেন কখন মডেলের উত্তরের ওপর পুরোপুরি নির্ভর করা উচিত নয়।
এই তত্ত্ব ভবিষ্যতে এলএলএম ডিজাইনের পদ্ধতি পরিবর্তন করতে পারে। গবেষকরা এখন মডেলের আকার বাড়ানোর পরিবর্তে প্রশিক্ষণ ডেটার গুণমান ও বৈচিত্র্যের ওপর জোর দিতে পারেন। এছাড়াও, মডেলকে ‘আমি জানি না’ বলার ক্ষমতা দেওয়ার ওপর গুরুত্ব বাড়তে পারে, যা ব্যবহারকারীদের জন্য আরও স্বচ্ছ ও বিশ্বাসযোগ্য অভিজ্ঞতা তৈরি করবে।
কনভারজেন্স পয়েন্ট থিওরি এলএলএম গবেষণার একটি নতুন দিগন্ত খুলে দিয়েছে। এটি প্রমাণ করে যে কৃত্রিম বুদ্ধিমত্তার সীমাবদ্ধতা বোঝার জন্য আমাদের মডেলের বাইরে তাকাতে হবে এবং বিষয়বস্তুর প্রকৃতি বুঝতে হবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: Reddit r/artificial
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...