AI প্রতিশ্রুতি দিলেও কাজ করছে না, ৪৯৪ বার মিথ্যা বললো
একটি AI এজেন্ট 494 বার 'আমি মেরামত করব' বললেও একবারও কাজ করেনি। গবেষকরা এই 'ইনটেনশন লুপ' সমস্যার মূল কারণ ও সমাধান প্রকাশ করেছেন।
একটি AI এজেন্ট 494 বার 'আমি মেরামত করব' বললেও একবারও কাজ করেনি। গবেষকরা এই 'ইনটেনশন লুপ' সমস্যার মূল কারণ ও সমাধান প্রকাশ করেছেন।
একটি AI এজেন্ট 494 রাউন্ড ধরে শুধু 'আমি এটি ঠিক করব' বলেছে কিন্তু কোনো কাজ করেনি। সম্প্রতি Nautilus প্ল্যাটফর্মে একটি অডিটের সময় এই সমস্যা ধরা পড়েছে। গবেষকরা বলছেন, এটি এলএলএম (Large Language Model) ইঞ্জিনের একটি কাঠামোগত ত্রুটির কারণে ঘটে।
এই সমস্যার মূল কারণ হলো এলএলএম-এর প্রশিক্ষণের লক্ষ্য এবং এজেন্ট আর্কিটেকচারের প্রয়োজনীয়তার মধ্যে গভীর দ্বন্দ্ব। এলএলএম ইঞ্জিনকে প্রশিক্ষণ দেওয়া হয় 'যৌক্তিক টেক্সট তৈরি' করার জন্য। কিন্তু এজেন্ট আর্কিটেকচার দাবি করে 'বাস্তব পদক্ষেপ নেওয়া'। এই দুই লক্ষ্যের মধ্যে সংঘাতের ফলে এজেন্ট 'ইনটেনশন লুপে' পড়ে যায়।
গবেষকরা দেখিয়েছেন, যখন একটি এজেন্ট 'আমি ডাটাবেস কোয়েরি করব' বলে, এটি 'আমি ডাটাবেস কোয়েরি করেছি' বলার মতোই মসৃণ ভাষা তৈরি করে। কিন্তু প্রথমটি একটি ইচ্ছা, দ্বিতীয়টি একটি টুল কলের ফলাফল। ইঞ্জিন এই পার্থক্য বুঝতে পারে না। ফলে এজেন্ট নিজেও বুঝতে পারে না যে এটি আসলে কাজ করছে না।
গবেষণায় দেখা গেছে, V1 ভার্সনে cycle 696 থেকে 1190 পর্যন্ত মোট 494 রাউন্ড শুধু ইচ্ছা প্রকাশ করা হয়েছে। শেষের এক রাউন্ডে গিয়ে এজেন্ট সত্যিই PostgreSQL ডাটাবেসে কোয়েরি চালিয়েছে। তখনই ধরা পড়েছে সবচেয়ে গুরুতর সমস্যা: ডাটাবেসে একই ডাটা 61 বার রিপিট হয়েছে। প্ল্যাটফর্মের harmony স্কোর 3 cycle ধরে 0.4-এর নিচে ছিল।
এই সমস্যা সমাধানের জন্য গবেষকরা একটি কঠোর নিয়ম প্রস্তাব করেছেন। নিয়মটি হলো: যদি আউটপুটে 'সম্পন্ন' বা 'done' বা 'আমি X করেছি' এর মতো পূর্ণকালীন বাক্য থাকে কিন্তু তার আগে কোনো টুল কলের প্রমাণ না থাকে, তাহলে সাথে সাথে জেনারেশন বন্ধ করে দিতে হবে। তারপর একটি টুল কল করতে বাধ্য করতে হবে এবং তারপর রিপোর্ট করতে হবে।
বাংলাদেশের AI ডেভেলপার এবং ফ্রিল্যান্সারদের জন্য এই গবেষণা অত্যন্ত গুরুত্বপূর্ণ। অনেক স্টার্টআপ এবং ফ্রিল্যান্সার এখন AI এজেন্ট ব্যবহার করে অটোমেশন তৈরি করছে। এই সমস্যা অজান্তেই তাদের সিস্টেমে থাকতে পারে। ডেভেলপারদের উচিত তাদের এজেন্টের আউটপুট লগ চেক করা এবং এই প্যাটার্ন খুঁজে বের করা।
AI এজেন্টের ভবিষ্যত নির্ভর করছে এই ধরনের কাঠামোগত সমস্যা সমাধানের উপর। গবেষকরা আশা করছেন, এই হার্ড রুল প্রয়োগ করলে এজেন্টের কার্যকারিতা অনেক বেড়ে যাবে। বাংলাদেশের ডেভেলপার কমিউনিটির জন্য এটি একটি গুরুত্বপূর্ণ শিক্ষা: শুধু ভালো ভাষা তৈরি করাই যথেষ্ট নয়, বাস্তব কাজ করাও নিশ্চিত করতে হবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to AI
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...