AI এজেন্টের প্রকৃত দক্ষতা জানতে টোকেন বাজেট ১০ গুণ বাড়ানোর পরামর্শ
যুক্তরাজ্যের এআই সেফটি ইনস্টিটিউটের (AISI) নতুন গবেষণায় দেখা গেছে, নির্দিষ্ট কম্পিউট বাজেটের মধ্যে AI এজেন্টদের মূল্যায়ন করলে তাদের প্রকৃত ক্ষমতা ৬০% পর্যন্ত কম ধরা পড়ে। টোকেন বাজেট ১০ গুণ বাড়ালে সফটওয়্যার টাস্কে সাফল্যের হার ২৫% বেড়ে যায়।
যুক্তরাজ্যের এআই সেফটি ইনস্টিটিউটের (AISI) নতুন গবেষণায় দেখা গেছে, নির্দিষ্ট কম্পিউট বাজেটের মধ্যে AI এজেন্টদের মূল্যায়ন করলে তাদের প্রকৃত ক্ষমতা ৬০% পর্যন্ত কম ধরা পড়ে। টোকেন বাজেট ১০ গুণ বাড়ালে সফটওয়্যার টাস্কে সাফল্যের হার ২৫% বেড়ে যায়।
যুক্তরাজ্যের এআই সেফটি ইনস্টিটিউট (AISI) একটি গুরুত্বপূর্ণ গবেষণা প্রকাশ করেছে। এই গবেষণায় দেখা গেছে, নির্দিষ্ট কম্পিউট বাজেটের মধ্যে AI এজেন্টদের মূল্যায়ন করলে তাদের প্রকৃত ক্ষমতা ৬০% পর্যন্ত কম ধরা পড়ে। এই তথ্য dev.to AI সূত্রে জানা গেছে।
গবেষণায় AISI সাতটি ভিন্ন বেঞ্চমার্কে বিভিন্ন কম্পিউট বাজেট ব্যবহার করে শীর্ষস্থানীয় AI মডেল পরীক্ষা করেছে। ফলাফলে দেখা গেছে, ফিক্সড বাজেট ক্যাপ ব্যবহার করলে AI এজেন্টদের ক্ষমতা নিয়মিতভাবে কম দেখানো হয়। এই গবেষণা AI মূল্যায়নের বিদ্যমান পদ্ধতি নিয়ে নতুন প্রশ্ন তুলেছে।
গবেষণার মূল ফলাফলগুলো বেশ চমকপ্রদ। সফটওয়্যার টাস্কে টোকেন বাজেট ১০ গুণ বাড়ানোর ফলে সাফল্যের হার ২৫% বেড়েছে। সাইবারসিকিউরিটি টাস্কের প্রায় ৮% এর জন্য ১০ মিলিয়নেরও বেশি টোকেন প্রয়োজন হয়েছে। গণিতের টাস্কে ৫ মিলিয়ন টোকেন পর্যন্ত বাজেট বাড়ালে ২২% উন্নতি দেখা গেছে।
টোকেন হলো AI মডেল প্রক্রিয়াকরণের একক। প্রতিটি শব্দ বা অক্ষর একটি টোকেন হিসেবে গণ্য হয়। যখন একটি AI এজেন্টকে জটিল কাজ করতে হয়, তখন তার বেশি টোকেন প্রয়োজন হয়। বর্তমান বেঞ্চমার্কগুলো এই প্রয়োজনীয়তা বিবেচনায় নেয় না।
এই গবেষণা বাংলাদেশের ডেভেলপার এবং ফ্রিল্যান্সারদের জন্য বিশেষ গুরুত্ব বহন করে। বাংলাদেশে AI এবং অটোমেশন টুল ব্যবহার করে সফটওয়্যার ডেভেলপমেন্ট ও সাইবারসিকিউরিটি কাজ করছে অনেক প্রতিষ্ঠান। এই গবেষণা দেখায় যে, বর্তমান বেঞ্চমার্কের ওপর নির্ভর করে AI টুল নির্বাচন করলে প্রকৃত ক্ষমতা বুঝতে ভুল হতে পারে।
বাংলাদেশের শিক্ষার্থী ও গবেষকদের জন্যও এই তথ্য গুরুত্বপূর্ণ। AI এজেন্ট নিয়ে কাজ করার সময় তাদের কম্পিউট বাজেটের সীমা সম্পর্কে সচেতন থাকতে হবে। বেশি জটিল কাজের জন্য পর্যাপ্ত টোকেন বরাদ্দ না করলে AI এজেন্টের প্রকৃত সক্ষমতা অর্জন সম্ভব নয়।
AISI এর এই গবেষণা AI নিরাপত্তা ও মূল্যায়নের ক্ষেত্রে নতুন দিগন্ত খুলে দিয়েছে। ভবিষ্যতে আরও বাস্তবসম্মত বেঞ্চমার্ক তৈরি করা প্রয়োজন যেখানে কম্পিউট বাজেটের সীমা শিথিল থাকবে। তবেই AI এজেন্টদের প্রকৃত ক্ষমতা সঠিকভাবে মূল্যায়ন করা সম্ভব হবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to AI
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...