AI এজেন্টের টুল কল বন্ধ করে দিচ্ছে JSON-Schema, দুই ধাপেই সমাধান
গবেষকরা আবিষ্কার করেছেন যে JSON-Schema টোকেন মাস্ক LLM এজেন্টের প্রয়োজনীয় ফাংশন কল নীরবভাবে ব্লক করতে পারে। একটি হালকা দুই-পদক্ষেপ ইনফারেন্স হ্যাক এই সমস্যার সমাধান দিয়েছে, যা মডেল পুনঃপ্রশিক্ষণ ছাড়াই কাজ করে।
গবেষকরা আবিষ্কার করেছেন যে JSON-Schema টোকেন মাস্ক LLM এজেন্টের প্রয়োজনীয় ফাংশন কল নীরবভাবে ব্লক করতে পারে। একটি হালকা দুই-পদক্ষেপ ইনফারেন্স হ্যাক এই সমস্যার সমাধান দিয়েছে, যা মডেল পুনঃপ্রশিক্ষণ ছাড়াই কাজ করে।
একটি নতুন গবেষণায় দেখা গেছে যে গ্রামার-ভিত্তিক টোকেন মাস্ক এলএলএম এজেন্টের প্রয়োজনীয় ফাংশন কল নীরবভাবে ব্লক করে দিতে পারে। ডেভ টু ডট সূত্রে জানা গেছে, ইঞ্জিনিয়াররা আগে ধরে নিতেন যে JSON-Schema কনস্ট্রেইন্ট এবং টুল-কলিং API নিরাপদে একসঙ্গে কাজ করে। কিন্তু এই ধারণা ভুল প্রমাণিত হয়েছে।
এই সমস্যার সমাধান হিসেবে গবেষকরা একটি হালকা দুই-পদক্ষেপ ইনফারেন্স হ্যাক তৈরি করেছেন। এই পদ্ধতিটি মডেল পুনঃপ্রশিক্ষণ ছাড়াই কাজ করে এবং খুব সহজেই বাস্তবায়ন করা যায়। এর ফলে ডেভেলপাররা তাদের বিদ্যমান মডেল পরিবর্তন না করেই এই সমস্যা সমাধান করতে পারবেন।
সমস্যাটি মূলত JSON-Schema টোকেন মাস্কের কারণে হয়। যখন একটি এলএলএম এজেন্ট টুল কল করার সিদ্ধান্ত নেয়, মাস্কটি কিছু প্রয়োজনীয় টোকেন ব্লক করে দেয়। এর ফলে এজেন্টটি সঠিক ফাংশন কল করতে ব্যর্থ হয় এবং নীরবভাবে ভুল আউটপুট তৈরি করে। এই সমস্যাটি আগে কখনো সঠিকভাবে শনাক্ত করা যায়নি।
গবেষকদের প্রস্তাবিত দুই-পদক্ষেপ পদ্ধতিটি প্রথমে একটি প্রাথমিক ইনফারেন্স চালায়। এই ইনফারেন্সে টুল কলের প্রয়োজনীয়তা শনাক্ত করা হয়। দ্বিতীয় পদক্ষেপে, প্রয়োজনীয় টোকেনগুলি আনব্লক করে পুনরায় ইনফারেন্স চালানো হয়। এই সহজ কৌশলটি পুরো সমস্যার সমাধান করে দেয়।
বাংলাদেশের ডেভেলপার এবং ফ্রিল্যান্সারদের জন্য এই গবেষণা অত্যন্ত গুরুত্বপূর্ণ। যারা এলএলএম এজেন্ট ব্যবহার করে অটোমেশন এবং চ্যাটবট তৈরি করেন, তারা এই সমস্যায় পড়তে পারেন। নতুন এই পদ্ধতি ব্যবহার করে তারা তাদের এজেন্টের নির্ভরযোগ্যতা বাড়াতে পারবেন। বিশেষ করে যারা JSON-Schema এবং টুল-কলিং API একসঙ্গে ব্যবহার করেন, তাদের জন্য এটি একটি বড় সমাধান।
এই আবিষ্কার ভবিষ্যতে এলএলএম এজেন্টের ডিজাইন পরিবর্তন করতে পারে। গবেষকরা আশা করছেন যে এই পদ্ধতি ব্যবহার করে আরও নির্ভরযোগ্য এবং শক্তিশালী এজেন্ট তৈরি করা সম্ভব হবে। ইতিমধ্যে বেশ কিছু ওপেন সোর্স প্রকল্প এই পদ্ধতি গ্রহণ করার কথা ভাবছে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to ML
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...