Claude Opus 4.8-এ টুল কল ব্যর্থ, AI নির্ভরযোগ্যতা নিয়ে প্রশ্ন
Anthropic-এর সর্বশেষ Claude Opus 4.8 মডেল টুল কল করার সময় অতিরিক্ত ও অবৈধ ফিল্ড তৈরি করছে। এই সমস্যার কারণে সঠিক এডিট করলেও টুল কল ব্যর্থ হচ্ছে, যা AI-এর নির্ভরযোগ্যতার ওপর নতুন প্রশ্ন তুলেছে।
Anthropic-এর সর্বশেষ Claude Opus 4.8 মডেল টুল কল করার সময় অতিরিক্ত ও অবৈধ ফিল্ড তৈরি করছে। এই সমস্যার কারণে সঠিক এডিট করলেও টুল কল ব্যর্থ হচ্ছে, যা AI-এর নির্ভরযোগ্যতার ওপর নতুন প্রশ্ন তুলেছে।
Anthropic তাদের সর্বশেষ Claude Opus 4.8 মডেল প্রকাশ করেছে। কিন্তু এই মডেল একটি অদ্ভুত সমস্যা তৈরি করছে। নতুন মডেলটি টুল কল করার সময় অতিরিক্ত ও অবৈধ ফিল্ড তৈরি করছে। ফলে টুল কলগুলো সঠিক হলেও সেগুলো প্রত্যাখ্যাত হচ্ছে।
ডেভেলপার Armin Pi প্রকল্পে কাজ করার সময় এই সমস্যা খুঁজে পেয়েছেন। তিনি জানিয়েছেন যে Claude Opus 4.8 edit টুল কল করার সময় nested edits[] অ্যারেতে অতিরিক্ত ফিল্ড যোগ করছে। এই ফিল্ডগুলো মডেল নিজেই তৈরি করছে। এগুলো কোনো স্কিমার অংশ নয়।
এই সমস্যা শুধু ছোট মডেলের জন্য নয়। এটি ঘটছে সবচেয়ে উন্নত মডেল Opus 4.8-এর ক্ষেত্রে। এডিট নিজে সাধারণত সঠিক থাকে। কিন্তু আর্গুমেন্টগুলো স্কিমার সাথে মেলে না। কারণ মডেল তৈরি করছে মেড-আপ কী। Pi তখন টুল কল প্রত্যাখ্যান করে আবার চেষ্টা করতে বলে।
Simon Willison এই ঘটনা নিয়ে একটি ব্লগ পোস্ট লিখেছেন। তিনি বলেছেন যে এটি মডেল-জেনারেটেড স্ট্রাকচার্ড আউটপুটের নির্ভরযোগ্যতা নিয়ে প্রশ্ন তোলে। ভালো মডেল আসলে টুলের পারফরম্যান্স খারাপ করে দিচ্ছে। এটি একটি আয়রনিক পরিস্থিতি।
এই সমস্যার মূল কারণ হলো মডেলের প্রশিক্ষণ ডেটা। মডেলগুলো অনেক বেশি ফ্রি-টেক্সট ডেটা দেখে প্রশিক্ষিত হয়। ফলে তারা কখনো কখনো স্কিমার বাইরে গিয়ে অতিরিক্ত তথ্য যোগ করে। এটি স্ট্রাকচার্ড আউটপুটের জন্য বড় সমস্যা। কারণ স্ট্রাকচার্ড আউটপুটে প্রতিটি ফিল্ডের নির্দিষ্ট নাম ও টাইপ থাকে।
বাংলাদেশের ডেভেলপার ও ফ্রিল্যান্সারদের জন্য এই খবর গুরুত্বপূর্ণ। যারা AI টুল ব্যবহার করে অ্যাপ্লিকেশন তৈরি করেন, তাদের এই সমস্যা বুঝতে হবে। বিশেষ করে যারা Pi-এর মতো টুল ব্যবহার করেন, তাদের অতিরিক্ত ভ্যালিডেশন যোগ করতে হবে। টুল কলের আগে আর্গুমেন্ট চেক করা জরুরি।
ভবিষ্যতে মডেল নির্মাতাদের এই সমস্যা সমাধান করতে হবে। একটি উপায় হলো টুল কলের জন্য আলাদা প্রশিক্ষণ দেওয়া। আরেকটি উপায় হলো আউটপুটে কঠোর স্কিমা ভ্যালিডেশন প্রয়োগ করা। যতক্ষণ না এই সমস্যার সমাধান হয়, ডেভেলপারদের সতর্ক থাকতে হবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: Simon Willison
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...