GPT-5.4-এ ওভার-এডিটিং: কোড ঠিক করতে 6.5 গুণ বেশি খরচ, নির্ভুলতা সমান
একটি নতুন গবেষণায় দেখা গেছে, GPT-5.4 কোড ঠিক করতে গিয়ে অপ্রয়োজনীয় পরিবর্তন করে, যার ফলে ক্লদ অপাস 4.6-এর তুলনায় 6.5 গুণ বেশি আউটপুট টোকেন উৎপন্ন করে। পাস@1 নির্ভুলতা প্রায় সমান হওয়ায় এই ওভার-এডিটিং ডেভেলপারদের জন্য অপ্রত্যাশিত বিল বাড়িয়ে দিতে পারে।
একটি নতুন গবেষণায় দেখা গেছে, GPT-5.4 কোড ঠিক করতে গিয়ে অপ্রয়োজনীয় পরিবর্তন করে, যার ফলে ক্লদ অপাস 4.6-এর তুলনায় 6.5 গুণ বেশি আউটপুট টোকেন উৎপন্ন করে। পাস@1 নির্ভুলতা প্রায় সমান হওয়ায় এই ওভার-এডিটিং ডেভেলপারদের জন্য অপ্রত্যাশিত বিল বাড়িয়ে দিতে পারে।
কৃত্রিম বুদ্ধিমত্তার জগতে কোড সম্পাদনার দক্ষতা নিয়ে একটি গুরুত্বপূর্ণ গবেষণা সামনে এসেছে। ডেভ.টু-তে প্রকাশিত এক প্রতিবেদনে বলা হয়েছে, ওপেনএআই-এর সর্বশেষ মডেল GPT-5.4 কোড ঠিক করতে গিয়ে অপ্রয়োজনীয় পরিবর্তন করে। এই ঘটনাটিকে ওভার-এডিটিং বলা হচ্ছে।
ওভার-এডিটিং বলতে বোঝায়, যখন একটি AI মডেল কোডের কার্যকারিতা ঠিক রাখার জন্য ন্যূনতম পরিবর্তনের বদলে অপ্রয়োজনীয় কাঠামোগত পরিবর্তন করে। গবেষণায় দেখা গেছে, GPT-5.4 প্রতি এডিটে গড়ে 0.395 নরমালাইজড লেভেনশটেইন দূরত্ব অতিক্রম করে। অন্যদিকে, অ্যানথ্রপিকের ক্লদ অপাস 4.6 একই কাজে গড়ে মাত্র 0.060 দূরত্ব অতিক্রম করে। অর্থাৎ GPT-5.4 একই ধরনের ত্রুটি ঠিক করতে 6.5 গুণ বেশি আউটপুট টোকেন উৎপন্ন করে।
সবচেয়ে মজার বিষয় হলো, পাস@1 নির্ভুলতার দিক থেকে দুটি মডেলের মধ্যে তেমন কোনো পার্থক্য নেই। গবেষণায় পাস@1 স্কোর 0.723 থেকে 0.912-এর মধ্যে পাওয়া গেছে। এর মানে হলো, GPT-5.4 বেশি টোকেন খরচ করলেও প্রথম চেষ্টায় সঠিক উত্তর দেওয়ার ক্ষমতা ক্লদ অপাস 4.6-এর চেয়ে ভালো নয়। এই অতিরিক্ত টোকেন খরচ সরাসরি ব্যবহারকারীর বিলে প্রভাব ফেলে।
গবেষকরা বলছেন, মডেলটির দীর্ঘ রিজনিং প্রক্রিয়া এটিকে অপ্রয়োজনীয় উন্নতি করতে উৎসাহিত করে। মডেলটি মনে করে এটি কোডকে আরও ভালো করছে, কিন্তু বাস্তবে কোডটি ইতিমধ্যেই সঠিক ছিল। এই সমস্যাটিকে টোকেন ট্যাক্স বলেও অভিহিত করা হচ্ছে, কারণ ব্যবহারকারী অপ্রয়োজনীয় কাজের জন্য অর্থ দিচ্ছেন।
বাংলাদেশের ডেভেলপার এবং ফ্রিল্যান্সারদের জন্য এই গবেষণার বিশেষ গুরুত্ব রয়েছে। যারা কোড রিভিউ এবং ডিবাগিংয়ের জন্য AI মডেল ব্যবহার করেন, তারা অজান্তেই বেশি খরচ করতে পারেন। বিশেষ করে যারা API-ভিত্তিক পেমেন্ট মডেলে কাজ করেন, তাদের জন্য টোকেন অপ্টিমাইজেশন এখন আরও জরুরি হয়ে উঠেছে। একটি সাধারণ বাগ ফিক্সের জন্য GPT-5.4 ব্যবহার করলে ক্লদ অপাস 4.6-এর তুলনায় 6.5 গুণ বেশি খরচ হতে পারে, যদিও ফলাফল একই থাকে।
ভবিষ্যতে AI মডেল তৈরির সময় ওভার-এডিটিং সমস্যা সমাধানে বিশেষ নজর দিতে হবে। গবেষকরা মনে করছেন, মডেলগুলোর রিজনিং পাইপলাইন সংক্ষিপ্ত করে এবং অপ্রয়োজনীয় পরিবর্তন সীমিত করে এই সমস্যা কমানো সম্ভব। ডেভেলপারদের উচিত তাদের নির্দিষ্ট কাজের জন্য সবচেয়ে সাশ্রয়ী মডেল বেছে নেওয়া এবং টোকেন ব্যবহারের ওপর নজর রাখা।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to AI
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...