LIVE
মডেলGoogle DeepMind-এর Gemma 4 মডেল এখন Amazon Bedrock-এ, ফ্রিল্যান্সারদের জন্য বড় সুযোগটুলGitHub Copilot CLI-তে স্ল্যাশ কমান্ড: টার্মিনালে AI এজেন্ট নিয়ন্ত্রণ এখন সহজগবেষণাGPT-5.4-এ ওভার-এডিটিং: কোড ঠিক করতে 6.5 গুণ বেশি খরচ, নির্ভুলতা সমানইন্ডাস্ট্রিAI মডেল প্রশিক্ষণে নতুন সুযোগ: AGPL Pro Max লাইসেন্স বাংলাদেশি ডেভেলপারদের কী দেবেটুল৪০ লাইন কোডেই ইমেইল সামলাবে Claude, চাকরির পথ বদলে দেবেটুলCopilot এখন অ্যাজেন্টিক টুল, কোড রিভিউ ও পারফরম্যান্সে ৩ গুণ উন্নতিইন্ডাস্ট্রিআপনার সফটওয়্যার কি AI সার্চে অদৃশ্য? GEO অপটিমাইজেশনই এখন বাঁচার পথমডেলমাইক্রোসফট কপিলটে মিলল বিপজ্জনক ত্রুটি, আপনার ডেটা কি নিরাপদ?ইন্ডাস্ট্রিবিদেশি ফ্রিল্যান্সারদের জন্য বন্ধ হলো উন্নত AI, বাংলাদেশি ব্যবহারকারীদের কী করণীয়ইন্ডাস্ট্রিএম্বেডেড ML-এ সময় বাঁচাতে চান? ডেটা সংগ্রহ নয়, লেবেলিংই আসল বাধাবাংলাদেশবিএমইউতে অনুষ্ঠিত এআই ইন রেডিওলজি সেমিনারইন্ডাস্ট্রিযুক্তরাষ্ট্রের নিষেধাজ্ঞায় বাংলাদেশের AI ব্যবহারকারীদের জন্য বড় সুযোগমডেলGoogle DeepMind-এর Gemma 4 মডেল এখন Amazon Bedrock-এ, ফ্রিল্যান্সারদের জন্য বড় সুযোগটুলGitHub Copilot CLI-তে স্ল্যাশ কমান্ড: টার্মিনালে AI এজেন্ট নিয়ন্ত্রণ এখন সহজগবেষণাGPT-5.4-এ ওভার-এডিটিং: কোড ঠিক করতে 6.5 গুণ বেশি খরচ, নির্ভুলতা সমানইন্ডাস্ট্রিAI মডেল প্রশিক্ষণে নতুন সুযোগ: AGPL Pro Max লাইসেন্স বাংলাদেশি ডেভেলপারদের কী দেবেটুল৪০ লাইন কোডেই ইমেইল সামলাবে Claude, চাকরির পথ বদলে দেবেটুলCopilot এখন অ্যাজেন্টিক টুল, কোড রিভিউ ও পারফরম্যান্সে ৩ গুণ উন্নতিইন্ডাস্ট্রিআপনার সফটওয়্যার কি AI সার্চে অদৃশ্য? GEO অপটিমাইজেশনই এখন বাঁচার পথমডেলমাইক্রোসফট কপিলটে মিলল বিপজ্জনক ত্রুটি, আপনার ডেটা কি নিরাপদ?ইন্ডাস্ট্রিবিদেশি ফ্রিল্যান্সারদের জন্য বন্ধ হলো উন্নত AI, বাংলাদেশি ব্যবহারকারীদের কী করণীয়ইন্ডাস্ট্রিএম্বেডেড ML-এ সময় বাঁচাতে চান? ডেটা সংগ্রহ নয়, লেবেলিংই আসল বাধাবাংলাদেশবিএমইউতে অনুষ্ঠিত এআই ইন রেডিওলজি সেমিনারইন্ডাস্ট্রিযুক্তরাষ্ট্রের নিষেধাজ্ঞায় বাংলাদেশের AI ব্যবহারকারীদের জন্য বড় সুযোগ
হোম/নিউজ/রিসার্চ
রিসার্চ৫ মিনিট পড়া

GPT-5.4-এ ওভার-এডিটিং: কোড ঠিক করতে 6.5 গুণ বেশি খরচ, নির্ভুলতা সমান

একটি নতুন গবেষণায় দেখা গেছে, GPT-5.4 কোড ঠিক করতে গিয়ে অপ্রয়োজনীয় পরিবর্তন করে, যার ফলে ক্লদ অপাস 4.6-এর তুলনায় 6.5 গুণ বেশি আউটপুট টোকেন উৎপন্ন করে। পাস@1 নির্ভুলতা প্রায় সমান হওয়ায় এই ওভার-এডিটিং ডেভেলপারদের জন্য অপ্রত্যাশিত বিল বাড়িয়ে দিতে পারে।

d
সম্পাদকীয় টিম
স্টাফ রিপোর্টার · ২ ঘণ্টা আগে · সূত্র: dev.to AI
GPT-5.4-এ ওভার-এডিটিং: কোড ঠিক করতে 6.5 গুণ বেশি খরচ, নির্ভুলতা সমান

একটি নতুন গবেষণায় দেখা গেছে, GPT-5.4 কোড ঠিক করতে গিয়ে অপ্রয়োজনীয় পরিবর্তন করে, যার ফলে ক্লদ অপাস 4.6-এর তুলনায় 6.5 গুণ বেশি আউটপুট টোকেন উৎপন্ন করে। পাস@1 নির্ভুলতা প্রায় সমান হওয়ায় এই ওভার-এডিটিং ডেভেলপারদের জন্য অপ্রত্যাশিত বিল বাড়িয়ে দিতে পারে।

কৃত্রিম বুদ্ধিমত্তার জগতে কোড সম্পাদনার দক্ষতা নিয়ে একটি গুরুত্বপূর্ণ গবেষণা সামনে এসেছে। ডেভ.টু-তে প্রকাশিত এক প্রতিবেদনে বলা হয়েছে, ওপেনএআই-এর সর্বশেষ মডেল GPT-5.4 কোড ঠিক করতে গিয়ে অপ্রয়োজনীয় পরিবর্তন করে। এই ঘটনাটিকে ওভার-এডিটিং বলা হচ্ছে।

ওভার-এডিটিং বলতে বোঝায়, যখন একটি AI মডেল কোডের কার্যকারিতা ঠিক রাখার জন্য ন্যূনতম পরিবর্তনের বদলে অপ্রয়োজনীয় কাঠামোগত পরিবর্তন করে। গবেষণায় দেখা গেছে, GPT-5.4 প্রতি এডিটে গড়ে 0.395 নরমালাইজড লেভেনশটেইন দূরত্ব অতিক্রম করে। অন্যদিকে, অ্যানথ্রপিকের ক্লদ অপাস 4.6 একই কাজে গড়ে মাত্র 0.060 দূরত্ব অতিক্রম করে। অর্থাৎ GPT-5.4 একই ধরনের ত্রুটি ঠিক করতে 6.5 গুণ বেশি আউটপুট টোকেন উৎপন্ন করে।

সবচেয়ে মজার বিষয় হলো, পাস@1 নির্ভুলতার দিক থেকে দুটি মডেলের মধ্যে তেমন কোনো পার্থক্য নেই। গবেষণায় পাস@1 স্কোর 0.723 থেকে 0.912-এর মধ্যে পাওয়া গেছে। এর মানে হলো, GPT-5.4 বেশি টোকেন খরচ করলেও প্রথম চেষ্টায় সঠিক উত্তর দেওয়ার ক্ষমতা ক্লদ অপাস 4.6-এর চেয়ে ভালো নয়। এই অতিরিক্ত টোকেন খরচ সরাসরি ব্যবহারকারীর বিলে প্রভাব ফেলে।

গবেষকরা বলছেন, মডেলটির দীর্ঘ রিজনিং প্রক্রিয়া এটিকে অপ্রয়োজনীয় উন্নতি করতে উৎসাহিত করে। মডেলটি মনে করে এটি কোডকে আরও ভালো করছে, কিন্তু বাস্তবে কোডটি ইতিমধ্যেই সঠিক ছিল। এই সমস্যাটিকে টোকেন ট্যাক্স বলেও অভিহিত করা হচ্ছে, কারণ ব্যবহারকারী অপ্রয়োজনীয় কাজের জন্য অর্থ দিচ্ছেন।

বাংলাদেশের ডেভেলপার এবং ফ্রিল্যান্সারদের জন্য এই গবেষণার বিশেষ গুরুত্ব রয়েছে। যারা কোড রিভিউ এবং ডিবাগিংয়ের জন্য AI মডেল ব্যবহার করেন, তারা অজান্তেই বেশি খরচ করতে পারেন। বিশেষ করে যারা API-ভিত্তিক পেমেন্ট মডেলে কাজ করেন, তাদের জন্য টোকেন অপ্টিমাইজেশন এখন আরও জরুরি হয়ে উঠেছে। একটি সাধারণ বাগ ফিক্সের জন্য GPT-5.4 ব্যবহার করলে ক্লদ অপাস 4.6-এর তুলনায় 6.5 গুণ বেশি খরচ হতে পারে, যদিও ফলাফল একই থাকে।

ভবিষ্যতে AI মডেল তৈরির সময় ওভার-এডিটিং সমস্যা সমাধানে বিশেষ নজর দিতে হবে। গবেষকরা মনে করছেন, মডেলগুলোর রিজনিং পাইপলাইন সংক্ষিপ্ত করে এবং অপ্রয়োজনীয় পরিবর্তন সীমিত করে এই সমস্যা কমানো সম্ভব। ডেভেলপারদের উচিত তাদের নির্দিষ্ট কাজের জন্য সবচেয়ে সাশ্রয়ী মডেল বেছে নেওয়া এবং টোকেন ব্যবহারের ওপর নজর রাখা।

আরও পড়ুন

🌐 তথ্যসূত্র ও স্বচ্ছতা

এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।

ট্যাগ:#রিসার্চ#AI#বাংলাদেশ#dev.to AI
AD
📧

AI নিউজ সরাসরি ইমেইলে পান

প্রতিদিনের সেরা AI খবর বাছাই করে আপনার inbox-এ পাঠাই। বিজ্ঞাপন নেই।

মূল প্রতিবেদন: dev.to AI

সোর্স দেখুন ↗

মন্তব্য

লোড হচ্ছে...