LIVE
গবেষণাHindsight এলো, AI-এর অস্থির সিদ্ধান্ত নেওয়ার সমস্যা দূর করবে বাংলাদেশেগবেষণাAI এজেন্টে নতুন দিগন্ত: লুপ ইঞ্জিনিয়ারিং শিখলে চাকরির বাজার ৩ গুণ বাড়বেইন্ডাস্ট্রিSEO আর যথেষ্ট নয়, ২০২৬ সালে AEO ও GEO জানলেই ব্যবসা বাঁচবেইন্ডাস্ট্রি১৫ কোটি ডলারের OpenAI উদ্যোগ: বাংলাদেশি ব্যবসায় AI গ্রহণের সুযোগইন্ডাস্ট্রিSiri পিছিয়ে থাকলে আপনার iPhone-এর AI সুবিধা কমবে, অ্যাপল বড় চ্যালেঞ্জেটুল৩৭ মিলিয়ন ডলার পেয়ে AI বাগ ফিক্স করবে Undo, ফ্রিল্যান্সারদের কাজ বদলে যাবেইন্ডাস্ট্রিযুক্তরাষ্ট্রের আদেশে ইউরোপে বন্ধ হলো AI মডেল, বাংলাদেশের ফ্রিল্যান্সারদের কী প্রভাবইন্ডাস্ট্রিAnthropic-এ নিষেধাজ্ঞা: বাংলাদেশের AI ব্যবহারে কী প্রভাব পড়বে?গবেষণাAI কোডিং এজেন্ট ৮৬% গুরুত্বপূর্ণ লাইন মিস করছে, আপনার প্রজেক্টে কী প্রভাব ফেলবেইন্ডাস্ট্রিকেনাকাটায় AI এজেন্টকে সেরা বন্ধুর চেয়ে বেশি বিশ্বাস করছেন ৭৪% ভোক্তাগবেষণাসিলের মুখ চিনবে AI, বাংলাদেশের ফ্রিল্যান্সারদের জন্য নতুন সুযোগইন্ডাস্ট্রিচীনের এআই চিপ কোম্পানি আইপিও পেল, বাংলাদেশের প্রযুক্তি খাতে কী প্রভাব ফেলবেগবেষণাHindsight এলো, AI-এর অস্থির সিদ্ধান্ত নেওয়ার সমস্যা দূর করবে বাংলাদেশেগবেষণাAI এজেন্টে নতুন দিগন্ত: লুপ ইঞ্জিনিয়ারিং শিখলে চাকরির বাজার ৩ গুণ বাড়বেইন্ডাস্ট্রিSEO আর যথেষ্ট নয়, ২০২৬ সালে AEO ও GEO জানলেই ব্যবসা বাঁচবেইন্ডাস্ট্রি১৫ কোটি ডলারের OpenAI উদ্যোগ: বাংলাদেশি ব্যবসায় AI গ্রহণের সুযোগইন্ডাস্ট্রিSiri পিছিয়ে থাকলে আপনার iPhone-এর AI সুবিধা কমবে, অ্যাপল বড় চ্যালেঞ্জেটুল৩৭ মিলিয়ন ডলার পেয়ে AI বাগ ফিক্স করবে Undo, ফ্রিল্যান্সারদের কাজ বদলে যাবেইন্ডাস্ট্রিযুক্তরাষ্ট্রের আদেশে ইউরোপে বন্ধ হলো AI মডেল, বাংলাদেশের ফ্রিল্যান্সারদের কী প্রভাবইন্ডাস্ট্রিAnthropic-এ নিষেধাজ্ঞা: বাংলাদেশের AI ব্যবহারে কী প্রভাব পড়বে?গবেষণাAI কোডিং এজেন্ট ৮৬% গুরুত্বপূর্ণ লাইন মিস করছে, আপনার প্রজেক্টে কী প্রভাব ফেলবেইন্ডাস্ট্রিকেনাকাটায় AI এজেন্টকে সেরা বন্ধুর চেয়ে বেশি বিশ্বাস করছেন ৭৪% ভোক্তাগবেষণাসিলের মুখ চিনবে AI, বাংলাদেশের ফ্রিল্যান্সারদের জন্য নতুন সুযোগইন্ডাস্ট্রিচীনের এআই চিপ কোম্পানি আইপিও পেল, বাংলাদেশের প্রযুক্তি খাতে কী প্রভাব ফেলবে
হোম/নিউজ/রিসার্চ
রিসার্চ৫ মিনিট পড়া

AI কোডিং এজেন্ট ৮৬% গুরুত্বপূর্ণ লাইন মিস করছে, আপনার প্রজেক্টে কী প্রভাব ফেলবে

SWE-Explore বেঞ্চমার্কে দেখা গেছে, Claude Code ও Codex-এর মতো AI কোডিং এজেন্টরা সঠিক ফাইল চিহ্নিত করলেও 81 থেকে 86 শতাংশ গুরুত্বপূর্ণ কোড লাইন শনাক্ত করতে ব্যর্থ হচ্ছে। 848টি বাগ-ফিক্সিং টাস্কের ভিত্তিতে এই ফলাফল প্রকাশ করেছে dev.to ML।

d
সম্পাদকীয় টিম
স্টাফ রিপোর্টার · ৪ ঘণ্টা আগে · সূত্র: dev.to ML
AI কোডিং এজেন্ট ৮৬% গুরুত্বপূর্ণ লাইন মিস করছে, আপনার প্রজেক্টে কী প্রভাব ফেলবে

SWE-Explore বেঞ্চমার্কে দেখা গেছে, Claude Code ও Codex-এর মতো AI কোডিং এজেন্টরা সঠিক ফাইল চিহ্নিত করলেও 81 থেকে 86 শতাংশ গুরুত্বপূর্ণ কোড লাইন শনাক্ত করতে ব্যর্থ হচ্ছে। 848টি বাগ-ফিক্সিং টাস্কের ভিত্তিতে এই ফলাফল প্রকাশ করেছে dev.to ML।

AI কোডিং এজেন্টরা কি সত্যিই সফটওয়্যার ডেভেলপারদের কাজ সহজ করে দিচ্ছে? নতুন এক গবেষণায় দেখা গেছে, তারা ফাইল স্তরে সঠিক হলেও কোডের গভীরে গিয়ে ব্যর্থ হচ্ছে। dev.to ML-এর প্রতিবেদন অনুযায়ী, SWE-Explore বেঞ্চমার্কে Claude Code, Codex 5.3 এবং OpenHands নামক AI এজেন্টরা সঠিক ফাইল খুঁজে পেলেও 81 থেকে 86 শতাংশ গুরুত্বপূর্ণ কোড লাইন মিস করছে।

এই গবেষণাটি 203টি ওপেন-সোর্স প্রকল্পের 848টি বাগ-ফিক্সিং কাজের উপর ভিত্তি করে তৈরি। গবেষকরা দেখেছেন, বর্তমান AI কোডিং এজেন্টগুলোর একটি কাঠামোগত দুর্বলতা রয়েছে। তারা ফাইল স্তরে 100 শতাংশ নির্ভুলতা দেখালেও কোডের ভেতরের জটিল ও গুরুত্বপূর্ণ লাইনগুলি কভার করতে পারে মাত্র 14 থেকে 19 শতাংশ পর্যন্ত।

SWE-Explore বেঞ্চমার্কে পাইথন ভাষার প্রাধান্য উল্লেখযোগ্য। মোট 848টি সমস্যার মধ্যে 547টিই ছিল পাইথন ভাষাভিত্তিক। এই তথ্যটি ইঙ্গিত দেয় যে AI এজেন্টদের প্রশিক্ষণ ও পরীক্ষা মূলত পাইথনকেন্দ্রিক হলেও তাদের কর্মক্ষমতা এখনও সীমিত।

গবেষণার ফলাফল বলছে, মডেলের শক্তি বৃদ্ধি করলেও এই কাঠামোগত দুর্বলতা দূর হচ্ছে না। Claude Code বা Codex 5.3-এর মতো উন্নত মডেলগুলোও একই সমস্যায় ভুগছে। অর্থাৎ, শুধু মডেল বড় করলেই কোড বোঝার গভীরতা বাড়ে না।

বাংলাদেশের সফটওয়্যার ডেভেলপার, ফ্রিল্যান্সার এবং শিক্ষার্থীদের জন্য এই গবেষণার তাৎপর্য অনেক। বর্তমানে অনেকে AI টুল ব্যবহার করে কোডিংয়ের সময় বাঁচানোর চেষ্টা করছেন। কিন্তু এই গবেষণা দেখাচ্ছে, AI এজেন্টদের উপর সম্পূর্ণ নির্ভর করা বিপজ্জনক হতে পারে। বিশেষ করে যখন বাগ ফিক্সিং বা জটিল কোড রিভিউর কাজ আসে, তখন মানুষের দক্ষতা এখনও অপরিহার্য।

ভবিষ্যতে AI কোডিং এজেন্টদের আরও উন্নত করতে গবেষকদের নতুন পদ্ধতি নিয়ে কাজ করতে হবে। ফাইল স্তরের নির্ভুলতার পাশাপাশি লাইন-বাই-লাইন কভারেজ বাড়ানোর দিকে নজর দিতে হবে। তবেই AI সত্যিকার অর্থে ডেভেলপারদের নির্ভরযোগ্য সহায়ক হয়ে উঠতে পারবে।

আরও পড়ুন

🌐 তথ্যসূত্র ও স্বচ্ছতা

এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।

ট্যাগ:#রিসার্চ#AI#বাংলাদেশ#dev.to ML
AD
📧

AI নিউজ সরাসরি ইমেইলে পান

প্রতিদিনের সেরা AI খবর বাছাই করে আপনার inbox-এ পাঠাই। বিজ্ঞাপন নেই।

মূল প্রতিবেদন: dev.to ML

সোর্স দেখুন ↗

মন্তব্য

লোড হচ্ছে...