LIVE
গবেষণাশূন্য Loss দেখে খুশি? আপনার AI আসলে চাইনিজ বলছে!টুলBun রানটাইম AI দিয়ে ৯ দিনে Zig থেকে Rust-এ, জানুন কী লাভটুলএকই GPU তে একাধিক AI এজেন্ট চালালে কর্মক্ষমতা কমে ৩ গুণ, গবেষণায় চাঞ্চল্যইন্ডাস্ট্রিChatGPT-কে পেছনে ফেলে ব্যবসায়ী বাজারে ক্লাউডের জয়, বাংলাদেশি ফ্রিল্যান্সারদের কী লাভমডেলChatGPT কেন Strawberry-তে R গণনা করতে পারে না, জানলে চমকে যাবেনমডেলডিপ লার্নিংয়ের গোপন শক্তি: ১০০ লেয়ারেও কাজ করে এক লাইনের মতোইন্ডাস্ট্রিভারতে AI অ্যাক্সেস সীমিত করলো Anthropic, বাংলাদেশের জন্য কী বার্তা?গবেষণাAI এখন খাদ্য নিরাপত্তার জাল প্রমাণ তৈরি করতে পারে, সতর্ক করছে গবেষণাইন্ডাস্ট্রিমেটার নতুন AI মডেল বাণিজ্যিক বিক্রি শুরু, বাংলাদেশি ব্যবসায়ীদের জন্য সুযোগইন্ডাস্ট্রিAI ইঞ্জিনিয়ারদের বেতন বৈষম্য ৪ গুণ, সঠিক কোম্পানি বাছাইয়ে মিলবে দ্বিগুণটুলবিনামূল্যে AI কোডিং: ZeroScript রোব্লক্স স্টুডিওতে DeepSeek ও Gemini এনে দিলটুলAI কোডিং এজেন্টের ভুল কমিয়ে ৩ গুণ দ্রুত কাজ শেষ করুনগবেষণাশূন্য Loss দেখে খুশি? আপনার AI আসলে চাইনিজ বলছে!টুলBun রানটাইম AI দিয়ে ৯ দিনে Zig থেকে Rust-এ, জানুন কী লাভটুলএকই GPU তে একাধিক AI এজেন্ট চালালে কর্মক্ষমতা কমে ৩ গুণ, গবেষণায় চাঞ্চল্যইন্ডাস্ট্রিChatGPT-কে পেছনে ফেলে ব্যবসায়ী বাজারে ক্লাউডের জয়, বাংলাদেশি ফ্রিল্যান্সারদের কী লাভমডেলChatGPT কেন Strawberry-তে R গণনা করতে পারে না, জানলে চমকে যাবেনমডেলডিপ লার্নিংয়ের গোপন শক্তি: ১০০ লেয়ারেও কাজ করে এক লাইনের মতোইন্ডাস্ট্রিভারতে AI অ্যাক্সেস সীমিত করলো Anthropic, বাংলাদেশের জন্য কী বার্তা?গবেষণাAI এখন খাদ্য নিরাপত্তার জাল প্রমাণ তৈরি করতে পারে, সতর্ক করছে গবেষণাইন্ডাস্ট্রিমেটার নতুন AI মডেল বাণিজ্যিক বিক্রি শুরু, বাংলাদেশি ব্যবসায়ীদের জন্য সুযোগইন্ডাস্ট্রিAI ইঞ্জিনিয়ারদের বেতন বৈষম্য ৪ গুণ, সঠিক কোম্পানি বাছাইয়ে মিলবে দ্বিগুণটুলবিনামূল্যে AI কোডিং: ZeroScript রোব্লক্স স্টুডিওতে DeepSeek ও Gemini এনে দিলটুলAI কোডিং এজেন্টের ভুল কমিয়ে ৩ গুণ দ্রুত কাজ শেষ করুন
হোম/নিউজ/রিসার্চ
রিসার্চ৫ মিনিট পড়া

AI কোডিং এজেন্ট ৮০% সময় গুরুত্বপূর্ণ লাইন মিস করছে, গবেষণায় চাঞ্চল্য

একটি নতুন গবেষণায় দেখা গেছে, Claude Code ও Codex-এর মতো AI কোডিং এজেন্ট সঠিক ফাইল শনাক্ত করলেও প্রায় ৮০% ক্ষেত্রে গুরুত্বপূর্ণ কোড লাইন খুঁজে পায় না। SWE-Explore নামের নতুন বেঞ্চমার্কটি প্রথমবারের মতো কোড সার্চ ও রিপেয়ার দক্ষতা আলাদাভাবে পরীক্ষা করেছে।

T
সম্পাদকীয় টিম
স্টাফ রিপোর্টার · ৫ ঘণ্টা আগে · সূত্র: The Decoder
AI কোডিং এজেন্ট ৮০% সময় গুরুত্বপূর্ণ লাইন মিস করছে, গবেষণায় চাঞ্চল্য

একটি নতুন গবেষণায় দেখা গেছে, Claude Code ও Codex-এর মতো AI কোডিং এজেন্ট সঠিক ফাইল শনাক্ত করলেও প্রায় ৮০% ক্ষেত্রে গুরুত্বপূর্ণ কোড লাইন খুঁজে পায় না। SWE-Explore নামের নতুন বেঞ্চমার্কটি প্রথমবারের মতো কোড সার্চ ও রিপেয়ার দক্ষতা আলাদাভাবে পরীক্ষা করেছে।

AI কোডিং এজেন্টরা কি সত্যিই সফটওয়্যার ডেভেলপমেন্টে বিপ্লব ঘটাতে পারছে? একটি নতুন গবেষণা বলছে, তাদের সক্ষমতা নিয়ে এখনই উৎসাহিত হওয়ার সময় হয়নি।

The Decoder-এর প্রতিবেদন অনুযায়ী, Claude Code ও Codex-এর মতো জনপ্রিয় AI কোডিং এজেন্ট সঠিক ফাইল খুঁজে বের করলেও অধিকাংশ ক্ষেত্রে ফাইলের ভেতরের সমালোচনামূলক কোড লাইন শনাক্ত করতে ব্যর্থ হচ্ছে। গবেষকরা SWE-Explore নামে একটি নতুন বেঞ্চমার্ক তৈরি করেছেন যা প্রথমবারের মতো কোড সার্চ করার ক্ষমতাকে প্রকৃত মেরামতের দক্ষতা থেকে পৃথকভাবে পরীক্ষা করেছে।

এই বেঞ্চমার্কের ফলাফল উদ্বেগজনক। দেখা গেছে, সঠিক ফাইল খুঁজে পাওয়ার হার ৯০% হলেও সঠিক লাইন শনাক্ত করার হার মাত্র ২০%। এর মানে হলো, AI এজেন্টরা প্রায় ৮০% সময় ভুল জায়গায় পরিবর্তন করার চেষ্টা করে, যা বাগ ফিক্সিংকে আরও জটিল করে তোলে।

গবেষণায় আরও দেখা গেছে, পর্যাপ্ত প্রসঙ্গ বা কনটেক্সট ছাড়া সর্বোত্তম AI ফিক্সও ব্যর্থ হবে। যখন এজেন্টদের পুরো ফাইল বা সম্পর্কিত ফাংশনের তথ্য দেওয়া হয়নি, তখন তাদের সঠিক সমাধান দেওয়ার সক্ষমতা প্রায় অর্ধেকে নেমে এসেছে। এটি প্রমাণ করে যে কেবল ফাইল খুঁজে পাওয়াই যথেষ্ট নয়, সমস্যার প্রকৃত অবস্থান চিহ্নিত করাই সবচেয়ে গুরুত্বপূর্ণ।

বাংলাদেশের প্রেক্ষাপটে এই গবেষণার বিশেষ গুরুত্ব রয়েছে। দেশের হাজার হাজার সফটওয়্যার ডেভেলপার ও ফ্রিল্যান্সার দৈনন্দিন কাজে AI টুলস ব্যবহার করছেন। তারা যদি অন্ধভাবে AI-এর পরামর্শ গ্রহণ করেন, তাহলে উৎপাদনশীলতা বাড়ার পরিবর্তে বাগ ও সময় নষ্টের ঝুঁকি বাড়বে। বিশেষ করে আউটসোর্সিং কাজে যেখানে ক্লায়েন্টের সময় ও অর্থ দুটোই গুরুত্বপূর্ণ, সেখানে এই ভুলগুলো মারাত্মক প্রভাব ফেলতে পারে।

গবেষকরা বলছেন, AI কোডিং এজেন্টদের উন্নত করতে হলে তাদের কোড বোঝার গভীরতা বাড়াতে হবে। বর্তমানে এই এজেন্টরা পৃষ্ঠীয় মিলের ওপর নির্ভর করে, যা জটিল বাগ শনাক্ত করতে অক্ষম। ভবিষ্যতে আরও উন্নত কনটেক্সট মডেল ও ট্রেনিং ডেটা দিয়ে এই সমস্যা সমাধান সম্ভব হবে বলে তারা আশা করছেন।

AIখবরের বিশ্লেষণে দেখা যাচ্ছে, এই গবেষণার আলোকে বাংলাদেশের ডেভেলপারদের উচিত AI টুলসকে সম্পূর্ণ নির্ভরযোগ্য সহায়ক হিসেবে না দেখে, বরং একটি সহায়ক হাতিয়ার হিসেবে ব্যবহার করা। কোড রিভিউ ও ম্যানুয়াল ভেরিফিকেশন এখনও অপরিহার্য।

আরও পড়ুন

🌐 তথ্যসূত্র ও স্বচ্ছতা

এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।

ট্যাগ:#রিসার্চ#AI#বাংলাদেশ#The Decoder
AD
📧

AI নিউজ সরাসরি ইমেইলে পান

প্রতিদিনের সেরা AI খবর বাছাই করে আপনার inbox-এ পাঠাই। বিজ্ঞাপন নেই।

মূল প্রতিবেদন: The Decoder

সোর্স দেখুন ↗

মন্তব্য

লোড হচ্ছে...