LIVE
ইন্ডাস্ট্রিAI Agent এখন ডেভেলপারের সহায়ক, প্রতিযোগী নয়: কীভাবে কাজ বদলাবেটুলAPI কী ছাড়াই ডেটা কিনুন, পে-পার-কল সুবিধা আনলো Claude Codeইন্ডাস্ট্রিফেসিয়াল রিকগনিশনের ভুলে নির্দোষ ব্যক্তি ৫০ দিন জেলে, বাংলাদেশেও সতর্কতা জরুরিগবেষণাAI এজেন্টের পারফরম্যান্স বোঝা সহজ হচ্ছে, জানুন নতুন টায়ার্ড পদ্ধতিইন্ডাস্ট্রি২০২৬ সালে আপনার সাইটের অর্ধেক ট্রাফিক আসবে ChatGPT থেকে, জানুন কীভাবেগবেষণাTempoVLA রোবটের গতি নিজেই বদলাবে, নিরাপত্তা ও দক্ষতা বাড়বে কয়েকগুণগবেষণাবাংলাদেশি ডেভেলপারদের জন্য সুখবর: AI কোডিং টুলের খরচ কমল ৩ গুণমডেলTransformer কীভাবে বদলে দিচ্ছে AI জগৎ, বুঝে নিন বাংলায়টুলগুগল কন্টাক্টের তথ্য নিয়ে জেমিনি এখন দেবে ব্যক্তিগত উত্তর, কাজ বদলে যাবেইন্ডাস্ট্রি৭৫% টেক সিইও AI সাইকোসিসে: আপনার চাকরি কি নিরাপদ?ইন্ডাস্ট্রিAI API-তে দাম যুদ্ধে বাংলাদেশি ডেভেলপারদের লাভ, ১ সেন্টেই পাওয়া যাচ্ছে শক্তিশালী মডেলগবেষণাAI এজেন্ট এখন নিজেই সিদ্ধান্ত নেয়, আপনার চাকরি বদলে যাবেইন্ডাস্ট্রিAI Agent এখন ডেভেলপারের সহায়ক, প্রতিযোগী নয়: কীভাবে কাজ বদলাবেটুলAPI কী ছাড়াই ডেটা কিনুন, পে-পার-কল সুবিধা আনলো Claude Codeইন্ডাস্ট্রিফেসিয়াল রিকগনিশনের ভুলে নির্দোষ ব্যক্তি ৫০ দিন জেলে, বাংলাদেশেও সতর্কতা জরুরিগবেষণাAI এজেন্টের পারফরম্যান্স বোঝা সহজ হচ্ছে, জানুন নতুন টায়ার্ড পদ্ধতিইন্ডাস্ট্রি২০২৬ সালে আপনার সাইটের অর্ধেক ট্রাফিক আসবে ChatGPT থেকে, জানুন কীভাবেগবেষণাTempoVLA রোবটের গতি নিজেই বদলাবে, নিরাপত্তা ও দক্ষতা বাড়বে কয়েকগুণগবেষণাবাংলাদেশি ডেভেলপারদের জন্য সুখবর: AI কোডিং টুলের খরচ কমল ৩ গুণমডেলTransformer কীভাবে বদলে দিচ্ছে AI জগৎ, বুঝে নিন বাংলায়টুলগুগল কন্টাক্টের তথ্য নিয়ে জেমিনি এখন দেবে ব্যক্তিগত উত্তর, কাজ বদলে যাবেইন্ডাস্ট্রি৭৫% টেক সিইও AI সাইকোসিসে: আপনার চাকরি কি নিরাপদ?ইন্ডাস্ট্রিAI API-তে দাম যুদ্ধে বাংলাদেশি ডেভেলপারদের লাভ, ১ সেন্টেই পাওয়া যাচ্ছে শক্তিশালী মডেলগবেষণাAI এজেন্ট এখন নিজেই সিদ্ধান্ত নেয়, আপনার চাকরি বদলে যাবে
হোম/নিউজ/রিসার্চ
রিসার্চ৫ মিনিট পড়া

AI প্যাচ দিচ্ছে কিন্তু ফাঁক রয়ে যাচ্ছে, আপনার সফটওয়্যার কি নিরাপদ?

LLM এজেন্টরা সফটওয়্যারের নিরাপত্তা ত্রুটি মেরামত করছে কিন্তু পরীক্ষায় পাস করার পরও সমস্যা থেকে যাচ্ছে। নতুন CVE-Bench গবেষণায় 20টি বাস্তব দুর্বলতা পরীক্ষা করে এই ফাঁক ধরা পড়েছে।

R
সম্পাদকীয় টিম
স্টাফ রিপোর্টার · ৩ দিন আগে · সূত্র: Reddit r/MachineLearning
AI প্যাচ দিচ্ছে কিন্তু ফাঁক রয়ে যাচ্ছে, আপনার সফটওয়্যার কি নিরাপদ?

LLM এজেন্টরা সফটওয়্যারের নিরাপত্তা ত্রুটি মেরামত করছে কিন্তু পরীক্ষায় পাস করার পরও সমস্যা থেকে যাচ্ছে। নতুন CVE-Bench গবেষণায় 20টি বাস্তব দুর্বলতা পরীক্ষা করে এই ফাঁক ধরা পড়েছে।

কৃত্রিম বুদ্ধিমত্তা (AI) মডেল এখন নিজে নিজে সফটওয়্যারের নিরাপত্তা ত্রুটি মেরামত করতে পারে। কিন্তু একটি নতুন গবেষণায় দেখা গেছে, এই মডেলগুলি সব পরীক্ষায় পাস করলেও নিরাপত্তা দুর্বলতা পুরোপুরি দূর করতে ব্যর্থ হচ্ছে। গবেষকরা CVE-Bench নামে একটি নতুন বেঞ্চমার্ক তৈরি করেছেন যা AI এজেন্টের সুরক্ষা প্যাচ দেওয়ার দক্ষতা যাচাই করে।

এই গবেষণাটি রেডিটের মেশিন লার্নিং ফোরামে প্রকাশিত হয়েছে। গবেষকরা 18টি পাইথন প্রজেক্টের (Pillow, GitPython, yt-dlp, urllib3 সহ) 20টি বাস্তব সুরক্ষা দুর্বলতা (CVE) নিয়ে কাজ করেছেন। তারা 5টি শীর্ষস্থানীয় AI মডেলকে তিনটি ভিন্ন প্রম্পট শর্তে পরীক্ষা করেছেন, মোট 300টি পরীক্ষা চালিয়েছেন।

CVE-Bench পদ্ধতিতে প্রতিটি AI এজেন্টকে একটি স্যান্ডবক্সড কন্টেইনারে রাখা হয়। তারপর তাদের দেওয়া প্যাচের কার্যকারিতা যাচাই করা হয় একটি লুকানো test_security.py স্ক্রিপ্ট দিয়ে। এই স্ক্রিপ্টটি তৈরি করা হয়েছে আসল ডেভেলপারের ফিক্সের ভিত্তিতে। এখানে পাস বা ফেলের স্কোর বাইনারি। অর্থাৎ 90 শতাংশ প্যাচ করলেও তা ফেল হিসেবে গণ্য হয়, কারণ সম্পূর্ণ নিরাপত্তা নিশ্চিত না হলে দুর্বলতা থেকে যায়।

গবেষণার সবচেয়ে চমকপ্রদ ফলাফল হলো AI এজেন্টরা প্রায় সব স্বয়ংক্রিয় পরীক্ষায় (unit test) পাস করছে। কিন্তু নিরাপত্তা পরীক্ষায় তারা বারবার ব্যর্থ হচ্ছে। এর মানে হলো প্রচলিত টেস্টিং পদ্ধতি AI প্যাচের প্রকৃত কার্যকারিতা যাচাই করতে পারে না। গবেষকরা তিনটি প্রম্পট শর্ত ব্যবহার করে ব্যর্থতার কারণ বোঝার চেষ্টা করেছেন: সম্পূর্ণ GHSA রিপোর্ট (অ্যাডভাইজরি), শোষণ পদ্ধতির বর্ণনা (ডায়াগনোজ), এবং সাধারণ নির্দেশনা।

বাংলাদেশের সফটওয়্যার ডেভেলপার ও ফ্রিল্যান্সারদের জন্য এই গবেষণার গুরুত্ব অনেক। দেশের আইটি খাতে ওপেন সোর্স প্যাকেজের ব্যবহার ব্যাপক। অনেকেই নিজেদের প্রজেক্টে Pillow, yt-dlp বা urllib3-এর মতো লাইব্রেরি ব্যবহার করেন। AI দিয়ে প্যাচ দিলেও নিরাপত্তা ফাঁক থেকে যেতে পারে, যা হ্যাকারদের জন্য সুযোগ তৈরি করে। ডেভেলপারদের তাই শুধু AI-এর ওপর নির্ভর না করে ম্যানুয়ালি সুরক্ষা পরীক্ষা করা উচিত।

এই গবেষণা AI-ভিত্তিক সুরক্ষা সমাধানের একটি বড় সীমাবদ্ধতা তুলে ধরেছে। ভবিষ্যতে গবেষকরা আরও উন্নত পদ্ধতি তৈরি করতে পারেন যেখানে AI শুধু কোড ঠিক করবে না, বরং নিরাপত্তা দুর্বলতা পুরোপুরি দূর করবে। ততদিন পর্যন্ত ডেভেলপারদের সতর্ক থাকতে হবে এবং AI প্যাচকে চূড়ান্ত সমাধান হিসেবে না দেখে একটি সহায়ক টুল হিসেবে ব্যবহার করতে হবে।

আরও পড়ুন

🌐 তথ্যসূত্র ও স্বচ্ছতা

এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।

ট্যাগ:#রিসার্চ#AI#বাংলাদেশ#Reddit r/MachineLearning
AD
📧

AI নিউজ সরাসরি ইমেইলে পান

প্রতিদিনের সেরা AI খবর বাছাই করে আপনার inbox-এ পাঠাই। বিজ্ঞাপন নেই।

মূল প্রতিবেদন: Reddit r/MachineLearning

সোর্স দেখুন ↗

মন্তব্য

লোড হচ্ছে...