AI প্যাচ দিচ্ছে কিন্তু ফাঁক রয়ে যাচ্ছে, আপনার সফটওয়্যার কি নিরাপদ?
LLM এজেন্টরা সফটওয়্যারের নিরাপত্তা ত্রুটি মেরামত করছে কিন্তু পরীক্ষায় পাস করার পরও সমস্যা থেকে যাচ্ছে। নতুন CVE-Bench গবেষণায় 20টি বাস্তব দুর্বলতা পরীক্ষা করে এই ফাঁক ধরা পড়েছে।
LLM এজেন্টরা সফটওয়্যারের নিরাপত্তা ত্রুটি মেরামত করছে কিন্তু পরীক্ষায় পাস করার পরও সমস্যা থেকে যাচ্ছে। নতুন CVE-Bench গবেষণায় 20টি বাস্তব দুর্বলতা পরীক্ষা করে এই ফাঁক ধরা পড়েছে।
কৃত্রিম বুদ্ধিমত্তা (AI) মডেল এখন নিজে নিজে সফটওয়্যারের নিরাপত্তা ত্রুটি মেরামত করতে পারে। কিন্তু একটি নতুন গবেষণায় দেখা গেছে, এই মডেলগুলি সব পরীক্ষায় পাস করলেও নিরাপত্তা দুর্বলতা পুরোপুরি দূর করতে ব্যর্থ হচ্ছে। গবেষকরা CVE-Bench নামে একটি নতুন বেঞ্চমার্ক তৈরি করেছেন যা AI এজেন্টের সুরক্ষা প্যাচ দেওয়ার দক্ষতা যাচাই করে।
এই গবেষণাটি রেডিটের মেশিন লার্নিং ফোরামে প্রকাশিত হয়েছে। গবেষকরা 18টি পাইথন প্রজেক্টের (Pillow, GitPython, yt-dlp, urllib3 সহ) 20টি বাস্তব সুরক্ষা দুর্বলতা (CVE) নিয়ে কাজ করেছেন। তারা 5টি শীর্ষস্থানীয় AI মডেলকে তিনটি ভিন্ন প্রম্পট শর্তে পরীক্ষা করেছেন, মোট 300টি পরীক্ষা চালিয়েছেন।
CVE-Bench পদ্ধতিতে প্রতিটি AI এজেন্টকে একটি স্যান্ডবক্সড কন্টেইনারে রাখা হয়। তারপর তাদের দেওয়া প্যাচের কার্যকারিতা যাচাই করা হয় একটি লুকানো test_security.py স্ক্রিপ্ট দিয়ে। এই স্ক্রিপ্টটি তৈরি করা হয়েছে আসল ডেভেলপারের ফিক্সের ভিত্তিতে। এখানে পাস বা ফেলের স্কোর বাইনারি। অর্থাৎ 90 শতাংশ প্যাচ করলেও তা ফেল হিসেবে গণ্য হয়, কারণ সম্পূর্ণ নিরাপত্তা নিশ্চিত না হলে দুর্বলতা থেকে যায়।
গবেষণার সবচেয়ে চমকপ্রদ ফলাফল হলো AI এজেন্টরা প্রায় সব স্বয়ংক্রিয় পরীক্ষায় (unit test) পাস করছে। কিন্তু নিরাপত্তা পরীক্ষায় তারা বারবার ব্যর্থ হচ্ছে। এর মানে হলো প্রচলিত টেস্টিং পদ্ধতি AI প্যাচের প্রকৃত কার্যকারিতা যাচাই করতে পারে না। গবেষকরা তিনটি প্রম্পট শর্ত ব্যবহার করে ব্যর্থতার কারণ বোঝার চেষ্টা করেছেন: সম্পূর্ণ GHSA রিপোর্ট (অ্যাডভাইজরি), শোষণ পদ্ধতির বর্ণনা (ডায়াগনোজ), এবং সাধারণ নির্দেশনা।
বাংলাদেশের সফটওয়্যার ডেভেলপার ও ফ্রিল্যান্সারদের জন্য এই গবেষণার গুরুত্ব অনেক। দেশের আইটি খাতে ওপেন সোর্স প্যাকেজের ব্যবহার ব্যাপক। অনেকেই নিজেদের প্রজেক্টে Pillow, yt-dlp বা urllib3-এর মতো লাইব্রেরি ব্যবহার করেন। AI দিয়ে প্যাচ দিলেও নিরাপত্তা ফাঁক থেকে যেতে পারে, যা হ্যাকারদের জন্য সুযোগ তৈরি করে। ডেভেলপারদের তাই শুধু AI-এর ওপর নির্ভর না করে ম্যানুয়ালি সুরক্ষা পরীক্ষা করা উচিত।
এই গবেষণা AI-ভিত্তিক সুরক্ষা সমাধানের একটি বড় সীমাবদ্ধতা তুলে ধরেছে। ভবিষ্যতে গবেষকরা আরও উন্নত পদ্ধতি তৈরি করতে পারেন যেখানে AI শুধু কোড ঠিক করবে না, বরং নিরাপত্তা দুর্বলতা পুরোপুরি দূর করবে। ততদিন পর্যন্ত ডেভেলপারদের সতর্ক থাকতে হবে এবং AI প্যাচকে চূড়ান্ত সমাধান হিসেবে না দেখে একটি সহায়ক টুল হিসেবে ব্যবহার করতে হবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: Reddit r/MachineLearning
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...