ডেটা পয়জনিং অ্যাটাক কী?

ডেটা পয়জনিং হলো এমন একটি আক্রমণ যেখানে AI মডেলের ট্রেনিং ডেটাতে ভুল বা ক্ষতিকর তথ্য ঢুকিয়ে দেওয়া হয়, যার ফলে মডেলটি ভুল সিদ্ধান্ত নিতে শুরু করে।

এই আক্রমণ থেকে কি সাধারণ ব্যবহারকারীরা ক্ষতিগ্রস্ত হতে পারেন?

হ্যাঁ, যদি কোনো AI চ্যাটবট বা অনুসন্ধান ইঞ্জিন এই ধরনের পয়জনড ডেটার উপর ভিত্তি করে উত্তর দেয়, তাহলে ব্যবহারকারীরা ভুল তথ্য পেতে পারেন।

বাংলাদেশের AI মডেলগুলো কি এই ঝুঁকির মধ্যে আছে?

যেকোনো AI মডেল, বিশেষ করে যেগুলো উইকিপিডিয়ার মতো ওপেন সোর্স ডেটার উপর নির্ভর করে, এই ঝুঁকির মধ্যে রয়েছে। তাই ডেটা যাচাই প্রক্রিয়া জোরদার করা জরুরি।

হোম/নিউজ/রিসার্চ

রিসার্চ৫ মিনিট পড়া

১২ ডলারে AI-কে ধোঁকা! চমকপ্রদ উইকিপিডিয়া কৌশল

মাত্র ১২ ডলারের একটি ডোমেইন রেজিস্ট্রেশন এবং একটি উইকিপিডিয়া সম্পাদনার মাধ্যমেই একাধিক বড় ভাষার মডেলকে (LLM) বিষাক্ত ডেটা দিয়ে প্রভাবিত করা সম্ভব। দ্য রেজিস্টার AI-এর এক প্রতিবেদনে এই উদ্বেগজনক তথ্য উঠে এসেছে।

সম্পাদকীয় টিম

স্টাফ রিপোর্টার · ৭১ দিন আগে · সূত্র: The Register AI

১২ ডলারে AI-কে ধোঁকা! চমকপ্রদ উইকিপিডিয়া কৌশল

বড় ভাষার মডেল বা Large Language Models (LLM)-এর নিরাপত্তা নিয়ে নতুন করে প্রশ্ন তুলেছে একটি সাম্প্রতিক পরীক্ষা। দ্য রেজিস্টার AI-এর প্রতিবেদন অনুযায়ী, মাত্র ১২ ডলার খরচ করে একটি ডোমেইন নাম নিবন্ধন এবং всего একটি উইকিপিডিয়া পাতা সম্পাদনা করেই একাধিক জনপ্রিয় LLM-কে ভুল তথ্য দিয়ে 'পয়জন' বা দূষিত করা সম্ভব হয়েছে।

এই পরীক্ষায় গবেষকরা দেখিয়েছেন, কীভাবে খুব সহজ এবং সস্তা উপায়ে AI মডেলগুলোর আউটপুটকে কারসাজি করা যায়। তারা প্রথমে একটি সস্তা ডোমেইন কিনে সেখানে একটি জাল ওয়েবসাইট তৈরি করেন। এরপর উইকিপিডিয়ার একটি পাতায় একটি ছোটখাটো তথ্যসূত্র যোগ করে সেই জাল ওয়েবসাইটের লিংক বসিয়ে দেন। এই ছোট পরিবর্তনটিই যথেষ্ট ছিল যে, পরবর্তীতে যখন বিভিন্ন LLM-কে উইকিপিডিয়া থেকে তথ্য নিয়ে প্রশ্নের উত্তর দিতে বলা হয়, তখন তারা সেই জাল তথ্যটিকেই সঠিক বলে চালিয়ে দেয়।

এই ঘটনা প্রমাণ করে যে, বর্তমান AI সিস্টেমগুলো তথ্যের উৎস যাচাইয়ে কতটা দুর্বল। বিশেষ করে, উইকিপিডিয়ার মতো ওপেন সোর্স প্ল্যাটফর্মের উপর নির্ভরশীল মডেলগুলো সহজেই ডেটা পয়জনিং অ্যাটাকের শিকার হতে পারে। গবেষকরা সতর্ক করে দিয়েছেন, এই ধরনের আক্রমণ শুধু ভুল তথ্য ছড়ানোর জন্যই নয়, বরং কোনো নির্দিষ্ট পণ্য বা ব্র্যান্ডের প্রচার, রাজনৈতিক প্রচারণা, বা এমনকি ক্ষতিকর কন্টেন্ট তৈরি করতেও ব্যবহার করা যেতে পারে।

বাংলাদেশের প্রেক্ষাপটেও এই খবরটি গুরুত্বপূর্ণ। দেশে ডিজিটাল মাধ্যম এবং AI-চালিত সেবার ব্যবহার বাড়ছে। বাংলা ভাষায় কাজ করে এমন AI মডেলগুলো যদি উইকিপিডিয়ার মতো প্ল্যাটফর্ম থেকে তথ্য নেয়, তাহলে এগুলোও একই ধরনের হামলার ঝুঁকিতে রয়েছে। সঠিক তথ্য যাচাই ও মডেল ট্রেনিংয়ের সময় ডেটা ক্লিনিং-এর গুরুত্ব এখানে আরও বেশি করে সামনে আসে।

এই পরীক্ষাটি AI নিরাপত্তা গবেষণার জন্য একটি জাগরণী সংকেত। প্রযুক্তি প্রতিষ্ঠানগুলোকে তাদের মডেলগুলোর তথ্য উৎস যাচাই করার পদ্ধতি আরও শক্তিশালী করতে হবে। অন্যথায়, খুব অল্প খরচেই ভুল তথ্যের মহামারী তৈরি করা সম্ভব হবে।

১২ ডলারে AI-কে ধোঁকা! চমকপ্রদ উইকিপিডিয়া কৌশল

আরও পড়ুন

AI নিউজ সরাসরি ইমেইলে পান

মন্তব্য০