১২ ডলারে AI-কে ধোঁকা! চমকপ্রদ উইকিপিডিয়া কৌশল
মাত্র ১২ ডলারের একটি ডোমেইন রেজিস্ট্রেশন এবং একটি উইকিপিডিয়া সম্পাদনার মাধ্যমেই একাধিক বড় ভাষার মডেলকে (LLM) বিষাক্ত ডেটা দিয়ে প্রভাবিত করা সম্ভব। দ্য রেজিস্টার AI-এর এক প্রতিবেদনে এই উদ্বেগজনক তথ্য উঠে এসেছে।
মাত্র ১২ ডলারের একটি ডোমেইন রেজিস্ট্রেশন এবং একটি উইকিপিডিয়া সম্পাদনার মাধ্যমেই একাধিক বড় ভাষার মডেলকে (LLM) বিষাক্ত ডেটা দিয়ে প্রভাবিত করা সম্ভব। দ্য রেজিস্টার AI-এর এক প্রতিবেদনে এই উদ্বেগজনক তথ্য উঠে এসেছে।
বড় ভাষার মডেল বা Large Language Models (LLM)-এর নিরাপত্তা নিয়ে নতুন করে প্রশ্ন তুলেছে একটি সাম্প্রতিক পরীক্ষা। দ্য রেজিস্টার AI-এর প্রতিবেদন অনুযায়ী, মাত্র ১২ ডলার খরচ করে একটি ডোমেইন নাম নিবন্ধন এবং всего একটি উইকিপিডিয়া পাতা সম্পাদনা করেই একাধিক জনপ্রিয় LLM-কে ভুল তথ্য দিয়ে 'পয়জন' বা দূষিত করা সম্ভব হয়েছে।
এই পরীক্ষায় গবেষকরা দেখিয়েছেন, কীভাবে খুব সহজ এবং সস্তা উপায়ে AI মডেলগুলোর আউটপুটকে কারসাজি করা যায়। তারা প্রথমে একটি সস্তা ডোমেইন কিনে সেখানে একটি জাল ওয়েবসাইট তৈরি করেন। এরপর উইকিপিডিয়ার একটি পাতায় একটি ছোটখাটো তথ্যসূত্র যোগ করে সেই জাল ওয়েবসাইটের লিংক বসিয়ে দেন। এই ছোট পরিবর্তনটিই যথেষ্ট ছিল যে, পরবর্তীতে যখন বিভিন্ন LLM-কে উইকিপিডিয়া থেকে তথ্য নিয়ে প্রশ্নের উত্তর দিতে বলা হয়, তখন তারা সেই জাল তথ্যটিকেই সঠিক বলে চালিয়ে দেয়।
এই ঘটনা প্রমাণ করে যে, বর্তমান AI সিস্টেমগুলো তথ্যের উৎস যাচাইয়ে কতটা দুর্বল। বিশেষ করে, উইকিপিডিয়ার মতো ওপেন সোর্স প্ল্যাটফর্মের উপর নির্ভরশীল মডেলগুলো সহজেই ডেটা পয়জনিং অ্যাটাকের শিকার হতে পারে। গবেষকরা সতর্ক করে দিয়েছেন, এই ধরনের আক্রমণ শুধু ভুল তথ্য ছড়ানোর জন্যই নয়, বরং কোনো নির্দিষ্ট পণ্য বা ব্র্যান্ডের প্রচার, রাজনৈতিক প্রচারণা, বা এমনকি ক্ষতিকর কন্টেন্ট তৈরি করতেও ব্যবহার করা যেতে পারে।
বাংলাদেশের প্রেক্ষাপটেও এই খবরটি গুরুত্বপূর্ণ। দেশে ডিজিটাল মাধ্যম এবং AI-চালিত সেবার ব্যবহার বাড়ছে। বাংলা ভাষায় কাজ করে এমন AI মডেলগুলো যদি উইকিপিডিয়ার মতো প্ল্যাটফর্ম থেকে তথ্য নেয়, তাহলে এগুলোও একই ধরনের হামলার ঝুঁকিতে রয়েছে। সঠিক তথ্য যাচাই ও মডেল ট্রেনিংয়ের সময় ডেটা ক্লিনিং-এর গুরুত্ব এখানে আরও বেশি করে সামনে আসে।
এই পরীক্ষাটি AI নিরাপত্তা গবেষণার জন্য একটি জাগরণী সংকেত। প্রযুক্তি প্রতিষ্ঠানগুলোকে তাদের মডেলগুলোর তথ্য উৎস যাচাই করার পদ্ধতি আরও শক্তিশালী করতে হবে। অন্যথায়, খুব অল্প খরচেই ভুল তথ্যের মহামারী তৈরি করা সম্ভব হবে।
আরও পড়ুন
মূল প্রতিবেদন: The Register AI
সোর্স দেখুন ↗মন্তব্য২
বাংলাদেশের জন্য এটা huge opportunity।
খুবই তথ্যপূর্ণ লেখা। ধন্যবাদ।