AI থেকে তথ্য মুছে ফেলা যায় না, শুধু লুকানো যায়, LACUNA গবেষণায় ধরা
গবেষকরা দেখিয়েছেন, ভাষা মডেল থেকে তথ্য মুছে ফেলার বর্তমান কৌশলগুলো আসলে ডেটা লুকিয়ে রাখে, সম্পূর্ণ মুছে ফেলে না। LACUNA নামের নতুন বেঞ্চমার্ক এই গুরুতর দুর্বলতা উন্মোচন করেছে। এর ফলে প্রোডাকশন সিস্টেমে তথ্য অপসারণের নির্ভরযোগ্যতা নিয়ে নতুন করে প্রশ্ন উঠেছে।
গবেষকরা দেখিয়েছেন, ভাষা মডেল থেকে তথ্য মুছে ফেলার বর্তমান কৌশলগুলো আসলে ডেটা লুকিয়ে রাখে, সম্পূর্ণ মুছে ফেলে না। LACUNA নামের নতুন বেঞ্চমার্ক এই গুরুতর দুর্বলতা উন্মোচন করেছে। এর ফলে প্রোডাকশন সিস্টেমে তথ্য অপসারণের নির্ভরযোগ্যতা নিয়ে নতুন করে প্রশ্ন উঠেছে।
আর্টিফিশিয়াল ইন্টেলিজেন্স (AI) মডেল থেকে সংবেদনশীল তথ্য মুছে ফেলার বর্তমান পদ্ধতিগুলো আসলে কতটা কার্যকর? একটি নতুন গবেষণায় দেখা গেছে, এই পদ্ধতিগুলো তথ্য সম্পূর্ণ মুছে ফেলার পরিবর্তে শুধুমাত্র লুকিয়ে রাখে। গবেষকদের দাবি, এটি একটি গুরুতর নিরাপত্তা ত্রুটি যা প্রোডাকশন সিস্টেমের জন্য বড় ঝুঁকি তৈরি করছে।
গবেষক দলটি LACUNA নামে একটি বিশেষ পরীক্ষামূলক কাঠামো তৈরি করেছে। এই বেঞ্চমার্কটি পরীক্ষা করে দেখে যে ভাষা মডেল (Language Model) কোনো তথ্য সত্যিই ভুলে গেছে নাকি সেটি কেবল গোপন রেখেছে। LACUNA-র ফলাফল উদ্বেগজনক। এটি প্রমাণ করেছে যে বর্তমানে ব্যবহৃত জনপ্রিয় আনলার্নিং (Unlearning) কৌশলগুলো প্রতারণামূলকভাবে কাজ করে।
আনলার্নিং বলতে বোঝানো হয় একটি প্রশিক্ষিত AI মডেল থেকে নির্দিষ্ট কিছু ডেটা বা জ্ঞান সরানোর প্রক্রিয়াকে। ধরা যাক, একটি চ্যাটবটকে কোনো ব্যক্তির ব্যক্তিগত তথ্য দেওয়া হয়েছে। পরে সেই তথ্য সরানোর জন্য আনলার্নিং পদ্ধতি ব্যবহার করা হয়। কিন্তু LACUNA দেখিয়েছে, এই পদ্ধতিগুলো তথ্যকে মডেলের সক্রিয় স্মৃতি থেকে সরিয়ে দিলেও গভীর নিউরাল নেটওয়ার্কের কোথাও না কোথাও তার ছাপ থেকে যায়।
এই গবেষণার মূল বার্তা হলো, বর্তমান আনলার্নিং পদ্ধতিগুলো নিরাপদ নয়। একটি মডেলকে নির্দিষ্ট বিষয়ে প্রশ্ন করলে সেটি যদি উত্তর না দেয়, তার মানে এই নয় যে তথ্যটি মুছে গেছে। গবেষকরা দেখিয়েছেন, বিশেষ কিছু প্রম্পট বা প্রশ্নের কৌশল ব্যবহার করে সেই লুকানো তথ্য আবার বের করে আনা সম্ভব। এটি প্রোডাকশনে থাকা AI সিস্টেমের জন্য একটি বড় নিরাপত্তা ফাঁকি।
বাংলাদেশের জন্য এই গবেষণার বিশেষ গুরুত্ব রয়েছে। দেশে AI-ভিত্তিক বিভিন্ন সেবা যেমন চ্যাটবট, কাস্টমার সার্ভিস অটোমেশন এবং ডেটা অ্যানালিটিক্স প্ল্যাটফর্ম দ্রুত জনপ্রিয় হচ্ছে। অনেক কোম্পানি এবং স্টার্টআপ তাদের মডেল প্রশিক্ষণের জন্য ব্যবহারকারীর ডেটা ব্যবহার করে। যদি এই ডেটা অপসারণের প্রক্রিয়া নির্ভরযোগ্য না হয়, তাহলে এটি ব্যবহারকারীর গোপনীয়তার জন্য হুমকি হয়ে দাঁড়াতে পারে। ফ্রিল্যান্সার এবং ডেভেলপারদের জন্য এটি একটি সতর্কবার্তা। তাদের বুঝতে হবে যে শুধু মডেলকে 'ভুলে যেতে' বলা যথেষ্ট নয়।
গবেষকরা এখন নতুন এবং আরও শক্তিশালী আনলার্নিং পদ্ধতি তৈরি করার উপর জোর দিচ্ছেন। LACUNA বেঞ্চমার্কটি এখন থেকে যেকোনো নতুন পদ্ধতি পরীক্ষার জন্য একটি মানদণ্ড হিসেবে কাজ করবে। ভবিষ্যতে AI সিস্টেম তৈরি করার সময় ডেটা গোপনীয়তা এবং নিরাপত্তা নিশ্চিত করতে এই দুর্বলতা মাথায় রাখা জরুরি। শুধু তথ্য লুকানো নয়, সত্যিকারের মুছে ফেলার কৌশলই হতে হবে AI-র ভবিষ্যতের ভিত্তি।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to ML
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...