AI-তে ডেটা পাঠানোর আগে রিড্যাক্ট করুন, নইলে ফাঁস হবে আপনার গোপন তথ্য
তৃতীয় পক্ষের বড় ভাষার মডেলে (LLM) সংবেদনশীল তথ্য পাঠানো নিরাপত্তা ও সম্মতি ঝুঁকি তৈরি করে। একটি নতুন গাইড স্বয়ংক্রিয় রিড্যাকশন কৌশল নিয়ে আলোচনা করে যা নেটওয়ার্ক ছাড়ার আগেই প্রম্পট পরিষ্কার করে।
তৃতীয় পক্ষের বড় ভাষার মডেলে (LLM) সংবেদনশীল তথ্য পাঠানো নিরাপত্তা ও সম্মতি ঝুঁকি তৈরি করে। একটি নতুন গাইড স্বয়ংক্রিয় রিড্যাকশন কৌশল নিয়ে আলোচনা করে যা নেটওয়ার্ক ছাড়ার আগেই প্রম্পট পরিষ্কার করে।
OpenAI, Anthropic এবং Google-এর মতো প্রতিষ্ঠানের বড় ভাষার মডেল (LLM) শক্তিশালী টুল হলেও সেগুলোতে সংবেদনশীল তথ্য পাঠানো ডেটা ফাঁসের গুরুতর ঝুঁকি তৈরি করে। প্রতিটি কর্মচারী যখন কোনো প্রম্পটে গ্রাহকের নাম, ঠিকানা বা আর্থিক তথ্য দেয় তখন সেই ডেটা তৃতীয় পক্ষের সার্ভারে চলে যায়। dev.to AI-তে প্রকাশিত একটি নতুন গাইড এই সমস্যার সমাধানে স্বয়ংক্রিয় রিড্যাকশন কৌশল নিয়ে বিস্তারিত নির্দেশনা দিয়েছে।
এই গাইডের মূল লক্ষ্য হলো দলগুলোকে AI টুল ব্যবহার করতে সাহায্য করা যাতে গোপনীয় তথ্য উন্মুক্ত না হয়। রিড্যাকশন প্রক্রিয়াটি প্রম্পটকে নেটওয়ার্ক ছাড়ার আগেই স্যানিটাইজ করে। এর মানে হলো সংবেদনশীল ডেটা যেমন ক্রেডিট কার্ড নম্বর, জাতীয় পরিচয়পত্র নম্বর বা স্বাস্থ্য সংক্রান্ত তথ্য স্বয়ংক্রিয়ভাবে মুছে ফেলা বা প্রতিস্থাপন করা যায়।
গাইডটি বিভিন্ন রিড্যাকশন পদ্ধতি নিয়ে আলোচনা করে। প্রথম পদ্ধতি হলো রেগুলার এক্সপ্রেশন (regex) ব্যবহার করে নির্দিষ্ট প্যাটার্ন চিহ্নিত করা। যেমন 16-সংখ্যার ক্রেডিট কার্ড নম্বর বা ইমেল ঠিকানা সহজেই শনাক্ত করা যায়। দ্বিতীয় পদ্ধতি হলো নেমড এন্টিটি রিকগনিশন (NER) মডেল ব্যবহার করা যা নাম, প্রতিষ্ঠান, অবস্থান ইত্যাদি চিহ্নিত করে। তৃতীয় পদ্ধতি হলো কাস্টম ব্ল্যাকলিস্ট তৈরি করা যেখানে নির্দিষ্ট শব্দ বা বাক্যাংশ সংরক্ষণ করা থাকে।
এই কৌশলগুলো ব্যবহারের জন্য গাইডটি প্র্যাকটিক্যাল উদাহরণ দিয়েছে। একটি উদাহরণে দেখানো হয়েছে কীভাবে একটি Python স্ক্রিপ্ট ব্যবহার করে প্রম্পট থেকে ফোন নম্বর সরানো যায়। আরেকটি উদাহরণে দেখানো হয়েছে কীভাবে API কলের আগে ডেটা মাস্ক করা হয়। প্রতিটি পদ্ধতির সুবিধা ও অসুবিধা নিয়েও আলোচনা করা হয়েছে।
বাংলাদেশের ডেভেলপার, ফ্রিল্যান্সার এবং প্রযুক্তি প্রতিষ্ঠানের জন্য এই গাইড অত্যন্ত প্রাসঙ্গিক। দেশের আউটসোর্সিং শিল্পে প্রতিদিন হাজার হাজার প্রম্পট বিভিন্ন AI API-তে পাঠানো হয়। ফ্রিল্যান্সাররা প্রায়ই ক্লায়েন্টের গোপনীয় তথ্য নিয়ে কাজ করেন। এই রিড্যাকশন কৌশল ব্যবহার করে তারা নিরাপদে AI টুল ব্যবহার করতে পারবেন এবং ডেটা ফাঁসের ঝুঁকি এড়াতে পারবেন।
ভবিষ্যতে আরও উন্নত রিড্যাকশন টুল তৈরি হবে বলে আশা করা যায়। বর্তমানে ওপেন সোর্স লাইব্রেরি যেমন Presidio এবং Microsoft-এর FPE (Format Preserving Encryption) ইতিমধ্যেই জনপ্রিয় হয়ে উঠেছে। যেকোনো প্রতিষ্ঠানের জন্য সবচেয়ে ভালো পন্থা হলো একাধিক স্তরের নিরাপত্তা ব্যবস্থা গ্রহণ করা এবং নিয়মিতভাবে রিড্যাকশন প্রক্রিয়া আপডেট করা।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to AI
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...