AI কাজের নিরাপত্তা যাচাই করলেন কার্পাথি, জানুন কোন কাজে ঝুঁকি বেশি
একটি ছোট পরীক্ষায় দেখা গেছে, LLM-এর আউটপুট যাচাইযোগ্যতা অনুযায়ী কাজ ভাগ করলে কোড ও JSON-এর মতো উচ্চ যাচাইযোগ্য কাজ নিরাপদ। অন্যদিকে সৃজনশীল লেখার মতো কাজে ঝুঁকি বেশি। কার্পাথির এই ফ্রেমওয়ার্ক AI ব্যবহারে নতুন দিশা দেখাতে পারে।
একটি ছোট পরীক্ষায় দেখা গেছে, LLM-এর আউটপুট যাচাইযোগ্যতা অনুযায়ী কাজ ভাগ করলে কোড ও JSON-এর মতো উচ্চ যাচাইযোগ্য কাজ নিরাপদ। অন্যদিকে সৃজনশীল লেখার মতো কাজে ঝুঁকি বেশি। কার্পাথির এই ফ্রেমওয়ার্ক AI ব্যবহারে নতুন দিশা দেখাতে পারে।
AI মডেলের আউটপুট কতটা নির্ভরযোগ্য, তা বোঝার জন্য একটি ছোট কিন্তু গুরুত্বপূর্ণ পরীক্ষা চালানো হয়েছে। রেডিটের MachineLearning সাবরেডিটে প্রকাশিত এই পরীক্ষায় 120টি কাজ এবং 3টি ভিন্ন LLM ব্যবহার করা হয়েছে। পরীক্ষাটি পরিচালনা করেছেন একটি LLM infrastructure কোম্পানির কর্মী, তবে তিনি নিজের ব্যক্তিগত সময়ে এটি করেছেন এবং এটি কোম্পানির কোনো দাবি নয়।
পরীক্ষাটির ভিত্তি হলো অ্যান্ড্রে কার্পাথির একটি ফ্রেমওয়ার্ক। কার্পাথি, যিনি OpenAI-এর প্রাক্তন গবেষক এবং Tesla-তে AI বিভাগের প্রধান ছিলেন, তিনি LLM-এর কাজকে আউটপুটের যাচাইযোগ্যতার ভিত্তিতে ভাগ করেছেন। তার মতে, কিছু কাজের আউটপুট সহজেই মেশিনের মাধ্যমে যাচাই করা যায়, আর কিছু কাজের ক্ষেত্রে তা সম্ভব নয়।
উচ্চ যাচাইযোগ্য কাজের মধ্যে রয়েছে কোড কম্পাইল করা এবং স্ট্রাকচার্ড JSON এক্সট্রাকশন। এই কাজগুলিতে LLM-এর আউটপুট ভুল হলে ভেরিফায়ার তা সহজেই ধরে ফেলতে পারে। ফলে এই কাজগুলি ব্যবহার করা তুলনামূলকভাবে নিরাপদ। অন্যদিকে সৃজনশীল লেখা বা ওপেন-এন্ডেড প্রশ্নের উত্তর দেওয়ার মতো কাজে যাচাইযোগ্যতা কম। সেখানে ভুল আউটপুট সনাক্ত করা কঠিন, তাই ঝুঁকি বেশি।
পরীক্ষায় 120টি কাজের মধ্যে উচ্চ, মধ্যম এবং নিম্ন যাচাইযোগ্যতার কাজ রাখা হয়েছিল। তিনটি ভিন্ন মডেলের ফলাফল বিশ্লেষণ করে দেখা গেছে, উচ্চ যাচাইযোগ্য কাজে মডেলগুলির নির্ভুলতা অনেক বেশি ছিল। নিম্ন যাচাইযোগ্য কাজে ত্রুটির হার বেড়ে গেছে। গবেষক বলেছেন, এটি একটি দিকনির্দেশনামূলক পরীক্ষা, কোনো পিয়ার রিভিউড পেপার নয়।
বাংলাদেশের ডেভেলপার ও ফ্রিল্যান্সারদের জন্য এই গবেষণার বিশেষ গুরুত্ব রয়েছে। অনেক ফ্রিল্যান্সার এখন কোডিং, কনটেন্ট রাইটিং এবং ডেটা এন্ট্রির জন্য AI টুল ব্যবহার করেন। কোডিংয়ের মতো কাজে AI-এর ওপর নির্ভর করা তুলনামূলকভাবে নিরাপদ, কারণ ভুল ধরা সহজ। কিন্তু ক্লায়েন্টের জন্য সৃজনশীল কনটেন্ট তৈরি করতে গেলে AI-এর আউটপুট যাচাই করা জরুরি।
ব্যবসায়িক ক্ষেত্রেও এই ফ্রেমওয়ার্ক কাজে লাগতে পারে। কোনো কোম্পানি যদি API বা JSON ডেটা প্রসেসিংয়ের জন্য AI ব্যবহার করে, তবে তা স্বয়ংক্রিয়ভাবে যাচাই করা সম্ভব। কিন্তু গ্রাহক সাপোর্ট বা কনটেন্ট জেনারেশনের মতো কাজে মানুষের তদারকি প্রয়োজন।
ভবিষ্যতে আরও বড় পরিসরে এই ধরনের গবেষণা হলে AI ব্যবহারের নিরাপত্তা আরও বাড়বে। কার্পাথির ফ্রেমওয়ার্ক ব্যবহার করে কোম্পানিগুলি তাদের AI সিস্টেমের দুর্বলতা চিহ্নিত করতে পারবে। সাধারণ ব্যবহারকারীদের জন্যও এটি একটি সতর্কবার্তা: সব AI আউটপুট সমান নির্ভরযোগ্য নয়।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: Reddit r/MachineLearning
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...