কার্পাথির ফ্রেমওয়ার্ক কীভাবে LLM-এর কাজ分类 করে?

এটি কাজকে আউটপুটের যাচাইযোগ্যতার ভিত্তিতে ভাগ করে। উচ্চ যাচাইযোগ্য কাজ যেমন কোড কম্পাইলেশন মেশিন সহজেই চেক করতে পারে। নিম্ন যাচাইযোগ্য কাজ যেমন সৃজনশীল লেখায় ভুল ধরা কঠিন।

এই পরীক্ষার ফলাফল কি নির্ভরযোগ্য?

গবেষক নিজেই বলেছেন এটি একটি দিকনির্দেশনামূলক পরীক্ষা, পিয়ার রিভিউড পেপার নয়। মাত্র 120টি কাজ এবং একজন অভ্যন্তরীণ মূল্যায়নকারী ব্যবহার করা হয়েছে। তাই ফলাফলকে চূড়ান্ত বলা যাবে না।

বাংলাদেশের ডেভেলপাররা এই গবেষণা থেকে কী শিখতে পারে?

ডেভেলপাররা বুঝতে পারবেন যে কোডিং ও JSON প্রসেসিংয়ের মতো কাজে AI ব্যবহার নিরাপদ। কিন্তু সৃজনশীল কনটেন্ট বা ওপেন-এন্ডেড কাজে AI-এর আউটপুট যাচাই করে নেওয়া জরুরি।

হোম/নিউজ/রিসার্চ

রিসার্চ৫ মিনিট পড়া

AI কাজের নিরাপত্তা যাচাই করলেন কার্পাথি, জানুন কোন কাজে ঝুঁকি বেশি

একটি ছোট পরীক্ষায় দেখা গেছে, LLM-এর আউটপুট যাচাইযোগ্যতা অনুযায়ী কাজ ভাগ করলে কোড ও JSON-এর মতো উচ্চ যাচাইযোগ্য কাজ নিরাপদ। অন্যদিকে সৃজনশীল লেখার মতো কাজে ঝুঁকি বেশি। কার্পাথির এই ফ্রেমওয়ার্ক AI ব্যবহারে নতুন দিশা দেখাতে পারে।

সম্পাদকীয় টিম

স্টাফ রিপোর্টার · ৪৫ দিন আগে · সূত্র: Reddit r/MachineLearning

AI কাজের নিরাপত্তা যাচাই করলেন কার্পাথি, জানুন কোন কাজে ঝুঁকি বেশি

AI মডেলের আউটপুট কতটা নির্ভরযোগ্য, তা বোঝার জন্য একটি ছোট কিন্তু গুরুত্বপূর্ণ পরীক্ষা চালানো হয়েছে। রেডিটের MachineLearning সাবরেডিটে প্রকাশিত এই পরীক্ষায় 120টি কাজ এবং 3টি ভিন্ন LLM ব্যবহার করা হয়েছে। পরীক্ষাটি পরিচালনা করেছেন একটি LLM infrastructure কোম্পানির কর্মী, তবে তিনি নিজের ব্যক্তিগত সময়ে এটি করেছেন এবং এটি কোম্পানির কোনো দাবি নয়।

পরীক্ষাটির ভিত্তি হলো অ্যান্ড্রে কার্পাথির একটি ফ্রেমওয়ার্ক। কার্পাথি, যিনি OpenAI-এর প্রাক্তন গবেষক এবং Tesla-তে AI বিভাগের প্রধান ছিলেন, তিনি LLM-এর কাজকে আউটপুটের যাচাইযোগ্যতার ভিত্তিতে ভাগ করেছেন। তার মতে, কিছু কাজের আউটপুট সহজেই মেশিনের মাধ্যমে যাচাই করা যায়, আর কিছু কাজের ক্ষেত্রে তা সম্ভব নয়।

উচ্চ যাচাইযোগ্য কাজের মধ্যে রয়েছে কোড কম্পাইল করা এবং স্ট্রাকচার্ড JSON এক্সট্রাকশন। এই কাজগুলিতে LLM-এর আউটপুট ভুল হলে ভেরিফায়ার তা সহজেই ধরে ফেলতে পারে। ফলে এই কাজগুলি ব্যবহার করা তুলনামূলকভাবে নিরাপদ। অন্যদিকে সৃজনশীল লেখা বা ওপেন-এন্ডেড প্রশ্নের উত্তর দেওয়ার মতো কাজে যাচাইযোগ্যতা কম। সেখানে ভুল আউটপুট সনাক্ত করা কঠিন, তাই ঝুঁকি বেশি।

পরীক্ষায় 120টি কাজের মধ্যে উচ্চ, মধ্যম এবং নিম্ন যাচাইযোগ্যতার কাজ রাখা হয়েছিল। তিনটি ভিন্ন মডেলের ফলাফল বিশ্লেষণ করে দেখা গেছে, উচ্চ যাচাইযোগ্য কাজে মডেলগুলির নির্ভুলতা অনেক বেশি ছিল। নিম্ন যাচাইযোগ্য কাজে ত্রুটির হার বেড়ে গেছে। গবেষক বলেছেন, এটি একটি দিকনির্দেশনামূলক পরীক্ষা, কোনো পিয়ার রিভিউড পেপার নয়।

বাংলাদেশের ডেভেলপার ও ফ্রিল্যান্সারদের জন্য এই গবেষণার বিশেষ গুরুত্ব রয়েছে। অনেক ফ্রিল্যান্সার এখন কোডিং, কনটেন্ট রাইটিং এবং ডেটা এন্ট্রির জন্য AI টুল ব্যবহার করেন। কোডিংয়ের মতো কাজে AI-এর ওপর নির্ভর করা তুলনামূলকভাবে নিরাপদ, কারণ ভুল ধরা সহজ। কিন্তু ক্লায়েন্টের জন্য সৃজনশীল কনটেন্ট তৈরি করতে গেলে AI-এর আউটপুট যাচাই করা জরুরি।

ব্যবসায়িক ক্ষেত্রেও এই ফ্রেমওয়ার্ক কাজে লাগতে পারে। কোনো কোম্পানি যদি API বা JSON ডেটা প্রসেসিংয়ের জন্য AI ব্যবহার করে, তবে তা স্বয়ংক্রিয়ভাবে যাচাই করা সম্ভব। কিন্তু গ্রাহক সাপোর্ট বা কনটেন্ট জেনারেশনের মতো কাজে মানুষের তদারকি প্রয়োজন।

ভবিষ্যতে আরও বড় পরিসরে এই ধরনের গবেষণা হলে AI ব্যবহারের নিরাপত্তা আরও বাড়বে। কার্পাথির ফ্রেমওয়ার্ক ব্যবহার করে কোম্পানিগুলি তাদের AI সিস্টেমের দুর্বলতা চিহ্নিত করতে পারবে। সাধারণ ব্যবহারকারীদের জন্যও এটি একটি সতর্কবার্তা: সব AI আউটপুট সমান নির্ভরযোগ্য নয়।

AI কাজের নিরাপত্তা যাচাই করলেন কার্পাথি, জানুন কোন কাজে ঝুঁকি বেশি

আরও পড়ুন

AI নিউজ সরাসরি ইমেইলে পান

মন্তব্য০