LIVE
গবেষণাEurekAgent: AI গবেষণায় নতুন পদ্ধতি, বাড়বে বাংলাদেশের ফ্রিল্যান্সিং সুযোগগবেষণাবাংলাদেশে রোবট এখন কাজের অর্থ বুঝবে, শুধু ছবি নয়টুল৫ মিনিটে নিজের AI এজেন্ট বানান, Dify ওপেন সোর্সেই সম্ভবমডেলGemini 2.5 Flash ব্যবহারে খরচ ৮.৬ গুণ বেশি, চিনুন লুকানো ফাঁদটুলল্যাংচেইন দিয়ে নিজের AI এজেন্ট বানান, আয় করুন ডলারেইন্ডাস্ট্রিযুক্তরাষ্ট্রের নির্দেশে বন্ধ হলো অ্যানথ্রপিকের ক্লদ মডেল, কী প্রভাব পড়বে বাংলাদেশে?ইন্ডাস্ট্রিবিশ্বের স্টার্টআপ বিনিয়োগের ৫৭% এখন AI-তে, বাংলাদেশের ফ্রিল্যান্সারদের জন্য বড় সুযোগইন্ডাস্ট্রিযুক্তরাষ্ট্রে OpenAI-এর বিরুদ্ধে তদন্ত শুরু, বাংলাদেশের ফ্রিল্যান্সারদের কী প্রভাব পড়বে?ইন্ডাস্ট্রিযুক্তরাষ্ট্রের চাপে বাংলাদেশি ব্যবহারকারীদের জন্য বন্ধ হলো শক্তিশালী AI মডেলইন্ডাস্ট্রিOracle Cloud-এ OpenAI মডেল: বাংলাদেশি প্রতিষ্ঠানের AI ব্যবহার এখন সহজ ও সাশ্রয়ীটুলনটিয়নে এলো OpenAI Codex, প্রজেক্ট ম্যানেজমেন্টে AI সহায়তা এখন সবার জন্যইন্ডাস্ট্রিOpenAI-র নীতি প্রস্তাবে বাংলাদেশের AI অর্থনীতিতে বড় সুযোগ আসছেগবেষণাEurekAgent: AI গবেষণায় নতুন পদ্ধতি, বাড়বে বাংলাদেশের ফ্রিল্যান্সিং সুযোগগবেষণাবাংলাদেশে রোবট এখন কাজের অর্থ বুঝবে, শুধু ছবি নয়টুল৫ মিনিটে নিজের AI এজেন্ট বানান, Dify ওপেন সোর্সেই সম্ভবমডেলGemini 2.5 Flash ব্যবহারে খরচ ৮.৬ গুণ বেশি, চিনুন লুকানো ফাঁদটুলল্যাংচেইন দিয়ে নিজের AI এজেন্ট বানান, আয় করুন ডলারেইন্ডাস্ট্রিযুক্তরাষ্ট্রের নির্দেশে বন্ধ হলো অ্যানথ্রপিকের ক্লদ মডেল, কী প্রভাব পড়বে বাংলাদেশে?ইন্ডাস্ট্রিবিশ্বের স্টার্টআপ বিনিয়োগের ৫৭% এখন AI-তে, বাংলাদেশের ফ্রিল্যান্সারদের জন্য বড় সুযোগইন্ডাস্ট্রিযুক্তরাষ্ট্রে OpenAI-এর বিরুদ্ধে তদন্ত শুরু, বাংলাদেশের ফ্রিল্যান্সারদের কী প্রভাব পড়বে?ইন্ডাস্ট্রিযুক্তরাষ্ট্রের চাপে বাংলাদেশি ব্যবহারকারীদের জন্য বন্ধ হলো শক্তিশালী AI মডেলইন্ডাস্ট্রিOracle Cloud-এ OpenAI মডেল: বাংলাদেশি প্রতিষ্ঠানের AI ব্যবহার এখন সহজ ও সাশ্রয়ীটুলনটিয়নে এলো OpenAI Codex, প্রজেক্ট ম্যানেজমেন্টে AI সহায়তা এখন সবার জন্যইন্ডাস্ট্রিOpenAI-র নীতি প্রস্তাবে বাংলাদেশের AI অর্থনীতিতে বড় সুযোগ আসছে
হোম/নিউজ/রিসার্চ
রিসার্চ৫ মিনিট পড়া

বাংলাদেশে PII সুরক্ষায় নতুন দিগন্ত: Ensemble পদ্ধতি Regex-কে ৪ গুণে হারাল

একটি নতুন গবেষণায় PII শনাক্তকরণের তিনটি পদ্ধতি তুলনা করে দেখা গেছে, Ensemble পদ্ধতি সর্বোচ্চ গড় F1 স্কোর 0.662 অর্জন করেছে। অন্যদিকে, মেডিকেল টেক্সটে BERT-NER-এর F1 স্কোর মাত্র 0.167, যা Regex-এর চেয়েও দুর্বল।

d
সম্পাদকীয় টিম
স্টাফ রিপোর্টার · ২ ঘণ্টা আগে · সূত্র: dev.to ML
বাংলাদেশে PII সুরক্ষায় নতুন দিগন্ত: Ensemble পদ্ধতি Regex-কে ৪ গুণে হারাল

একটি নতুন গবেষণায় PII শনাক্তকরণের তিনটি পদ্ধতি তুলনা করে দেখা গেছে, Ensemble পদ্ধতি সর্বোচ্চ গড় F1 স্কোর 0.662 অর্জন করেছে। অন্যদিকে, মেডিকেল টেক্সটে BERT-NER-এর F1 স্কোর মাত্র 0.167, যা Regex-এর চেয়েও দুর্বল।

প্রযুক্তি সংবাদমাধ্যম dev.to-তে প্রকাশিত একটি সাম্প্রতিক গবেষণায় ব্যক্তিগত শনাক্তকারী তথ্য (PII) শনাক্তকরণের তিনটি ভিন্ন পদ্ধতির তুলনামূলক পরীক্ষা করা হয়েছে। গবেষণাটি 2026 সালের এপ্রিল মাসের শেষের দিকে পরিচালিত হয় এবং এতে মোট 9টি ভিন্ন পরিস্থিতিতে পরীক্ষা চালানো হয়। পরিস্থিতিগুলোর মধ্যে ছিল বাণিজ্যিক চুক্তি, মানবসম্পদ রেকর্ড, কোড রিভিউ, ইলেকট্রনিক মেডিকেল রেকর্ডের সারাংশ, জিন রিপোর্ট এবং রেডিওলজি রিপোর্ট। এর পাশাপাশি তিন ধরনের অস্পষ্ট বা গোপন করা PII ফরম্যাটও পরীক্ষায় অন্তর্ভুক্ত ছিল।

গবেষণার মূল ফলাফল অনুযায়ী, Ensemble পদ্ধতি সর্বোচ্চ গড় F1 স্কোর 0.662 অর্জন করেছে। F1 স্কোর হলো একটি মেট্রিক যা নির্ভুলতা এবং পুনরুদ্ধারের মধ্যে ভারসাম্য পরিমাপ করে। অন্যদিকে, শুধুমাত্র BERT-NER মডেল ব্যবহার করে চালানো পরীক্ষায় গড় F1 স্কোর ছিল মাত্র 0.167। বিশেষ করে মেডিকেল টেক্সটের ক্ষেত্রে BERT-NER-এর পারফরম্যান্স ছিল অত্যন্ত দুর্বল।

তিনটি পদ্ধতির ডিজাইন লজিক ভিন্ন ছিল। প্রথম পদ্ধতি Regex সম্পূর্ণ নিয়মভিত্তিক। এটি নির্দিষ্ট ফরম্যাট যেমন ফোন নম্বর, ইমেইল, আইডি কার্ড নম্বর এবং তারিখ শনাক্ত করতে পারে। এই পদ্ধতির বিলম্ব প্রায় শূন্য, প্রতি রেকর্ডে 0.3 মিলিসেকেন্ডের কম সময় লাগে। দ্বিতীয় পদ্ধতি BERT-NER একটি প্রাক-প্রশিক্ষিত ভাষা মডেল ব্যবহার করে যা প্রসঙ্গ বুঝে PII শনাক্ত করার চেষ্টা করে। তবে মেডিকেল টেক্সটের জটিলতার কারণে এটি ভালো কাজ করতে পারেনি। তৃতীয় পদ্ধতি Ensemble উভয় পদ্ধতির শক্তিকে একত্রিত করে, যা সবচেয়ে ভালো ফলাফল দিয়েছে।

বাংলাদেশের জন্য এই গবেষণার গুরুত্ব অনেক। বর্তমানে বাংলাদেশে হেলথটেক এবং ফিনটেক সেক্টর দ্রুত প্রসারিত হচ্ছে। অনেক স্টার্টআপ মেডিকেল রেকর্ড এবং আর্থিক তথ্য প্রক্রিয়াকরণের জন্য AI পাইপলাইন তৈরি করছে। এই গবেষণার ফলাফল তাদের জন্য একটি গুরুত্বপূর্ণ নির্দেশনা হতে পারে। বিশেষ করে যারা মেডিকেল ডেটা নিয়ে কাজ করছেন, তাদের জন্য BERT-NER-এর দুর্বলতা একটি বড় সতর্কবার্তা।

গবেষণাটি আরও দেখিয়েছে যে শুধুমাত্র একটি পদ্ধতির ওপর নির্ভর না করে একাধিক পদ্ধতির সমন্বয় ব্যবহার করলে PII শনাক্তকরণের নির্ভুলতা অনেক বাড়ানো সম্ভব। Ensemble পদ্ধতি Regex-এর দ্রুততা এবং BERT-NER-এর প্রসঙ্গ বোঝার ক্ষমতাকে একত্রিত করে কাজ করে। এই পদ্ধতি বর্তমানে মেডিকেল AI পাইপলাইনের জন্য সবচেয়ে কার্যকর সমাধান হিসেবে দেখা হচ্ছে।

ভবিষ্যতে আরও উন্নত মডেল এবং ডেটা সেট ব্যবহার করে এই ধরনের গবেষণা অব্যাহত থাকবে। বাংলাদেশের ডেভেলপার এবং গবেষকদের জন্য এটি একটি সময়োপযোগী নির্দেশনা। তাদের উচিত তাদের নিজস্ব পাইপলাইনে Ensemble পদ্ধতি প্রয়োগ করে PII শনাক্তকরণের নির্ভুলতা বাড়ানো।

আরও পড়ুন

🌐 তথ্যসূত্র ও স্বচ্ছতা

এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।

ট্যাগ:#রিসার্চ#AI#বাংলাদেশ#dev.to ML
AD
📧

AI নিউজ সরাসরি ইমেইলে পান

প্রতিদিনের সেরা AI খবর বাছাই করে আপনার inbox-এ পাঠাই। বিজ্ঞাপন নেই।

মূল প্রতিবেদন: dev.to ML

সোর্স দেখুন ↗

মন্তব্য

লোড হচ্ছে...