Nature গবেষণা: AI মূল্যায়নে বড় পরিবর্তন, চিকিৎসায় নতুন দিগন্ত
চিকিৎসা ক্ষেত্রে কৃত্রিম বুদ্ধিমত্তার মূল্যায়ন পদ্ধতি নিয়ে বড় পরিবর্তনের ইঙ্গিত দিয়েছে Nature-এ প্রকাশিত এক গবেষণা। বিস্তৃত মূল্যায়নের পরিবর্তে গভীর ও প্রসঙ্গ-নির্দিষ্ট বিশ্লেষণের ওপর জোর দিয়েছে এই গবেষণা।
চিকিৎসা ক্ষেত্রে কৃত্রিম বুদ্ধিমত্তার মূল্যায়ন পদ্ধতি নিয়ে বড় পরিবর্তনের ইঙ্গিত দিয়েছে Nature-এ প্রকাশিত এক গবেষণা। বিস্তৃত মূল্যায়নের পরিবর্তে গভীর ও প্রসঙ্গ-নির্দিষ্ট বিশ্লেষণের ওপর জোর দিয়েছে এই গবেষণা।
চিকিৎসা খাতে কৃত্রিম বুদ্ধিমত্তার (AI) ব্যবহার দিন দিন বাড়ছে। কিন্তু এই AI সিস্টেমগুলো কতটা নির্ভরযোগ্য, তা যাচাই করার পদ্ধতি নিয়ে বড় ধরনের পরিবর্তনের প্রয়োজনীয়তা তুলে ধরেছে Nature জার্নালে প্রকাশিত একটি নতুন গবেষণা। গবেষণাটি ক্লিনিক্যাল AI মূল্যায়নের প্রচলিত ধারণাকে চ্যালেঞ্জ করে একটি গভীর ও প্রসঙ্গ-নির্দিষ্ট পদ্ধতির ওপর জোর দিয়েছে।
গবেষণাপত্রটির শিরোনাম From breadth to depth in clinical artificial intelligence evaluation। এতে বলা হয়েছে, বর্তমানে বেশিরভাগ ক্লিনিক্যাল AI মডেলকে বিস্তৃত বা Broad পদ্ধতিতে মূল্যায়ন করা হয়। এই পদ্ধতিতে মডেলটি অনেকগুলো ডেটাসেটে কেমন পারফর্ম করে, সেটি দেখা হয়। কিন্তু গবেষকরা বলছেন, এই Broad মূল্যায়ন যথেষ্ট নয়। এর পরিবর্তে Deep বা গভীর মূল্যায়ন প্রয়োজন। Deep মূল্যায়ন বলতে বোঝানো হয়েছে নির্দিষ্ট রোগী, নির্দিষ্ট চিকিৎসা পরিবেশ এবং নির্দিষ্ট ক্লিনিক্যাল প্রসঙ্গে AI মডেলটি কেমন কাজ করে, সেটি বিশ্লেষণ করা।
গবেষণাটি Nature-এ প্রকাশিত হওয়ায় এর একাডেমিক গুরুত্ব অনেক বেশি। Nature বিশ্বের সবচেয়ে সম্মানিত বৈজ্ঞানিক জার্নালগুলোর একটি। এই গবেষণায় অংশ নেওয়া বিজ্ঞানীরা দেখিয়েছেন যে Broad মূল্যায়ন প্রায়ই AI মডেলের প্রকৃত সক্ষমতা ও দুর্বলতা লুকিয়ে রাখে। উদাহরণস্বরূপ, একটি AI মডেল বিভিন্ন হাসপাতালের সাধারণ ডেটাতে ভালো কাজ করতে পারে। কিন্তু একটি নির্দিষ্ট হাসপাতালের নির্দিষ্ট রোগীর জটিল ক্ষেত্রে এটি ভুল নির্ণয় দিতে পারে। Deep মূল্যায়ন সেই ফাঁকগুলো ধরতে সাহায্য করে।
গবেষকরা আরও বলেছেন, ক্লিনিক্যাল AI-এর মূল্যায়নে শুধু নির্ভুলতা বা Accuracy দেখলেই হবে না। বরং মডেলটি কোন প্রসঙ্গে কেন এমন সিদ্ধান্ত নিল, সেটি বোঝাও জরুরি। এই কারণে Explainability বা ব্যাখ্যাযোগ্যতার ওপর জোর দিতে হবে। গবেষণাপত্রে কয়েকটি নির্দিষ্ট কেস স্টাডিও দেওয়া হয়েছে, যেখানে দেখা গেছে Broad মূল্যায়নে একটি AI মডেল ভালো স্কোর করলেও Deep মূল্যায়নে তার গুরুতর ত্রুটি ধরা পড়েছে।
বাংলাদেশের প্রেক্ষাপটে এই গবেষণার গুরুত্ব অনেক। দেশে স্বাস্থ্যখাতে AI-ভিত্তিক ডায়াগনস্টিক টুল ও টেলিমেডিসিন প্ল্যাটফর্মের ব্যবহার বাড়ছে। কিন্তু এসব টুলের মূল্যায়ন প্রায়শই বিদেশি ডেটাসেটের ওপর নির্ভর করে করে। বাংলাদেশের রোগীর শারীরবৃত্তীয় বৈশিষ্ট্য, রোগের ধরন ও চিকিৎসা পরিবেশ ভিন্ন হতে পারে। তাই বাংলাদেশি ডেভেলপার, হাসপাতাল ও নীতিনির্ধারকদের উচিত স্থানীয় প্রসঙ্গে Deep মূল্যায়ন পদ্ধতি প্রয়োগ করা। তাহলেই AI-ভিত্তিক স্বাস্থ্যসেবা সত্যিই কার্যকর ও নিরাপদ হবে।
ভবিষ্যতে ক্লিনিক্যাল AI-এর মূল্যায়ন আরও কঠোর ও নির্দিষ্ট হবে বলে গবেষণাটি ইঙ্গিত দেয়। নিয়ন্ত্রক সংস্থা ও হাসপাতাল কর্তৃপক্ষকে নতুন এই পদ্ধতি গ্রহণ করতে হবে। শুধু Broad পরীক্ষায় পাস করলেই হবে না, প্রতিটি AI টুলকে নির্দিষ্ট ক্লিনিক্যাল পরিবেশে গভীরভাবে যাচাই করতে হবে। এই পরিবর্তন রোগীর সুরক্ষা নিশ্চিত করবে এবং AI-এর ওপর আস্থা বাড়াবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: GNews AI Global
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...