ডাটা লিকেজে ভুল ফল দিচ্ছে AI, প্রিন্সটনের গবেষণায় বড় চমক
প্রিন্সটন বিশ্ববিদ্যালয়ের এক গবেষণায় দেখা গেছে, প্রায় ৩০০টি AI গবেষণাপত্রে ডাটা লিকেজের সমস্যা রয়েছে। এর ফলে মডেলগুলোর কার্যক্ষমতা প্রকৃতপক্ষে যতটুকু, তার চেয়ে বেশি দেখানো হচ্ছে। বাস্তব বিশ্বে এগুলো ব্যর্থ হচ্ছে।
প্রিন্সটন বিশ্ববিদ্যালয়ের এক গবেষণায় দেখা গেছে, প্রায় ৩০০টি AI গবেষণাপত্রে ডাটা লিকেজের সমস্যা রয়েছে। এর ফলে মডেলগুলোর কার্যক্ষমতা প্রকৃতপক্ষে যতটুকু, তার চেয়ে বেশি দেখানো হচ্ছে। বাস্তব বিশ্বে এগুলো ব্যর্থ হচ্ছে।
AI গবেষণার জগতে একটি বড় সতর্কবার্তা এসেছে প্রিন্সটন বিশ্ববিদ্যালয় থেকে। কাপুর ও নারায়ণনের নেতৃত্বে পরিচালিত এক গবেষণায় দেখা গেছে, চিকিৎসা, অর্থনীতি, যুদ্ধ পূর্বাভাসসহ ১৭টি ক্ষেত্রের প্রায় ৩০০টি গবেষণাপত্রে ডাটা লিকেজের প্রমাণ মিলেছে।
ডাটা লিকেজ বলতে বোঝায়, মডেলকে যখন প্রশিক্ষণ দেওয়া হয়, তখন সেই প্রশিক্ষণ ডাটার মধ্যে এমন তথ্য ঢুকে যায় যা বাস্তবে মডেল কখনো পাবে না। ফলে টেস্ট সেটে মডেলটি অস্বাভাবিক ভালো ফলাফল দেখায়। কিন্তু বাস্তব বিশ্বে গিয়ে তা হঠাৎ করেই ব্যর্থ হয়।
গবেষকদের মতে, এই সমস্যা AI-এর বাস্তব প্রয়োগের জন্য মারাত্মক হুমকি। একটি মডেল যদি গবেষণাপত্রে ৯৫% নির্ভুলতা দেখায়, কিন্তু বাস্তবে তা ৬০% এর বেশি না হয়, তাহলে সেই মডেলের ওপর ভিত্তি করে গুরুত্বপূর্ণ সিদ্ধান্ত নেওয়া বিপজ্জনক হতে পারে।
সবচেয়ে চমকপ্রদ উদাহরণটি হলো গৃহযুদ্ধ পূর্বাভাসের মডেল। গবেষণাপত্রে দাবি করা হয়েছিল, জটিল AI মডেলগুলো পুরনো লজিস্টিক রিগ্রেশন পদ্ধতির চেয়ে অনেক ভালো ফলাফল দিচ্ছে। কিন্তু ডাটা লিকেজ ঠিক করার পর দেখা গেছে, সেই জটিল মডেলগুলো লজিস্টিক রিগ্রেশনের চেয়ে কোনোভাবেই ভালো নয়।
বাংলাদেশের জন্য এই গবেষণার গুরুত্ব অপরিসীম। দেশের প্রযুক্তি খাতে AI-এর ব্যবহার দিনদিন বাড়ছে। ফ্রিল্যান্সার, শিক্ষার্থী ও উদ্যোক্তারা বিভিন্ন AI মডেল ব্যবহার করছেন। যদি গবেষণাপত্রের ফলাফল ভুল হয়, তাহলে তারা ভুল পথে পরিচালিত হতে পারেন।
বাংলাদেশের বিশ্ববিদ্যালয় ও গবেষণা প্রতিষ্ঠানগুলোর জন্য এটি একটি বড় শিক্ষা। গবেষণার মান নিশ্চিত করতে ডাটা লিকেজ পরীক্ষা করা অত্যন্ত জরুরি। অন্যথায় প্রকাশিত গবেষণার ওপর আস্থা রাখা কঠিন হবে।
গবেষকরা বলছেন, ভবিষ্যতে AI গবেষণার জন্য একটি কঠোর মানদণ্ড তৈরি করা প্রয়োজন। প্রতিটি গবেষণাপত্রে ডাটা লিকেজ টেস্ট বাধ্যতামূলক করা উচিত। তবেই AI-এর প্রকৃত সম্ভাবনা উপলব্ধি করা সম্ভব হবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: Reddit r/artificial
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...