প্রিন্সটন গবেষণা: ডাটা লিকেজে ভুল প্রমাণিত হচ্ছে ৩০০ AI গবেষণা, বাংলাদেশি গবেষকদের সাবধান
প্রিন্সটন বিশ্ববিদ্যালয়ের এক গবেষণায় দেখা গেছে, প্রায় ৩০০ টি AI গবেষণাপত্রে ডাটা লিকেজ রয়েছে। এর ফলে মডেলের কর্মক্ষমতা ভুলভাবে দেখানো হচ্ছে এবং বাস্তব জগতে সেগুলো ব্যর্থ হচ্ছে। গবেষণাটি ১৭ টি ক্ষেত্রের ওপর পরিচালিত হয়েছে।
প্রিন্সটন বিশ্ববিদ্যালয়ের এক গবেষণায় দেখা গেছে, প্রায় ৩০০ টি AI গবেষণাপত্রে ডাটা লিকেজ রয়েছে। এর ফলে মডেলের কর্মক্ষমতা ভুলভাবে দেখানো হচ্ছে এবং বাস্তব জগতে সেগুলো ব্যর্থ হচ্ছে। গবেষণাটি ১৭ টি ক্ষেত্রের ওপর পরিচালিত হয়েছে।
কৃত্রিম বুদ্ধিমত্তা (AI) নিয়ে প্রকাশিত গবেষণার একটি বড় অংশই ভুল হতে পারে। প্রিন্সটন বিশ্ববিদ্যালয়ের গবেষক কাপুর ও নারায়ণনের একটি সাম্প্রতিক গবেষণায় এই চাঞ্চল্যকর তথ্য উঠে এসেছে। তারা ১৭ টি ভিন্ন ক্ষেত্রের প্রায় ৩০০ টি গবেষণাপত্রে ডাটা লিকেজ খুঁজে পেয়েছেন।
ডাটা লিকেজ মানে কী? এটি একটি প্রযুক্তিগত সমস্যা। যখন একটি AI মডেলকে এমন তথ্য দিয়ে প্রশিক্ষণ দেওয়া হয় যা বাস্তব ভবিষ্যদ্বাণীর সময় তার কাছে থাকবে না। এর ফলে মডেলটি টেস্ট ডেটাতে অসাধারণ ফলাফল দেখায় কিন্তু বাস্তব জগতে এসে সম্পূর্ণ ব্যর্থ হয়।
গবেষণাটি চিকিৎসাশাস্ত্র, অর্থনীতি এবং গৃহযুদ্ধের পূর্বাভাসের মতো গুরুত্বপূর্ণ ক্ষেত্রগুলো পরীক্ষা করেছে। গবেষকদের সবচেয়ে প্রিয় উদাহরণ হলো গৃহযুদ্ধের পূর্বাভাস। সেখানে জটিল মডেলগুলোকে বলা হয়েছিল যে তারা পুরনো লজিস্টিক রিগ্রেশন মডেলের চেয়ে অনেক ভালো কাজ করছে। কিন্তু ডাটা লিকেজ ঠিক করার পর দেখা গেছে, সেই জটিল মডেলগুলো আর সাধারণ মডেলের চেয়ে ভালো নয়।
এই আবিষ্কার খুবই গুরুত্বপূর্ণ। কারণ AI মডেলের ওপর ভিত্তি করে বড় বড় সিদ্ধান্ত নেওয়া হয়। চিকিৎসায় রোগ নির্ণয় থেকে শুরু করে অর্থনৈতিক নীতি নির্ধারণ পর্যন্ত সব জায়গায় AI ব্যবহার হচ্ছে। যদি গবেষণাপত্রের ফলাফলই ভুল হয়, তাহলে বাস্তব প্রয়োগে তা বিপর্যয় ডেকে আনতে পারে।
বাংলাদেশের জন্য এই খবরটির বিশেষ তাৎপর্য রয়েছে। বাংলাদেশে AI গবেষণা ও প্রযুক্তি খাত দ্রুত বাড়ছে। অনেক ফ্রিল্যান্সার এবং ডেভেলপার আন্তর্জাতিক গবেষণাপত্রের মডেল ব্যবহার করে নিজেদের প্রকল্প তৈরি করছেন। তারা যদি ভুল তথ্যের ওপর নির্ভর করেন, তাহলে তাদের প্রকল্পও ব্যর্থ হবে। শিক্ষার্থীদের জন্যও এটি একটি সতর্কবার্তা। গবেষণাপত্র পড়ার সময় তাদের সোর্স এবং পদ্ধতি যাচাই করা উচিত।
গবেষকরা বলছেন, এই সমস্যা সমাধানের জন্য গবেষণাপত্র প্রকাশের আগে আরও কঠোর পর্যালোচনা প্রয়োজন। পাশাপাশি গবেষকদের নিজেদেরও ডাটা লিকেজ সম্পর্কে সচেতন হতে হবে। প্রিন্সটনের এই গবেষণাটি AI বিশ্বে একটি বড় ধাক্কা দিয়েছে। এখন দেখার বিষয়, গবেষণা সম্প্রদায় কীভাবে এই চ্যালেঞ্জ মোকাবিলা করে। ভবিষ্যতে আরও নির্ভরযোগ্য ও স্বচ্ছ গবেষণার প্রয়োজনীয়তা এখন সবার কাছে স্পষ্ট।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: Reddit r/artificial
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...