এজিআই অধরা? ভাষা এআই-এর ১ বড় সীমাবদ্ধতা!
দ্য গ্রেডিয়েন্ট-এর এক নতুন বিশ্লেষণে দাবি করা হয়েছে, বর্তমান জেনারেটিভ এআই মডেলগুলো কখনোই এজিআই-তে পৌঁছাতে পারবে না, কারণ এদের মধ্যে 'মূর্ত উপলব্ধি' (embodied understanding) নেই। নিবন্ধটি ভাষাকে চিন্তার মডেল হিসেবে ব্যবহার করার ওভাররিলায়েন্স নিয়ে প্রশ্ন তুলেছে।
দ্য গ্রেডিয়েন্ট-এর এক নতুন বিশ্লেষণে দাবি করা হয়েছে, বর্তমান জেনারেটিভ এআই মডেলগুলো কখনোই এজিআই-তে পৌঁছাতে পারবে না, কারণ এদের মধ্যে 'মূর্ত উপলব্ধি' (embodied understanding) নেই। নিবন্ধটি ভাষাকে চিন্তার মডেল হিসেবে ব্যবহার করার ওভাররিলায়েন্স নিয়ে প্রশ্ন তুলেছে।
কৃত্রিম বুদ্ধিমত্তার জগতে সাম্প্রতিক সাফল্য অনেককে ভাবিয়েছে যে আমরা হয়তো খুব শীঘ্রই আর্টিফিশিয়াল জেনারেল ইন্টেলিজেন্স (এজিআই)-এর দ্বারপ্রান্তে দাঁড়িয়ে আছি। কিন্তু 'দ্য গ্রেডিয়েন্ট'-এ প্রকাশিত এক নতুন প্রতিবেদন সেই ধারণাকে চ্যালেঞ্জ করে বলছে, বর্তমান জেনারেটিভ এআই মডেলগুলোর পথে এজিআই আসন্ন নয় বরং এটি একটি মরীচিকা মাত্র।
নিবন্ধটির মূল বক্তব্য হলো, বর্তমান মডেলগুলো কেবল ভাষার প্যাটার্ন শিখছে, কিন্তু তারা বুঝতে পারছে না। এখানে কম্পিউটার বিজ্ঞানী টেরি উইনোগ্রাডের একটি বিখ্যাত উক্তি উদ্ধৃত করা হয়েছে: "ভাষাকে চিন্তার মডেল হিসেবে ব্যবহার করতে গিয়ে আমরা সেই মূর্ত উপলব্ধিকে (embodied understanding) হারিয়ে ফেলছি, যা আমাদের বুদ্ধিমত্তার ভিত্তি।" অর্থাৎ, মানুষের বুদ্ধিমত্তা কেবল ভাষার মধ্যে সীমাবদ্ধ নয়; এটি আমাদের শারীরিক অভিজ্ঞতা, ইন্দ্রিয়ের সাথে মিথস্ক্রিয়া এবং বাস্তব জগতের সাথে সরাসরি যোগাযোগের মাধ্যমে গঠিত হয়। একটি শিশু যেমন আগুন ছুঁয়ে পোড়ার অভিজ্ঞতা থেকে 'গরম' বুঝতে শেখে, তেমনি একটি এআই মডেল কখনোই সেই 'অভিজ্ঞতা' অর্জন করতে পারে না যদি না এটি শারীরিক জগতে কাজ করতে পারে।
প্রতিবেদনে আরও যুক্তি দেওয়া হয়েছে যে, ভাষাভিত্তিক মডেলগুলো (যেমন GPT-4) যত বড়ই হোক না কেন, তারা মূলত একটি বিশাল স্ট্যাটিস্টিক্যাল ইঞ্জিন। তারা পরবর্তী শব্দ কী হবে তা অনুমান করে, কিন্তু তারা 'অর্থ' বা 'প্রসঙ্গ' বোঝে না। এখানে একটি উদাহরণ দেওয়া যেতে পারে: একটি এআই যদি 'চেয়ার' শব্দটি লাখবার দেখে, তবুও এটি জানে না যে চেয়ারে বসতে হয় বা এটি ভাঙলে কী হয়। যতক্ষণ না একটি মেশিন বাস্তব জগতে হস্তক্ষেপ করতে পারে, তার ফলাফল দেখতে পারে এবং সেই অনুযায়ী শিখতে পারে, ততক্ষণ পর্যন্ত এটিকে সত্যিকারের বুদ্ধিমান বলা যাবে না।
বাংলাদেশের প্রেক্ষাপটে এই আলোচনা অত্যন্ত প্রাসঙ্গিক। দেশে বর্তমানে এআই-ভিত্তিক চ্যাটবট এবং কনটেন্ট জেনারেশন টুলের ব্যবহার বাড়ছে। কিন্তু এই নিবন্ধটি আমাদের মনে করিয়ে দেয় যে, শিক্ষা, চিকিৎসা বা কৃষির মতো গুরুত্বপূর্ণ সেক্টরে এআই-এর ব্যবহার নিয়ে আমাদের বাস্তবসম্মত হতে হবে। শুধু ভাষা অনুকরণ করলেই হবে না; বাংলাদেশের মতো দেশের জন্য এমন এআই দরকার যা স্থানীয় প্রেক্ষাপট, সংস্কৃতি এবং ভৌগোলিক বাস্তবতা বুঝতে সক্ষম হবে। উদাহরণস্বরূপ, একটি ভাষা মডেল যদি বন্যার পূর্বাভাস দেয়, কিন্তু 'পানি জমে যাওয়া' বা 'মাটি স্যাচুরেটেড হওয়ার' শারীরিক অর্থ না বোঝে, তাহলে সেই পূর্বাভাস মারাত্মক ভুল হতে পারে।
পরিশেষে, 'দ্য গ্রেডিয়েন্ট'-এর এই প্রতিবেদন একটি গুরুত্বপূর্ণ সতর্কবার্তা: এআই গবেষণায় আমাদের ভাষার জাদুতে বিভ্রান্ত না হয়ে বরং 'মূর্ত বুদ্ধিমত্তা' (embodied intelligence) এবং বাস্তব জগতের মিথস্ক্রিয়ার দিকে নজর দেওয়া উচিত। যতক্ষণ না আমরা মেশিনকে 'দেখতে', 'ছুঁতে' এবং 'অভিজ্ঞতা অর্জন করতে' শেখাতে পারব, ততক্ষণ এজিআই শুধু একটি স্বপ্নই থেকে যাবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: The Gradient
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...