বাংলা ভাষা AI-তে পিছিয়ে, গবেষণা না বাড়লে ক্ষতি চাকরি ও ফ্রিল্যান্সিংয়ে
বিশ্বের ৯৯ শতাংশ ভাষা বর্তমান AI উন্নয়নে উপেক্ষিত। dev.to ML-এর এক প্রতিবেদনে বলা হয়েছে, উচ্চসম্পদ ভাষার আধিপত্যে বাংলার মতো ভাষা পিছিয়ে পড়ছে। এই বৈষম্য দূর করতে আরও গবেষণার আহ্বান জানিয়েছেন বিশেষজ্ঞরা।
বিশ্বের ৯৯ শতাংশ ভাষা বর্তমান AI উন্নয়নে উপেক্ষিত। dev.to ML-এর এক প্রতিবেদনে বলা হয়েছে, উচ্চসম্পদ ভাষার আধিপত্যে বাংলার মতো ভাষা পিছিয়ে পড়ছে। এই বৈষম্য দূর করতে আরও গবেষণার আহ্বান জানিয়েছেন বিশেষজ্ঞরা।
বিশ্বের মাত্র কয়েকটি ভাষা বর্তমান কৃত্রিম বুদ্ধিমত্তা বা AI-এর বিশাল অগ্রগতির সুবিধা ভোগ করছে। dev.to ML-এর এক সাম্প্রতিক প্রতিবেদনে এই বৈষম্যকে 'অদৃশ্য ৯৯ শতাংশ' বলে অভিহিত করা হয়েছে। প্রতিবেদনে বলা হয়েছে, GPT-4 এবং LLaMA-র মতো বড় ভাষার মডেল বা LLM-গুলো মূলত ইংরেজি, চীনা ও স্প্যানিশের মতো উচ্চসম্পদ ভাষার ওপর প্রশিক্ষিত। এই ভাষাগুলোর জন্য রয়েছে প্রচুর ডিজিটাল তথ্য, সুসংহত লেখার পদ্ধতি এবং শক্তিশালী অনলাইন উপস্থিতি। অন্যদিকে বাংলাসহ বিশ্বের ৭০০০ ভাষার মধ্যে ৯৯ শতাংশ ভাষারই এই সুযোগ নেই।
এই প্রযুক্তিগত বিপ্লব যখন সমাজের প্রতিটি স্তরে প্রবেশ করছে, তখন নিম্নসম্পদ ভাষার উপেক্ষা একটি গভীর সংকট তৈরি করছে। প্রতিবেদনটি সতর্ক করে দিয়েছে যে, এই অসমতা কেবল প্রযুক্তিগত নয় বরং এটি সাংস্কৃতিক ও অর্থনৈতিক বৈষম্যকেও আরও বাড়িয়ে তুলবে। যেসব ভাষায় পর্যাপ্ত AI গবেষণা নেই, সেগুলোর ব্যবহারকারীরা স্বাস্থ্য, শিক্ষা ও তথ্যের মতো মৌলিক সেবা থেকে বঞ্চিত হচ্ছেন।
প্রতিবেদনটির মতে, উচ্চসম্পদ ভাষার প্রাধান্যের পেছনে কয়েকটি কারণ কাজ করছে। প্রথমত, এই ভাষাগুলোর জন্য ইন্টারনেটে বিপুল পরিমাণ পাঠ্য তথ্য রয়েছে যা মডেল প্রশিক্ষণের জন্য অপরিহার্য। দ্বিতীয়ত, বড় প্রযুক্তি কোম্পানিগুলো তাদের বিনিয়োগ ও গবেষণা সেই ভাষাগুলোর দিকেই কেন্দ্রীভূত করছে যেখানে সবচেয়ে বেশি বাণিজ্যিক সম্ভাবনা আছে। ফলে বাংলা, উর্দু, হাউসা বা সোয়াহিলির মতো ভাষার জন্য উপযুক্ত AI টুল তৈরি হচ্ছে না।
বাংলাদেশের জন্য এই প্রতিবেদনের বার্তা অত্যন্ত গুরুত্বপূর্ণ। দেশের ১৭ কোটির বেশি মানুষ বাংলা ভাষায় কথা বলে। কিন্তু বর্তমান AI মডেলগুলোতে বাংলা ভাষার সীমিত উপস্থিতি রয়েছে। একটি উদাহরণ দিলে বিষয়টি পরিষ্কার হবে। ChatGPT-তে বাংলায় প্রশ্ন করলে উত্তর অনেক সময় অসম্পূর্ণ বা ভুল আসে। অন্যদিকে ইংরেজিতে একই প্রশ্নের উত্তর অনেক নির্ভুল হয়। এই সমস্যা বাংলাদেশের শিক্ষার্থী, গবেষক, ফ্রিল্যান্সার ও ব্যবসায়ীদের জন্য বাস্তব প্রতিবন্ধকতা তৈরি করছে।
বাংলাদেশের ডেভেলপার ও গবেষকদের জন্য এখানে একটি বড় সুযোগ রয়েছে। নিম্নসম্পদ ভাষার জন্য বিশেষায়িত AI মডেল তৈরি করা একটি গুরুত্বপূর্ণ গবেষণার ক্ষেত্র হয়ে উঠতে পারে। স্থানীয় ডেটাসেট তৈরি, বাংলা ভাষার ব্যাকরণ ও বাগধারা বোঝার মতো কাজগুলোতে মনোযোগ দিলে দেশীয় প্রযুক্তি খাত বিশ্ববাজারে নিজের অবস্থান শক্ত করতে পারবে। সরকার ও শিক্ষাপ্রতিষ্ঠানের উচিত এই খাতে গবেষণা ও বিনিয়োগ বাড়ানো।
নিম্নসম্পদ ভাষার জন্য AI গবেষণা কেবল একটি প্রযুক্তিগত প্রয়োজন নয় বরং এটি ডিজিটাল অধিকারের বিষয়। প্রতিটি ভাষাভাষী মানুষের তথ্য ও প্রযুক্তিতে সমান প্রবেশাধিকার পাওয়া উচিত। ভবিষ্যতে আরও অন্তর্ভুক্তিমূলক AI তৈরি করতে হলে গবেষক, নীতিনির্ধারক ও প্রযুক্তি কোম্পানিগুলোকে একসঙ্গে কাজ করতে হবে। তবেই 'অদৃশ্য ৯৯ শতাংশ' ভাষাকে দৃশ্যমান করা সম্ভব হবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to ML
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...