LIVE
মডেলচীনা ওপেন সোর্স AI মডেলে খরচ কমবে ৩ গুণ, জানুন কীভাবেটুলব্যয়বহুল SEO টুলের বিকল্প এখন Claude AI, জানুন কীভাবে খরচ বাঁচাবেনমডেল৫ মিনিটে তৈরি করুন ব্র্যান্ড ভিজুয়াল, Google DeepMind-এর Nano Banana Proটুলকী বা লগইন ছাড়াই হাজারো AI মডেল র‍্যাঙ্ক করুন, এখন ফ্রিটুলFable 5 AI ২০ মিনিট আগের কথা মনে রাখে, আপনার কাজ বদলে যাবেইন্ডাস্ট্রিAnthropic-স্যামসাং জোটে বদলে যাবে AI চিপের দাম, লাভবান হবেন বাংলাদেশি ফ্রিল্যান্সাররাগবেষণাট্রান্সফরমার বানিয়েও হার মানল TF-IDF, এয়ারলাইন কমপ্লেইনে বড় শিক্ষাইন্ডাস্ট্রিAI এন্ডপয়েন্ট হ্যাকারদের হাতে, আপনার ডেটা সুরক্ষিত রাখার উপায় জানুনগবেষণাDSPy লাইব্রেরি দিয়ে SQL সিস্টেম ৩ গুণ উন্নত, জানুন কী লাভইন্ডাস্ট্রিমাইক্রোসফটের ৬০০০ AI বিশেষজ্ঞ দল, বাংলাদেশি ফ্রিল্যান্সারদের জন্য নতুন সুযোগইন্ডাস্ট্রিবাংলাদেশে AI স্ক্রাইব আসছে: জরুরি বিভাগের ডকুমেন্টেশন ৩ গুণ দ্রুত হবেইন্ডাস্ট্রিটেসলা ডেলিভারি ২৫% বেড়ে ওয়াল স্ট্রিটের আশা ছাড়াল, ওপেনএআই সরকারকে শেয়ার দেবেমডেলচীনা ওপেন সোর্স AI মডেলে খরচ কমবে ৩ গুণ, জানুন কীভাবেটুলব্যয়বহুল SEO টুলের বিকল্প এখন Claude AI, জানুন কীভাবে খরচ বাঁচাবেনমডেল৫ মিনিটে তৈরি করুন ব্র্যান্ড ভিজুয়াল, Google DeepMind-এর Nano Banana Proটুলকী বা লগইন ছাড়াই হাজারো AI মডেল র‍্যাঙ্ক করুন, এখন ফ্রিটুলFable 5 AI ২০ মিনিট আগের কথা মনে রাখে, আপনার কাজ বদলে যাবেইন্ডাস্ট্রিAnthropic-স্যামসাং জোটে বদলে যাবে AI চিপের দাম, লাভবান হবেন বাংলাদেশি ফ্রিল্যান্সাররাগবেষণাট্রান্সফরমার বানিয়েও হার মানল TF-IDF, এয়ারলাইন কমপ্লেইনে বড় শিক্ষাইন্ডাস্ট্রিAI এন্ডপয়েন্ট হ্যাকারদের হাতে, আপনার ডেটা সুরক্ষিত রাখার উপায় জানুনগবেষণাDSPy লাইব্রেরি দিয়ে SQL সিস্টেম ৩ গুণ উন্নত, জানুন কী লাভইন্ডাস্ট্রিমাইক্রোসফটের ৬০০০ AI বিশেষজ্ঞ দল, বাংলাদেশি ফ্রিল্যান্সারদের জন্য নতুন সুযোগইন্ডাস্ট্রিবাংলাদেশে AI স্ক্রাইব আসছে: জরুরি বিভাগের ডকুমেন্টেশন ৩ গুণ দ্রুত হবেইন্ডাস্ট্রিটেসলা ডেলিভারি ২৫% বেড়ে ওয়াল স্ট্রিটের আশা ছাড়াল, ওপেনএআই সরকারকে শেয়ার দেবে
হোম/নিউজ/রিসার্চ
রিসার্চ৫ মিনিট পড়া

Apple গবেষণা: AI মডেল RL প্রশিক্ষণে সহজ টেক্সটেই ভুল করে, সতর্ক থাকুন

Apple-এর নতুন গবেষণায় দেখা গেছে, Reinforcement Learning (RL) ফাইনটিউনিং ভিশন-ল্যাঙ্গুয়েজ মডেলের (VLM) চাক্ষুষ যুক্তি উন্নত করলেও তাদের দুর্বলতা বাড়িয়ে দেয়। সহজ টেক্সট পরিবর্তন, যেমন বিভ্রান্তিকর ক্যাপশন, মডেলের কর্মক্ষমতা ব্যাপকভাবে কমিয়ে দেয়।

A
সম্পাদকীয় টিম
স্টাফ রিপোর্টার · ২০ ঘণ্টা আগে · সূত্র: Apple ML Research
Apple গবেষণা: AI মডেল RL প্রশিক্ষণে সহজ টেক্সটেই ভুল করে, সতর্ক থাকুন

Apple-এর নতুন গবেষণায় দেখা গেছে, Reinforcement Learning (RL) ফাইনটিউনিং ভিশন-ল্যাঙ্গুয়েজ মডেলের (VLM) চাক্ষুষ যুক্তি উন্নত করলেও তাদের দুর্বলতা বাড়িয়ে দেয়। সহজ টেক্সট পরিবর্তন, যেমন বিভ্রান্তিকর ক্যাপশন, মডেলের কর্মক্ষমতা ব্যাপকভাবে কমিয়ে দেয়।

Apple-এর ML গবেষণা দল সম্প্রতি একটি গুরুত্বপূর্ণ গবেষণা প্রকাশ করেছে, যা ভিশন-ল্যাঙ্গুয়েজ মডেল বা VLM-এর নিরাপত্তা ও নির্ভরযোগ্যতা নিয়ে নতুন প্রশ্ন তুলেছে। গবেষণাপত্রটির শিরোনাম ‘On Robustness and Chain-of-Thought Consistency of RL-Finetuned VLMs’। এতে দেখা গেছে, Reinforcement Learning বা RL ফাইনটিউনিং মডেলের চাক্ষুষ যুক্তি ক্ষমতা বাড়ালেও এর মধ্যে নতুন ধরনের দুর্বলতা তৈরি করে।

গবেষণায় বলা হয়েছে, RL-টিউন করা VLM গুলো চাক্ষুষ যুক্তি পরীক্ষায় ভালো করলেও তারা সহজ টেক্সট পরিবর্তনের জন্যও অত্যন্ত সংবেদনশীল। বিভ্রান্তিকর ক্যাপশন বা ভুল চেইন-অফ-থট বা CoT ট্রেস দিলে মডেলের কর্মক্ষমতা ব্যাপকভাবে কমে যায়। এটি প্রমাণ করে যে এই মডেলগুলো এখনও দুর্বল ভিজুয়াল গ্রাউন্ডিং বা চাক্ষুষ ভিত্তি থেকে ভুগছে এবং তারা টেক্সটের উপর অতিরিক্ত নির্ভরশীল।

গবেষণার ফলাফল বলছে, RL ফাইনটিউনিং মডেলকে আরও বেশি হ্যালুসিনেশন প্রবণ করে তুলতে পারে। অর্থাৎ মডেল এমন তথ্য তৈরি করে যা ছবিতে নেই। মডেলটি টেক্সট ক্যু বা সংকেতের উপর বেশি নির্ভর করতে শুরু করে এবং ছবির প্রকৃত তথ্য উপেক্ষা করে। এটি বিশেষ করে সুরক্ষা সংবেদনশীল অ্যাপ্লিকেশনে বড় ঝুঁকি তৈরি করে।

গবেষকরা দেখিয়েছেন, চেইন-অফ-থথ বা ধাপে ধাপে চিন্তা করার প্রক্রিয়ায় সামান্য পরিবর্তন আনলেই মডেলের আউটপুট পুরোপুরি বদলে যায়। উদাহরণস্বরূপ, একটি ছবির সঠিক বর্ণনার পরিবর্তে সামান্য বিভ্রান্তিকর ক্যাপশন দিলে মডেল ভুল উত্তর দিতে শুরু করে। এটি প্রমাণ করে যে মডেলটি আসলে ছবি বোঝার চেয়ে টেক্সট প্যাটার্ন মিলিয়ে উত্তর দিচ্ছে।

বাংলাদেশের প্রেক্ষাপটে এই গবেষণাটি অত্যন্ত গুরুত্বপূর্ণ। বাংলাদেশে AI এবং মেশিন লার্নিং নিয়ে কাজ করা ডেভেলপার, গবেষক ও শিক্ষার্থীদের জন্য এটি একটি বড় সতর্কবার্তা। অনেক স্টার্টআপ এবং ফ্রিল্যান্সার VLM ব্যবহার করে ইমেজ অ্যানালাইসিস, কন্টেন্ট জেনারেশন এবং অটোমেশন টুল তৈরি করছে। যদি তারা RL ফাইনটিউনিং ব্যবহার করে তবে তাদের মডেলের এই দুর্বলতা সম্পর্কে সচেতন থাকতে হবে। অন্যথায় ভুল তথ্য তৈরি করে ব্যবহারকারীদের বিভ্রান্ত করার ঝুঁকি থাকবে।

গবেষণাটি আরও দেখায় যে বর্তমান বেঞ্চমার্ক বা মানদণ্ডগুলো মডেলের প্রকৃত দুর্বলতা ধরতে ব্যর্থ হচ্ছে। গবেষকরা নতুন ধরনের পরীক্ষার প্রস্তাব দিয়েছেন যা টেক্সট পরিবর্তনের বিরুদ্ধে মডেলের সহনশীলতা পরিমাপ করে। ভবিষ্যতে মডেল তৈরির সময় এই দুর্বলতা মোকাবেলায় আরও শক্তিশালী প্রশিক্ষণ পদ্ধতি এবং উন্নত ডেটাসেট প্রয়োজন হবে।

Apple-এর এই গবেষণা AI নিরাপত্তা নিয়ে নতুন করে ভাবার সুযোগ করে দিয়েছে। এটি প্রমাণ করে যে শুধু বেঞ্চমার্কে ভালো ফলাফল করাই যথেষ্ট নয়। মডেলের বাস্তব জগতে ব্যবহারের সময় তার নির্ভরযোগ্যতা ও দৃঢ়তা নিশ্চিত করা জরুরি। বিশেষ করে যেসব অ্যাপ্লিকেশনে ভুল তথ্যের মারাত্মক পরিণতি হতে পারে, সেখানে এই গবেষণার ফলাফল বিশেষভাবে প্রাসঙ্গিক।

আরও পড়ুন

🌐 তথ্যসূত্র ও স্বচ্ছতা

এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।

ট্যাগ:#রিসার্চ#AI#বাংলাদেশ#Apple ML Research
AD
📧

AI নিউজ সরাসরি ইমেইলে পান

প্রতিদিনের সেরা AI খবর বাছাই করে আপনার inbox-এ পাঠাই। বিজ্ঞাপন নেই।

মূল প্রতিবেদন: Apple ML Research

সোর্স দেখুন ↗

মন্তব্য

লোড হচ্ছে...