AI প্রশিক্ষণের খরচ কমবে ৩ গুণ, লাভ হবে ফ্রিল্যান্সারদের
গবেষণায় দেখা গেছে, রিইনফোর্সমেন্ট লার্নিং-এর মাধ্যমে মডেল টিউনিংয়ের বেশিরভাগ উন্নতি ঘটে মাত্র এক বা দুটি মধ্যবর্তী স্তরে। এই আবিষ্কার প্রশিক্ষণের খরচ কমিয়ে AI অভিযোজনের অর্থনীতি বদলে দিতে পারে।
গবেষণায় দেখা গেছে, রিইনফোর্সমেন্ট লার্নিং-এর মাধ্যমে মডেল টিউনিংয়ের বেশিরভাগ উন্নতি ঘটে মাত্র এক বা দুটি মধ্যবর্তী স্তরে। এই আবিষ্কার প্রশিক্ষণের খরচ কমিয়ে AI অভিযোজনের অর্থনীতি বদলে দিতে পারে।
বৃহৎ ভাষা মডেলের (LLM) শেখার প্রক্রিয়া নিয়ে একটি চমকপ্রদ গবেষণা সামনে এসেছে। গবেষকরা দেখেছেন, রিইনফোর্সমেন্ট লার্নিং (RL) বা শক্তিবৃদ্ধি শিক্ষণের মাধ্যমে মডেলকে সূক্ষ্ম-টিউনিং করার সময় যে উন্নতি হয়, তার সিংহভাগই ঘটে মডেলের মাত্র এক বা দুটি মধ্যবর্তী স্তরে। এই আবিষ্কার মেশিন লার্নিংয়ের একটি মৌলিক ধারণাকে চ্যালেঞ্জ করছে।
এতদিন ধারণা করা হতো, বড় ভাষার মডেলের সব স্তরই শেখার ক্ষেত্রে প্রায় সমানভাবে অবদান রাখে। কিন্তু নতুন এই গবেষণা বলছে, RL-ভিত্তিক ফাইন-টিউনিংয়ের সময় উন্নতির প্রায় পুরোটাই কেন্দ্রীভূত হয় মডেলের মধ্যভাগের স্তরগুলোতে। এটি অত্যন্ত গুরুত্বপূর্ণ কারণ এই আবিষ্কার প্রশিক্ষণের জন্য প্রয়োজনীয় কম্পিউটেশনাল শক্তি বা গণনামূলক খরচ ব্যাপকভাবে কমিয়ে দিতে পারে।
গবেষণার ফলাফল বলছে, মডেলের গভীরতা যতই বাড়ুক না কেন, RL-এর মাধ্যমে শেখার মূল কাজটি ঘটে মাঝের একটি ছোট অংশে। এর মানে হলো, পুরো মডেল জুড়ে ব্যয়বহুল গণনা চালানোর পরিবর্তে শুধুমাত্র এই কয়েকটি স্তরকে লক্ষ্য করে প্রশিক্ষণ দিলে একই রকম বা আরও ভালো ফলাফল পাওয়া সম্ভব। এটি AI মডেল অভিযোজনের অর্থনীতিতে এক বিরাট পরিবর্তন আনতে পারে।
বাংলাদেশের ডেভেলপার এবং AI গবেষকদের জন্য এই খবর বিশেষভাবে তাৎপর্যপূর্ণ। বর্তমানে বড় ভাষার মডেল প্রশিক্ষণ ও ফাইন-টিউনিংয়ের জন্য বিপুল পরিমাণ GPU বা গ্রাফিক্স প্রসেসিং ইউনিটের প্রয়োজন হয়, যা অত্যন্ত ব্যয়বহুল। এই নতুন পদ্ধতি ব্যবহার করে কম্পিউটেশনাল খরচ ৩০ থেকে ৫০ শতাংশ পর্যন্ত কমানো সম্ভব হতে পারে। এর ফলে ছোট স্টার্টআপ এবং ফ্রিল্যান্সার ডেভেলপারদের জন্যও বড় মডেল নিয়ে কাজ করার পথ উন্মুক্ত হবে।
প্রযুক্তি বিশ্লেষকরা বলছেন, এই গবেষণা AI মডেল অপ্টিমাইজেশনের একটি নতুন দিগন্ত খুলে দিয়েছে। ভবিষ্যতে মডেল ডিজাইন করার সময় স্থাপত্যের দিকে নজর দেওয়ার পরিবর্তে শেখার জন্য সবচেয়ে কার্যকর স্তরগুলো চিহ্নিত করে সেগুলোতেই বিনিয়োগ করা যেতে পারে। এটি কেবল সময় ও অর্থ সাশ্রয় করবে না, বরং বর্তমান মডেলগুলোর চেয়ে ৩ গুণ বেশি কার্যকরী এবং সাশ্রয়ী মডেল তৈরি করাও সম্ভব করে তুলবে।
সবমিলিয়ে, এই আবিষ্কার প্রমাণ করে যে বড় ভাষার মডেলের শেখার প্রক্রিয়া আগের ধারণার চেয়ে অনেক বেশি কাঠামোবদ্ধ এবং কেন্দ্রীভূত। এখন থেকে মডেল ফাইন-টিউনিংয়ের সময় শুধুমাত্র প্রয়োজনীয় স্তরগুলোকে টার্গেট করলেই হবে। এটি AI প্রযুক্তিকে আরও সহজলভ্য এবং গণতান্ত্রিক করার পথে একটি বড় পদক্ষেপ।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to ML
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...