ছোট মডেলেই ফ্রন্টিয়ার মানের কাছাকাছি, খরচ কমবে ১০০ গুণ
একটি নতুন গবেষণাপত্র দেখিয়েছে যে ফ্রন্টিয়ার মডেলের ট্রেস ব্যবহার করে ছোট ভাষার মডেল (SLM) ফাইন-টিউন করলে প্রায় সমান মানের ফলাফল পাওয়া যায়, কিন্তু খরচ পড়ে দুই অর্ডার অফ ম্যাগনিটিউড কম। টোকেন-ভিত্তিক বিলিং ব্যবস্থা কোম্পানিগুলোকে ছোট ও সস্তা মডেলের দিকে ঝুঁকতে বাধ্য করছে। এই পদ্ধতি AI ইনফারেন্স খরচ কমানোর একটি বাস্তব সমাধান দিচ্ছে।
একটি নতুন গবেষণাপত্র দেখিয়েছে যে ফ্রন্টিয়ার মডেলের ট্রেস ব্যবহার করে ছোট ভাষার মডেল (SLM) ফাইন-টিউন করলে প্রায় সমান মানের ফলাফল পাওয়া যায়, কিন্তু খরচ পড়ে দুই অর্ডার অফ ম্যাগনিটিউড কম। টোকেন-ভিত্তিক বিলিং ব্যবস্থা কোম্পানিগুলোকে ছোট ও সস্তা মডেলের দিকে ঝুঁকতে বাধ্য করছে। এই পদ্ধতি AI ইনফারেন্স খরচ কমানোর একটি বাস্তব সমাধান দিচ্ছে।
একটি নতুন গবেষণাপত্র AI জগতে বড় ধরনের আলোড়ন সৃষ্টি করেছে। গবেষকরা দেখিয়েছেন যে ফ্রন্টিয়ার মডেলের (যেমন GPT-4) ট্রেস বা কার্যকলাপের নমুনা ব্যবহার করে ছোট ভাষার মডেল (SLM) ফাইন-টিউন করলে প্রায় একই মানের ফলাফল পাওয়া সম্ভব। কিন্তু এই পদ্ধতির খরচ পড়ে দুই অর্ডার অফ ম্যাগনিটিউড কম। অর্থাৎ আগের তুলনায় শতভাগের এক ভাগ খরচে প্রায় একই কাজ করা যাচ্ছে।
এই গবেষণাটি Reddit-এর r/MachineLearning সাবরেডিটে প্রকাশিত হয়েছে। সেখানে এক ব্যবহারকারী জানিয়েছেন যে টোকেন-ভিত্তিক বিলিং তাদের কোম্পানিকে ছোট ভাষার মডেল পুনর্মূল্যায়ন করতে বাধ্য করছে। টোকেন-ভিত্তিক বিলিং মানে হলো AI মডেল ব্যবহারের সময় প্রতিটি শব্দ বা টোকেনের জন্য খরচ দিতে হয়। এই খরচ কমানোর জন্যই ছোট মডেলের দিকে ঝোঁক বাড়ছে।
গবেষণাপত্রটির শিরোনাম হচ্ছে Compiling Agentic Workflows into LLM Weights। এতে বলা হয়েছে যে ফ্রন্টিয়ার মডেলগুলোকে অর্কেস্ট্রেট করে তাদের কার্যকলাপের ট্রেস সংগ্রহ করা হয়। তারপর সেই ট্রেস দিয়ে একটি ছোট মডেলকে সুপারভাইজড ফাইন-টিউনিং করা হয়। ফলাফল দেখায় যে এই পদ্ধতি নিয়ার-ফ্রন্টিয়ার কোয়ালিটি দিতে সক্ষম। অর্থাৎ ফ্রন্টিয়ার মডেলের খুব কাছাকাছি মানের আউটপুট পাওয়া যায়।
এই পদ্ধতির সবচেয়ে বড় সুবিধা হলো খরচ সাশ্রয়। বর্তমানে বড় AI মডেল চালানোর জন্য প্রচুর GPU এবং বিদ্যুৎ প্রয়োজন। ফলে প্রতি API কলের খরচ অনেক বেশি। কিন্তু ছোট মডেল হওয়ায় SLM-এর ইনফারেন্স খরচ অনেক কম। গবেষণাপত্রটি দাবি করছে যে এই পদ্ধতি ব্যবহার করে দুই অর্ডার অফ ম্যাগনিটিউড খরচ কমানো সম্ভব।
বাংলাদেশের ডেভেলপার, ফ্রিল্যান্সার এবং স্টার্টআপগুলোর জন্য এই গবেষণা অত্যন্ত গুরুত্বপূর্ণ। বর্তমানে AI API ব্যবহারের খরচ অনেক ব্যবসার জন্য বাধা হয়ে দাঁড়াচ্ছে। বিশেষ করে ছোট স্টার্টআপ এবং ফ্রিল্যান্সারদের জন্য GPT-4 বা ক্লডের মতো মডেল ব্যবহার করা ব্যয়বহুল। এই পদ্ধতি ব্যবহার করে তারা নিজেদের ছোট মডেল তৈরি করে নিতে পারবে। এতে খরচ কমবে এবং কাস্টমাইজেশনের সুযোগ বাড়বে।
শিক্ষার্থী এবং গবেষকরাও এই পদ্ধতি থেকে উপকৃত হতে পারেন। তারা ফ্রন্টিয়ার মডেলের ট্রেস ব্যবহার করে নিজেদের গবেষণার জন্য বিশেষায়িত মডেল তৈরি করতে পারবেন। এতে করে বড় মডেলের উপর নির্ভরতা কমবে এবং নিজস্ব মডেল ডেভেলপমেন্টের সুযোগ সৃষ্টি হবে।
এই গবেষণাটি এখনও প্রাথমিক পর্যায়ে রয়েছে। তবে বাস্তব জগতে এর প্রয়োগ নিয়ে ইতিমধ্যে আলোচনা শুরু হয়েছে। বিশেষজ্ঞরা বলছেন যে এজেন্টিক ওয়ার্কফ্লো কম্পাইল করার এই পদ্ধতি AI-এর গণতন্ত্রীকরণে বড় ভূমিকা রাখতে পারে। ভবিষ্যতে ছোট মডেলগুলো আরও শক্তিশালী হবে এবং বড় মডেলের বিকল্প হিসেবে কাজ করবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: Reddit r/MachineLearning
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...