AI মডেলের খরচ ২২% কমালো বাংলাদেশি গবেষকদের নতুন ডিজাইন
গবেষকরা ট্রান্সফরমারের ঐতিহ্যবাহী নকশা বদলে দিয়েছেন। নতুন পদ্ধতিতে লেয়ারগুলোর আকার সমান না রেখে অসমভাবে বণ্টন করে কম্পিউটিং খরচ ২২% কমানো সম্ভব হয়েছে, পাশাপাশি পারফরম্যান্সও উন্নত হয়েছে।
গবেষকরা ট্রান্সফরমারের ঐতিহ্যবাহী নকশা বদলে দিয়েছেন। নতুন পদ্ধতিতে লেয়ারগুলোর আকার সমান না রেখে অসমভাবে বণ্টন করে কম্পিউটিং খরচ ২২% কমানো সম্ভব হয়েছে, পাশাপাশি পারফরম্যান্সও উন্নত হয়েছে।
কম্পিউটার বিজ্ঞানীরা লার্জ ল্যাঙ্গুয়েজ মডেল তৈরির একটি মৌলিক ধারণাকে চ্যালেঞ্জ জানিয়েছেন। তারা দেখিয়েছেন যে নিউরাল নেটওয়ার্কের স্তরগুলোতে অসমভাবে সম্পদ বণ্টন করলে দক্ষতা ও পারফরম্যান্স উভয়ই বাড়ানো সম্ভব।
গবেষণাপত্রটি ডেভ.টু-তে প্রকাশিত হয়েছে এবং এটি ট্রান্সফরমার আর্কিটেকচারের প্রচলিত ধারণাকে ভেঙে দিয়েছে। প্রচলিত ট্রান্সফরমার আর্কিটেকচারে প্রতিটি লেয়ারের আকার সমান রাখা হয়। চ্যাটজিপিটি বা ক্লদ-এর মতো সিস্টেম এই নিয়মেই তৈরি।
নতুন পদ্ধতিতে একটি বটলনেক-আকৃতির মডেল স্ট্রাকচার ব্যবহার করা হয়েছে। এই কাঠামোতে মাঝের লেয়ারগুলো ছোট রাখা হয়েছে এবং শুরু ও শেষের লেয়ারগুলো বড় রাখা হয়েছে। এই অসম বিন্যাস প্রচলিত পদ্ধতির চেয়ে ২২% কম কম্পিউটিং খরচে কাজ করে এবং একইসঙ্গে পারফরম্যান্সও উন্নত করে।
গবেষকরা ব্যাখ্যা করেছেন যে সমান আকারের লেয়ার ব্যবহার করলে অনেক ক্ষেত্রেই অপ্রয়োজনীয় গণনা হয়। কিছু লেয়ারের বেশি ক্ষমতার প্রয়োজন হয় না কিন্তু প্রচলিত নকশায় সেগুলোও সম্পূর্ণ আকারে থাকে। নতুন পদ্ধতিতে শুধু প্রয়োজন অনুযায়ী সংস্থান বরাদ্দ করা হয়।
এই গবেষণার ফলে ভবিষ্যতে আরও সাশ্রয়ী ও শক্তিশালী AI মডেল তৈরি করা সম্ভব হবে। বিশেষ করে যেসব প্রতিষ্ঠানের সীমিত GPU বা কম্পিউটিং রিসোর্স রয়েছে, তারা এই পদ্ধতি ব্যবহার করে বড় মডেল চালাতে পারবে।
বাংলাদেশের প্রেক্ষাপটে এই আবিষ্কার বিশেষভাবে গুরুত্বপূর্ণ। স্থানীয় স্টার্টআপ ও গবেষকরা প্রায়ই সীমিত কম্পিউটিং সম্পদ নিয়ে কাজ করেন। এই পদ্ধতি তাদের জন্য বড় মডেল নিয়ে পরীক্ষা-নিরীক্ষার সুযোগ তৈরি করবে। ফ্রিল্যান্সার ও ছোট দলের ডেভেলপাররাও কম খরচে উন্নত AI সমাধান তৈরি করতে পারবেন।
গবেষকরা এখন এই পদ্ধতিকে আরও বড় মডেলে প্রয়োগ করার পরিকল্পনা করছেন। তারা মনে করছেন যে এই কৌশল ভবিষ্যতের AI উন্নয়নে একটি গুরুত্বপূর্ণ দিক পরিবর্তন আনতে পারে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to ML
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...