145 KB মডেলেই AI প্রশিক্ষণ, TensorFlow লাগবে না
একজন ডেভেলপার NumPy ব্যবহার করে স্ক্র্যাচ থেকে নিউরাল নেটওয়ার্ক প্রশিক্ষণ দিয়ে মাত্র 145 KB আকারের মডেল তৈরি করেছেন। তিনি মডেলটিকে int8 ফরম্যাটে কোয়ান্টাইজ করে কোনো সার্ভার বা ফ্রেমওয়ার্ক ছাড়াই ব্রাউজারে চালিয়েছেন।
একজন ডেভেলপার NumPy ব্যবহার করে স্ক্র্যাচ থেকে নিউরাল নেটওয়ার্ক প্রশিক্ষণ দিয়ে মাত্র 145 KB আকারের মডেল তৈরি করেছেন। তিনি মডেলটিকে int8 ফরম্যাটে কোয়ান্টাইজ করে কোনো সার্ভার বা ফ্রেমওয়ার্ক ছাড়াই ব্রাউজারে চালিয়েছেন।
একজন ডেভেলপার প্রমাণ করেছেন যে বড় ফ্রেমওয়ার্ক ছাড়াই শক্তিশালী মডেল তৈরি করা সম্ভব। তিনি NumPy লাইব্রেরি ব্যবহার করে স্ক্র্যাচ থেকে একটি নিউরাল নেটওয়ার্ক প্রশিক্ষণ দিয়েছেন। তারপর মডেলটিকে int8 ফরম্যাটে কোয়ান্টাইজ করে মাত্র 145 KB আকারে কম্প্রেস করেছেন। সবশেষে তিনি প্রায় 80 লাইনের জাভাস্ক্রিপ্ট কোড দিয়ে মডেলটিকে ব্রাউজারে চালিয়েছেন।
এই প্রকল্পটি dev.to ML প্ল্যাটফর্মে প্রকাশিত হয়েছে। ডেভেলপারটি MNIST ডেটাসেট ব্যবহার করে হাতের লেখা ডিজিট শনাক্ত করার মডেল তৈরি করেছেন। MNIST হলো মেশিন লার্নিংয়ের হ্যালো ওয়ার্ল্ড প্রোগ্রাম। এটি একটি সহজ সমস্যা, কিন্তু এখানে মূল লক্ষ্য ছিল মডেল নয়, বরং মডেলের চারপাশের পুরো প্রক্রিয়াটি প্রদর্শন করা।
প্রক্রিয়াটি তিনটি ধাপে সম্পন্ন হয়েছে। প্রথম ধাপে ডেভেলপার NumPy দিয়ে সম্পূর্ণ নিউরাল নেটওয়ার্ক তৈরি করেছেন। তিনি কোনো TensorFlow বা PyTorch ব্যবহার করেননি। দ্বিতীয় ধাপে তিনি মডেলের ওজনগুলোকে 32-বিট ফ্লোটিং পয়েন্ট থেকে 8-বিট ইন্টিজারে রূপান্তর করেছেন। এই কোয়ান্টাইজেশন প্রক্রিয়াটি মডেলের আকার প্রায় 4 গুণ কমিয়ে দিয়েছে। তৃতীয় ধাপে তিনি একটি প্যারিটি টেস্ট চালিয়েছেন। এই টেস্টে ব্রাউজারের ফলাফল পাইথনের ফলাফলের সাথে 1e-6 নির্ভুলতার সাথে মিলেছে।
এই পদ্ধতির সবচেয়ে বড় সুবিধা হলো ডিপেন্ডেন্সি মুক্ত পরিবেশ। মডেলটি চালানোর জন্য কোনো সার্ভার, কোনো ভারী লাইব্রেরি বা কোনো ক্লাউড API প্রয়োজন হয় না। পুরো মডেলটি একটি ছোট জাভাস্ক্রিপ্ট ফাইলের মধ্যে কাজ করে। এটি ওয়েব অ্যাপ্লিকেশনের জন্য আদর্শ সমাধান। ব্যবহারকারীর ব্রাউজারেই সব হিসাবনিকাশ সম্পন্ন হয়।
বাংলাদেশের ডেভেলপার ও স্টার্টআপগুলোর জন্য এই পদ্ধতি বিশেষভাবে গুরুত্বপূর্ণ। দেশের অনেক ওয়েব ডেভেলপার ব্রাউজার-ভিত্তিক অ্যাপ্লিকেশন তৈরি করেন। এই পদ্ধতি ব্যবহার করে তারা সহজেই তাদের অ্যাপে মেশিন লার্নিং ফিচার যোগ করতে পারবেন। ফ্রিল্যান্সারদের জন্যও এটি একটি শক্তিশালী টুল। তারা ক্লায়েন্টকে কোনো সার্ভার খরচ ছাড়াই AI সমাধান দিতে পারবেন। শিক্ষার্থীরাও এই পদ্ধতি থেকে শিখতে পারেন কিভাবে ফ্রেমওয়ার্কের অন্তর্নিহিত মেকানিজম কাজ করে।
ভবিষ্যতে এই ধরনের হালকা মডেল আরও জনপ্রিয় হবে। বিশেষ করে এজ কম্পিউটিং এবং আইওটি ডিভাইসের জন্য এগুলো অপরিহার্য হয়ে উঠবে। 145 KB আকারের একটি মডেল যেকোনো ডিভাইসে সহজেই ফিট হবে। ডেভেলপারদের এখন থেকেই এই পদ্ধতি আয়ত্ত করা উচিত।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to ML
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...