গুগলের নতুন AI এখন ল্যাপটপে, ছবি-অডিও সরাসরি প্রক্রিয়া করবে
গুগল ডিপমাইন্ডের নতুন Gemma 4 12B মডেলটি মাত্র 16GB RAM-এর ল্যাপটপে চলে। এটি কোনো পৃথক এনকোডার ছাড়াই ছবি ও অডিও সরাসরি প্রক্রিয়া করতে পারে। এই মডেলটি প্রথম মিড-সাইজ জেমা মডেল যা নেটিভ অডিও ইনপুট সমর্থন করে।
গুগল ডিপমাইন্ডের নতুন Gemma 4 12B মডেলটি মাত্র 16GB RAM-এর ল্যাপটপে চলে। এটি কোনো পৃথক এনকোডার ছাড়াই ছবি ও অডিও সরাসরি প্রক্রিয়া করতে পারে। এই মডেলটি প্রথম মিড-সাইজ জেমা মডেল যা নেটিভ অডিও ইনপুট সমর্থন করে।
গুগল ডিপমাইন্ড এই সপ্তাহে Gemma 4 12B মডেলটি প্রকাশ করেছে। এটি একটি মাল্টিমোডাল AI মডেল যা 16GB RAM বা ইউনিফাইড মেমোরি সম্পন্ন সাধারণ ল্যাপটপে চলে। মাত্র 12 বিলিয়ন প্যারামিটার থাকা সত্ত্বেও এটি প্রায় 26 বিলিয়ন প্যারামিটার মডেলের সমান পারফরম্যান্স দিতে সক্ষম।
এই মডেলটির সবচেয়ে বড় বিশেষত্ব হলো এর আর্কিটেকচার। Gemma 4 12B-তে কোনো পৃথক মাল্টিমোডাল এনকোডার নেই। ছবি ও অডিও সরাসরি LLM ব্যাকবোনে চলে যায়। এর ফলে মডেলটি দ্রুত এবং কম মেমোরি ব্যবহার করে কাজ করতে পারে।
গুগল ডিপমাইন্ড জানিয়েছে, Gemma 4 12B তার আকারের তুলনায় অসাধারণ ক্ষমতা প্যাকেজ করেছে। এটি তাদের প্রথম মিড-সাইজ মডেল যা নেটিভ অডিও ইনপুট ফিচার নিয়ে এসেছে। আগের জেমা মডেলগুলোতে অডিও প্রক্রিয়াকরণের জন্য আলাদা এনকোডার প্রয়োজন হতো।
প্রযুক্তিগত দিক থেকে এই মডেলটি টেক্সট, ইমেজ এবং অডিও তিন ধরনের ইনপুটই একসঙ্গে প্রক্রিয়া করতে পারে। ব্যবহারকারীরা ছবি দেখিয়ে প্রশ্ন করতে পারেন, অডিও ক্লিপ দিয়ে নির্দেশ দিতে পারেন বা সাধারণ টেক্সট লিখে কাজ করতে পারেন। মডেলটি সবগুলো ইনপুটকে একীভূতভাবে বিশ্লেষণ করে উত্তর তৈরি করে।
বাংলাদেশের ডেভেলপার, ফ্রিল্যান্সার এবং শিক্ষার্থীদের জন্য এই মডেলটি বড় সুযোগ তৈরি করছে। এখন থেকে ডেভেলপাররা নিজেদের ল্যাপটপে বসেই জটিল মাল্টিমোডাল AI অ্যাপ্লিকেশন তৈরি করতে পারবেন। এর জন্য দামি ক্লাউড GPU বা সার্ভারের প্রয়োজন হবে না। শিক্ষার্থীরা গবেষণা ও প্রজেক্টের জন্য এই মডেল ব্যবহার করে হাতে-কলমে শিখতে পারবেন।
গুগলের এই পদক্ষেপ AI অ্যাক্সেসকে আরও গণতান্ত্রিক করছে। সাধারণ হার্ডওয়্যারে চলে এমন শক্তিশালী মডেল বাজারে এলে ছোট ব্যবসা ও স্টার্টআপগুলোর জন্যও নতুন সম্ভাবনা তৈরি হবে। Gemma 4 12B এখন থেকে গুগলের অফিসিয়াল সাইট থেকে ডাউনলোড করা যাবে এবং এটি ওপেন সোর্স লাইসেন্সের আওতায় পাওয়া যাবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to ML
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...