Qwen 3.6 মডেল কী এবং এটি কেন গুরুত্বপূর্ণ?

Qwen 3.6 একটি ওপেন সোর্স লার্জ ল্যাঙ্গুয়েজ মডেল যা ৩৫ বিলিয়ন প্যারামিটার নিয়ে তৈরি। এটি গুরুত্বপূর্ণ কারণ এটি সংকুচিত করে একটি মাত্র RTX 3090 কার্ডে চালানো সম্ভব হয়েছে, যা লোকাল AI ব্যবহারের খরচ ও জটিলতা অনেক কমিয়ে দিয়েছে।

লোকাল AI চালানোর জন্য আমার কী কী প্রয়োজন?

একটি RTX 3090 বা সমতুল্য GPU যার কমপক্ষে ২০ জিবি ভিআরএএম আছে, একটি কোয়ান্টাইজড মডেল ফাইল এবং ollama বা similar টুল প্রয়োজন। ব্যবহৃত গেমিং রিগ কিনে এই সেটআপ করা সম্ভব।

বাংলাদেশের ডেভেলপাররা কীভাবে এই প্রযুক্তি কাজে লাগাতে পারেন?

তারা ব্যবহৃত RTX 3090 কার্ড কিনে নিজস্ব লোকাল AI সার্ভার তৈরি করতে পারেন। এতে API-র খরচ বাঁচবে, ডেটা গোপনীয়তা রক্ষা পাবে এবং দ্রুত প্রোটোটাইপ তৈরি সম্ভব হবে। শিক্ষার্থীরা গবেষণা ও প্রকল্পে বড় মডেল ব্যবহার করতে পারবেন।

হোম/নিউজ/টুল

টুল৫ মিনিট পড়া

পুরনো RTX 3090 দিয়ে AI চালান ১০ গুণ দ্রুত, জানুন কীভাবে

একটি পুরনো গেমিং রিগ আর ২০ জিবি ভিআরএএম ব্যবহার করে Qwen 3.6 মডেল ১৫ টিপিএস থেকে ১৬০ টিপিএস গতি অর্জন করেছে। লোকাল AI এখন আর ধীর বা সীমাবদ্ধ নয়। এই অগ্রগতি ডেভেলপার ও ফ্রিল্যান্সারদের জন্য নতুন দিগন্ত খুলে দিচ্ছে।

সম্পাদকীয় টিম

স্টাফ রিপোর্টার · ৪৮ দিন আগে · সূত্র: Reddit r/artificial

পুরনো RTX 3090 দিয়ে AI চালান ১০ গুণ দ্রুত, জানুন কীভাবে

লোকাল AI ইনফারেন্সের জগতে এক বড় অগ্রগতি ঘটেছে। Reddit-এর r/artificial ফোরামের এক ব্যবহারকারী জানিয়েছেন যে Qwen 3.6:35b-a3b মডেলটি একটি মাত্র RTX 3090 গ্রাফিক্স কার্ডে 160 টোকেন প্রতি সেকেন্ড (tps) গতিতে আউটপুট দিতে সক্ষম হয়েছে। এই গতি আগের চেয়ে প্রায় ১০ গুণ বেশি।

ব্যবহারকারীটি আগে Anthropic ও OpenAI-র API ব্যবহার করতেন। পরে তিনি ollama-র ধীরগতির কারণে লোকাল মডেল পুরোপুরি এড়িয়ে গিয়েছিলেন। তবে গত সপ্তাহে তিনি একটি ব্যবহৃত গেমিং রিগ কিনেছেন যাতে একটি RTX 3090 কার্ড ছিল। সেখানে তিনি batiai/qwen3.6-35b:iq4 নামের একটি সংকুচিত মডেল সেটআপ করেন যা মাত্র ২০ জিবি ভিআরএএম দখল করে।

প্রথমে মডেলটি সিস্টেম র্যামে চলছিল এবং তখন আউটপুট গতি ছিল ১৫ টিপিএস। এটি একটি গ্রহণযোগ্য গতি হলেও বড় মডেলের জন্য যথেষ্ট ছিল না। কিন্তু পুরো মডেলটি ভিআরএএম-এ স্থানান্তর করার পর গতি লাফিয়ে ১৬০ টিপিএস-এ পৌঁছে যায়। এই পরিবর্তন দেখায় যে লোকাল AI এখন বাস্তবিক ব্যবহারের উপযোগী হয়ে উঠছে।

ব্যবহারকারীটি আরও জানিয়েছেন যে তিনি মডেলটিকে একটি ছবি ইনপুট দিয়েছেন। এটি নির্দেশ করে যে Qwen 3.6 মডেলটি মাল্টিমোডাল কাজেও সক্ষম। RTX 3090-এর ২৪ জিবি ভিআরএএম-এর মধ্যে ২০ জিবি ব্যবহার করায় মডেলটি আরামে ফিট হয়েছে এবং কোনো মেমরি সমস্যা হয়নি।

এই সাফল্যের পেছনে মূল কারণ হলো মডেল কোয়ান্টাইজেশন। Qwen 3.6:35b-a3b মডেলটিকে বিশেষভাবে সংকুচিত করা হয়েছে যাতে এটি ২০ জিবি ভিআরএএম-এ ফিট হয়। সাধারণত ৩৫ বিলিয়ন প্যারামিটারের মডেল চালাতে ৪০ জিবি বা তার বেশি মেমরি প্রয়োজন হয়। কিন্তু কোয়ান্টাইজেশন প্রক্রিয়ায় মডেলের নির্ভুলতা কিছুটা কমিয়ে আকার ছোট করা হয়েছে।

বাংলাদেশের ডেভেলপার ও ফ্রিল্যান্সারদের জন্য এই খবর অত্যন্ত গুরুত্বপূর্ণ। এখন ব্যবহৃত RTX 3090 কার্ড (যার দাম প্রায় ৩০-৪০ হাজার টাকা) কিনে একটি শক্তিশালী লোকাল AI সার্ভার তৈরি করা সম্ভব। এর ফলে API-র মাসিক খরচ বাঁচবে এবং ডেটা গোপনীয়তা নিশ্চিত হবে। শিক্ষার্থীরা গবেষণার জন্য বড় মডেল নিয়ে পরীক্ষা করতে পারবেন।

তবে কিছু সীমাবদ্ধতা রয়েছে। মডেলটি সংকুচিত হওয়ায় এর নির্ভুলতা মূল মডেলের চেয়ে কম হতে পারে। এছাড়া RTX 3090-এর বিদ্যুৎ খরচ ও তাপ নিয়ন্ত্রণ একটি চ্যালেঞ্জ। তবুও ব্যবহৃত গেমিং হার্ডওয়্যার ব্যবহার করে লোকাল AI-র এই অগ্রগতি প্রযুক্তি খাতে একটি নতুন দিগন্ত খুলে দিয়েছে।

ভবিষ্যতে আরও উন্নত কোয়ান্টাইজেশন কৌশল ও সস্তা হার্ডওয়্যার আসলে লোকাল AI আরও সহজলভ্য হবে। ডেভেলপারদের এখনই এই সুযোগ কাজে লাগানো উচিত।

পুরনো RTX 3090 দিয়ে AI চালান ১০ গুণ দ্রুত, জানুন কীভাবে

আরও পড়ুন

AI নিউজ সরাসরি ইমেইলে পান

মন্তব্য০