LIVE
টুলগবেষণায় বৈপ্লবিক পরিবর্তন: AI টুলে লিটারেচার রিভিউ এখন সেকেন্ডেমডেলচীনের ৪ এআই মডেলে ক্লাউড খরচ কমেছে কয়েকগুণ, জানালেন ডেভেলপারটুলAI টুলে ৪ ধাপে নিজেই মিউজিক ভিডিও বানান, ফ্রিল্যান্সারদের নতুন আয়ের সুযোগটুলরাসায়নিক গবেষণায় AI ব্যবহার বাড়ছে, টোকেন খরচে বিপাকে প্রকল্পটুলবাংলাদেশি গবেষকদের জন্য সুখবর: AI টুলে ডিএনএ বিশ্লেষণ ৩ গুণ দ্রুত হবেটুলবিনামূল্যে Claude Code এখন আপনার Mac-এ, AI কোডিং সহায়ক চালান নিজেইগবেষণাডেটা অগমেন্টেশনেই লুকিয়ে এআই মডেলের সাফল্য, গবেষণায় চমকগবেষণাদীর্ঘ ডকুমেন্ট বুঝতে AI-র নতুন পদ্ধতি, রিট্রেনিং ছাড়াই মিলবে নির্ভুল তথ্যমডেলবাংলাদেশি ডেভেলপারদের জন্য সুখবর: বিনামূল্যে 119B প্যারামিটারের AI মডেল এলোটুল১৬ হাজার API শিখলো AI, ফ্রিল্যান্সারদের কাজ বদলে দেবে ToolLLMটুলপার্বত্য অঞ্চলের ভাষায় AI এজেন্ট, বাংলাদেশেও কাজ করবেটুলAI কোডিং এজেন্টে ডেমো দেখে ভুলবেন না, বাস্তব অ্যাপ বানানো অনেক কঠিনটুলগবেষণায় বৈপ্লবিক পরিবর্তন: AI টুলে লিটারেচার রিভিউ এখন সেকেন্ডেমডেলচীনের ৪ এআই মডেলে ক্লাউড খরচ কমেছে কয়েকগুণ, জানালেন ডেভেলপারটুলAI টুলে ৪ ধাপে নিজেই মিউজিক ভিডিও বানান, ফ্রিল্যান্সারদের নতুন আয়ের সুযোগটুলরাসায়নিক গবেষণায় AI ব্যবহার বাড়ছে, টোকেন খরচে বিপাকে প্রকল্পটুলবাংলাদেশি গবেষকদের জন্য সুখবর: AI টুলে ডিএনএ বিশ্লেষণ ৩ গুণ দ্রুত হবেটুলবিনামূল্যে Claude Code এখন আপনার Mac-এ, AI কোডিং সহায়ক চালান নিজেইগবেষণাডেটা অগমেন্টেশনেই লুকিয়ে এআই মডেলের সাফল্য, গবেষণায় চমকগবেষণাদীর্ঘ ডকুমেন্ট বুঝতে AI-র নতুন পদ্ধতি, রিট্রেনিং ছাড়াই মিলবে নির্ভুল তথ্যমডেলবাংলাদেশি ডেভেলপারদের জন্য সুখবর: বিনামূল্যে 119B প্যারামিটারের AI মডেল এলোটুল১৬ হাজার API শিখলো AI, ফ্রিল্যান্সারদের কাজ বদলে দেবে ToolLLMটুলপার্বত্য অঞ্চলের ভাষায় AI এজেন্ট, বাংলাদেশেও কাজ করবেটুলAI কোডিং এজেন্টে ডেমো দেখে ভুলবেন না, বাস্তব অ্যাপ বানানো অনেক কঠিন
হোম/নিউজ/রিসার্চ
রিসার্চ৫ মিনিট পড়া

২৪৯ মিলিয়ন প্যারামিটারের ওপেন সোর্স মডেল বানালেন বাংলাদেশি ডেভেলপার

একজন ডেভেলপার PyTorch ব্যবহার করে স্ক্র্যাচ থেকে 249M প্যারামিটারের Mixture-of-Experts Transformer তৈরি করেছেন। মডেলটিতে GQA, sparse MoE, SwiGLU, RoPE ও sliding-window attention-এর মতো আধুনিক ফিচার রয়েছে। প্রকল্পটি ওপেন সোর্স এবং এলএলএম-এর অভ্যন্তরীণ কাজ বুঝতে সাহায্য করবে।

R
সম্পাদকীয় টিম
স্টাফ রিপোর্টার · ৩ ঘণ্টা আগে · সূত্র: Reddit r/MachineLearning
২৪৯ মিলিয়ন প্যারামিটারের ওপেন সোর্স মডেল বানালেন বাংলাদেশি ডেভেলপার

একজন ডেভেলপার PyTorch ব্যবহার করে স্ক্র্যাচ থেকে 249M প্যারামিটারের Mixture-of-Experts Transformer তৈরি করেছেন। মডেলটিতে GQA, sparse MoE, SwiGLU, RoPE ও sliding-window attention-এর মতো আধুনিক ফিচার রয়েছে। প্রকল্পটি ওপেন সোর্স এবং এলএলএম-এর অভ্যন্তরীণ কাজ বুঝতে সাহায্য করবে।

একজন গবেষক PyTorch ফ্রেমওয়ার্ক ব্যবহার করে স্ক্র্যাচ থেকে একটি 249M প্যারামিটারের Mixture-of-Experts Transformer তৈরি করেছেন। মডেলটির নাম H64LM এবং এটি ওপেন সোর্স হিসেবে প্রকাশ করা হয়েছে। প্রকল্পটির মূল লক্ষ্য আধুনিক লার্জ ল্যাঙ্গুয়েজ মডেলের (LLM) অভ্যন্তরীণ কার্যপ্রণালী বোঝা।

H64LM মডেলটি শুধু একটি ছোট পরীক্ষা নয়, বরং এটি বর্তমান সময়ের সবচেয়ে আধুনিক কিছু টেকনিক একত্রিত করেছে। এর মধ্যে রয়েছে Grouped Query Attention (GQA), যা মডেলটিকে দ্রুত ও কার্যকর করে। এছাড়াও রয়েছে Sparse Mixture-of-Experts (MoE) আর্কিটেকচার, যেখানে 8 জন বিশেষজ্ঞ (expert) কাজ করে এবং Top-2 রাউটিং পদ্ধতি ব্যবহার করা হয়।

মডেলটিতে আরও রয়েছে SwiGLU অ্যাক্টিভেশন ফাংশন, RoPE পজিশনাল এনকোডিং, RMSNorm নরমালাইজেশন এবং স্লাইডিং-উইন্ডো অ্যাটেনশন। এই সব ফিচার বর্তমানে GPT-4 ও LLaMA-র মতো বড় মডেলগুলোতে ব্যবহৃত হয়। গবেষকটি হাই-লেভেল ট্রেনিং ফ্রেমওয়ার্ক ব্যবহার না করে নিজেই অ্যাটেনশন, MoE রাউটিং, নরমালাইজেশন ও ট্রেনিং লুপ বাস্তবায়ন করেছেন।

মিক্সড-প্রিসিশন ট্রেনিংয়ের মাধ্যমে মডেলটি মেমোরি ব্যবহারে দক্ষ। এটি তিনটি অক্সিলিয়ারি রাউটিং লস ব্যবহার করে যাতে বিশেষজ্ঞদের মধ্যে কাজের ভারসাম্য বজায় থাকে। প্রকল্পটি রেডিটের r/MachineLearning কমিউনিটিতে শেয়ার করা হয়েছে এবং সেখানে ব্যাপক আলোচনা চলছে।

বাংলাদেশের ডেভেলপার ও গবেষকদের জন্য এই প্রকল্পটি একটি দারুণ শিক্ষার উপকরণ। যারা এলএলএম তৈরির জটিলতা বুঝতে চান, তারা এই ওপেন সোর্স কোড দেখে শিখতে পারবেন। ফ্রিল্যান্সার ও স্টার্টআপগুলোর জন্যও এটি গুরুত্বপূর্ণ, কারণ তারা ছোট স্কেলে আধুনিক AI মডেল নিয়ে পরীক্ষা চালাতে পারবেন।

H64LM প্রমাণ করে যে বড় মডেল তৈরির জন্য সবসময় বিশাল টিম বা দামি টুল লাগে না। একজন দক্ষ প্রোগ্রামার PyTorch দিয়েই স্ক্র্যাচ থেকে আধুনিক এলএলএম তৈরি করতে পারেন। ভবিষ্যতে এই ধরনের ওপেন সোর্স প্রকল্প AI শিক্ষাকে আরও সহজ ও গণতান্ত্রিক করে তুলবে।

আরও পড়ুন

🌐 তথ্যসূত্র ও স্বচ্ছতা

এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।

ট্যাগ:#রিসার্চ#AI#বাংলাদেশ#Reddit r/MachineLearning
AD
📧

AI নিউজ সরাসরি ইমেইলে পান

প্রতিদিনের সেরা AI খবর বাছাই করে আপনার inbox-এ পাঠাই। বিজ্ঞাপন নেই।

মূল প্রতিবেদন: Reddit r/MachineLearning

সোর্স দেখুন ↗

মন্তব্য

লোড হচ্ছে...