LIVE
টুলআপনার GPU-তে LLM চালানোর আসল খরচ কত, জানুনইন্ডাস্ট্রিজেক পলের ১০০ মিলিয়ন ডলার ফান্ডে AI বিনিয়োগে বাংলাদেশের ফ্রিল্যান্সারদের নতুন সুযোগগবেষণাবাংলাদেশে AI মডেলের নতুন চ্যালেঞ্জ: বড় মডেল কেন ছোটের চেয়ে খারাপ পারফর্ম করলোটুলAI এজেন্ট এখন নিজেই ১ সেন্টে লাইভ ডেটা কিনবে, আপনার চাকরি বদলাবেইন্ডাস্ট্রিGoogle DeepMind-এর ৭৫ মিলিয়ন ডলার চুক্তি: AI এখন আবেগ বুঝবে, আপনার কাজ বদলে যাবেটুলওপেন সোর্স ডেভেলপারদের জন্য বড় সুখবর, AI দিয়ে মিলবে নিরাপত্তা সুরক্ষাইন্ডাস্ট্রিSpaceX বিনিয়োগ-গ্রেড বন্ড ইস্যু করছে, বাংলাদেশি বিনিয়োগকারীদের জন্য নতুন সুযোগইন্ডাস্ট্রিবাংলাদেশে সাশ্রয়ী AI মডেলের পথ খুলল, Baseten পেল ১.৫ বিলিয়ন ডলারইন্ডাস্ট্রিAnthropic-এর Mythos মডেল নিয়ে সরকারের দ্বন্দ্ব: বাংলাদেশের AI নীতিতে কী প্রভাব ফেলবেটুলAI এজেন্টে খরচ কমাবে Ampersend, Amazon Bedrock-এ চালু নতুন পদ্ধতিইন্ডাস্ট্রিGoogle-এর ৭৫ মিলিয়ন ডলার বিনিয়োগ: AI দিয়ে বদলে যাবে সৃজনশীল শিল্পমডেলAria মডেলে এখন টেক্সট, ছবি ও ভিডিও একসঙ্গে প্রক্রিয়া করুন বিনামূল্যেটুলআপনার GPU-তে LLM চালানোর আসল খরচ কত, জানুনইন্ডাস্ট্রিজেক পলের ১০০ মিলিয়ন ডলার ফান্ডে AI বিনিয়োগে বাংলাদেশের ফ্রিল্যান্সারদের নতুন সুযোগগবেষণাবাংলাদেশে AI মডেলের নতুন চ্যালেঞ্জ: বড় মডেল কেন ছোটের চেয়ে খারাপ পারফর্ম করলোটুলAI এজেন্ট এখন নিজেই ১ সেন্টে লাইভ ডেটা কিনবে, আপনার চাকরি বদলাবেইন্ডাস্ট্রিGoogle DeepMind-এর ৭৫ মিলিয়ন ডলার চুক্তি: AI এখন আবেগ বুঝবে, আপনার কাজ বদলে যাবেটুলওপেন সোর্স ডেভেলপারদের জন্য বড় সুখবর, AI দিয়ে মিলবে নিরাপত্তা সুরক্ষাইন্ডাস্ট্রিSpaceX বিনিয়োগ-গ্রেড বন্ড ইস্যু করছে, বাংলাদেশি বিনিয়োগকারীদের জন্য নতুন সুযোগইন্ডাস্ট্রিবাংলাদেশে সাশ্রয়ী AI মডেলের পথ খুলল, Baseten পেল ১.৫ বিলিয়ন ডলারইন্ডাস্ট্রিAnthropic-এর Mythos মডেল নিয়ে সরকারের দ্বন্দ্ব: বাংলাদেশের AI নীতিতে কী প্রভাব ফেলবেটুলAI এজেন্টে খরচ কমাবে Ampersend, Amazon Bedrock-এ চালু নতুন পদ্ধতিইন্ডাস্ট্রিGoogle-এর ৭৫ মিলিয়ন ডলার বিনিয়োগ: AI দিয়ে বদলে যাবে সৃজনশীল শিল্পমডেলAria মডেলে এখন টেক্সট, ছবি ও ভিডিও একসঙ্গে প্রক্রিয়া করুন বিনামূল্যে
হোম/নিউজ/রিসার্চ
রিসার্চ৫ মিনিট পড়া

AI চ্যাটবটের পেছনে জাদু নয়, ৩টি ইঞ্জিনিয়ারিং ফিক্স, জানলে কাজে লাগবে

ডেভ টু ডট ওয়ানের একটি নতুন বিশ্লেষণে বলা হয়েছে, ট্রান্সফরমার আর্কিটেকচার আসলে তিনটি সাধারণ ইঞ্জিনিয়ারিং সমাধানের সমন্বয়। আর একটি শব্দ-অনুমানকারী মডেলকে চ্যাটবটে পরিণত করতে প্রিট্রেনিং ও অ্যালাইনমেন্ট রেসিপি কাজ করে। কোনো পদক্ষেপই জাদুকরী নয়, বরং প্রতিটি নির্দিষ্ট গণনাগত সমস্যা সমাধান করে।

d
সম্পাদকীয় টিম
স্টাফ রিপোর্টার · ৩ ঘণ্টা আগে · সূত্র: dev.to ML
AI চ্যাটবটের পেছনে জাদু নয়, ৩টি ইঞ্জিনিয়ারিং ফিক্স, জানলে কাজে লাগবে

ডেভ টু ডট ওয়ানের একটি নতুন বিশ্লেষণে বলা হয়েছে, ট্রান্সফরমার আর্কিটেকচার আসলে তিনটি সাধারণ ইঞ্জিনিয়ারিং সমাধানের সমন্বয়। আর একটি শব্দ-অনুমানকারী মডেলকে চ্যাটবটে পরিণত করতে প্রিট্রেনিং ও অ্যালাইনমেন্ট রেসিপি কাজ করে। কোনো পদক্ষেপই জাদুকরী নয়, বরং প্রতিটি নির্দিষ্ট গণনাগত সমস্যা সমাধান করে।

প্রযুক্তি বিশ্বে বর্তমানে সবচেয়ে আলোচিত বিষয় হলো বড় ভাষা মডেল বা LLM। কিন্তু এই মডেলগুলোর পেছনের স্থাপত্য কি আসলেই এত জটিল? dev.to ML-এ প্রকাশিত একটি নতুন নিবন্ধে দাবি করা হয়েছে, ট্রান্সফরমার আর্কিটেকচার মাত্র তিনটি ইঞ্জিনিয়ারিং ফিক্সের সমন্বয়। এগুলো হলো শর্টকাট, রিস্কেল এবং ওয়েটেড লুকআপ। লেখকের মতে, এই তিনটি উপাদানের কোনোটাই জাদু নয়।

নিবন্ধটি একটি সিরিজের অংশ যা AI-এর মৌলিক বিষয়গুলো সহজ ভাষায় ব্যাখ্যা করে। আগের পর্বে লেখক দেখিয়েছিলেন কীভাবে এই তিনটি ফিক্স একসঙ্গে কাজ করে। কিন্তু তিনি তখন স্বীকার করেছিলেন যে স্থাপত্য পুরো গল্পের শুধু এক পা। বাকি দুই পা হলো স্কেল এবং সেই বিশেষ রেসিপি যা একটি কাঁচা শব্দ-অনুমানকারীকে সার্থক চ্যাটবটে রূপান্তরিত করে। এই নতুন পোস্টটি সেই প্রতিশ্রুতি পূরণ করছে।

লেখক ব্যাখ্যা করেছেন যে একটি মডেলকে প্রশিক্ষণের প্রক্রিয়াটি তিনটি রাউন্ডে বিভক্ত। প্রথম রাউন্ডটি হলো প্রিট্রেনিং। এই ধাপে মডেলটি ইন্টারনেট থেকে সংগ্রহ করা বিপুল পরিমাণ টেক্সট দেখে। এটি শেখে কোন শব্দের পর সাধারণত কোন শব্দ আসে। এই ধাপেই মডেলটি ভাষার ব্যাকরণ, তথ্য এবং কিছু যুক্তি শিখে ফেলে। কিন্তু এই মডেলটি এখনও কোনো প্রশ্নের উত্তর দিতে পারে না। এটি কেবল একটি অত্যন্ত দক্ষ টেক্সট সম্পূর্ণকারী মেশিন।

দ্বিতীয় রাউন্ডটি হলো ফাইন-টিউনিং। এই ধাপে মডেলটিকে নির্দিষ্ট কাজের জন্য তৈরি করা হয়। যেমন প্রশ্নের উত্তর দেওয়া বা সারসংক্ষেপ তৈরি করা। গবেষকরা মডেলটিকে হাজার হাজার উদাহরণ দেখান যেখানে একটি ইনপুট এবং একটি কাঙ্ক্ষিত আউটপুট থাকে। এই প্রশিক্ষণের মাধ্যমে মডেলটি শেখে কীভাবে ব্যবহারকারীর নির্দেশ অনুসরণ করতে হয়। এটি চ্যাটবটে রূপান্তরের প্রথম বড় ধাপ।

তৃতীয় এবং সবচেয়ে গুরুত্বপূর্ণ রাউন্ডটি হলো অ্যালাইনমেন্ট। এই ধাপে মডেলটিকে মানবিক পছন্দের সঙ্গে সামঞ্জস্যপূর্ণ করা হয়। গবেষকরা মডেলটিকে একাধিক উত্তর তৈরি করতে বলেন এবং তারপর মানুষ বা অন্য একটি মডেল সেরাটি বেছে নেয়। রিইনফোর্সমেন্ট লার্নিং ফ্রম হিউম্যান ফিডব্যাক বা RLHF নামক এই কৌশলটি মডেলটিকে শেখায় কোন উত্তরটি বেশি সহায়ক, সঠিক এবং নিরাপদ। এই তিনটি রাউন্ড মিলেই একটি শব্দ-অনুমানকারী মেশিন সার্থক চ্যাটবটে পরিণত হয়।

বাংলাদেশের জন্য এই গবেষণার গুরুত্ব অপরিসীম। দেশের ডেভেলপার এবং AI গবেষকরা যদি বুঝতে পারেন যে এই প্রক্রিয়াটি কোনো জাদু নয় বরং সুনির্দিষ্ট ইঞ্জিনিয়ারিং, তাহলে তারা নিজেরাই ছোট মডেল তৈরি করতে পারবেন। ফ্রিল্যান্সার এবং শিক্ষার্থীরা এই জ্ঞান ব্যবহার করে স্থানীয় ভাষার জন্য বিশেষায়িত চ্যাটবট তৈরি করতে পারবেন। ব্যবসায়িক প্রতিষ্ঠানগুলোও নিজস্ব ডেটা দিয়ে মডেল ফাইন-টিউন করে গ্রাহক সেবা স্বয়ংক্রিয় করতে পারবে।

মূল বার্তাটি পরিষ্কার। AI মডেল তৈরির পেছনে কোনো রহস্য নেই। প্রতিটি ধাপই একটি নির্দিষ্ট সমস্যার সমাধান করে। যারা এই প্রক্রিয়া বুঝবেন, তারাই ভবিষ্যতের প্রযুক্তি তৈরি করবেন।

আরও পড়ুন

🌐 তথ্যসূত্র ও স্বচ্ছতা

এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।

ট্যাগ:#রিসার্চ#AI#বাংলাদেশ#dev.to ML
AD
📧

AI নিউজ সরাসরি ইমেইলে পান

প্রতিদিনের সেরা AI খবর বাছাই করে আপনার inbox-এ পাঠাই। বিজ্ঞাপন নেই।

মূল প্রতিবেদন: dev.to ML

সোর্স দেখুন ↗

মন্তব্য

লোড হচ্ছে...