AI চ্যাটবটের পেছনে জাদু নয়, ৩টি ইঞ্জিনিয়ারিং ফিক্স, জানলে কাজে লাগবে
ডেভ টু ডট ওয়ানের একটি নতুন বিশ্লেষণে বলা হয়েছে, ট্রান্সফরমার আর্কিটেকচার আসলে তিনটি সাধারণ ইঞ্জিনিয়ারিং সমাধানের সমন্বয়। আর একটি শব্দ-অনুমানকারী মডেলকে চ্যাটবটে পরিণত করতে প্রিট্রেনিং ও অ্যালাইনমেন্ট রেসিপি কাজ করে। কোনো পদক্ষেপই জাদুকরী নয়, বরং প্রতিটি নির্দিষ্ট গণনাগত সমস্যা সমাধান করে।
ডেভ টু ডট ওয়ানের একটি নতুন বিশ্লেষণে বলা হয়েছে, ট্রান্সফরমার আর্কিটেকচার আসলে তিনটি সাধারণ ইঞ্জিনিয়ারিং সমাধানের সমন্বয়। আর একটি শব্দ-অনুমানকারী মডেলকে চ্যাটবটে পরিণত করতে প্রিট্রেনিং ও অ্যালাইনমেন্ট রেসিপি কাজ করে। কোনো পদক্ষেপই জাদুকরী নয়, বরং প্রতিটি নির্দিষ্ট গণনাগত সমস্যা সমাধান করে।
প্রযুক্তি বিশ্বে বর্তমানে সবচেয়ে আলোচিত বিষয় হলো বড় ভাষা মডেল বা LLM। কিন্তু এই মডেলগুলোর পেছনের স্থাপত্য কি আসলেই এত জটিল? dev.to ML-এ প্রকাশিত একটি নতুন নিবন্ধে দাবি করা হয়েছে, ট্রান্সফরমার আর্কিটেকচার মাত্র তিনটি ইঞ্জিনিয়ারিং ফিক্সের সমন্বয়। এগুলো হলো শর্টকাট, রিস্কেল এবং ওয়েটেড লুকআপ। লেখকের মতে, এই তিনটি উপাদানের কোনোটাই জাদু নয়।
নিবন্ধটি একটি সিরিজের অংশ যা AI-এর মৌলিক বিষয়গুলো সহজ ভাষায় ব্যাখ্যা করে। আগের পর্বে লেখক দেখিয়েছিলেন কীভাবে এই তিনটি ফিক্স একসঙ্গে কাজ করে। কিন্তু তিনি তখন স্বীকার করেছিলেন যে স্থাপত্য পুরো গল্পের শুধু এক পা। বাকি দুই পা হলো স্কেল এবং সেই বিশেষ রেসিপি যা একটি কাঁচা শব্দ-অনুমানকারীকে সার্থক চ্যাটবটে রূপান্তরিত করে। এই নতুন পোস্টটি সেই প্রতিশ্রুতি পূরণ করছে।
লেখক ব্যাখ্যা করেছেন যে একটি মডেলকে প্রশিক্ষণের প্রক্রিয়াটি তিনটি রাউন্ডে বিভক্ত। প্রথম রাউন্ডটি হলো প্রিট্রেনিং। এই ধাপে মডেলটি ইন্টারনেট থেকে সংগ্রহ করা বিপুল পরিমাণ টেক্সট দেখে। এটি শেখে কোন শব্দের পর সাধারণত কোন শব্দ আসে। এই ধাপেই মডেলটি ভাষার ব্যাকরণ, তথ্য এবং কিছু যুক্তি শিখে ফেলে। কিন্তু এই মডেলটি এখনও কোনো প্রশ্নের উত্তর দিতে পারে না। এটি কেবল একটি অত্যন্ত দক্ষ টেক্সট সম্পূর্ণকারী মেশিন।
দ্বিতীয় রাউন্ডটি হলো ফাইন-টিউনিং। এই ধাপে মডেলটিকে নির্দিষ্ট কাজের জন্য তৈরি করা হয়। যেমন প্রশ্নের উত্তর দেওয়া বা সারসংক্ষেপ তৈরি করা। গবেষকরা মডেলটিকে হাজার হাজার উদাহরণ দেখান যেখানে একটি ইনপুট এবং একটি কাঙ্ক্ষিত আউটপুট থাকে। এই প্রশিক্ষণের মাধ্যমে মডেলটি শেখে কীভাবে ব্যবহারকারীর নির্দেশ অনুসরণ করতে হয়। এটি চ্যাটবটে রূপান্তরের প্রথম বড় ধাপ।
তৃতীয় এবং সবচেয়ে গুরুত্বপূর্ণ রাউন্ডটি হলো অ্যালাইনমেন্ট। এই ধাপে মডেলটিকে মানবিক পছন্দের সঙ্গে সামঞ্জস্যপূর্ণ করা হয়। গবেষকরা মডেলটিকে একাধিক উত্তর তৈরি করতে বলেন এবং তারপর মানুষ বা অন্য একটি মডেল সেরাটি বেছে নেয়। রিইনফোর্সমেন্ট লার্নিং ফ্রম হিউম্যান ফিডব্যাক বা RLHF নামক এই কৌশলটি মডেলটিকে শেখায় কোন উত্তরটি বেশি সহায়ক, সঠিক এবং নিরাপদ। এই তিনটি রাউন্ড মিলেই একটি শব্দ-অনুমানকারী মেশিন সার্থক চ্যাটবটে পরিণত হয়।
বাংলাদেশের জন্য এই গবেষণার গুরুত্ব অপরিসীম। দেশের ডেভেলপার এবং AI গবেষকরা যদি বুঝতে পারেন যে এই প্রক্রিয়াটি কোনো জাদু নয় বরং সুনির্দিষ্ট ইঞ্জিনিয়ারিং, তাহলে তারা নিজেরাই ছোট মডেল তৈরি করতে পারবেন। ফ্রিল্যান্সার এবং শিক্ষার্থীরা এই জ্ঞান ব্যবহার করে স্থানীয় ভাষার জন্য বিশেষায়িত চ্যাটবট তৈরি করতে পারবেন। ব্যবসায়িক প্রতিষ্ঠানগুলোও নিজস্ব ডেটা দিয়ে মডেল ফাইন-টিউন করে গ্রাহক সেবা স্বয়ংক্রিয় করতে পারবে।
মূল বার্তাটি পরিষ্কার। AI মডেল তৈরির পেছনে কোনো রহস্য নেই। প্রতিটি ধাপই একটি নির্দিষ্ট সমস্যার সমাধান করে। যারা এই প্রক্রিয়া বুঝবেন, তারাই ভবিষ্যতের প্রযুক্তি তৈরি করবেন।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to ML
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...