৮ মাসের চেষ্টা, ২০০ ব্যর্থতা: নিউরাল নেট ছাড়া AI বানাতে পারবেন কি?
একজন গবেষক 8 মাস ধরে নিউরাল নেটওয়ার্ক ছাড়া শুধুমাত্র CPU-তে চালানোর উপযোগী একটি ভাষা মডেল তৈরির চেষ্টা করছেন। প্রায় 200টি ব্যর্থ পরীক্ষার পর তিনি এক অদৃশ্য প্রাচীরে আঘাত করেছেন। এই প্রচেষ্টা LLM-এর বিকল্প পথের সন্ধান দিতে পারে।
একজন গবেষক 8 মাস ধরে নিউরাল নেটওয়ার্ক ছাড়া শুধুমাত্র CPU-তে চালানোর উপযোগী একটি ভাষা মডেল তৈরির চেষ্টা করছেন। প্রায় 200টি ব্যর্থ পরীক্ষার পর তিনি এক অদৃশ্য প্রাচীরে আঘাত করেছেন। এই প্রচেষ্টা LLM-এর বিকল্প পথের সন্ধান দিতে পারে।
বড় ভাষার মডেল বা LLM-এর বিকল্প কি শুধুমাত্র নিউরাল নেটওয়ার্ক দিয়েই তৈরি করতে হবে? একটি নতুন গবেষণা সিরিজ এই ধারণাকে চ্যালেঞ্জ জানিয়েছে। dev.to AI প্ল্যাটফর্মে প্রকাশিত একটি নিবন্ধে একজন গবেষক তার 8 মাসের প্রচেষ্টার কথা জানিয়েছেন। তিনি একটি নন-নিউরাল, শুধুমাত্র CPU-তে চালানোর উপযোগী সিস্টেম তৈরি করতে চেয়েছিলেন। এই পথে তিনি প্রায় 200টি ব্যর্থ পরীক্ষার সম্মুখীন হয়েছেন।
গবেষণাটির দ্বিতীয় পর্বে গবেষক একটি মৌলিক প্রশ্নের উত্তর খুঁজছেন। প্রশ্নটি হলো, একটি সিস্টেম কি নিউরাল নেটওয়ার্ক ছাড়াই অভিজ্ঞতা সঞ্চয় করতে পারে? এটি কি নিজের অভ্যন্তরীণ অবস্থা পরিবর্তন করে ভবিষ্যতে আরও ভালো সিদ্ধান্ত নিতে পারবে? গবেষক জানিয়েছেন, এটি কোনো চ্যাটবট র্যাপার নয়। এটি কোনো নতুন প্রম্পট স্ট্যাক বা সুন্দর ইউজার ইন্টারফেস দেওয়া ভেক্টর ডাটাবেসও নয়।
প্রথম পর্বে গবেষক একটি সিন্থেটিক ইভালুয়েশনে 30-এর মধ্যে 30 স্কোর পেয়েছিলেন। কিন্তু বাস্তবিক পরীক্ষায় তার LoCoMo স্কোর ছিল মাত্র 0.13। এই ফলাফল তাকে দেখিয়েছে যে সিন্থেটিক টেস্ট এবং বাস্তব জগতের মধ্যে বিশাল পার্থক্য রয়েছে। দ্বিতীয় পর্বে তিনি এই পার্থক্য দূর করার চেষ্টা করেছেন। তিনি একটি সিস্টেম তৈরি করেছেন যা নিজের ভুল থেকে শিখতে পারে এবং নিজেকে পরিবর্তন করতে পারে।
গবেষক AuraSDK নামে একটি কোড সংগ্রহ তৈরি করেছেন। এই কোডটি তার সবচেয়ে সফল পরীক্ষাগুলোর ফল। এই সিস্টেমটি নিউরাল নেটওয়ার্কের পরিবর্তে একটি ভিন্ন পদ্ধতি ব্যবহার করে। এটি ট্রান্সফরমার আর্কিটেকচারের ওপর নির্ভর করে না। পরিবর্তে এটি একটি নিয়ম-ভিত্তিক এবং বিবর্তনীয় পদ্ধতি অনুসরণ করে।
বাংলাদেশের প্রযুক্তি খাতের জন্য এই গবেষণার গুরুত্ব অনেক। দেশের অনেক ডেভেলপার এবং ফ্রিল্যান্সার উচ্চক্ষমতাসম্পন্ন GPU-তে অ্যাক্সেস পান না। একটি CPU-তে চালানোর উপযোগী, নন-নিউরাল AI সিস্টেম তাদের জন্য নতুন দিগন্ত খুলতে পারে। এটি ক্লাউড কম্পিউটিং খরচ কমাতে সাহায্য করতে পারে। স্থানীয় ভাষা প্রক্রিয়াকরণেও এটি কার্যকর হতে পারে।
গবেষক স্বীকার করেছেন যে তিনি এখন এক অদৃশ্য প্রাচীরে আঘাত করেছেন। তার সিস্টেম নির্দিষ্ট কিছু কাজে ভালো করলেও জটিল ভাষা বোঝার ক্ষেত্রে পিছিয়ে আছে। তবে তিনি হাল ছাড়েননি। তিনি আশা করছেন যে আরও পরীক্ষা-নিরীক্ষার মাধ্যমে তিনি এই প্রাচীর ভাঙতে পারবেন।
এই গবেষণা প্রমাণ করে যে AI-তে এখনও অনেক অজানা পথ রয়েছে। নিউরাল নেটওয়ার্কই হয়তো শেষ কথা নয়। বিকল্প পদ্ধতি খুঁজে বের করা ভবিষ্যতের AI-কে আরও সাশ্রয়ী ও সহজলভ্য করে তুলতে পারে। গবেষক তার তৃতীয় পর্বে এই পদ্ধতির সীমাবদ্ধতা কাটিয়ে ওঠার চেষ্টা করবেন।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to AI
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...