AI-এর চিন্তা মুছে ফেলার চেষ্টা, আপনার ফ্রিল্যান্সিং কাজে কী প্রভাব ফেলবে
কৃত্রিম বুদ্ধিমত্তার গবেষণায় একটি অদ্ভুত পরিবর্তন দেখা যাচ্ছে। সাম্প্রতিক গবেষণাগুলো LLM-এর চিন্তার ধারা বা চেইন-অব-থট ট্রেস মুছে ফেলার চেষ্টা করছে। এই প্রবণতা আগের যুগান্তকারী সাফল্যের বিপরীতে দাঁড়িয়েছে।
কৃত্রিম বুদ্ধিমত্তার গবেষণায় একটি অদ্ভুত পরিবর্তন দেখা যাচ্ছে। সাম্প্রতিক গবেষণাগুলো LLM-এর চিন্তার ধারা বা চেইন-অব-থট ট্রেস মুছে ফেলার চেষ্টা করছে। এই প্রবণতা আগের যুগান্তকারী সাফল্যের বিপরীতে দাঁড়িয়েছে।
কৃত্রিম বুদ্ধিমত্তার জগতে একটি অদ্ভুত পরিবর্তন দেখা যাচ্ছে। সাম্প্রতিক গবেষণাগুলো Large Language Model বা LLM-এর চিন্তার ধারা মুছে ফেলার চেষ্টা করছে। Reddit-এর r/artificial ফোরামে এই প্রবণতা নিয়ে ব্যাপক আলোচনা শুরু হয়েছে।
গত ২-৩ বছরে LLM-এর যুক্তি করার ক্ষমতা বাড়ানোর সবচেয়ে বড় অগ্রগতি এসেছে মধ্যম ধাপের চিন্তা তৈরি করার মাধ্যমে। 2022 সালে Wei এবং তার দল Chain-of-Thought prompting নামক একটি পদ্ধতি চালু করে। এই পদ্ধতি PaLM 540B মডেলের গণিত সমাধানের দক্ষতা GSM8K ডেটাসেটে প্রায় 18% থেকে 58% এ নিয়ে যায়। এটি ছিল প্রায় 40 শতাংশ পয়েন্টের একটি বিশাল লাফ।
এরপর গবেষকরা আরও উন্নত পদ্ধতি তৈরি করেন। Self-Consistency নামক একটি কৌশল মডেলকে একাধিক পথে চিন্তা করতে শেখায়। এটি Chain-of-Thought-এর উপরে আরও 17.9 শতাংশ পয়েন্ট যোগ করে। Tree-of-Thoughts নামক আরেকটি পদ্ধতি বিভিন্ন শাখায় চিন্তা করে সেরা সমাধান বেছে নেওয়ার সুযোগ দেয়।
কিন্তু এখন গবেষকরা বিপরীত দিকে যাচ্ছেন। তারা চেষ্টা করছেন LLM-কে সরাসরি উত্তর দিতে শেখানোর, মধ্যম ধাপের চিন্তা না দেখিয়ে। এই পদ্ধতির নাম দেওয়া হয়েছে Chain-of-Thought Distillation বা চিন্তার ধারা পাতন। গবেষকরা মনে করছেন মডেল যদি নিজে নিজে চিন্তা করতে পারে তাহলে তা আরও দক্ষ হবে।
বাংলাদেশের প্রযুক্তি ও AI গবেষণা জগতের জন্য এই প্রবণতা গুরুত্বপূর্ণ। দেশের ডেভেলপার ও ফ্রিল্যান্সাররা বর্তমানে Chain-of-Thought ব্যবহার করে জটিল কাজ সমাধান করছেন। যদি এই নতুন পদ্ধতি সফল হয় তাহলে তারা আরও দ্রুত ও কম খরচে মডেল চালাতে পারবেন। শিক্ষার্থীরা গবেষণার এই পরিবর্তন বুঝতে পারলে নতুন ক্যারিয়ার গড়তে পারবেন।
তবে এই পদ্ধতি এখনও প্রাথমিক পর্যায়ে রয়েছে। গবেষকরা এখনও বোঝার চেষ্টা করছেন মডেল আসলে কীভাবে চিন্তা করে। Chain-of-Thought সরিয়ে ফেললে মডেলের যুক্তি করার ক্ষমতা কতটা কমে যায় তা নিয়ে পরীক্ষা চলছে। এই গবেষণার ফলাফল আগামী কয়েক মাসের মধ্যে প্রকাশিত হবে বলে আশা করা যাচ্ছে।
সব মিলিয়ে LLM গবেষণা একটি মজার মোড় নিয়েছে। আগে মডেলকে আরও বেশি তথ্য দেখানোর চেষ্টা করা হতো। এখন দেখা যাচ্ছে মডেল যত কম তথ্য দেখানো হয় ততই ভালো কাজ করছে। এই দ্বন্দ্ব সমাধান করাই হবে আগামী দিনের গবেষণার মূল চ্যালেঞ্জ।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: Reddit r/artificial
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...