AI এখন অদৃশ্য স্থান বুঝবে, আপনার কাজে আসবে ৩ গুণ বেশি
গবেষকরা একটি নতুন প্রশিক্ষণ পদ্ধতি তৈরি করেছেন যা ভিশন-ল্যাঙ্গুয়েজ মডেলকে দৃশ্যমান ফ্রেমের বাইরের স্থান সম্পর্কে যুক্তি দিতে শেখায়। এই পদ্ধতি প্রচলিত টেক্সট-ভিত্তিক পদ্ধতির চেয়ে অনেক বেশি কার্যকর।
গবেষকরা একটি নতুন প্রশিক্ষণ পদ্ধতি তৈরি করেছেন যা ভিশন-ল্যাঙ্গুয়েজ মডেলকে দৃশ্যমান ফ্রেমের বাইরের স্থান সম্পর্কে যুক্তি দিতে শেখায়। এই পদ্ধতি প্রচলিত টেক্সট-ভিত্তিক পদ্ধতির চেয়ে অনেক বেশি কার্যকর।
একদল গবেষক ভিশন-ল্যাঙ্গুয়েজ মডেলের একটি বড় দুর্বলতা দূর করার জন্য একটি অভিনব প্রশিক্ষণ পদ্ধতি তৈরি করেছেন। এই মডেলগুলো সাধারণত ছবির ভেতরে যা দেখা যায় তা বুঝতে পারে কিন্তু ফ্রেমের বাইরের তথ্য কল্পনা করতে পারে না। নতুন পদ্ধতির নাম Imaginative Perception Tokens।
গবেষণাটি dev.to ML সূত্রে প্রকাশিত হয়েছে। এই পদ্ধতি মডেলকে শেখায় কীভাবে অদৃশ্য কোনো স্থানের জ্যামিতিক ও স্থানিক সম্পর্ক অনুমান করতে হয়। প্রচলিত টেক্সট-ভিত্তিক যুক্তির চেয়ে এটি অনেক বেশি নির্ভুল ফলাফল দিয়েছে।
Imaginative Perception Tokens পদ্ধতিটি কীভাবে কাজ করে? গবেষকরা মডেলকে এমন কিছু বিশেষ টোকেন বা প্রতীক ব্যবহার করে প্রশিক্ষণ দেন যা অদৃশ্য স্থানের তথ্য বহন করে। মডেল যখন একটি ছবি দেখে তখন এই টোকেনগুলো তাকে কল্পনা করতে সাহায্য করে যে ছবির বাইরে কী থাকতে পারে। উদাহরণস্বরূপ, একটি ঘরের ছবি দেখে মডেলটি অনুমান করতে পারে যে দরজার ওপারে আরেকটি কক্ষ আছে।
এই পদ্ধতির সবচেয়ে বড় সাফল্য হলো এটি প্রচলিত টেক্সট-ভিত্তিক পদ্ধতির তুলনায় অনেক বেশি কার্যকর। টেক্সট-ভিত্তিক পদ্ধতিতে মডেলকে শুধু শব্দের মাধ্যমে বোঝানো হয় কিন্তু Imaginative Perception Tokens পদ্ধতিতে মডেলটি সরাসরি স্থানিক তথ্য প্রক্রিয়া করতে শেখে। ফলে তার কল্পনা আরও বাস্তবসম্মত হয়।
এই গবেষণার ফলে স্বয়ংক্রিয় গাড়ি, রোবোটিক্স এবং ভার্চুয়াল রিয়েলিটির মতো ক্ষেত্রে বড় পরিবর্তন আসতে পারে। স্বয়ংক্রিয় গাড়ির জন্য রাস্তার অদৃশ্য অংশ অনুমান করা খুবই গুরুত্বপূর্ণ। রোবটের জন্যও তার চারপাশের অদৃশ্য স্থান বুঝতে পারা জরুরি।
বাংলাদেশের প্রযুক্তি খাতের জন্যও এই গবেষণার গুরুত্ব অনেক। বাংলাদেশে AI এবং মেশিন লার্নিং নিয়ে কাজ করা ডেভেলপার ও গবেষকদের জন্য এটি একটি নতুন দিগন্ত খুলে দিতে পারে। স্থানীয় স্টার্টআপগুলো যদি এই পদ্ধতি ব্যবহার করে তবে তারা আরও উন্নত ভিশন-ভিত্তিক অ্যাপ্লিকেশন তৈরি করতে পারবে। যেমন স্মার্ট সিকিউরিটি সিস্টেম বা অগমেন্টেড রিয়েলিটি অ্যাপ।
ভবিষ্যতে গবেষকরা এই পদ্ধতিকে আরও উন্নত করার পরিকল্পনা করছেন। তারা চান মডেলটি যেন শুধু স্থানিক তথ্যই নয় বরং সময়ের সাথে পরিবর্তনশীল অদৃশ্য স্থানও কল্পনা করতে পারে। এই গবেষণা AI-কে মানুষের মতো কল্পনা করার আরও কাছাকাছি নিয়ে যাবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to ML
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...