বাংলাদেশে ভিডিওতে বস্তু শনাক্তকরণে 3D মাত্রা যোগ করল GMOS, বদলে যাবে ফ্রিল্যান্সিং
কম্পিউটার ভিশন গবেষকরা ভিডিওতে চলমান বস্তু শনাক্তকরণের জন্য GMOS নামের একটি নতুন পদ্ধতি তৈরি করেছেন। এটি ঐতিহ্যবাহী 2D পদ্ধতির সীমাবদ্ধতা কাটিয়ে সরাসরি 3D সেগমেন্টেশন মাস্ক তৈরি করতে পারে। এই উদ্ভাবন স্বায়ত্তশাসিত যান থেকে শুরু করে ভিডিও অ্যানালিটিকস পর্যন্ত নানা ক্ষেত্রে বিপ্লব ঘটাতে পারে।
কম্পিউটার ভিশন গবেষকরা ভিডিওতে চলমান বস্তু শনাক্তকরণের জন্য GMOS নামের একটি নতুন পদ্ধতি তৈরি করেছেন। এটি ঐতিহ্যবাহী 2D পদ্ধতির সীমাবদ্ধতা কাটিয়ে সরাসরি 3D সেগমেন্টেশন মাস্ক তৈরি করতে পারে। এই উদ্ভাবন স্বায়ত্তশাসিত যান থেকে শুরু করে ভিডিও অ্যানালিটিকস পর্যন্ত নানা ক্ষেত্রে বিপ্লব ঘটাতে পারে।
কম্পিউটার ভিশন গবেষকরা ভিডিওতে চলমান বস্তু শনাক্তকরণ ও ট্র্যাকিংয়ের একটি নতুন পদ্ধতি উন্মোচন করেছেন। arXiv-এর তথ্য অনুযায়ী, GMOS নামের এই পদ্ধতি ভিডিও ফুটেজ থেকে সরাসরি ত্রিমাত্রিক সেগমেন্টেশন মাস্ক তৈরি করে। এটি প্রি-কম্পিউটেড 2D অ্যাপ্রোক্সিমেশনের ওপর নির্ভর না করে স্প্যাটিওটেম্পোরাল কোঅর্ডিনেটস ব্যবহার করে বস্তুর গতি শনাক্ত করে।
এই পদ্ধতির মূল শক্তি হলো এটি বস্তুর গতি বোঝার জন্য সময় ও স্থানের সমন্বয় ঘটায়। প্রচলিত পদ্ধতিগুলো প্রথমে 2D ইমেজ প্রসেসিং করে তারপর 3D তথ্য অনুমান করে। সেই প্রক্রিয়ায় অনেক গুরুত্বপূর্ণ তথ্য হারিয়ে যায়। GMOS সরাসরি র ভিডিও ডেটা থেকে কাজ করে এই সীমাবদ্ধতা দূর করে।
গবেষক দলটি জানিয়েছে, GMOS বস্তুর গতিপথ ও আকৃতি আরও নির্ভুলভাবে ধারণ করতে পারে। এটি বিশেষ করে জটিল দৃশ্যে কার্যকর যেখানে একাধিক বস্তু ওভারল্যাপ করে বা দ্রুত গতিতে চলে। পদ্ধতিটি র ভিডিওর প্রতিটি ফ্রেমকে 3D স্পেসে ম্যাপ করে এবং টেম্পোরাল কনটেক্সট ব্যবহার করে বস্তুর অবস্থান ও পরিবর্তন ট্র্যাক করে।
এই প্রযুক্তির প্রভাব অনেক ক্ষেত্রেই গুরুত্বপূর্ণ। স্বায়ত্তশাসিত গাড়ির জন্য এটি রাস্তার অন্যান্য যানবাহন ও পথচারীদের আরও নির্ভুলভাবে শনাক্ত করতে সাহায্য করবে। ভিডিও সার্ভেইল্যান্স সিস্টেমে এটি জটিল ঘটনা বিশ্লেষণে নতুন মাত্রা যোগ করবে। রোবোটিক্সে এটি বস্তু হ্যান্ডলিং ও নেভিগেশনকে আরও স্মার্ট করে তুলবে।
বাংলাদেশের প্রযুক্তি খাতের জন্যও এই গবেষণার গুরুত্ব অনেক। দেশের স্টার্টআপ ও গবেষকরা এই পদ্ধতি ব্যবহার করে স্বাস্থ্যসেবা, কৃষি ও উৎপাদন খাতে উন্নত ভিডিও অ্যানালিটিকস সলিউশন তৈরি করতে পারেন। ফ্রিল্যান্সার ও ডেভেলপারদের জন্য এটি নতুন দক্ষতা অর্জনের সুযোগ তৈরি করবে। বিশ্ববিদ্যালয়ের গবেষকরা এই পদ্ধতি নিয়ে আরও কাজ করে আন্তর্জাতিক পর্যায়ে অবদান রাখতে পারেন।
GMOS এখনও গবেষণা পর্যায়ে আছে। তবে এর সাফল্য ভবিষ্যতে ভিডিও প্রসেসিংয়ের মানদণ্ড পরিবর্তন করতে পারে। গবেষক দলটি পদ্ধতিটিকে আরও অপ্টিমাইজ করে বাস্তব বিশ্বের অ্যাপ্লিকেশনের জন্য প্রস্তুত করার পরিকল্পনা করছে। এই উদ্ভাবন AI ও কম্পিউটার ভিশনের জগতে একটি গুরুত্বপূর্ণ মাইলফলক হিসেবে চিহ্নিত হবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to ML
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...