গুগলের নতুন AI: কয়েকটি ছবি থেকেই ৩D মডেল বানাবে, ক্যামেরা পোজ লাগবে না
গুগল রিসার্চ নতুন AI মডেল MELON চালু করেছে। এটি মাত্র কয়েকটি ২D ছবি থেকে ৩D অবজেক্ট পুনর্গঠন করতে পারে। ক্যামেরার অবস্থান বা পোজ জানার প্রয়োজন নেই।
গুগল রিসার্চ নতুন AI মডেল MELON চালু করেছে। এটি মাত্র কয়েকটি ২D ছবি থেকে ৩D অবজেক্ট পুনর্গঠন করতে পারে। ক্যামেরার অবস্থান বা পোজ জানার প্রয়োজন নেই।
কম্পিউটার ভিশনের একটি পুরনো ও জটিল সমস্যার সমাধান নিয়ে এলো Google Research। গবেষণা সংস্থাটি MELON নামের একটি নতুন পদ্ধতি চালু করেছে। এটি মাত্র কয়েকটি ২D ছবি থেকে যেকোনো বস্তুর ত্রিমাত্রিক (3D) আকার পুনর্গঠন করতে পারে। সবচেয়ে বড় কথা হলো, এই কাজের জন্য ক্যামেরার অবস্থান বা পোজের তথ্যের প্রয়োজন হয় না।
মানুষের জন্য একটি বস্তুর ২D ছবি দেখে তার সম্পূর্ণ ৩D আকৃতি কল্পনা করা সহজ। কিন্তু একটি কম্পিউটারের জন্য এটি ছিল অত্যন্ত কঠিন একটি অ্যালগরিদমিক চ্যালেঞ্জ। MELON সেই চ্যালেঞ্জকে জয় করেছে। এটি মেশিন লার্নিং মডেলকে শেখায় কীভাবে অল্প তথ্য দিয়েও বস্তুর গভীরতা ও গঠন বুঝতে হয়।
MELON পদ্ধতিটি কীভাবে কাজ করে তা বোঝা গুরুত্বপূর্ণ। সাধারণত ৩D মডেল তৈরি করতে হলে ক্যামেরার কোণ, দূরত্ব ও অবস্থান জানা জরুরি। এই তথ্যগুলোকে বলা হয় ক্যামেরা পোজ। MELON সেই পোজ অনুমান করেই নেয়। এটি নিউরাল নেটওয়ার্ক ব্যবহার করে ছবির বিভিন্ন কোণ থেকে তথ্য সংগ্রহ করে। এরপর সেই তথ্য বিশ্লেষণ করে একটি সম্পূর্ণ ৩D মেশ তৈরি করে। এই মেশটি বাস্তব বস্তুর মতোই দেখতে হয়।
এই প্রযুক্তির সম্ভাবনা বিশাল। ভিডিও গেম, ভার্চুয়াল রিয়েলিটি ও অগমেন্টেড রিয়েলিটি শিল্পে এটি বিপ্লব ঘটাতে পারে। উদাহরণস্বরূপ, একটি মিউজিয়ামের কয়েকটি ছবি দিয়েই তার ডিজিটাল টুইন তৈরি করা সম্ভব হবে। ই-কমার্স সাইটগুলো পণ্যের ৩D মডেল তৈরি করতে পারবে মাত্র কয়েকটি ছবি তুলেই। এটি পণ্য প্রদর্শনের অভিজ্ঞতা বদলে দেবে।
বাংলাদেশের ডেভেলপার ও ফ্রিল্যান্সারদের জন্য এটি একটি বড় সুযোগ। বর্তমানে ৩D মডেলিং অনেক সময় ও খরচ সাপেক্ষ। MELON ব্যবহার করে তারা দ্রুত ও সস্তায় ৩D কন্টেন্ট তৈরি করতে পারবেন। স্থানীয় স্টার্টআপগুলো তাদের পণ্যের ক্যাটালগকে আরও আকর্ষণীয় করে তুলতে পারবে। শিক্ষার্থীরা কম্পিউটার ভিশন ও AI নিয়ে গবেষণার নতুন দিগন্ত পাবে।
তবে এই প্রযুক্তি এখনো গবেষণার স্তরে আছে। বাস্তব বিশ্বে ব্যবহারের জন্য আরও পরীক্ষা-নিরীক্ষা প্রয়োজন। Google Research জানিয়েছে, তারা MELON-কে ওপেন সোর্স হিসেবে প্রকাশের পরিকল্পনা করছে। এটি শিল্প ও শিক্ষাক্ষেত্রে দ্রুত ছড়িয়ে পড়তে সাহায্য করবে। ভবিষ্যতে আমরা হয়তো আমাদের স্মার্টফোন দিয়েই যেকোনো বস্তুর ৩D স্ক্যান করতে পারব।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: Google Research
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...