গুগলের নতুন AI জেমিনি ওমনি: ভিডিও-অডিও-টেক্সটে ৩ গুণ দক্ষতা
গুগল তাদের নতুন মাল্টিমোডাল AI মডেল জেমিনি ওমনি ও জেমিনি ৩.৫-এর ১১টি ডেমো প্রকাশ করেছে। ডেমোগুলোতে মডেলগুলোর উন্নত ভিডিও, অডিও ও টেক্সট প্রক্রিয়াকরণ ক্ষমতা তুলে ধরা হয়েছে।
গুগল তাদের নতুন মাল্টিমোডাল AI মডেল জেমিনি ওমনি ও জেমিনি ৩.৫-এর ১১টি ডেমো প্রকাশ করেছে। ডেমোগুলোতে মডেলগুলোর উন্নত ভিডিও, অডিও ও টেক্সট প্রক্রিয়াকরণ ক্ষমতা তুলে ধরা হয়েছে।
গুগল তাদের এআই ব্লগে জেমিনি ওমনি ও জেমিনি ৩.৫ মডেলের ১১টি ডেমো প্রকাশ করেছে। এই ডেমোগুলোতে মডেল দুটির মাল্টিমোডাল ও উন্নত এআই ক্ষমতা প্রদর্শন করা হয়েছে। গুগল জানিয়েছে, নতুন মডেলগুলো আগের সংস্করণের তুলনায় উল্লেখযোগ্য কর্মক্ষমতা উন্নতি দেখিয়েছে।
জেমিনি ওমনি একটি মাল্টিমোডাল মডেল যা একসঙ্গে টেক্সট, ছবি, অডিও ও ভিডিও প্রক্রিয়া করতে পারে। এর মানে হলো, ব্যবহারকারীরা ভিডিও দেখার সময় সরাসরি প্রশ্ন করতে পারবেন এবং মডেল সেই ভিডিও থেকে উত্তর দিতে পারবে। অন্যদিকে, জেমিনি ৩.৫ একটি অত্যন্ত শক্তিশালী ভাষা মডেল যা জটিল যুক্তি ও বিশ্লেষণে পারদর্শী।
ডেমোগুলোর মধ্যে একটি দেখায় কিভাবে জেমিনি ওমনি একটি লাইভ ভিডিও স্ট্রিম বিশ্লেষণ করে বস্তু শনাক্ত করতে পারে। আরেকটি ডেমোতে জেমিনি ৩.৫ একটি জটিল গণিত সমস্যার ধাপে ধাপে সমাধান দিয়েছে। গুগল বলেছে, জেমিনি ৩.৫ আগের মডেলের চেয়ে ২ গুণ দ্রুত কাজ করে এবং ভুলের হার অনেক কমিয়েছে।
প্রযুক্তি বিশ্লেষকদের মতে, এই মডেলগুলো এআই-এর বর্তমান সীমা উল্লেখযোগ্যভাবে বাড়িয়ে দিয়েছে। বিশেষ করে ভিডিও ও অডিও বোঝার ক্ষমতা নতুন সম্ভাবনা তৈরি করছে। উদাহরণস্বরূপ, শিক্ষার্থীরা লেকচার ভিডিও থেকে সরাসরি নোট নিতে পারবে। ব্যবসায়ীরা মিটিং রেকর্ডিং থেকে স্বয়ংক্রিয়ভাবে সারাংশ তৈরি করতে পারবে।
বাংলাদেশের ডেভেলপার ও ফ্রিল্যান্সারদের জন্য এই খবর অত্যন্ত গুরুত্বপূর্ণ। জেমিনি ওমনি ও জেমিনি ৩.৫-এর এপিআই ব্যবহার করে তারা উন্নত অ্যাপ্লিকেশন তৈরি করতে পারবে। যেমন, একটি বাংলা ভাষার ভিডিও বিশ্লেষণ টুল বা স্বয়ংক্রিয় কনটেন্ট মডারেশন সিস্টেম। স্থানীয় স্টার্টআপগুলো এই মডেল ব্যবহার করে গ্রাহকসেবা, শিক্ষা ও স্বাস্থ্যসেবায় নতুন সমাধান আনতে পারে।
গুগল জানিয়েছে, মডেল দুটি ধীরে ধীরে তাদের ক্লাউড প্ল্যাটফর্মে উপলব্ধ হবে। ডেভেলপাররা এখনই গুগলের এআই স্টুডিওতে ডেমো অ্যাক্সেস করতে পারবেন। আগামী মাসগুলোতে আরও বিস্তারিত তথ্য ও এপিআই প্রকাশ করা হবে বলে জানিয়েছে গুগল।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: Google AI Blog
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...