Gradium-এর নতুন মডেলে রিয়েল-টাইম অনুবাদ, GPT-কে হারিয়ে ফ্রিল্যান্সারদের কাজ বদলে দেবে
Gradium দুটি নতুন রিয়েল-টাইম স্পিচ ট্রান্সলেশন মডেল প্রকাশ করেছে। stt-translate এবং s2s-translate মডেলগুলো ২০টি ভাষা জোড়ায় কাজ করে এবং নির্ভুলতা ও বিলম্বে GPT-র চেয়ে এগিয়ে রয়েছে।
Gradium দুটি নতুন রিয়েল-টাইম স্পিচ ট্রান্সলেশন মডেল প্রকাশ করেছে। stt-translate এবং s2s-translate মডেলগুলো ২০টি ভাষা জোড়ায় কাজ করে এবং নির্ভুলতা ও বিলম্বে GPT-র চেয়ে এগিয়ে রয়েছে।
কৃত্রিম বুদ্ধিমত্তাভিত্তিক রিয়েল-টাইম ভাষা অনুবাদের জগতে বড় পরিবর্তন এসেছে। Gradium নামের একটি প্রযুক্তি প্রতিষ্ঠান দুটি নতুন মডেল প্রকাশ করেছে। মডেল দুটির নাম stt-translate এবং s2s-translate। এই মডেলগুলো বক্তৃতা সরাসরি অনুবাদ করতে পারে। প্রতিষ্ঠানটি দাবি করছে, এগুলো বর্তমান সময়ের সবচেয়ে জনপ্রিয় মডেল GPT-র চেয়েও ভালো কাজ করে।
এই মডেলগুলোর সবচেয়ে বড় বৈশিষ্ট্য হলো এগুলো খুব কম সময়ে অনুবাদ সম্পন্ন করে। সাধারণত একটি বক্তৃতা অনুবাদ করতে তিনটি আলাদা মডেলের প্রয়োজন হয়। কিন্তু Gradium সেই প্রক্রিয়াকে সরল করে দুটি মডেলে এনেছে। প্রথম মডেলটি বক্তৃতা শুনে সরাসরি লেখায় রূপান্তর করে এবং অনুবাদ করে। দ্বিতীয় মডেলটি সেই অনুবাদকে আবার কণ্ঠস্বর দিয়ে উপস্থাপন করে। পুরো প্রক্রিয়াটি একটি WebSocket সংযোগের মাধ্যমে রিয়েল-টাইমে ঘটে।
Gradium-এর মডেলগুলো বর্তমানে ২০টি ভাষা জোড়ায় কাজ করে। ভাষাগুলোর মধ্যে রয়েছে ইংরেজি, ফ্রেঞ্চ, জার্মান, স্প্যানিশ এবং পর্তুগিজ। প্রতিটি ভাষার জন্য আলাদাভাবে প্রশিক্ষিত মডেল তৈরি করা হয়েছে। প্রতিষ্ঠানটি জানিয়েছে, এই মডেলগুলো gpt-realtime-translate এবং gemini-3.5-live-translate-এর তুলনায় নির্ভুলতা এবং বিলম্ব উভয় ক্ষেত্রেই ভালো ফলাফল দেয়।
এই প্রযুক্তির সবচেয়ে বড় সুবিধা হলো ব্যবহারকারী নিজের পছন্দের কণ্ঠস্বর নির্বাচন করতে পারেন। এমনকি নিজের কণ্ঠস্বর ক্লোন করেও অনুবাদ শোনার সুযোগ রয়েছে। এর ফলে অনুবাদ আরও স্বাভাবিক এবং ব্যক্তিগত হয়ে ওঠে। ব্যবসায়িক মিটিং, আন্তর্জাতিক সম্মেলন বা শিক্ষামূলক ওয়েবিনারে এই প্রযুক্তি ব্যাপকভাবে কাজে লাগতে পারে।
বাংলাদেশের প্রেক্ষাপটে এই প্রযুক্তির গুরুত্ব অনেক। বাংলাদেশের ফ্রিল্যান্সার এবং ডেভেলপাররা আন্তর্জাতিক ক্লায়েন্টদের সাথে কাজ করেন। এই মডেলগুলো ব্যবহার করে তারা রিয়েল-টাইমে ভাষার বাধা দূর করতে পারবেন। শিক্ষার্থীরাও বিদেশি ভাষার কন্টেন্ট সহজে বুঝতে পারবেন। ব্যবসায়ীরা বিদেশি বিনিয়োগকারীদের সাথে সরাসরি আলোচনা চালাতে পারবেন। তবে বর্তমানে এই মডেলগুলো বাংলা ভাষা সমর্থন করে না। ভবিষ্যতে বাংলা যুক্ত হলে এর প্রভাব আরও বাড়বে।
Gradium এই মডেলগুলো ওপেন সোর্স হিসেবে প্রকাশ করবে বলে জানিয়েছে। এর ফলে যে কেউ এই প্রযুক্তি ব্যবহার করে নিজের অ্যাপ্লিকেশন তৈরি করতে পারবেন। বাজারে বর্তমানে Google এবং OpenAI-র মতো বড় কোম্পানিগুলোর মডেল রয়েছে। Gradium তাদের চ্যালেঞ্জ জানিয়ে ছোট প্রতিষ্ঠানগুলোর জন্যও নতুন দরজা খুলে দিয়েছে। আগামী দিনে রিয়েল-টাইম অনুবাদ আরও সুলভ এবং নির্ভুল হবে বলে আশা করা যাচ্ছে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: MarkTechPost
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...