Mistral AI-র নতুন OCR মডেলে ডকুমেন্ট পড়া ৭২% বেশি নির্ভুল, কাজ হবে দ্রুত
Mistral AI তাদের নতুন OCR 4 মডেল প্রকাশ করেছে, যা ডকুমেন্ট থেকে টেক্সট পড়ায় প্রতিযোগীদের তুলনায় ৭২ শতাংশ ব্লাইন্ড টেস্টে জয়ী হয়েছে। মডেলটি PDF, Word ও PowerPoint ফাইল সমর্থন করে, যা প্রযুক্তি জগতে আলোড়ন সৃষ্টি করেছে।
Mistral AI তাদের নতুন OCR 4 মডেল প্রকাশ করেছে, যা ডকুমেন্ট থেকে টেক্সট পড়ায় প্রতিযোগীদের তুলনায় ৭২ শতাংশ ব্লাইন্ড টেস্টে জয়ী হয়েছে। মডেলটি PDF, Word ও PowerPoint ফাইল সমর্থন করে, যা প্রযুক্তি জগতে আলোড়ন সৃষ্টি করেছে।
ফরাসি কৃত্রিম বুদ্ধিমত্তা স্টার্টআপ Mistral AI তাদের নতুন মডেল OCR 4 প্রকাশ করেছে। এই মডেলটি ডকুমেন্ট থেকে টেক্সট পড়ার জন্য তৈরি করা হয়েছে। কোম্পানির দাবি, এটি প্রতিযোগীদের তুলনায় ৭২ শতাংশ ব্লাইন্ড টেস্ট কেসে ভালো পারফরম্যান্স দেখিয়েছে।
OCR বা অপটিক্যাল ক্যারেক্টার রিকগনিশন প্রযুক্তি ছবি বা স্ক্যান করা ডকুমেন্ট থেকে লেখা বের করে আনে। Mistral AI-র নতুন মডেলটি এই কাজে বিশেষ দক্ষতা দেখাচ্ছে। এটি PDF, Word ফাইল এবং পাওয়ারপয়েন্ট প্রেজেন্টেশন সহ বিভিন্ন ফরম্যাটের ডকুমেন্ট থেকে নির্ভুলভাবে টেক্সট পড়তে পারে।
The Decoder জানিয়েছে, Mistral AI তাদের মডেলটিকে ব্লাইন্ড টেস্টে অন্যান্য জনপ্রিয় OCR মডেলের সাথে তুলনা করেছে। এই টেস্টে পরীক্ষকরা জানতেন না কোন আউটপুট কোন মডেলের। ফলাফলে দেখা গেছে, OCR 4 ৭২ শতাংশ ক্ষেত্রে প্রতিযোগীদের ছাড়িয়ে গেছে।
প্রযুক্তি বিশ্লেষকরা বলছেন, এই সাফল্য ডকুমেন্ট প্রসেসিংয়ের ক্ষেত্রে বড় পরিবর্তন আনতে পারে। ব্যবসায়িক প্রতিষ্ঠানগুলো প্রায়ই হাজার হাজার ডকুমেন্ট থেকে তথ্য বের করতে OCR ব্যবহার করে। আরও নির্ভুল মডেল তাদের সময় এবং খরচ বাঁচাতে সাহায্য করবে।
Mistral AI-র OCR 4 মডেলটি বিশেষভাবে প্রশিক্ষিত হয়েছে জটিল লেআউট এবং ফন্ট হ্যান্ডেল করার জন্য। কোম্পানি জানিয়েছে, এটি ছোট ফন্ট, টেবিল এবং মাল্টি-কলাম লেআউটের ক্ষেত্রেও ভালো কাজ করে। মডেলটি ক্লাউড-ভিত্তিক API হিসেবে উপলব্ধ হবে।
বাংলাদেশের ডেভেলপার এবং ফ্রিল্যান্সারদের জন্য এই খবর বিশেষ গুরুত্বপূর্ণ। অনেক বাংলাদেশি ফ্রিল্যান্সার ডকুমেন্ট প্রসেসিং এবং ডেটা এন্ট্রি প্রকল্পে কাজ করেন। উন্নত OCR মডেল তাদের কাজের গতি ও গুণমান বাড়াতে সাহায্য করতে পারে। একইসঙ্গে স্থানীয় স্টার্টআপগুলোও এই প্রযুক্তি ব্যবহার করে নতুন সেবা তৈরি করতে পারে।
প্রতিযোগিতামূলক বাজারে Mistral AI-র এই পদক্ষেপ প্রযুক্তি জায়ান্টদের চ্যালেঞ্জ জানিয়েছে। OpenAI এবং Google-এর মতো কোম্পানিগুলোরও নিজস্ব OCR সমাধান রয়েছে। তবে Mistral AI-র দাবি অনুযায়ী, তাদের মডেল ছোট ও মাঝারি ডকুমেন্টের ক্ষেত্রে বেশি কার্যকর।
ভবিষ্যতে ওপেন সোর্স কমিউনিটির জন্য মডেলটি উন্মুক্ত করার সম্ভাবনা রয়েছে। Mistral AI আগেও তাদের কিছু মডেল ওপেন সোর্স করেছে। এটি ডেভেলপারদের আরও সহজে অত্যাধুনিক OCR প্রযুক্তি ব্যবহারের সুযোগ করে দেবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: The Decoder
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...