চীনা AI মডেলের লড়াই: ডেটা বিশ্লেষণে কে এগিয়ে, দেখুন ফলাফল
একজন ডেভেলপার 30 দিন ধরে চারটি চীনা LLM-কে টেবুলার ডেটা টাস্কে বেঞ্চমার্ক করেছে। ফলাফলে উঠে এসেছে 1,247টি মডেল আউটপুট, যা রিগ্রেশন ও ক্লাসিফিকেশনে মডেলগুলোর সক্ষমতা তুলে ধরে।
একজন ডেভেলপার 30 দিন ধরে চারটি চীনা LLM-কে টেবুলার ডেটা টাস্কে বেঞ্চমার্ক করেছে। ফলাফলে উঠে এসেছে 1,247টি মডেল আউটপুট, যা রিগ্রেশন ও ক্লাসিফিকেশনে মডেলগুলোর সক্ষমতা তুলে ধরে।
চীনের শীর্ষ চারটি বড় ভাষা মডেল (LLM) — DeepSeek, Qwen, Kimi ও GLM-এর কার্যকারিতা নিয়ে একটি বিস্তারিত 30 দিনের বেঞ্চমার্ক সম্পন্ন হয়েছে। এই গবেষণাটি dev.to প্ল্যাটফর্মে প্রকাশিত এক বিশ্লেষণে উঠে এসেছে, যেখানে টেবুলার ডেটা নিয়ে কাজ করার ওপর জোর দেওয়া হয়েছে। গবেষক 1,247টি মডেল আউটপুট সংগ্রহ করে সেগুলোর তুলনামূলক বিশ্লেষণ করেছেন।
বেঞ্চমার্কটির মূল লক্ষ্য ছিল রিগ্রেশন এবং ক্লাসিফিকেশন টাস্কে মডেলগুলোর পারফরম্যান্স যাচাই করা। টেবুলার ডেটা বলতে বোঝায় সারণি আকারে সাজানো তথ্য, যেমন এক্সেল শিটে পাওয়া যায়। রিগ্রেশন মানে সংখ্যার পূর্বাভাস দেওয়া, আর ক্লাসিফিকেশন মানে ডেটাকে বিভিন্ন ক্যাটাগরিতে ভাগ করা। গবেষক জানিয়েছেন, তিনি প্রথমে একটি ক্লায়েন্ট প্রকল্পের জন্য একটি চীনা LLM বেছে নিতে চেয়েছিলেন, কিন্তু পরে এই তুলনামূলক বিশ্লেষণটি তৈরি করেন।
পরিসংখ্যান অনুযায়ী, DeepSeek টেবুলার ডেটা বিশ্লেষণে দ্রুত প্রতিক্রিয়া ও নির্ভুলতা দেখিয়েছে। Qwen জটিল ক্লাসিফিকেশন টাস্কে ভালো পারফর্ম করেছে। Kimi ও GLM-ও নিজ নিজ ক্ষেত্রে শক্তিশালী ফলাফল দিয়েছে, তবে কিছু ক্ষেত্রে তারা DeepSeek ও Qwen-এর চেয়ে পিছিয়ে পড়েছে। গবেষক উল্লেখ করেছেন যে এই মডেলগুলো বিনামূল্যে বা কম খরচে ব্যবহার করা যায়, যা ছোট ব্যবসা ও ফ্রিল্যান্সারদের জন্য বড় সুযোগ।
বাংলাদেশের ডেভেলপার ও ফ্রিল্যান্সারদের জন্য এই বেঞ্চমার্ক অত্যন্ত প্রাসঙ্গিক। টেবুলার ডেটা নিয়ে কাজ করা বাংলাদেশের অনেক স্টার্টআপ ও ফ্রিল্যান্সার এই মডেলগুলো ব্যবহার করে দ্রুত ডেটা বিশ্লেষণ করতে পারবে। উদাহরণস্বরূপ, একটি ই-কমার্স কোম্পানি গ্রাহকের কেনাকাটার ধরণ বুঝতে বা একটি ব্যাংক ঋণ দেওয়ার আগে ঝুঁকি মূল্যায়ন করতে এই LLM-গুলো কাজে লাগাতে পারে। GPT-4-এর মতো পশ্চিমা মডেলের তুলনায় এগুলো কম খরচে পাওয়া যায়, যা বাংলাদেশের মতো উদীয়মান বাজারের জন্য বড় সুবিধা।
ভবিষ্যতে এই চীনা LLM-গুলোর আরও উন্নতি আশা করা যায়। গবেষক মনে করেন, টেবুলার ডেটা টাস্কে মডেলগুলোর বর্তমান সক্ষমতা অনেক ব্যবসায়িক সমস্যার সমাধান দিতে পারে। তবে এখনও কিছু সীমাবদ্ধতা আছে, যেমন জটিল প্রশ্নের উত্তর দিতে সময় বেশি লাগা বা নির্দিষ্ট ডোমেইনের তথ্যে দুর্বলতা। এই বেঞ্চমার্ক থেকে প্রাপ্ত তথ্য ব্যবহার করে ডেভেলপাররা তাদের প্রকল্পের জন্য সবচেয়ে উপযুক্ত মডেল বেছে নিতে পারবেন।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to ML
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...