মাইক্রোসফটের AI মডেল প্রশিক্ষণে জাল ডেটা, আপনার ফ্রিল্যান্স কাজে প্রভাব ফেলতে পারে
মাইক্রোসফট দাবি করেছিল তাদের MAI মডেল শুধুমাত্র পরিষ্কার ও বাণিজ্যিক লাইসেন্সকৃত ডেটায় প্রশিক্ষিত। কিন্তু সাম্প্রতিক প্রতিবেদনে দেখা গেছে, তারা অননুমোদিত ওয়েব ডেটা যেমন Common Crawl ব্যবহার করেছে। এই ঘটনা কোম্পানির প্রতিশ্রুতি ও বাস্তব অনুশীলনের মধ্যে ফারাক প্রকাশ করে।
মাইক্রোসফট দাবি করেছিল তাদের MAI মডেল শুধুমাত্র পরিষ্কার ও বাণিজ্যিক লাইসেন্সকৃত ডেটায় প্রশিক্ষিত। কিন্তু সাম্প্রতিক প্রতিবেদনে দেখা গেছে, তারা অননুমোদিত ওয়েব ডেটা যেমন Common Crawl ব্যবহার করেছে। এই ঘটনা কোম্পানির প্রতিশ্রুতি ও বাস্তব অনুশীলনের মধ্যে ফারাক প্রকাশ করে।
মাইক্রোসফট তাদের নতুন MAI মডেলগুলোর প্রশিক্ষণে অননুমোদিত ওয়েব ডেটা ব্যবহার করেছে। The Decoder-এর প্রতিবেদনে এই তথ্য প্রকাশিত হয়েছে। কোম্পানিটি আগে দাবি করেছিল যে তারা শুধুমাত্র এন্টারপ্রাইজ-গ্রেডের পরিষ্কার ও বাণিজ্যিক লাইসেন্সকৃত ডেটা ব্যবহার করে।
এই ঘটনা মাইক্রোসফটের প্রতিশ্রুতি ও বাস্তব অনুশীলনের মধ্যে একটি বড় ফারাক প্রকাশ করে। কোম্পানিটি তাদের এলএলএম ট্রেনিং পদ্ধতিকে অন্যান্য AI কোম্পানির থেকে আলাদা হিসেবে বিক্রি করেছিল। কিন্তু বাস্তবে তারা অন্য সব AI ল্যাবের মতোই ফেয়ার ইউজের ওপর নির্ভর করে এবং ওয়েবসাইট মালিকদের তাদের ক্রলার ব্লক করার দায়িত্ব দেয়।
মাইক্রোসফট তাদের MAI মডেল তৈরি করতে Common Crawl-এর মতো ওপেন ওয়েব ডেটাসেট ব্যবহার করেছে। Common Crawl হলো ইন্টারনেট থেকে সংগৃহীত একটি বিশাল ডেটাসেট যা অনেক AI কোম্পানি ব্যবহার করে। কিন্তু এই ডেটার অধিকাংশই কপিরাইট-সুরক্ষিত এবং লাইসেন্সবিহীন।
কোম্পানিটি এখন ফেয়ার ইউজ ডকট্রিনের আড়ালে নিজেদের অবস্থান শক্তিশালী করার চেষ্টা করছে। তারা যুক্তি দিচ্ছে যে ওয়েবসাইট মালিকরা যদি তাদের ডেটা AI প্রশিক্ষণের জন্য ব্যবহার করতে না চান, তাহলে তাদের নিজেদেরই ক্রলার ব্লক করা উচিত। এই পদ্ধতি অন্যান্য AI কোম্পানির মতোই।
বাংলাদেশের ডেভেলপার ও ফ্রিল্যান্সারদের জন্য এই খবর গুরুত্বপূর্ণ। অনেক বাংলাদেশি ডেভেলপার মাইক্রোসফটের AI টুলস ব্যবহার করে। তাদের বুঝতে হবে যে মাইক্রোসফটের প্রতিশ্রুতি সত্ত্বেও তাদের ডেটা অননুমোদিতভাবে ব্যবহার হতে পারে। বাংলাদেশি কন্টেন্ট ক্রিয়েটরদের তাদের ওয়েবসাইটে robots.txt ফাইল আপডেট করে মাইক্রোসফটের ক্রলার ব্লক করার কথা বিবেচনা করা উচিত।
ভবিষ্যতে AI কোম্পানিগুলোর ডেটা ব্যবহারের স্বচ্ছতা নিয়ে আরও প্রশ্ন উঠবে। মাইক্রোসফটের এই ঘটনা দেখায় যে বড় প্রযুক্তি কোম্পানিগুলোর প্রতিশ্রুতি ও বাস্তব অনুশীলনের মধ্যে পার্থক্য থাকতে পারে। ব্যবহারকারীদের সচেতন থাকা এবং নিজেদের ডেটা সুরক্ষিত রাখার ব্যবস্থা নেওয়া জরুরি।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: The Decoder
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...