কোটি গানের ডেটাসেটে এআই প্রশিক্ষণ, বাংলাদেশি শিল্পীদের কী ক্ষতি হচ্ছে
দি অ্যাটলান্টিকের এক সাংবাদিকের তদন্তে চারটি বড় মিউজিক ডেটাসেটের সন্ধান মিলেছে, যেগুলো জেনারেটিভ এআই মডেল প্রশিক্ষণে ব্যবহৃত হচ্ছে। এই ডেটাসেটে কোটি কোটি গান রয়েছে, যা শিল্পীদের সম্মতি ও ন্যায্য ক্ষতিপূরণ নিয়ে প্রশ্ন তুলেছে।
দি অ্যাটলান্টিকের এক সাংবাদিকের তদন্তে চারটি বড় মিউজিক ডেটাসেটের সন্ধান মিলেছে, যেগুলো জেনারেটিভ এআই মডেল প্রশিক্ষণে ব্যবহৃত হচ্ছে। এই ডেটাসেটে কোটি কোটি গান রয়েছে, যা শিল্পীদের সম্মতি ও ন্যায্য ক্ষতিপূরণ নিয়ে প্রশ্ন তুলেছে।
দি অ্যাটলান্টিকের এক সাংবাদিকের তদন্তে চারটি বড় মিউজিক ডেটাসেট উন্মোচিত হয়েছে, যেগুলো জেনারেটিভ এআই মডেল প্রশিক্ষণে ব্যবহৃত হচ্ছে। এই ডেটাসেটগুলোতে কোটি কোটি গান রয়েছে, যা শিল্পীদের সম্মতি ও ন্যায্য ক্ষতিপূরণ নিয়ে গভীর উদ্বেগ তৈরি করেছে। তদন্তটি এআই প্রশিক্ষণ ডেটা সোর্সিংয়ে স্বচ্ছতার অভাবকে সামনে এনেছে।
এই তথ্য প্রকাশের ফলে সঙ্গীত শিল্পে একটি বড় আলোড়ন সৃষ্টি হয়েছে। জেনারেটিভ এআই মডেল যেমন সানও, মিউজিকএলএম বা গুগলের মিউজিকএলএম প্রশিক্ষণের জন্য এই ডেটাসেট ব্যবহার করা হচ্ছে। কিন্তু শিল্পীদের কাছ থেকে অনুমতি নেওয়া হয়নি, এবং তাদের কাজের জন্য কোনো ক্ষতিপূরণও দেওয়া হচ্ছে না। এটি কপিরাইট লঙ্ঘন ও নৈতিক প্রশ্ন তুলেছে।
তদন্তে উন্মোচিত চারটি ডেটাসেটের মধ্যে রয়েছে স্কেল অফ মিউ, যা একটি বিশাল সংগ্রহ। এই ডেটাসেটে লক্ষ লক্ষ গানের অডিও ও মেটাডেটা রয়েছে। আরেকটি ডেটাসেটে বিভিন্ন জেনারের হাজার হাজার গান রয়েছে, যা এআই মডেলকে বিভিন্ন শৈলী শেখাতে ব্যবহৃত হয়। তৃতীয় ও চতুর্থ ডেটাসেটে রয়েছে নির্দিষ্ট কিছু প্ল্যাটফর্ম থেকে সংগৃহীত গান, যা সরাসরি ব্যবহারকারীদের কাছ থেকে নেওয়া হয়েছে বলে জানা গেছে।
এআই প্রশিক্ষণের জন্য ডেটা সংগ্রহ একটি জটিল প্রক্রিয়া। সাধারণত ডেভেলপাররা ওয়েব স্ক্র্যাপিং বা পাবলিক ডেটাবেস থেকে তথ্য সংগ্রহ করে। কিন্তু এই মিউজিক ডেটাসেটগুলোর ক্ষেত্রে দেখা গেছে, অনেক গানই কপিরাইটযুক্ত এবং শিল্পীদের অনুমতি ছাড়া ব্যবহার করা হয়েছে। এটি আইনি জটিলতা সৃষ্টি করতে পারে, যেমনটি আগে ইমেজ ও টেক্সট ডেটাসেট নিয়ে হয়েছে।
বাংলাদেশের প্রেক্ষাপটে এই খবরটি বিশেষ গুরুত্ব বহন করে। দেশে এআই ও মিউজিক টেকনোলজি নিয়ে কাজ করা স্টার্টআপ ও ডেভেলপাররা এই ডেটাসেট ব্যবহার করে থাকতে পারেন। শিল্পী ও সঙ্গীতজ্ঞদের জন্য এটি একটি সতর্কবার্তা, কারণ তাদের কাজ অনুমতি ছাড়া এআই প্রশিক্ষণে ব্যবহার হতে পারে। বাংলাদেশের কপিরাইট আইন এখনও এআই প্রশিক্ষণের মতো বিষয়গুলো স্পষ্টভাবে সংজ্ঞায়িত করেনি।
বিশেষজ্ঞরা বলছেন, এই তদন্ত এআই শিল্পে স্বচ্ছতা ও নৈতিকতার প্রয়োজনীয়তা আরও জোরালো করেছে। ডেটাসেট নির্মাতাদের উচিত শিল্পীদের কাছ থেকে স্পষ্ট অনুমতি নেওয়া এবং ন্যায্য ক্ষতিপূরণের ব্যবস্থা করা। ভবিষ্যতে আইন প্রণেতারা এআই প্রশিক্ষণ ডেটার জন্য কঠোর নিয়ম তৈরি করতে পারেন, যা শিল্পীদের অধিকার রক্ষা করবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: dev.to ML
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...