ক্লদ মডেলের গোপন চিহ্ন: এই ২ নাম দেখলেই বুঝবেন কন্টেন্ট AI তৈরি
গবেষকরা আবিষ্কার করেছেন যে নির্দিষ্ট কিছু নাম, যেমন এলিনা ভাসকেজ ও মার্কাস চেন, একসঙ্গে ব্যবহার করলেই বোঝা যায় বিষয়বস্তুটি ক্লদ মডেল তৈরি করেছে। এই নামের জুটি ডজনখানেক ওয়েবসাইটে আগ্নেয়গিরি বিশেষজ্ঞ, পডকাস্ট হোস্ট ও থ্রিলার চরিত্র হিসেবে দেখা যাচ্ছে।
গবেষকরা আবিষ্কার করেছেন যে নির্দিষ্ট কিছু নাম, যেমন এলিনা ভাসকেজ ও মার্কাস চেন, একসঙ্গে ব্যবহার করলেই বোঝা যায় বিষয়বস্তুটি ক্লদ মডেল তৈরি করেছে। এই নামের জুটি ডজনখানেক ওয়েবসাইটে আগ্নেয়গিরি বিশেষজ্ঞ, পডকাস্ট হোস্ট ও থ্রিলার চরিত্র হিসেবে দেখা যাচ্ছে।
কৃত্রিম বুদ্ধিমত্তার বড় ভাষার মডেলগুলোর (LLM) নিজস্ব পছন্দের নাম আছে। আর এই নামের তালিকা মডেলভেদে ও ভার্শনভেদে আলাদা। সাম্প্রতিক এক গবেষণায় দেখা গেছে, এলিনা ভাসকেজ ও মার্কাস চেন নামের জুটি একসঙ্গে কোথাও থাকলেই সেটি ক্লদ মডেলের তৈরি হওয়ার সম্ভাবনা প্রবল।
গবেষণাটি রেডিটের r/MachineLearning ফোরামে প্রকাশিত হয়েছে। গবেষকরা মডেল ডিফিং পদ্ধতি (CDD) নিয়ে কাজ করার সময় এই তথ্যটি পেয়েছেন। তারা দেখেছেন, এই নামগুলো একে অপরের সঙ্গে সম্পর্কিত হয়ে বিভিন্ন ওয়েবসাইটে ছড়িয়ে পড়ছে। কোনো সাইটে তারা আগ্নেয়গিরি বিশেষজ্ঞ, কোথাও পডকাস্ট হোস্ট, আবার কোথাও থ্রিলার উপন্যাসের নায়ক।
গবেষকদের মতে, এই নামের জুটি এলোমেলো নয়। বরং এটি মডেলের ভেতরে থাকা নির্দিষ্ট পক্ষপাতের (priors) ফল। মডেল প্রশিক্ষণের সময় ডেটাসেটে থাকা কিছু নাম মডেলটির কাছে বেশি পরিচিত হয়ে ওঠে। ফলে নতুন কোনো কন্টেন্ট তৈরি করতে গেলেই মডেল সেসব নাম বেছে নেয়।
এই আবিষ্কার এআই সনাক্তকরণের ক্ষেত্রে নতুন দিগন্ত খুলে দিয়েছে। এখন পর্যন্ত এআই-জেনারেটেড কন্টেন্ট চেনার জন্য বিভিন্ন টুল ব্যবহার করা হতো। কিন্তু এই নামভিত্তিক পদ্ধতি অনেক সহজ ও কার্যকর হতে পারে। গবেষকরা বলছেন, একজন সাধারণ পাঠকও যদি এলিনা ভাসকেজ ও মার্কাস চেনকে একসঙ্গে দেখেন, তাহলে তিনি নিশ্চিত হতে পারেন যে এটি ক্লদ মডেলের তৈরি।
বাংলাদেশের জন্য এই গবেষণার বিশেষ গুরুত্ব রয়েছে। দেশের ফ্রিল্যান্সার ও কন্টেন্ট ক্রিয়েটররা প্রতিদিন বিভিন্ন এআই টুল ব্যবহার করছেন। তারা যদি জানেন যে ক্লদ মডেলের তৈরি কন্টেন্টে এই নামের জুটি থাকবে, তাহলে তারা সহজেই সেটি শনাক্ত করতে পারবেন। অন্যদিকে, শিক্ষার্থীরা গবেষণাপত্র বা অ্যাসাইনমেন্ট তৈরি করতে এআই ব্যবহার করলে তা ধরা পড়ার সম্ভাবনা বাড়বে।
গবেষণাটি আরও জানিয়েছে, এই নামের তালিকা শুধু ক্লদের মধ্যে সীমাবদ্ধ নয়। GPT-4, Llama 2, Mistral সহ অন্যান্য মডেলেরও নিজস্ব পছন্দের নাম আছে। প্রতিটি মডেলের নামের তালিকা আলাদা। গবেষকরা একটি ডেটাবেস তৈরি করছেন যেখানে সব মডেলের নামের তালিকা থাকবে। ভবিষ্যতে এআই কন্টেন্ট শনাক্তকরণ আরও সহজ হবে।
এই গবেষণা এআই সম্প্রদায়ে ব্যাপক আলোচনা সৃষ্টি করেছে। অনেকেই এটিকে এআই সনাক্তকরণের একটি কার্যকর পদ্ধতি হিসেবে দেখছেন। তবে কিছু সমালোচক বলছেন, মডেল আপডেটের সঙ্গে সঙ্গে এই নামের তালিকা পরিবর্তন হতে পারে। তাই দীর্ঘমেয়াদে এই পদ্ধতি কতটা কার্যকর থাকবে তা সময়ই বলবে।
যাই হোক, এই গবেষণা প্রমাণ করে যে এআই মডেলগুলোর নিজস্ব কিছু অভ্যাস আছে। আর সেই অভ্যাসগুলোই তাদের পরিচয় ফাঁস করে দেয়। ভবিষ্যতে এই ধরনের গবেষণা এআই স্বচ্ছতা ও জবাবদিহিতা নিশ্চিত করতে গুরুত্বপূর্ণ ভূমিকা রাখবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: Reddit r/MachineLearning
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...