OpenAI-র নতুন বেঞ্চমার্কে ফেল করল GPT-5, জানুন কেন বাংলাদেশি গবেষকদের জন্য এটি গুরুত্বপূর্ণ
OpenAI 750টি বিশেষজ্ঞ-নির্ধারিত কাজের সমন্বয়ে LifeSciBench নামে একটি বেঞ্চমার্ক প্রকাশ করেছে। এটি বাস্তব জীবনবিজ্ঞান গবেষণায় AI মডেলের দক্ষতা যাচাই করে। সেরা মডেল GPT-Rosalind মাত্র 36.1% পাস করেছে।
OpenAI 750টি বিশেষজ্ঞ-নির্ধারিত কাজের সমন্বয়ে LifeSciBench নামে একটি বেঞ্চমার্ক প্রকাশ করেছে। এটি বাস্তব জীবনবিজ্ঞান গবেষণায় AI মডেলের দক্ষতা যাচাই করে। সেরা মডেল GPT-Rosalind মাত্র 36.1% পাস করেছে।
OpenAI জীবনবিজ্ঞান গবেষণায় কৃত্রিম বুদ্ধিমত্তার (AI) বাস্তব দক্ষতা যাচাইয়ের জন্য LifeSciBench নামে একটি নতুন বেঞ্চমার্ক প্রকাশ করেছে। এই বেঞ্চমার্কে মোট 750টি কাজ রয়েছে। প্রতিটি কাজ তৈরি করেছেন পিএইচডি ডিগ্রিধারী 173 জন বিজ্ঞানী। তারা মিলে 19,020টি মূল্যায়ন মানদণ্ড (rubric criteria) নির্ধারণ করেছেন।
LifeSciBench শুধু তথ্য মুখস্থ করার ক্ষমতা নয় বরং গবেষণার সিদ্ধান্ত ও যুক্তি বিশ্লেষণের দক্ষতা পরিমাপ করে। এটি সাতটি ভিন্ন গবেষণা কর্মপ্রবাহ (workflow) এবং সাতটি জৈবিক ডোমেইন (domain) কভার করে। উদাহরণস্বরূপ, এটি পরীক্ষা করে যে একটি AI মডেল গবেষণাপত্রের ফলাফল সঠিকভাবে ব্যাখ্যা করতে পারে কিনা অথবা পরীক্ষামূলক ডেটা থেকে যৌক্তিক সিদ্ধান্ত নিতে পারে কিনা।
এই বেঞ্চমার্কে এখন পর্যন্ত সেরা পারফরম্যান্স দেখিয়েছে GPT-Rosalind নামক একটি বিশেষায়িত মডেল। কিন্তু এই মডেলও মাত্র 36.1% কাজ সঠিকভাবে সম্পন্ন করতে পেরেছে। এর মানে হলো বর্তমান AI মডেলগুলোর জীবনবিজ্ঞান গবেষণার জটিল ও সূক্ষ্ম কাজে এখনও অনেক উন্নতির প্রয়োজন রয়েছে। বিশেষ করে নির্ভুল আউটপুট তৈরি এবং অপারেশনাল সিদ্ধান্ত নেওয়ার ক্ষেত্রে বড় ঘাটতি দেখা গেছে।
বাংলাদেশের জন্য এই খবরটি বিশেষ গুরুত্বপূর্ণ। বাংলাদেশে ফার্মাসিউটিক্যালস, বায়োটেকনোলজি এবং কৃষি গবেষণায় জীবনবিজ্ঞানের ব্যবহার বাড়ছে। দেশের গবেষক ও শিক্ষার্থীরা AI ব্যবহার করে জিনোম সিকোয়েন্সিং, ড্রাগ ডিসকভারি এবং রোগ নির্ণয়ের কাজ করছেন। LifeSciBench তাদের বুঝতে সাহায্য করবে যে বর্তমান AI টুলগুলো কতটা নির্ভরযোগ্য এবং কোন ক্ষেত্রে সতর্কতা প্রয়োজন। ফ্রিল্যান্সার ও ডেভেলপারদের জন্যও এটি একটি গুরুত্বপূর্ণ নির্দেশিকা। তারা এই বেঞ্চমার্ক ব্যবহার করে নিজেদের তৈরি AI মডেলের জীবনবিজ্ঞান দক্ষতা যাচাই করতে পারবেন।
ভবিষ্যতে OpenAI LifeSciBench-এর ভিত্তিতে আরও উন্নত মডেল তৈরি করার পরিকল্পনা করছে। গবেষকরা আশা করছেন এই বেঞ্চমার্ক AI-কে প্রকৃত গবেষণার সহায়ক হিসেবে আরও কার্যকর করে তুলবে।
আরও পড়ুন
এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।
মূল প্রতিবেদন: MarkTechPost
সোর্স দেখুন ↗মন্তব্য০
লোড হচ্ছে...