LIVE
টুলAI এজেন্ট এখন নিজেই সার্চ করবে, চাকরির বাজার বদলে দেবে মাইক্রোসফট-গুগলটুললজিটেকের টুল বন্ধ, বিনামূল্যে ওপেন সোর্স AI এলো T+ইন্ডাস্ট্রিAI এজেন্টের ভুলে থমকে যাচ্ছে ফ্রিল্যান্সিং, জানুন বাস্তব সমাধানইন্ডাস্ট্রিমার্কিন জরিপে চাঞ্চল্য: মাত্র ১৬% মনে করে AI সমাজের জন্য ভালোইন্ডাস্ট্রিAI Agent দিয়ে সোশ্যাল মিডিয়া কন্টেন্ট: মাসে ১৫ হাজার ডলার আয়ের সুযোগ বাংলাদেশেমডেল২০২৬ সালে প্রম্পট ইঞ্জিনিয়ারিং শিখলে চাকরির বাজার ৩ গুণ বাড়বেইন্ডাস্ট্রিAnthropic-এর ক্লড এখন জলবায়ু বাঁচাতেও কাজ করবে, জানুন কী লাভগবেষণাএকটি মাত্র ছবি দিয়েই ডিপফেক, বিপদে বাংলাদেশের ফ্রিল্যান্সাররাগবেষণাAI নিজের ভুল শিখে ৩ গুণ দ্রুত পরিকল্পনা করবে, বলছে নতুন গবেষণাটুলGemini থেকে কোড কপি করছেন? dev.to-র এই সমাধান আপনার কাজ বাঁচাবেমডেলAI মডেল শিখলে আপনার ফ্রিল্যান্সিং আয় ৩ গুণ বাড়ানোর উপায়টুলAI আউটপুটের মান এখন দ্বিতীয় মডেল দিয়ে যাচাই, আপনার কাজে আসবে যেভাবেটুলAI এজেন্ট এখন নিজেই সার্চ করবে, চাকরির বাজার বদলে দেবে মাইক্রোসফট-গুগলটুললজিটেকের টুল বন্ধ, বিনামূল্যে ওপেন সোর্স AI এলো T+ইন্ডাস্ট্রিAI এজেন্টের ভুলে থমকে যাচ্ছে ফ্রিল্যান্সিং, জানুন বাস্তব সমাধানইন্ডাস্ট্রিমার্কিন জরিপে চাঞ্চল্য: মাত্র ১৬% মনে করে AI সমাজের জন্য ভালোইন্ডাস্ট্রিAI Agent দিয়ে সোশ্যাল মিডিয়া কন্টেন্ট: মাসে ১৫ হাজার ডলার আয়ের সুযোগ বাংলাদেশেমডেল২০২৬ সালে প্রম্পট ইঞ্জিনিয়ারিং শিখলে চাকরির বাজার ৩ গুণ বাড়বেইন্ডাস্ট্রিAnthropic-এর ক্লড এখন জলবায়ু বাঁচাতেও কাজ করবে, জানুন কী লাভগবেষণাএকটি মাত্র ছবি দিয়েই ডিপফেক, বিপদে বাংলাদেশের ফ্রিল্যান্সাররাগবেষণাAI নিজের ভুল শিখে ৩ গুণ দ্রুত পরিকল্পনা করবে, বলছে নতুন গবেষণাটুলGemini থেকে কোড কপি করছেন? dev.to-র এই সমাধান আপনার কাজ বাঁচাবেমডেলAI মডেল শিখলে আপনার ফ্রিল্যান্সিং আয় ৩ গুণ বাড়ানোর উপায়টুলAI আউটপুটের মান এখন দ্বিতীয় মডেল দিয়ে যাচাই, আপনার কাজে আসবে যেভাবে
হোম/নিউজ/রিসার্চ
রিসার্চ৫ মিনিট পড়া

OpenAI-র নতুন বেঞ্চমার্কে ফেল করল GPT-5, জানুন কেন বাংলাদেশি গবেষকদের জন্য এটি গুরুত্বপূর্ণ

OpenAI 750টি বিশেষজ্ঞ-নির্ধারিত কাজের সমন্বয়ে LifeSciBench নামে একটি বেঞ্চমার্ক প্রকাশ করেছে। এটি বাস্তব জীবনবিজ্ঞান গবেষণায় AI মডেলের দক্ষতা যাচাই করে। সেরা মডেল GPT-Rosalind মাত্র 36.1% পাস করেছে।

M
সম্পাদকীয় টিম
স্টাফ রিপোর্টার · ১০ ঘণ্টা আগে · সূত্র: MarkTechPost
OpenAI-র নতুন বেঞ্চমার্কে ফেল করল GPT-5, জানুন কেন বাংলাদেশি গবেষকদের জন্য এটি গুরুত্বপূর্ণ

OpenAI 750টি বিশেষজ্ঞ-নির্ধারিত কাজের সমন্বয়ে LifeSciBench নামে একটি বেঞ্চমার্ক প্রকাশ করেছে। এটি বাস্তব জীবনবিজ্ঞান গবেষণায় AI মডেলের দক্ষতা যাচাই করে। সেরা মডেল GPT-Rosalind মাত্র 36.1% পাস করেছে।

OpenAI জীবনবিজ্ঞান গবেষণায় কৃত্রিম বুদ্ধিমত্তার (AI) বাস্তব দক্ষতা যাচাইয়ের জন্য LifeSciBench নামে একটি নতুন বেঞ্চমার্ক প্রকাশ করেছে। এই বেঞ্চমার্কে মোট 750টি কাজ রয়েছে। প্রতিটি কাজ তৈরি করেছেন পিএইচডি ডিগ্রিধারী 173 জন বিজ্ঞানী। তারা মিলে 19,020টি মূল্যায়ন মানদণ্ড (rubric criteria) নির্ধারণ করেছেন।

LifeSciBench শুধু তথ্য মুখস্থ করার ক্ষমতা নয় বরং গবেষণার সিদ্ধান্ত ও যুক্তি বিশ্লেষণের দক্ষতা পরিমাপ করে। এটি সাতটি ভিন্ন গবেষণা কর্মপ্রবাহ (workflow) এবং সাতটি জৈবিক ডোমেইন (domain) কভার করে। উদাহরণস্বরূপ, এটি পরীক্ষা করে যে একটি AI মডেল গবেষণাপত্রের ফলাফল সঠিকভাবে ব্যাখ্যা করতে পারে কিনা অথবা পরীক্ষামূলক ডেটা থেকে যৌক্তিক সিদ্ধান্ত নিতে পারে কিনা।

এই বেঞ্চমার্কে এখন পর্যন্ত সেরা পারফরম্যান্স দেখিয়েছে GPT-Rosalind নামক একটি বিশেষায়িত মডেল। কিন্তু এই মডেলও মাত্র 36.1% কাজ সঠিকভাবে সম্পন্ন করতে পেরেছে। এর মানে হলো বর্তমান AI মডেলগুলোর জীবনবিজ্ঞান গবেষণার জটিল ও সূক্ষ্ম কাজে এখনও অনেক উন্নতির প্রয়োজন রয়েছে। বিশেষ করে নির্ভুল আউটপুট তৈরি এবং অপারেশনাল সিদ্ধান্ত নেওয়ার ক্ষেত্রে বড় ঘাটতি দেখা গেছে।

বাংলাদেশের জন্য এই খবরটি বিশেষ গুরুত্বপূর্ণ। বাংলাদেশে ফার্মাসিউটিক্যালস, বায়োটেকনোলজি এবং কৃষি গবেষণায় জীবনবিজ্ঞানের ব্যবহার বাড়ছে। দেশের গবেষক ও শিক্ষার্থীরা AI ব্যবহার করে জিনোম সিকোয়েন্সিং, ড্রাগ ডিসকভারি এবং রোগ নির্ণয়ের কাজ করছেন। LifeSciBench তাদের বুঝতে সাহায্য করবে যে বর্তমান AI টুলগুলো কতটা নির্ভরযোগ্য এবং কোন ক্ষেত্রে সতর্কতা প্রয়োজন। ফ্রিল্যান্সার ও ডেভেলপারদের জন্যও এটি একটি গুরুত্বপূর্ণ নির্দেশিকা। তারা এই বেঞ্চমার্ক ব্যবহার করে নিজেদের তৈরি AI মডেলের জীবনবিজ্ঞান দক্ষতা যাচাই করতে পারবেন।

ভবিষ্যতে OpenAI LifeSciBench-এর ভিত্তিতে আরও উন্নত মডেল তৈরি করার পরিকল্পনা করছে। গবেষকরা আশা করছেন এই বেঞ্চমার্ক AI-কে প্রকৃত গবেষণার সহায়ক হিসেবে আরও কার্যকর করে তুলবে।

আরও পড়ুন

🌐 তথ্যসূত্র ও স্বচ্ছতা

এই সংবাদটি আন্তর্জাতিক সূত্রের তথ্য অবলম্বনে AI-সহায়তায় বাংলায় উপস্থাপন ও বাংলাদেশের প্রেক্ষাপটে সম্পাদিত। মূল তথ্যের জন্য নিচের সূত্র দেখুন।

ট্যাগ:#রিসার্চ#AI#বাংলাদেশ#MarkTechPost
AD
📧

AI নিউজ সরাসরি ইমেইলে পান

প্রতিদিনের সেরা AI খবর বাছাই করে আপনার inbox-এ পাঠাই। বিজ্ঞাপন নেই।

মূল প্রতিবেদন: MarkTechPost

সোর্স দেখুন ↗

মন্তব্য

লোড হচ্ছে...