BUET-এর বাংলা LLM প্রজেক্ট — প্রথম বাংলাদেশি language model
BUET-এর গবেষক দল বাংলাদেশের প্রথম indigenous LLM তৈরির ঘোষণা দিয়েছে। ৫০ billion parameter-এর এই মডেল শুধু বাংলাদেশি data দিয়ে train হবে।
BUET (বাংলাদেশ প্রকৌশল বিশ্ববিদ্যালয়)-এর Computer Science department-এর গবেষকরা বাংলাদেশের প্রথম দেশীয় LLM তৈরির ঘোষণা দিয়েছেন।
প্রজেক্টের বিস্তারিত:
- নাম: BanglaBERT-LLM (প্রস্তাবিত)
- Parameter count: ৫০ billion
- Training data: বাংলাদেশি সংবাদপত্র, সাহিত্য, সোশ্যাল মিডিয়া পোস্ট
- Language focus: বাংলাদেশের dialectal Bengali
- Target: ২০২৭ সালে প্রথম version রিলিজ
কেন এটি গুরুত্বপূর্ণ? বিদ্যমান LLM-গুলো (ChatGPT, Claude, Gemini) বাংলাদেশের specific context এবং dialectal expression ভালো বোঝে না। একটি দেশীয় মডেল:
- বাংলাদেশের আইন, সংস্কৃতি এবং প্রেক্ষাপট বুঝবে
- বাংলাদেশের সরকারি সেবায় ব্যবহার করা যাবে
- Data sovereignty নিশ্চিত করবে
Funding: ICT Division থেকে ৫ কোটি টাকা এবং একটি বেসরকারি tech কোম্পানি থেকে ৩ কোটি টাকা।
Community collaboration: Open-source করার পরিকল্পনা আছে যাতে দেশের AI community contribute করতে পারে।