আমি একটা ISP-তে আছি। আমাদের কাস্টমার সাপোর্ট আছে, বিলিং কোয়েরি আছে, সেলস ফানেল আছে। এই কাজগুলোর জন্য প্রতিদিন হাবু-ডুবু খাচ্ছি। আবার বড় মডেল ব্যবহার করলে ডেটা যাচ্ছে বাইরে, খরচ হচ্ছে, প্রাইভেসি নেই। প্রশ্নটা হলো - ঘরের কাজ কি ঘরেই রাখা যায় না? উত্তর হলো - হ্যাঁ, যায়। কিন্তু দুটো রাস্তা আছে। একটা কঠিন, আরেকটা দরকারি। কঠিন রাস্তাটা হলো স্ক্র্যাচ থেকে মডেল বানানো। ২ বিলিয়ন প্যারামিটারের মডেল একেবারে শূন্য থেকে তৈরি করতে দরকার ৮টা A100 GPU, ১৮ দিনের নন-স্টপ ট্রেনিং, ৬০০ জিবি পরিষ্কার ডেটা। এর মানে লক্ষ লক্ষ টাকার ক্লাউড বিল। একটা ISP-এর জন্য এটা বাস্তব না। দরকারি রাস্তাটা হলো ফাইন-টিউনিং। ফাইন-টিউনিং কী? সহজ করে বলি। ধরুন একজন নতুন ইঞ্জিনিয়ার আসলেন। সে ইতোমধ্যে ইঞ্জিনিয়ারিং জানে, বাংলা জানে, লজিক বোঝে। কিন্তু আমাদের আইএসপি নেটওয়ার্ক সে চেনে না। আপনি তখন তাকে তিন মাস হাতে-কলমে ট্রেনিং দেন। সে শিখে নেয়। ফাইন-টিউনিং ঠিক এটাই। বেস মডেল ইতোমধ্যে ভাষা বোঝে, লজিক বোঝে। আপনি শুধু আপনার নিজের ডেটা দিয়ে তাকে আপনার কোম্পানির কাজ শেখাবেন। এটা করতে কী লাগে? প্রথমে দরকার ডেটা। আমাদের আইএসপির দুই হাজার রিজলভড সাপোর্ট টিকেট - যেগুলোতে সিনিয়র টেক সমস্যা সমাধান করেছেন। এগুলোকে "প্রবলেম-সলিউশন" জোড়ায় সাজাতে হবে। যেমন - ইনপুট: "কাস্টমারের ONU-তে লাল আলো।" আউটপুট: "ফাইবার লিংক চেক করুন, সিগনাল -30dB হলে ফিল্ড টেকনিশিয়ান পাঠান।" এই ধরনের দুই হাজার উদাহরণ। তারপর দরকার বেস মডেল। Qwen 2.5-এর ৩ বিলিয়ন প্যারামিটার ভার্সন, অথবা Google-এর Gemma 3B। এগুলো ফ্রি, ওপেনসোর্স। এরপর দরকার একটা টেকনিক - QLoRA। এটা কী? পুরো মডেল নতুন করে ট্রেইন করার বদলে একটা ছোট স্পেশালাইজড প্লাগইন যোগ করা হয়। কল্পনা করুন মডেলের ব্রেইনে একটা ছোট অ্যাডাপ্টার বসানো হলো। এই অ্যাডাপ্টারটাই শিখে নেয় আপনার সেই নির্দিষ্ট কাজ। পুরো মডেল বদলাতে হয় না। ফলে একটা সাধারণ গেমিং GPU - যেমন RTX 3060 - দিয়ে মাত্র কয়েক ঘণ্টায় ফাইন-টিউনিং শেষ। এই মডেল তৈরি হলে কী পাবেন? কাস্টমারের "আমার ইন্টারনেট নেই" মেসেজ পড়ে মডেল আপনার সিনিয়র টেকের মতো উত্তর দেবে। স্ক্রিপ্ট না, আসল সমাধান। কারণ সে শিখেছে আপনার নিজের ডেটা থেকে, আপনার নিজের কেসগুলো থেকে। বিলিং কোয়েরি এলে বিলিং টিমের লজিকে উত্তর দেবে। সেলস ফানেলের প্রশ্ন এলে সেলসের ভাষায় কথা বলবে। মিনিমালিস্ট দিক থেকে বলতে গেলে - ২ বিলিয়ন প্যারামিটারের মডেল অফিসের একটা সাধারণ মেশিনেই চলে। ইন্টারনেট লাগে না। ডেটা বাইরে যায় না। ChatGPT বা Claude-কে মাসে পয়সা দেওয়া লাগে না। একবার বানালে বারবার ব্যবহার করা যায়। আসল কথাটা হলো এটাই। আপনাকে GPT-5 বানাতে হবে না। বানাতে হবে এমন একটা মডেল যেটা শুধু আপনার কাজটা ভালো করে। আমাদের আইএসপির কাস্টমার সাপোর্টের জন্য পৃথিবীর সব জ্ঞান দরকার নেই। দরকার শুধু আমাদের নেটওয়ার্কের সমস্যাগুলো বোঝা আর সমাধান দেওয়া। সেলস ফানেল? কোয়েরি ম্যানেজমেন্ট? প্রতিটার জন্য আলাদা ছোট মডেল। প্রতিটা মডেল একটাই কাজ করে। সেটা নিখুঁতভাবে করে। ঘরের কাজ ঘরেই থাকে। ডেটা বাইরে যায় না। খরচ কমে। আর নিয়ন্ত্রণটা থাকে নিজের হাতে।
- Rakibul Hasan Sir