এআই কেন সহজ বানান ভুল করে?
ভাবুন এক অদ্ভুত রাজমিস্ত্রির কথা। সে একটা একটা করে ইট গাঁথে না। বরং পুরো দেয়ালটাই আগে থেকে তৈরি করা থাকে, সে শুধু জায়গায় বসিয়ে দেয়। 'রান্নাঘর' বা 'লাইব্রেরি' লেখা বড় বড় ব্লক নিমেষেই জুড়ে দেয়। আধুনিক এআই এভাবেই কাজ করে। সে অক্ষরের পর অক্ষর পড়ে না, বরং পুরো শব্দের টুকরো বা 'টোকেন' একবারে গিলে ফেলে।
সমস্যা হলো যখন আর্কিটেক্ট বললেন, "বাম দিকের তিন নম্বর ইটটা সরিয়ে ফেলুন।" মিস্ত্রি তো অবাক! তার কাছে তো ওটা আস্ত একটা ব্লক, সিমেন্ট দিয়ে আটকানো। সে তো ভেতরের ইটগুলো আলাদা করতে পারে না। এআই-এর সমস্যাও ঠিক এটাই। সে পুরো শব্দের মানে বোঝে, কিন্তু শব্দটা কোন কোন অক্ষর দিয়ে তৈরি, তা তার চোখে পড়ে না।
ম্যানেজার তাকে পরীক্ষা করতে চাইলেন। জিজ্ঞেস করলেন, "ওই দেয়ালে ঠিক কয়টা ইট আছে?" সে আন্দাজে একটা সংখ্যা বলল এবং ভুল হলো। কিন্তু তাকে যখন পুরো ঘরগুলো অদলবদল করতে বলা হলো, সে দারুণ কাজ করল। এআই-ও তাই; সে অক্ষরের সংখ্যা গুনতে গিয়ে ভুল করে, কিন্তু বাক্য সাজাতে ওস্তাদ।
এরপর কাজ শুরু হলো ভিন্ন ভাষার সাইটে। চীনা ভাষার ক্ষেত্রে কাজ সহজ, কারণ সেখানে একেকটা ব্লক মানেই একটা অক্ষর। কিন্তু কোরিয়ান সাইটে ঝামেলা বাধল। সেখানে ব্লকের ভেতরেও ছোট ছোট অংশ থাকে যা বাইরে থেকে দেখা যায় না। আমাদের মিস্ত্রি সেটা বুঝল না। এভাবেই 'টোকেন' পদ্ধতি সব ভাষার জন্য সমানভাবে কাজ করে না।
বোঝা গেল, গতির জন্য সূক্ষ্মতা কমে গেছে। এই ভুল শোধরাতে হলে আরও বড় ক্রেন দিয়ে লাভ নেই। দরকার এমন চশমা যা দিয়ে ব্লকের ভেতরের ইট দেখা যাবে। এআই-কে এখন শুধু ভারী অর্থ বয়ে বেড়ালে চলবে না, শব্দের ভেতরের ছোট ছোট অক্ষরগুলোকেও চিনতে শিখতে হবে।