បញ្ហា​នៅ​ក្នុង​ការ​ស្វែង​រក​ឯក​សារ​ជា​ភាសា​ខ្មែរ​ក្នុង​បណ្ដាញ​ស្រាវជ្រាវ​អ៊ីន​ធឺ​ណែត​

ស្របទៅ​នឹង​សម័យ​កាល​ជឿន​លឿន​ផ្នែក​បច្ចេកវិទ្យា​ បាន​​​ផ្ដល់​ភាព​ងាយ​ស្រួល​ដល់​ការ​ប្រើ​ប្រាស់​ និង​ការ​សិក្សា​ស្រាវជ្រាវ​តាម​ប្រព័ន្ធ​អ៊ីន​ធឺណែត​​។​ ជាមួយ​គ្នា​នេះ​ នៅ​ពេល​ដែល​យើង​ចង់​ស្វែង​រក​ពី​បញ្ហា​អ្វី​មួយ​ ​យើង​តែង​តែប្រើ​ប្រព័ន្ធ​អ៊ីនធឺណែត​​សំរាប់​ស្រាវជ្រាវ (Search Engine) ដែល​ភាគច្រើន​និយម​ប្រើ​គេហទំព័រ​ Google ។ ក្រៅ​ពី​គេហទំព័រ Google ក៏នៅ​មាន​ប្រព័ន្ធ Search Engine សំរាប់​ស្រាវ​ជ្រាវ​ ដូចជា​ Bing, Yahoo និង ផ្សេងៗទៀត។ នៅ​ពេល​នេះ​ខ្ញុំ​ចង់​និយាយ​ពីការ​ស្វែងរក​ឯក​សារជា​ភាសា​ខ្មែរ​​ នៅ​ក្នុង​​ប្រព័ន្ធ​ស្រាវជ្រាវ Google ។ ជា​ធម្មតា​រាល់​គេហទំព័រ​ដែល​មាន​នៅ​ទូទាំង​ពិភពលោក​ គ្រប់​ភាសា​ ត្រូវ​បាន​បញ្ចូល ​(Indexing) ទៅ​ក្នុង​​ប្រព័ន្ធ​ស្រាវជ្រាវ​​ (Search Engine) ។​ ដូច្នេះ​ហើយ នៅ​ពេល​ដែល​យើង​វាយ​បញ្ចូល​ពាក្យ​គន្លឹះ​ (Key word) ដើម្បី​ស្វែង​រក​ឯកសារ​អ្វី​មួយ នោះ​ប្រព័ន្ធ​ស្រាវជ្រាវ រឺ ម៉ាស៊ីនស្វែង​រក​នឹង​បង្ហាញ​ឯកសារ​នៅ​គេហទំព័រ​ដែល​ពាក់ព័ន្ធ​នឹង​ពាក្យ​គន្លឹះ​ដែល​យើង​ស្វែង​រក។​ ជាទូទៅ​ឯកសារ​ដែល​បង្ហាញ​នោះ​ក្នុងភាសា​​ដូច​នឹង​ពាក្យ​គន្លឹះ​ដែល​យើង​បញ្ចូល​ មាន​ន័យ​ថា បើ​ពាក្យ​គន្លឹះ​ដែល​យើង​វាយ​បញ្ចូល​ជា​ភាសា​អង់គ្លេស នោះ​ឯកសារ​នឹង​បង្ហាញ​ជា​ភាសា​អង់គ្លេស តែ​បើ​យើង​បញ្ចូល​ជា​ភាសា​ខ្មែរ​ នោះ​ឯកសារ​នឹង​បង្ហាញ​ជា​ភាសាខ្មែរ។ ប៉ុន្តែ​អ្វី​ដែល​ជា​បញ្ហា​នោះ​គឺ​នៅ​ពេល​ដែល​យើង​ស្វែង​រក​ឯក​សារ​ជា​ភាសាខ្មែរ​ ត្រង់ ៖

បញ្ហា​ទី១ ចំនួនឯកសារជាភាសា​ខ្មែរ​នៅ​បណ្ដាញ​អ៊ីនធឺណែត​មាន​ចំនួន និង​ មិន​បាន​គ្រប់​ផ្នែក ដូចដែលយើង​គ្រប់​គ្នា​បាន​ដឹង​រួច​មក​ហើយ​ថា​ កម្ពូជា​យើង​ទើប​តែ​មាន​ការ​រីក​ចំ​រើន​ខ្លះៗ​ផ្នែក​បច្ចេកវិទ្យា​ ក្នុង​​ប៉ុន្មាន​ឆ្នាំ​ចុង​ក្រោយ​នេះ​ទេ ហើយ​ បើ​និយាយ​ពី​ការ​ផ្សព្វផ្សាយ​តាម​បណ្ដាញ​អ៊ីនធឺណែត​ គឺនៅ​មាន​កំរិត​នៅ​ឡើយ​ និង​មិនបាន​គ្រប់​ផ្នែក​នោះទេ​ ជាពិសេស​ផ្នែក​ការសិក្សា​អប់​រំ​ស្រាវជ្រាវ និង​ ផ្នែក​ពត៌មាន​វិទ្យា​។ អ្វី​ដែល​គួរ​ឲ្យ​ចាប់​អារម្មណ៍​ទៅ​ទៀត​នោះ គឺ​គេហទំព័រ​មួយចំនួន​របស់​ខ្មែរដែលបាន​ផ្សព្វ​ផ្សាយ​ បាន​សរសេរ​នៅ​ក្នុង​ភាសា​បរទេស​ថែមទៀត រីឯ​ភាសា​ជាតិ​របស់​ខ្លួន​បែរ​ជា​មិន​មាន​ទៅ​វិញ​ (គេហទំព័រ​ដែល​ល្អ​គឺគួរ​តែ​ប្រើ​ជាភាសា​​ជាតិ​ខ្លួន​ជា​ចំបង និង​ប្រើ​ភាសា​បរទេសជាភាសា​បន្ទាប់ មានន័យថា ក្នុង​គេហទំព័រមួយ យ៉ាង​តិច​មាន​២ភាសា) ​។​ ហើយ​បើ​តាម​ការ​សង្កេត​របស់​​ខ្ញុំ គេហទំព័រ​របស់​ខ្មែរ​មួយ​ចំនួនធំ​ដែល​មាន​នៅ​លើ​បណ្ដាញ​អ៊ីនធឺណែត ភាគច្រើន​ជា​គេហទំព័រសារពត៌មាន ការ​កំសាន្ដ​ (តន្រ្តី) រឺ គេហទំព័រ​ស្ដី​ពី​ក្រសួង​ ស្ថាប័ន អង្គការ​ជា​ដើម ហើយ​ក្នុង​នោះ​ក៏​មាន​ប្លុក​ជា​ភាសា​ខ្មែរ​ផង​ដែរ ​តែ​និយម​និយាយ​ពី​បញ្ហាទូទៅ ផ្ទាល់​ខ្លួន​។ រីឯ​គេហទំព័រ​ដែល​ផ្សព្វផ្សាយ​ផ្នែក​អប់រំ សិក្សា​ស្រាវជ្រាវ ជា​ពិសេស​ផ្នែក​ពត៌មាន​វិទ្យា​ គឺ​នៅ​មាន​កំរិត​ រឺ អាច​ថា​គ្មាន​។ ផ្ទុយ​ពី​បណ្ដា​ប្រទេស​ជិតខាង​យើង ក៏​ដូច​បណ្ដា​ប្រទេស​អភិវឌ្ឍន៍​​​ គេ​ប្រើ​ប្រាស់​បណ្ដាញ​អ៊ីនធឺណែត​សំរាប់​ផ្សព្វ​ផ្សាយភាសា ​វប្បធម៌​ អរិយ​ធម៌ ចំណេះដឹង និង​សមិទ្ធផល​នៃ​ការ​សិក្សា​ស្រាវជ្រាវ ក៏​ដូច​ឯក​សារ​សំរាប់​ការ​សិក្សា​ផ្សេងៗ​ ​សំរាប់​ឲ្យ​អ្នក​ស្រាវជ្រាវ​យក​មក​ធ្វើ​ជា​ឯក​សារ​យោង និង ការ​ពង្រីក​ចំណេះ​ដឹង​ផង​ដែរ​។ ដោយ​ភាព​ភាព​ក្សត់​ខ្សោយ​នៃ​ឯក​សារ​ក្នុង​ភាសា​ខ្មែរ​ជាតិ​ខ្លួន​នេះ​ហើយ ​ដែល​ធ្វើ​ឲ្យ​អ្នក​សិក្សា​ស្រាវ​​មួយ​ចំនួន​មាន​ការ​លំ​បាក​ក្នុង​ការ​ស្វែង​រក​ ហើយ ពេល​ខ្លះ​ត្រូវ​បង្ខំ​​ចិត្ត​ស្វែង​រក​ជា​ភាសា​បរទេស (មិន​ចង់​បាន​ន័យ​ថា ភាសា​បរទេស​មិន​ល្អ​ទេ តែ​ការ​ប្រើ​ប្រាស់​ភាសា​ផ្ទាល់​ខ្លួន​ងាយ​យល់ និង​ប្រើ​ពេល​វេលា​ខ្លី​សំ​រាប់​ការ​សិក្សា​ស្វែង​យល់ ហើយ ក៏​ជា​ការ​ឲ្យ​តំលៃ​ភាសា​​ជាតិ​ខ្លួន​ដែរ​) ។​ តែ​ខ្ញុំ​សង្ឃឹម​ថា​ ក្នុង​រយៈ​កាល​ដ៏​ខ្លី​ខាង​មុខ ឯកសារ​សិក្សា​ស្រាវជ្រាវ​ ជាពិសេស​ចេញ​មក​ពី​ស្ថាប័ន​អប់រំ​ ក៏​ដូច​ជា​អ្នក​សិក្សា​ទាំង​ឡាយ​ កាន់​តែ​មាន​ច្រើន​នៅ​លើ​បណ្ដាញ​​អ៊ីនធឺណែត​។ ខាង​ក្រោម​ជា​ឧទាហរណ៍​នៃ​ការ​ស្វែង​រក​នៅ​ក្នុង​ប្រព័ន្ធស្រាវជ្រាវ Google ជាមួយពាក្យ​គន្លឹះ “បច្ចេកវទ្យា” និង​ការ​ប្រៀបធៀប​លទ្ធផល​ឯកសារ​ជា​ភាសា​ខ្មែរ​ ភាសា​អង់គ្លេស និង ភាសា​ឥណ្ឌូនេស៊ី។ ចំនួន​​ឯកសារ​បង្ហាញ​នៅ​​ក្នុង​រង្វង់​ព័រ​ក្រហមក្នុង​រូបភាព​ខាង​ក្រោម​ ដែល​ក្នុង​នោះ​យើង​សង្កេត​ឃើញ​ថា​ឯក​សារ​ជា​ភាសា​ខ្មែរ​នៅ​មាន​ចំ​នួន​តិច​តួច បើ​ប្រៀប​ទៅ​ប្រ​ទេស​ឥណ្ឌូនេស៊ី​ ហើយ​បើ​និយាយ​ឯកសារ​ជា​ភាសា​អង់​គ្លេស​វិញ​មាន​ចំនួន​ច្រើន​លើស​លុប​។

 

បញ្ហាទី២ ការវាយ​អក្សរខ្មែរ និង ពុម្ពអក្សរខ្មែរ​នៅ​លើ​បណ្ដាញ​អ៊ីនធឺណែត (គេហទំព័រ) បច្ចុប្បន្ននេះ​គេហទំព័រ​មួយចំនួន​ធំ​បាន​ប្រើ​ប្រាស់​ពុម្ព​អក្សរ​ខ្មែរ​យូនីកូដហើយ​ តែនៅ​មាន​មួយ​ចំនួនតូច​នៅ​ប្រើ​ពុម្ព​អក្សរ​ពី​សម័យ​មុន​។ បញ្ហានេះ​ នៅ​ពេល​ដែល​យើង​បញ្ចូល​ពាក្យ​គន្លឹះ​ដោយ​ប្រើ​ពុម្ព​យូនីកូដ នោះ​ម៉ាស៊ីន​ស្រាវជ្រាវ​នឹង​មិន​បង្ហាញ​លទ្ធផលអត្ថបទ​ដែល​មិន​ប្រើ​យូ​នីកូដ​​ឡើយ​ ព្រោះ​ម៉ាស៊ីន​កុំ​ព្យូទ័រ​​សម្មត​ថា​ខុស​គ្នា​ ទោះ​បីអត្ថ​បទ​នោះ​ដូច​​នឹង​ការ​ចង់​បាន​របស់​យើង​ក៏​ដោយ​។ មួយវិញ​ទៀត​ គឺ​ការ​អក្សរ​​យួនីកូដ​ដោយ​មិន​បាន​ប្រើ​ចន្លោះ​មើល​មិន​ឃើញ (Space bar) ។​ដោយ​សារ​តែ​ក្ដា​ចុចយួនីកូដ​ ទើប​ទេ​ចេញ​ឲ្យ​ប្រើ​នាពេល​ថ្មីៗនេះ​ ធ្វើ​ឲ្យ​​អ្នក​ខ្លះ​មិន​ទាន់​ទំលាប់​ ហើយ ពេល​ខ្លះ​មិន​បាន​ដឹង​ពី​ប្រយោជន៍​នៃ​ការ​ប្រើ​ប្រាស់​ចន្លោះ​មើល​មិន​ឃើញ ។ ចន្លោះ​មើល​មិន​ឃើញ​ មាន​ប្រយោជន៍​សំរាប់​ញែក​ពាក្យ​ឲ្យ​ដាច់​ពី​គ្នា ព្រោះ​ភាសា​ខ្មែរ​យើង​មិន​ដូច​ភាសា​អង់គ្លេស ដែល​ពីពាក្យមួយទៅ​ពាក្យ​មួយទៀត​ត្រូវ​ដក​ឃ្លា រីឯពាក្យ​ខ្មែរ​គឺជាប់​គ្នា​។ ដូច្នេះ​គឺត្រូវ​តែ​ប្រើចន្លោះ​មើល​មិន​ឃើញ​ ដើម្បី​ឲ្យ​ពាក្យ​មួយ​ទៅ​ពាក្យ​មួយ​ទៀត​ដាច់​ពី​គ្នា​ (យើង​មើល​មិនឃើញ​ថា​ដាច់​ពី​គ្នាទេ) ព្រោះ​ការ​ធ្វើ​បែប​នេះ​កុំព្យូទ័រ​អាច​ដឹង​ថា​ជាពាក្យមួយ​ នៅ​ពេល​មាន​ដក​ឃ្លា បើ​សិន​ជា​យើង​មិន​ប្រ​ចន្លោះ​មើល​មិន​ឃើញ​​នៅ​ក្នុង​អត្ថបទ​មួយ រឺ​ប្រយោគ​មួយ​ នោះ​កុំព្យូទ័រ​សន្មតថា​មួយអត្ថបទ​ រឺ​មួយឃ្លា​នោះ​ជា​មួយពាក្យ ។ នេះ​​ជាមូល​ហេតុ​នៅ​ពេល​ដែល​យើង​ស្វែង​រក​ ការផ្គូរ​ផ្គង​ពាក្យគន្លឹះ​ដែល​យើង​បញ្ចូល និង​អត្ថបទ​​មិន​ត្រូវ​គ្នា នាំឲ្យ​គ្មាន​លទ្ធផល​បង្ហាញ​ឡើយ។​ បញ្ហា​មួយទៀត​នៅ​ក្នុង​ការ​សរសេរ​ពាក្យ​ខ្មែរ​ផង​ដែរ​គឺ ការ​ដាក់​ជើង​ ដូចជា​ការ​ដាក់​ជើង​ “ត” និង ជើង​”ដ” ។​ នៅ​ពេល​យើង​សរសេរ​គឺ​មើល​ឃើញ​ដូច​គ្នា​ តែ​តាម​ពិត​គឺ​ខុសគ្នា ហើយ ចំ​ណែក​កុំព្យូទ័រ​ក៏​សម្មតថា​ខុសគ្នា​ដែរ​ ឧ​ទាហរណ៍​ការសរសេរពាក្យ “បន្ត” និង ពាក្យ “សន្ដោស​ប្រណី” ។​ ពាក្យទីមួយត្រូវ​ចុចជើង​ដោយ​ក្ដាចុច “ត” (Key « t ») រីឯពាក្យទីពីរ ត្រូវ​ប្រើ​ជើង “ដ” (Key « d ») ។ ដូច្នេះ​ហើយ ទាំង​អ្នក​សរសេរអត្ថបទ ទាំង​អ្នក​សរសេរ​ពាក្យ​គន្លឹះស្វែង​រក គឺ​ត្រូវ​សរសេរ​ពាក្យ​ខ្មែរ​ឲ្យ​បាន​ត្រឹម​ត្រូវ​តាម​ប្រកប​ និង ក្ដា​ចុច​យូនីកូដ ហើយ​មិនត្រូវ​​ភ្លេច​ប្រើ​ចន្លោះ​មើល​មិន​ឃើញ​។​ ខាង​ក្រោម​ជា​ឧទាហរណ៍ នៃ​ការស្វែង​រក​ដោយ​ប្រពាក្យ​មិន​បាន​ត្រឹម​ត្រូវ​ និង​ការ​វាយ​អក្សរ​បាន​ត្រឹម​ត្រូវ​តាម​ប្រកដ​និង​ក្ដា​ចុច​យូនីកូដ​។

10 thoughts on “បញ្ហា​នៅ​ក្នុង​ការ​ស្វែង​រក​ឯក​សារ​ជា​ភាសា​ខ្មែរ​ក្នុង​បណ្ដាញ​ស្រាវជ្រាវ​អ៊ីន​ធឺ​ណែត​

  1. និយាយ​អំពី​ zero space និង ជើង ត ជើង ដ ព្យាង្គរាយ ព្យាង្គ​តំរួត, អ្នក​សរសេរប្រូក្រាម​ serach ពាក្យ គួរ​គិតដល់​បញ្ហា​នេះ​ដែរ មាន​ន័យ​ថា ប្រួក្រាម​ serach នោះ​ត្រូវ​បាន​បញ្ញា​ដឹង​ថា អ្នក​បញ្ចូល​ពាក្យ​អាច​បញ្ចូល​ពាក្យ​ខុស​ដោយ​គ្មាន​ដក​ឃ្លា អាច​បញ្ចូល​ជើង ត ជា​ជើង​ដ ។ល។

    អំពី​ចំនួន​អត្ថបទ​វិញ ថ្ងៃ​ក្រោយ​យើង​នឹង​មាន​ច្រើន​ដូចគេ​មិន​ខាន។ តែយើង​មិន​អាច​ទៅ​ប្រៀប​ធៀប​ជាមួយ​គេ​កើត​ទេ ព្រោះ ៖ ចំនួន​ប្រជាជន​យើង​តិច​ជាងគេ ចំនួន​អ្នក​ចេះ​របស់​យើង​ក៏​តិច​ជាង​គេ ពេល​វេលា​របស់​អ្នក​ចេះ​ដើម្បី​មក​សរសេរ​វែបសាយថ៍​ក៏​តិច​ជាង​គេ (ព្រោះ​ធ្វើ​ការ​ច្រើន​កន្លែង)។

    ចូលចិត្ត

  2. អ្នក​សរសេរ​ប្រូក្រាម​តែង​​តែ​ជួយ​ដោះ​ស្រាយ​ដដែល​ហ្នឹង​ហើយ តែ​សំខាន់អ្នក​ប្រើ​ប្រាស់​ក៏​ត្រូវ​យល់​ដឹង និង ជួ​យ​សំរួល​ដល់​បញ្ហា​នេះ​ដែរ ជា​ពិសេស​ជួយ​កាត់​បន្ថយ​ការ​ងារ​លំ​បាក​របស់​អ្នក​សរសេរ​ប្រូ​ក្រាម​ ព្រោះ​ពួក​គាត់​មិន​ប្រាកដ​ថា​អាច​សរសេរ​ រឺ រក​កំ​ហុស​បាន​គ្រប់​ជ្រុង​ជ្រោយ​ រឺ​ឲ្យ​ប្រូ​ក្រាម​ដើរ​បាន​ល្អ​១០០%​ដែរ ហើយ​ ម្យ៉ាង​ទៀត​​ប្រព័ន្ធ​ Search Engine មិនមែន​ខ្មែរ​យើង​អ្នក​បង្កើត​ (សង្ឃឹម​ថា​ក៏​មាន​​ខ្មែរ​អ្នក​ចូល​រួម​ដែរ​) ចឹង​ទេ​ប្រ​ហែល​ជា​មិន​ទាន់​អាច​នឹង​កែ​តំរូវ​ពាក្យ​ខ្មែរ​ឲ្យ​បាន​ល្អ​នោះ​ទេ​។
    ចំនែក​ចំនួន​​ឯកសារ​ គឺ​មិន​មែន​សំ​ដៅ​ទៅ​រក​អ្នក​ធ្វើ​ការ​នោះ​ដែរ​ ព្រោះ​តាម​តែខ្ញុំ​ដឹង​ឯក​សារ​ដែល​បាន​លើ​បណ្ដាញ​អ៊ីន​ធឺ​ណែត​ មិន​មែន​សុទ្ធ​តែ​ជា​សមិទ្ធ​ផល​របស់​អ្នក​ធ្វើ​ការ​នោះ​ទេ គឺ​ភាគ​ច្រើន​ជាឯក​សារ​របស់​អ្នក​សិក្សា​ រឺ​ អ្នក​ស្រាវជ្រាវ រឺ ពី​សាលារៀន​ ជាពិសេស​ផ្នែក​ពត៌មាន​វិទ្យា​ និង ក្រសួង​ធំៗ​របស់​រដ្ឋាភិបាល​​ (មិនមែន​ត្រឹម​តែ​សារពត៌មាន​ធម្មតា​នោះ​ទេ​)។​ សង្កេត​មើល​នៅ​បណ្ដាប្រទេស​ផ្សេងៗ គេ​បាន​ប្រើ​ប្រាស់​ឯក​សារ​ពី​បណ្ដាញ​អ៊ីនធឺណែត សំរាប់​ការ​សិក្សា​ស្រាវជ្រាវ រីឯខ្មែរ​យើង​ តើ​អាច​រក​ឯកសារ​ជា​ភាសាជាតិ​ខ្លួន​លើ​បណ្ដាញ​អ៊ីនធឺណែត​សំរាប់​ការ​សិក្សា​ រឺ​ សំរាប់​បង្កើន​ចំណេះដឹង​បាន​ទេ?
    ខ្ញុំ​មិន​បាន​ប្រៀបធៀប​ចំនួន​ប្រជាជន​ទេ គ្រាន់​​តែ​ចង់​បង្ហាញ​ថា​ការ​យក​ចិត្ត​ទុក​របស់​ប្រជាជន​ ក៏ដូច​ជា​រដ្ឋាភិបាល​គេ មាន​ភាព​ប្រសើរជាង​យើង (មិនមែន​បង្អាប់បន្ទោសគ្នាឯងទេ តែគ្រាន់​តែចង់ចែករំលែកប្រាប់គ្នា និង សង្កេតមើល​អ្នក​ដែល​ប្រសើរ​ជាង​យើង កុំ​ប្រៀបតែ​ជា​មួយ​អ្នក​ដែល​នៅ​​ក្រោម​យើង)។​

    សុំទោសផង​បើ​មាន​ការ​ខុស​ឆ្គង​ គ្រាន់​តែ​ជា​ការ​យល់​ឃើញ​ និង សង្កេត​តាម​ដាន​របស់​ខ្ញុំ​ប៉ុណ្ណោះ។​

    សូមអរគុណផង​ដែរ​ ចំពោះ​ការ​រិះគន់កែលំអរ! 🙂

    ចូលចិត្ត

បញ្ចេញមតិ