सर्च इंजन हर साल स्मार्ट होते जा रहे हैं। यदि कुछ समय पहले तक उन्होंने केवल कीवर्ड के घनत्व और प्रासंगिकता के कुछ अस्थिर संकेतक को ध्यान में रखा था, तो अब एक लेख को शीर्ष पर ले जाने के लिए सबसे महत्वपूर्ण शर्तों में से एक पाठ की स्वाभाविकता बन गई है। Zipf के नियम के अनुसार विश्लेषण का उपयोग करके इसका अनुमान लगाया जा सकता है।
जिपफ के नियम के अनुसार टेक्स्ट का विश्लेषण कैसे किया जाता है?
खोज इंजन तंत्र ऐसे हैं कि कृत्रिम रूप से उत्पन्न पाठ को अप्राकृतिक के रूप में पहचाना जाता है और खोज परिणामों में शीर्ष पदों से बाहर रखा जाता है। पाठ की स्वाभाविकता के स्तर का निर्धारण कैसे करें? अमेरिकी भाषाविद् जॉर्ज जिपफ ने पाठ की स्वाभाविकता के नियम का प्रतिपादन किया, जिसके अनुसार किसी पाठ में किसी शब्द के प्रयोग की आवृत्ति उसकी क्रमसूचक संख्या के व्युत्क्रमानुपाती होती है। अर्थात्, दूसरा शब्द पहले की तुलना में आधा बार आता है, तीसरा पहले की तुलना में तीन गुना दुर्लभ है, और इसी तरह।
इस सरल गणितीय पद्धति के आधार पर आप स्वाभाविकता के लिए किसी भी पाठ का विश्लेषण कर सकते हैं। इस नियम का 30-50 प्रतिशत तक अनुपालन करने वाला पाठ प्राकृतिक माना जाता है। प्रतिशत जितना अधिक होगा, पाठ उतना ही स्वाभाविक दिखाई देगा। इंटरनेट पर पहले से ही विशेष ऑनलाइन संसाधन हैं जिनका उपयोग जिपफ के नियम के अनुसार पाठ का विश्लेषण करने के लिए किया जा सकता है। 30 प्रतिशत से कम इंडेक्स वाले लेख सर्च इंजन द्वारा खारिज कर दिए जाते हैं।
आप जिपफ के अनुसार पाठ के विश्लेषण के परिणामों पर कैसे भरोसा कर सकते हैं?
जिपफ का कानून पाठ विश्लेषण एक सामान्य सांख्यिकीय विश्लेषण है जो औसत देशी वक्ता द्वारा शब्दों के उपयोग की ख़ासियत को ध्यान में रखता है। बेशक, नियम के अपवाद हैं। यदि आप जिपफ के नियम के अनुसार प्रसिद्ध लेखकों के कुछ कार्यों का मूल्यांकन करने का प्रयास करते हैं, तो गवाही बहुत आश्चर्यजनक हो सकती है। हालांकि, क्लासिक्स की भाषा औसत सांख्यिकीय भाषण में फिट नहीं होती है।
Zipf के अनुसार टेक्स्ट का विश्लेषण उन सभी के लिए आवश्यक है जो किसी न किसी तरह से वेबसाइटों के प्रचार से जुड़े हैं। ये कॉपीराइटर, वेब प्रोग्रामर और SEO ऑप्टिमाइज़र हैं। पाठ की स्वाभाविकता की उच्च दर लेख को खोज इंजन के शीर्ष पर एक स्थान प्रदान करने की संभावना है। अच्छे Zipf's Law विश्लेषण के साथ टेक्स्ट लिखने के लिए, आपको यह याद रखना होगा कि कीवर्ड का उपयोग बड़े ब्रेक के साथ किया जाना चाहिए। अक्सर, ग्राहकों को निर्दिष्ट कीवर्ड और उपयोग की एक निश्चित आवृत्ति के साथ टेक्स्ट बनाने के लिए कलाकारों की आवश्यकता होती है। Zipf के विश्लेषण के अनुसार इस तरह के टेक्स्ट का स्कोर निश्चित रूप से कम होगा। सही तकनीकी कार्य तब होता है जब ग्राहक कॉपीराइटर को पाठ में उनके उपयोग की संख्या तक सीमित किए बिना केवल चाबियाँ स्वयं देता है। फिर यह तय करने के लिए पर्याप्त है कि पाठ में कौन सा शब्द सबसे अधिक बार मिलेगा, और इसके उपयोग की आवृत्ति के आधार पर बाकी सभी को लेख में शामिल करें।