Search Engine क्या है और सर्च इंजन कैसे काम करता हैं

वेबसाइट की दुनिया में सबसे ज्यादा इन्फ्रास्ट्रक्चर सर्च इंजन वेबसाइट के पास होता है, जिसमें दुनिया का सबसे प्रसिद्ध नाम गूगल का आता है। गूगल डॉट कॉम वास्तव में एक सर्च इंजन है, जो दुनिया के तमाम वेबसाइट का डाटा अपने पास रखता है। जब कोई यूजर गूगल पर कोई की-वर्ड अर्थात् कुछ सर्च करने की कोशिश करता है, उससे संबंधित वेबसाइट को ढूंढ़कर आपके सामने पेश करता है।

उदाहरण के तौर पर मान लें कि हमने सर्च इंजन पर इन हिन्दी की-वर्ड को सर्च किया है। गूगल आपको इससे संबंधित सभी वेबसाइट की लिस्ट आपके सामने पेश कर देता है। यह सर्चिंग वास्तव में एक प्रोग्राम है, जो इंटरनेट के माध्यम उपलब्ध डाटाबेस में से हमारे द्वारा सर्च किए गए की-वर्ड को खोजता है, जो उस सर्च इंजन के पास पहले से उपलब्ध होता है। गूगल के साथ याहू, बिंग, अल्टाविस्टा, खोज सहित कई सर्च इंजन का प्रयोग अलग-अलग इंटरनेट उपयोगकर्ताओं द्वारा किया जाता है।

सर्च इंजन के प्रकार

सर्च इंजनों को उनके काम करने के आधार पर पांच प्रकार में बांटा जा सकता है-

1. क्रॉवलर बेस्ड सर्च इंजन - वे सर्च इंजन जो सिर्फ और सिर्फ कम्प्यूटर प्रोग्राम की मदद से चलते हैं, उन्हें क्रॉवलर बेस्ड सर्च इंजन कहा जाता है। इन्हें स्पाइडर, क्रॉवलर या बूट्स भी कहते हैं। उनमें किसी व्यक्ति की जरूरत नहीं होती है। उदाहरण- ऑस्क डाट कॉम।

2. डायरेक्ट्री बेस्ड सर्च इंजन -वे सर्च इंजन जिनमें सिर्फ लोगों की एक टीम द्वारा सिलेक्ट की गई वेबसाइट दिखती हैं। इनमें खुद-ब-खुद कोई भी वेबसाइट शो नहीं होती हैं। उन्हें डायरेक्टरी बेस्ड सर्च इंजन कहा जाता है।

3. हाइब्रिड सर्च इंजन  - जो सर्च इंजन क्रॉवलर या बूट्स के साथ ही साथ मानव द्वारा चुनी गई चीजों का भी इस्तेमाल करते हैं, उन्हें हाइब्रिड सर्च इंजन कहा जाता है। जैसे— गूगल, याहू।

4. मेटा सर्च इंजन - यह सर्च इंजन लाखों वेबसाइटों को अपने डाटाबेस में नहीं रखते हैं, बल्कि जो की-वर्ड लोग उनमें सर्च करते हैं वे उन्हें गूगल और याहू जैसे बड़े सर्च इंजनों में सर्च करके लोगों को दिखाते हैं। उदाहरण– डकडकगो, डॉगपाइल ।

5. विशेष सर्च इंजन - यह सर्च इंजन एक खास तरह की या फिर खास क्षेत्र की मांग को पूरा करने के लिए बने होते हैं। जैसे- लोकल सर्च इंजन, शॉपिंग सर्च इंजन (याहू शॉपिंग)।

सर्च इंजन के मुख्य कार्य 

सामग्री ढूंढने के कई तरीके होने के बाद भी सभी सर्च इंजन तीन कार्य करता है-

  1. स्पाइडर या रोबोट या क्राउलर प्रोग्राम (Spider or robot or crawler program)
  2. इन्डेक्सिंग (Indexing)
  3. सर्च इंटरफेस (Search interface)

1. क्राउल (Crawler) - क्राउल शब्द का अर्थ है खोजना या ढूँढना। सर्च इंजन में स्पाइडर को कभी-कभी क्राउलर या वेब क्राउलर भी कहा जाता है। इनका यूज सर्च इंजन के द्वारा वेब साइट व वेब पेज को संगृहीत करने के लिए किया जाता है। सर्च इंजन को उन सभी वेब साइट्स व वेब पेज की सूचना चाहिए होती है जिसमें खोज सूचना उपलब्ध रहती है। यदि ऐसा नहीं हो पाता है तो सर्च इंजन का खोज किये गये वेब पेज को list करना व Priority के अनुसार Display करने में मुश्किल होगी। Spider or robot or crawler एक स्पेशल प्रोग्राम है जो कि robot.txt फाइल के माध्यम से प्रेसित किये गये keywords से Web server पर वेब पेज की खोज Java Script, CSS, Title, Contents, Metadata को खोजने का काम करता है। प्राप्त परिणामों को डाटाबेस को सूचना देता है। crawler न केवल वेब पेज को खोजता है बल्कि साथ-साथ उन्हें Rank करता है। 

2. इन्डेक्सिंग (Indexing) - इन्डेक्सिंग अर्थात सूची बनाना है । Unsystematic result को Systematic result रिजल्ट में प्रस्तुत करने का काम  Indexing के माध्यम से किया जाता है यह Indexing System को ज्यादातर सर्चइंजन गोपनीय रखते है। क्योंकि यही इन्डेक्सिंग तकनीकि सर्चइंजन को सटीक व प्रमाणिक बनाती है।  यह सारी प्रक्रिया आटोमेटिक होती है। यह प्रक्रिया Indexing कहलाती है। सर्च इंजन पर Indexing प्रक्रिया कुछ महत्वपूर्ण मानक सिद्धान्तों के सफल प्रयोग के द्वारा सम्पन्न हेाती है। यह Indexing search results में इस प्रकार से सुव्यवस्थित करके results देता है कि यूजर  का results उसके search एकदम नजदीक या उचित होता है।

3. सर्च इंटरफेस (Search interface) - सर्च इंटरफेस (Search interface) एक प्रोग्राम होता है जिससे यूजर अपनी जिज्ञासा को keywords के रूप में भेजता है। जिसे Crawler व Indexing के माध्यम से प्राप्त कर Relevant information present करती है। यह सूचना वेब पेज के रूप में उपलब्ध होती है। ज्यादातर सर्च इंजन keywords के रिजल्ट एक सूची के रूप में उपलब्घ कराते हैं। ये परिणाम नए से पुराने के क्रम में होते हैं। सर्च इंटरफेस पर सही रिजल्ट प्राप्त करने के लिए बड़े वाक्यों की जगह छोटे-छोटे की-वर्ड का प्रयोग करना चाहिए। न केवल सटीक परिणाम प्राप्त होते हैं बल्कि तुरंत परिणाम भी प्राप्त होते है। सर्च इंजन में सर्च करते समय कीवर्ड का प्रयोग Boolean Operators AND/OR/NOT के साथ प्रयोग करने से अधिक सही परिणाम प्राप्त किये जा सकते हैं। Phrase Search का प्रयोग भी सही और जल्दी परिणाम प्राप्त करने में सहायक है। 

Search Engine Spider, Crawler, Index and User Interface की सहायता से ये कार्य करते है।

  1. यूजर को किसी विषय पर वाक्यों, मुहावरों या शब्दों के रूप में Query करने देता है।
  2. Query को डाटाबेस में खोजने का काम करता है।
  3. Query से जो सूचनाएं वेब पेज पर समान होती हैं उन्हें इकट्ठा करता है।
  4. एकत्रित वेब पेज को उपलब्ध करता है।
  5. सर्च इंजन यूजर को Query को सुधारने व दुबारा भेजने करने की भी सुविधा देता है।

दुनिया के टॉप सर्च इंजन वेबसाइट की सूची

  1. गूगल
  2. याहू
  3. माइक्रोसॉफ्ट बिंग
  4. डकडकगो
  5. बाईडु – चीनी सर्च इंजन
  6. यानडेक्स रूसी सर्च इंजन
  7. ऑस्क
  8. अबाउट
  9. डॉगपाइल
  10. स्पाइडरवेब
  11. अल्टाविस्टा

भारतीय सर्च इंजन

भारत में भी कुछ सर्च इंजन बने हैं, हालांकि वे बहुत अधिक दिनों तक चल नहीं पाए

  1. गुरुजी डॉट काम (साल 2011 में बंद)
  2. ऐपिक सर्च
  3. खोज सर्च इंजन (123खोज)
  4. बिलसर
  5. रेडिफ
  6. जस्ट डॉयल
  7. 13टैब्स
जिस प्रकार हमें किसी वांछित व्यक्ति का टेलीफोन नं. पता न होने की स्थिति मे टेलीफोन डायरेक्टीª हमारी सहायता के लिये उपलब्ध होती है, उसी प्रकार उपयुक्त सूचना प्राप्त करने के लिये पेज सर्च करने की दो विधियाँ है।

1.  कुछ साइटस कैटेगरी एवं सब कैटेगरी के अनुसार षाॅर्ट करके वेब पेजेस रिटर्न करती है। जैसे याहू (विभिन्न साइटस http://www.yahoo.com एवं http:// yahoo.no आदि)

2. वेवसाइट्स सर्च इंजन आफर करती है, जो वेब पेजेस की लिस्ट रिटर्न करती है जो कि सर्च वर्ड या स्ट्रिंग से मैच करके टेक्स्ट सर्च करते हैं। जैसे गूगल (http://www.google.com), alvista (http://www.alvista.com), एवं fast search (http://www.alltheweb.com)

Post a Comment

Previous Post Next Post