वेबसाइट की दुनिया में सबसे ज्यादा इन्फ्रास्ट्रक्चर सर्च इंजन वेबसाइट के पास होता है, जिसमें दुनिया का सबसे प्रसिद्ध नाम गूगल का आता है। गूगल डॉट कॉम वास्तव में एक सर्च इंजन है, जो दुनिया के तमाम वेबसाइट का डाटा अपने पास रखता है। जब कोई यूजर गूगल पर कोई की-वर्ड अर्थात् कुछ सर्च करने की कोशिश करता है, उससे संबंधित वेबसाइट को ढूंढ़कर आपके सामने पेश करता है।
उदाहरण के तौर पर मान लें कि हमने सर्च इंजन पर इन हिन्दी की-वर्ड को सर्च किया है। गूगल आपको इससे संबंधित सभी वेबसाइट की लिस्ट आपके सामने पेश कर देता है। यह सर्चिंग वास्तव में एक प्रोग्राम है, जो इंटरनेट के माध्यम उपलब्ध डाटाबेस में से हमारे द्वारा सर्च किए गए की-वर्ड को खोजता है, जो उस सर्च इंजन के पास पहले से उपलब्ध होता है। गूगल के साथ याहू, बिंग, अल्टाविस्टा, खोज सहित कई सर्च इंजन का प्रयोग अलग-अलग इंटरनेट उपयोगकर्ताओं द्वारा किया जाता है।
सर्च इंजन के प्रकार
सर्च इंजनों को उनके काम करने के आधार पर पांच प्रकार में बांटा जा सकता है-
1. क्रॉवलर बेस्ड सर्च इंजन - वे सर्च इंजन जो सिर्फ और सिर्फ कम्प्यूटर प्रोग्राम की मदद से चलते हैं, उन्हें क्रॉवलर बेस्ड सर्च इंजन कहा जाता है। इन्हें स्पाइडर, क्रॉवलर या बूट्स भी कहते हैं। उनमें किसी व्यक्ति की जरूरत नहीं होती है। उदाहरण- ऑस्क डाट कॉम।
2. डायरेक्ट्री बेस्ड सर्च इंजन -वे सर्च इंजन जिनमें सिर्फ लोगों की एक टीम द्वारा सिलेक्ट की गई वेबसाइट दिखती हैं। इनमें खुद-ब-खुद कोई भी वेबसाइट शो नहीं होती हैं। उन्हें डायरेक्टरी बेस्ड सर्च इंजन कहा जाता है।
3. हाइब्रिड सर्च इंजन - जो सर्च इंजन क्रॉवलर या बूट्स के साथ ही साथ मानव द्वारा चुनी गई चीजों का भी इस्तेमाल करते हैं, उन्हें हाइब्रिड सर्च इंजन कहा जाता है। जैसे— गूगल, याहू।
4. मेटा सर्च इंजन - यह सर्च इंजन लाखों वेबसाइटों को अपने डाटाबेस में नहीं रखते हैं, बल्कि जो की-वर्ड लोग उनमें सर्च करते हैं वे उन्हें गूगल और याहू जैसे बड़े सर्च इंजनों में सर्च करके लोगों को दिखाते हैं। उदाहरण– डकडकगो, डॉगपाइल ।
5. विशेष सर्च इंजन - यह सर्च इंजन एक खास तरह की या फिर खास क्षेत्र की मांग को पूरा करने के लिए बने होते हैं। जैसे- लोकल सर्च इंजन, शॉपिंग सर्च इंजन (याहू शॉपिंग)।
सर्च इंजन के मुख्य कार्य
सामग्री ढूंढने के कई तरीके होने के बाद भी सभी सर्च इंजन तीन कार्य करता है-
- स्पाइडर या रोबोट या क्राउलर प्रोग्राम (Spider or robot or crawler program)
- इन्डेक्सिंग (Indexing)
- सर्च इंटरफेस (Search interface)
Search Engine Spider, Crawler, Index and User Interface की सहायता से ये कार्य करते है।
- यूजर को किसी विषय पर वाक्यों, मुहावरों या शब्दों के रूप में Query करने देता है।
- Query को डाटाबेस में खोजने का काम करता है।
- Query से जो सूचनाएं वेब पेज पर समान होती हैं उन्हें इकट्ठा करता है।
- एकत्रित वेब पेज को उपलब्ध करता है।
- सर्च इंजन यूजर को Query को सुधारने व दुबारा भेजने करने की भी सुविधा देता है।
दुनिया के टॉप सर्च इंजन वेबसाइट की सूची
- गूगल
- याहू
- माइक्रोसॉफ्ट बिंग
- डकडकगो
- बाईडु – चीनी सर्च इंजन
- यानडेक्स रूसी सर्च इंजन
- ऑस्क
- अबाउट
- डॉगपाइल
- स्पाइडरवेब
- अल्टाविस्टा
भारतीय सर्च इंजन
भारत में भी कुछ सर्च इंजन बने हैं, हालांकि वे बहुत अधिक दिनों तक चल नहीं पाए
- गुरुजी डॉट काम (साल 2011 में बंद)
- ऐपिक सर्च
- खोज सर्च इंजन (123खोज)
- बिलसर
- रेडिफ
- जस्ट डॉयल
- 13टैब्स
1. कुछ साइटस कैटेगरी एवं सब कैटेगरी के अनुसार षाॅर्ट करके वेब पेजेस रिटर्न करती है। जैसे याहू (विभिन्न साइटस http://www.yahoo.com एवं http:// yahoo.no आदि)
2. वेवसाइट्स सर्च इंजन आफर करती है, जो वेब पेजेस की लिस्ट रिटर्न करती है जो कि सर्च वर्ड या स्ट्रिंग से मैच करके टेक्स्ट सर्च करते हैं। जैसे गूगल (http://www.google.com), alvista (http://www.alvista.com), एवं fast search (http://www.alltheweb.com)