मशीनी अनुवाद की प्रक्रिया | Process of machine translation in hindi

मशीनी अनुवाद एक महत्वपूर्ण उपलब्धि है। इसमें अल्प समय में मूलपाठ का अनुवाद तीव्र गति से किया जा सकता है। मशीनी अनुवाद की प्रक्रिया में मूलपाठ अर्थात् अनुवाद किए जाने वाले डाॅटा को कंप्यूटर प्रणाली में input के विकास की दिशाएँ रूप में डाला जाता है। कंप्यूटर की भीतरी प्रणाली में दोनों भाषाओं के शब्द, मुहावरा और व्याकरण नियम फीड होते हैं। ये एक प्रकार के शब्दकोश और व्याकरणिक विश्लेषण होते हैं, जो मूलपाठ के वाक्यों का विश्लेषण, अंतरण और संश्लेषण मुख्य तीन चरणों में करते हैं। यह प्रणाली मूल पाठ के डाॅटा का दूसरी भाषा में स्वचालित अनुवाद करती हैं और कुछ क्षणों में अनूदित पाठ Output के रूप में प्राप्त होता है। इसमें यह देखना है कि अनूदित पाठ कितना सही और स्वीकार्य है। इसका स्वरूप क्या है - सामान्य है या तकनीकी या साहित्यिक। इसमें यह भी देखा जाता है कि प्रणाली (system) में कितनी द्विभाषी शब्दावली है और कितने व्याकरणिक नियम उपलब्ध हैं और कितने सटीक है। 

यहाँ यह जानना आवश्यक है कि अनुवाद मूलतः एक बौद्धिक प्रक्रिया है और इसकी क्षमता मानव के पास है। इसलिए मशीन मानव का स्थान नहीं ले सकती, क्योंकि कंप्यूटर प्रणाली मनुष्य की भाँति सहज बुद्धि से एक भाषा से दूसरी भाषा में रूपांतरित नहीं कर पाती। अनेकार्थी और संदिग्धार्थी शब्दों या वाक्यों का अनुवाद या निर्वाचन नहीं कर सकती हैं। उसमें तो वही अर्थ आएगा जो कंप्यूटर द्वारा समझी जा सकने वाली Algorithm या तर्कपूर्ण फार्मूला में परिवर्तित कर उसके (Memory) में दिया जाता है। यही कृत्रिम बुद्धि है जो मशीन में दिए गए नियमों से परिचालित है। वास्तव में कृत्रिम बुद्धि वह अध्ययन है जिसमें यह देखा जाता है कि कंप्यूटर कैसे वह काम करता है जिसे मानव उसी समय उसी तरह अच्छा कर सकता है। 

मशीनी अनुवाद तीन प्रणालियों पर आधारित है - 1) नियम आधारित प्रणाली 2) उदाहरण आधारित प्रणाली और 3) सांख्यिकी आधारित प्रणाली। नियम आधारित प्रणाली में भाषाओं के वाक्यपरक व्याकरण को प्राथमिकता दी जाती है और इसमें प्रायः व्याकरणिक नियम कार्य करते हैं। उदाहरण आधारित प्रणाली में काॅर्पोरा (विपुल शब्द संग्रह) के आधार पर मशीन के लिए कृत्रिम बुद्धि से समानांतर कार्पोरा तैयार किया जाता है और उसी के आधार पर नियम दिए जाते हैं। सांख्यिकी आधारित प्रणाली में भाषा-युग्म के बीच सांख्यिकीय संरचनाएँ निर्मित कर विरचना (decomposition) और सुव्यवस्थित अंतरापृष्ठन का प्रयोग होता है। यह प्रणाली अभी मानक रूप धारण नहीं कर पाई है। 

अंतराराष्ट्रीय सूचना प्रौद्योगिकी आई.आई.टी. हैदराबाद और हैदराबाद विश्वविद्यालय ने अनुसारक पद्धति से तेलुगु से हिंदी में अनुवाद करने की मशीनी अनुवाद प्रणाली का विकास किया है, जिसमें पणिनि व्याकरण के सिद्धांतों को आधार बनाया गया है। इस समय आई.आई.टी. हैदराबाद में अंग्रेज़ी-हिंदी मशीनी अनुवाद ‘शक्ति‘ और भाषा प्रौद्योगिकी ‘शिवा‘ का विकास उदाहरण पद्धति से हो रहा है। 

एक प्राइवेट संस्था सुपर इन्फोसाफ्ट प्रा. लि., नई दिल्ली ने अंग्रेज़ी के सरल वाक्यों के हिंदी अनुवाद का विकास अनुवादक के नाम से किया है। 

हैदराबाद विश्वविद्यालय के कंप्यूटर और सूचना विज्ञान विभाग ने अंग्रेजी-कन्नड़ मशीनी अनुवाद प्रणाली का विकास किया है जिसमें सार्वभौमिक वाक्यांश संरचना व्याकरण रूपवाद का प्रयोग हुआ है। अन्ना विश्वविद्यालय के बी. चंद्रशेखर अनुसंधान केन्द्र, चेन्नई में तमिल-हिंदी मशीन साधित अनुवाद प्रणाली का विकास हुआ है जो अनुसारक पद्धति पर आधारित है। इसी श्रृंखला में भारतीय भाषाओं हिंदी-पंजाबी, पंजाबी-हिंदी, मराठी-हिंदी, तेलुगु-हिंदी, कन्नड-हिंदी, बंगला-हिंदी, अंग्रेजी-पंजाबी, अंग्रेजी-उूर्द, अंग्रेजी-बंगला, अंग्रेजी-मलयालम आदि अन्य भारतीय भाषाओं के मशीनी अनुवादों का विकास कार्य भी चल रहा है।

मशीनी अनुवाद की प्रक्रिया (Process of machine translation)

मशीनी अनुवाद कंप्यूटेशनल भाषाविज्ञान का एक अनुप्रयोग है जिसमें कंप्यूटर के प्रयोग द्वारा पाठ को एक प्राकृतिक भाषा से दूसरी प्राकृतिक भाषा में अनुवादित किया जाता है। इसमें स्रोत और लक्ष्यभाषा की प्रकृति समान या असमान हो सकती है। अनुवाद प्रक्रिया की जटिलता भाषायुग्म की भिन्नताओं पर निर्भर करती है। यह जटिलता विभिन्न कारणों से खड़ी हो सकती है। इनमें वाक्य संरचना के रूपों, व्याकरण रूपों, संदर्भिक द्वि-अर्थकता या वाक्य में पाई जाने वाली शाब्दिक द्वि-अर्थकता, लेखन शैली के रूपों, मुहावरों या लोकोक्तियों का प्रयोग, सांस्कृतिक भिन्नता आदि होते हैं। ये ऐसे प्रयोग हैं जिनसे मूल स्रोतपाठ एक विशिष्टता लिए रहता है और इसका दूसरी भाषा में अंतरण करते समय जटिलताएँ उत्पन्न होती हैं।

अनुवाद संबंधी प्रौद्योगिकी पत्रिकाओं में मशीनी अनुवाद को दस सबसे चुनौतीपूर्ण प्रौद्योगिकियों की सूची में रखा गया है। मशीनी अनुवाद के विस्तार में जाने से पूर्व हम देखेंगे कि अनुवाद स्रोतभाषा में व्यक्त संदेश के लिए लक्ष्यभाषा में निकटतम सहज समतुल्य संदेश को प्रस्तुत करना है, यह समतुल्यता पहले अर्थ के स्तर पर होती है फिर शैली के स्तर पर।

सामान्य अनुवाद के उद्देश्य, प्रविधि तथा उससे संबंधित चुनौतियों पर विचार करने से हम देखते हैं कि अनुवाद में हम उस समतुल्य को पाना चाहते हैं जो स्रोतभाषा पाठ में निहित होता है तथा अनुवाद प्रक्रिया द्वारा संप्रेषित किया जाता है। यहाँ समतुल्यता अर्थ, रूप, शैली और प्रभाव के संबंध में है। समतुल्यता प्रकृति में औपचारिक रूप से गतिशील हो सकती है। नाइडा के अनुसार तात्विक समतुल्यता रूप और तत्व दोनों में केवल संदेश पर केंद्रित रहती है, इसका लक्ष्य होता है पाठकों तक अधिक से अधिक लक्ष्यभाषा के संदर्भ को पहुँचाना। तथापि, परिवर्तनात्मक समतुल्यता समतुल्य प्रभाव के सिद्धांत पर आधारित होती है अर्थात् प्राप्तकर्ता और संदेशकता के बीच का संबंध वैसा ही होता है जैसाकि मूल प्राप्तकर्ताओं और स्रोतभाषा संदेशकता के बीच होता है। यदि हम मानवीय आधार पर अनुवाद प्रक्रिया का विश्लेषण करें तो हमें यहाँ दिए गए उपकार्यों की प्रक्रिया की तरह विश्लेषण करना होगा;
  1. स्रोतपाठ के अर्थ को समझना; और
  2. लक्ष्यभाषा पाठ में इस अर्थ को उचित रूप से गठित करना।
यद्यपि यह पूरी प्रक्रिया सामान्य-सी प्रतीत होती है, तथापि इसमें जटिल ज्ञानात्मक प्रक्रिया सम्मिलित रहती है। स्रोतपाठ के अर्थ को समझने अथवा विकोडीकरण करने में अनुवादक को दिए गए संदर्भ में पाठ में अंतर्निहित अर्थ की व्याख्या और विश्लेषण करना होता है जो स्रोतभाषा के व्याकरण, अर्थग्रहण वाक्य-विन्यास, मुहावरों आदि के साथ-साथ उसके बोलने वालों के सांस्कृतिक रूपों के गहन अध्ययन में निहित होता है। लक्ष्यभाषा में समान रूप से पुनर्गठित और कोडीकृत करने के लिए, अनुवादक को लक्ष्यभाषा के व्याकरण और लक्ष्यभाषा पाठकों के सांस्कृतिक रूपों की विस्तारपूर्वक जानकारी होनी चाहिए।

मशीनी अनुवाद के संदर्भ में जब यह बात आती है तब यह चुनौतीपूर्ण होता है कि कैसे एक कंप्यूटर पर प्रोग्राम किया जाए कि वह पाठ को मानव अनुवादक की तरह ‘समझे’ और लक्ष्यभाषा में नए पाठ की ‘रचना’ करे जो ऐसा प्रतीत हो कि लक्ष्यभाषा के किसी व्यक्ति द्वारा लिखा गया है। अर्थात् लक्ष्य पाठक उस रचित पाठ को स्वाभाविक रूप से ग्रहण करे।

मशीनी अनुवाद की कार्यप्रणाली में आने वाली समस्याओं को कई प्रकार से दूर किया गया है। साधनों और आवश्यकताओं के बढ़ने के साथ इसका क्षेत्रा भी बढ़ता जा रहा है। मशीनी अनुवाद की पद्धतियों को वर्गीकृत करने के लिए विभिन्न मानक बनाए गए हैं। तथापि सबसे प्रचलित वर्गीकरण भाषायी स्तर (और उत्पाद) को ध्यान में रखकर ‘सिस्टम’ की जरूरत के अनुसार अनुवाद प्रस्तुत करने के लिए किया गया है। इस पूरी प्रक्रिया को पिरामिड द्वारा समझा जा सकता है जिसे ‘वोकोइस त्रिकोण’ कहते हैं।

वोकोइस त्रिकोण

सामान्य तौर पर कहा जाए तो पिरामिड का निचला भाग उन माध्यमों को प्रस्तुत करता है जो लक्ष्यवाक्य प्रस्तुत करने के क्रम में स्रोत वाक्य का कोई भाषिक विश्लेषण नहीं करते हैं। हम त्रिकोण में जैसे-जैसे ऊपर की ओर बढ़ते हैं मशीनी अनुवाद का क्षेत्रा बढ़ता जाता है अर्थात् जैसे ही हम ऊपर की तरफ बढ़ते हैं सिस्टम ज्यादा से ज्यादा विश्लेषण करता है। अंत में पिरामिड के शीर्ष पर स्रोतवाक्य की प्रासंगिक एवं अर्थगत विशेषता कार्यान्वित होती है जो स्रोतवाक्य में विन्यासगत व्याख्या के पश्चात लक्ष्य वाक्य उत्पादन में सहायक होती है।

Bandey

मैं एक सामाजिक कार्यकर्ता (MSW Passout 2014 MGCGVV University) चित्रकूट, भारत से ब्लॉगर हूं।

Post a Comment

Previous Post Next Post