सामग्री पर जाएँ

मशीनी लिप्यन्तरण

मुक्त ज्ञानकोश विकिपीडिया से

कम्प्यूटर सॉफ्टवेयर की सहायता से एक भाषा या लिपि के शब्दों का किसी दूसरी भाषा या लिपि में ध्वन्यात्मक (फोनेटिक) परिवर्तन मशीनी लिप्यन्तरण (मशीन ट्रान्सलिटरेशन) कहलाता है। John को देवनागरी/हिन्दी में जॉन लिखना लिप्यन्तरण का एक उदाहरण है।

उपयोग

  • कम्प्यूटर के इस युग में मशीनी अनुवाद के साथ-साथ मशीनी लिप्यन्तरण आजकल बहुत उपयोगी हो गया है। मशीनी अनुवाद करते समय जिन शब्दों के तुल्य शब्द मशीन के शब्दकोश में नहीं मिलते (Out of vocabulary words) उनको कुछ नियमों का पालन करते हुए केवल लिप्यन्तरित कर दिया जाता है। अधिकतर लिप्यंतरण सेवाएँ वेब आधारित हैं।
  • नामवाचक संज्ञाओं (प्रॉपर नाउन्स) का लिप्यन्तरण ही करना पड़ता है। जैसे Mc Donald को मैक डोनाल्ड लिखना पड़ता है।
  • कुछ तकनीकी शब्दों का अनुवाद करने के बजाय उन्हें केवल लिप्यन्त्तरित करना बेहतर माना जाता है। जैसे transistor को ट्रान्जिस्टर लिखना अधिक उचित होगा न कि transistor लिखना।
  • भारतीय भाषाओं में अधिकांश शब्द समान हैं किन्तु भिन्न लिपि में लिखे होने के कारण उन्हें पढकर समझना/सीखना कठिन होता है। इनका केवल लिप्यन्तरण कर देने से दूसरी भारतीय भाषा समझने व सीखने में बहुत अधिक सुविधा मिल जाती है।

मशीनी लिप्यन्तरण की विधियाँ

  • १) ध्वन्यात्मक प्रतिरूपण (फोनीनिक मैपिंग)
  • २) शब्दकोश में शब्दयुग्म देखकर
  • ३) मशीन शिक्षण द्वारा (मशीन लर्निंग बेस्ड)
  • ४) नियमाधारित (रूल-बेस्ड)

विभिन्न भारतीय भाषी लिप्यंतरण सेवाएँ

भारतीय भाषाऔं में लिप्यंतरण सेवा सर्वप्रथम लॅटिन कीबोर्ड से विभिन्न लिपियौं मे "ध्वन्यात्मक" कीकोड के रुप में विकास हुआ (उदाहरण "ka" दबाने पर "क" टाइप होना)। इस प्रकार के लिप्यंतरण का विकास भारतीय युनिकोड से पूर्व ही हो चुका था। यह विकास प्राथमिक रुप में लॅटिन कीबोर्ड से भारतीय ट्रेडिसनल फंट के सरल एण्ट्री के निमित्त विकसित हुआ था। भारतीय लिपियौं में अन्तर-लिप्यंतरण इस के बाद विकसित हुआ।

सर्वप्रथम भारतीय यान्त्रिक लिप्यन्तरण का विकास किस ने किया था, इस के बारे में आधिकारिक तथ्य उपलब्ध नहीं है। परन्तु अन्तरजाल के फैलाव व भारतीय युनिकोड के विकास के बाद भारतीय यान्त्रिक लिप्यन्तरण में एक प्रकार का उर्जा निर्माण कर दिया।

अन्तर-भारतीय भाषाऔं के मशीनी लिप्यंतरण में कन्नड-प्रमुख बरह सॉफ्टवॅर नें युनिकोड सहित विभिन्न ट्रेडिसनल फन्ट में यान्त्रिक लिप्यंतरण का सुबिधा उपलब्ध किया है। खुला स्रोत के आलोक कुमार द्वारा विभिन्न भारतीय भाषाओं के मध्य टैक्स्ट के लिप्यंतरण के लिए गिरगिट नाम से तंत्र बनाया गया था जो बहुत प्रसिद्ध रहा। इसके पश्चात पीयूष भट्ट जी द्वारा भोमियो नामक वेबसाइट बनायी गयी जो कि किसी वेबपेज के लिपि को रीयल टाइम में बदल कर दिखाता था। यह सेवा हिन्दी चिट्ठाकारों में काफी लोकप्रिय हुई। परन्तु कुछ समय बाद यह सेवा बन्द हो गई। इसके पश्चात आलोक कुमार तथा डॉ विपुल जैन ने गिरगिट का नयां संस्करण बनाया जो कि टैक्स्ट के अतिरिक्त वेबपेज की लिपि भी बदल कर दिखा सकता है। नवम्बर २००९ में गूगल ने भी विभिन्न भारतीय भाषाओं के मध्य लिप्यन्तरण सेवा का आरम्भ किया जिसमें कि कई लिपियाँ सम्मिलित हैं।

बाहरी कड़ियाँ

लेख

  • MACHINE TRANSLITERATION IN JAVA - यहाँ देवनागरी सहित थाई, चीनी, जापानी, कोरियाई, रूसी आदि के लिप्यन्तरण (ट्रान्सक्रिप्शन) के बारे में विस्तृत विचार किया गया है और एक आनलाइन लिप्यन्तरण प्रोग्राम भी है।

लिप्यंतरण यन्त्र

  • Sanskripta - देवनागरी एवम् अन्य भारतीय भाषाओं का परस्पर लिप्यन्तरण का आनलाइन प्रोग्राम । यहाँ भारतीय भाषाओं और आईट्रन्स/हार्वर्ड-क्योटो आदि को भी परस्पर बदलने की सुविधा है।
  • गिरगिट - यूनिकोडित उड़िया, कन्नड़, गुजराती, गुरमुखी, तमिल, तेलुगु, बाङ्ग्ला या मलयालम का परस्पर लिपि परिवर्तक प्रोग्राम
  • Unicode Transliteration Test Page
  • Turn your text into fənɛ́tɪks (IPA / American)
  • NHM Indic Transliterator 1.0.10 - इस फायरफॉक्स एक्स्टेंशन के सहारे देवनागरी, तमिल, तेलुगू, मलयालम, कन्नड आदि लिपियों में लिखे किसी वेबसाइट को एक क्लिक में इनमें से ही किसी दूसरी लिपि में बदल कर देखा जा सकता है।
  • Padma: Transformer for Indic Scripts
  • गूगल स्क्रिप्ट कन्वर्टर
  • भोमियो
  • गिरगिट का नया संस्करण
  • बरह
  • सिर्पी - तमिल से विभिन्न लिपियौं में लिप्यन्तरण
  • जावा लिप्यंतरण - यहाँ देवनागरी सहित थाई, चीनी, जापानी, कोरियाई, रूसी आदि के लिप्यन्तरण (ट्रान्सक्रिप्शन) सम्भव है। (फायरफॉक्स में नही चलता ; 27-04-2010)
  • IL Transliteration (Many scripts)