सामग्री पर जाएँ

"मशीनी लिप्यन्तरण": अवतरणों में अंतर

मुक्त ज्ञानकोश विकिपीडिया से
→‎लिप्यंतरण यन्त्र: साँचा:हिन्दी कम्प्यूटिंग जोड़ना using AWB
पंक्ति 40: पंक्ति 40:
* [http://rcalvi.com/cu_archive/Transliteration/demo.html जावा लिप्यंतरण] - यहाँ देवनागरी सहित थाई, चीनी, जापानी, कोरियाई, रूसी आदि के लिप्यन्तरण (ट्रान्सक्रिप्शन) सम्भव है। (फायरफॉक्स में नही चलता ; 27-04-2010)
* [http://rcalvi.com/cu_archive/Transliteration/demo.html जावा लिप्यंतरण] - यहाँ देवनागरी सहित थाई, चीनी, जापानी, कोरियाई, रूसी आदि के लिप्यन्तरण (ट्रान्सक्रिप्शन) सम्भव है। (फायरफॉक्स में नही चलता ; 27-04-2010)
*[http://www.transliterations.info/CustomPage.aspx?node=317&link=236 IL Transliteration] (Many scripts)
*[http://www.transliterations.info/CustomPage.aspx?node=317&link=236 IL Transliteration] (Many scripts)



[[श्रेणी:भाषा]]
[[श्रेणी:भाषा]]
पंक्ति 46: पंक्ति 45:
[[श्रेणी:हिन्दी कम्प्यूटिंग]]
[[श्रेणी:हिन्दी कम्प्यूटिंग]]
[[श्रेणी:लिप्यन्तरण]]
[[श्रेणी:लिप्यन्तरण]]

{{हिन्दी कम्प्यूटिंग}}

14:42, 15 अगस्त 2010 का अवतरण

कम्प्यूटर सॉफ्टवेयर की सहायता से एक भाषा या लिपि के शब्दों का किसी दूसरी भाषा या लिपि में ध्वन्यात्मक (फोनेटिक) परिवर्तन मशीनी लिप्यन्तरण (मशीन ट्रान्सलिटरेशन) कहलाता है। John को देवनागरी/हिन्दी में जॉन लिखना लिप्यन्तरण का एक उदाहरण है।

उपयोग

  • कम्प्यूटर के इस युग में मशीनी अनुवाद के साथ-साथ मशीनी लिप्यन्तरण आजकल बहुत उपयोगी हो गया है। मशीनी अनुवाद करते समय जिन शब्दों के तुल्य शब्द मशीन के शब्दकोश में नहीं मिलते (Out of vocabulary words) उनको कुछ नियमों का पालन करते हुए केवल लिप्यन्तरित कर दिया जाता है। अधिकतर लिप्यंतरण सेवाएँ वेब आधारित हैं।
  • नामवाचक संज्ञाओं (प्रॉपर नाउन्स) का लिप्यन्तरण ही करना पड़ता है। जैसे Mc Donald को मैक डोनाल्ड लिखना पड़ता है।
  • कुछ तकनीकी शब्दों का अनुवाद करने के बजाय उन्हें केवल लिप्यन्त्तरित करना बेहतर माना जाता है। जैसे transistor को ट्रान्जिस्टर लिखना अधिक उचित होगा न कि transistor लिखना।
  • भारतीय भाषाओं में अधिकांश शब्द समान हैं किन्तु भिन्न लिपि में लिखे होने के कारण उन्हें पढकर समझना/सीखना कठिन होता है। इनका केवल लिप्यन्तरण कर देने से दूसरी भारतीय भाषा समझने व सीखने में बहुत अधिक सुविधा मिल जाती है।

मशीनी लिप्यन्तरण की विधियाँ

  • १) ध्वन्यात्मक प्रतिरूपण (फोनीनिक मैपिंग)
  • २) शब्दकोश में शब्दयुग्म देखकर
  • ३) मशीन शिक्षण द्वारा (मशीन लर्निंग बेस्ड)
  • ४) नियमाधारित (रूल-बेस्ड)

विभिन्न भारतीय भाषी लिप्यंतरण सेवाएँ

भारतीय भाषाऔं में लिप्यंतरण सेवा सर्वप्रथम लॅटिन कीबोर्ड से विभिन्न लिपियौं मे "ध्वन्यात्मक" कीकोड के रुप में विकास हुआ (उदाहरण "ka" दबाने पर "क" टाइप होना)। इस प्रकार के लिप्यंतरण का विकास भारतीय युनिकोड से पूर्व ही हो चुका था। यह विकास प्राथमिक रुप में लॅटिन कीबोर्ड से भारतीय ट्रेडिसनल फंट के सरल एण्ट्री के निमित्त विकसित हुआ था। भारतीय लिपियौं में अन्तर-लिप्यंतरण इस के बाद विकसित हुआ।

सर्वप्रथम भारतीय यान्त्रिक लिप्यन्तरण का विकास किस ने किया था, इस के बारे में आधिकारिक तथ्य उपलब्ध नहीं है। परन्तु अन्तरजाल के फैलाव व भारतीय युनिकोड के विकास के बाद भारतीय यान्त्रिक लिप्यन्तरण में एक प्रकार का उर्जा निर्माण कर दिया।

अन्तर-भारतीय भाषाऔं के मशीनी लिप्यंतरण में कन्नड-प्रमुख बरह सॉफ्टवॅर नें युनिकोड सहित विभिन्न ट्रेडिसनल फन्ट में यान्त्रिक लिप्यंतरण का सुबिधा उपलब्ध किया है। खुला स्रोत के आलोक कुमार द्वारा विभिन्न भारतीय भाषाओं के मध्य टैक्स्ट के लिप्यंतरण के लिए गिरगिट नाम से तंत्र बनाया गया था जो बहुत प्रसिद्ध रहा। इसके पश्चात पीयूष भट्ट जी द्वारा भोमियो नामक वेबसाइट बनायी गयी जो कि किसी वेबपेज के लिपि को रीयल टाइम में बदल कर दिखाता था। यह सेवा हिन्दी चिट्ठाकारों में काफी लोकप्रिय हुई। परन्तु कुछ समय बाद यह सेवा बन्द हो गई। इसके पश्चात आलोक कुमार तथा डॉ विपुल जैन ने गिरगिट का नयां संस्करण बनाया जो कि टैक्स्ट के अतिरिक्त वेबपेज की लिपि भी बदल कर दिखा सकता है। नवम्बर २००९ में गूगल ने भी विभिन्न भारतीय भाषाओं के मध्य लिप्यन्तरण सेवा का आरम्भ किया जिसमें कि कई लिपियाँ सम्मिलित हैं।

बाहरी कड़ियाँ

लेख

  • MACHINE TRANSLITERATION IN JAVA - यहाँ देवनागरी सहित थाई, चीनी, जापानी, कोरियाई, रूसी आदि के लिप्यन्तरण (ट्रान्सक्रिप्शन) के बारे में विस्तृत विचार किया गया है और एक आनलाइन लिप्यन्तरण प्रोग्राम भी है।

लिप्यंतरण यन्त्र

  • Sanskripta - देवनागरी एवम् अन्य भारतीय भाषाओं का परस्पर लिप्यन्तरण का आनलाइन प्रोग्राम । यहाँ भारतीय भाषाओं और आईट्रन्स/हार्वर्ड-क्योटो आदि को भी परस्पर बदलने की सुविधा है।
  • गिरगिट - यूनिकोडित उड़िया, कन्नड़, गुजराती, गुरमुखी, तमिल, तेलुगु, बाङ्ग्ला या मलयालम का परस्पर लिपि परिवर्तक प्रोग्राम
  • Unicode Transliteration Test Page
  • Turn your text into fənɛ́tɪks (IPA / American)
  • NHM Indic Transliterator 1.0.10 - इस फायरफॉक्स एक्स्टेंशन के सहारे देवनागरी, तमिल, तेलुगू, मलयालम, कन्नड आदि लिपियों में लिखे किसी वेबसाइट को एक क्लिक में इनमें से ही किसी दूसरी लिपि में बदल कर देखा जा सकता है।
  • गूगल लॅब्स
  • भोमियो
  • गिरगिट का नया संस्करण
  • बरह
  • सिर्पी - तमिल से विभिन्न लिपियौं में लिप्यन्तरण
  • जावा लिप्यंतरण - यहाँ देवनागरी सहित थाई, चीनी, जापानी, कोरियाई, रूसी आदि के लिप्यन्तरण (ट्रान्सक्रिप्शन) सम्भव है। (फायरफॉक्स में नही चलता ; 27-04-2010)
  • IL Transliteration (Many scripts)