सामग्री पर जाएँ

"मशीनी लिप्यन्तरण": अवतरणों में अंतर

मुक्त ज्ञानकोश विकिपीडिया से
छो Removing link(s) देखें: विकिपीडिया:पृष्ठ हटाने हेतु चर्चा/लेख/भोमियो चर्चा समाप्त, परिणाम था हटाया (XFDcloser)
 
(10 सदस्यों द्वारा किए गए बीच के 16 अवतरण नहीं दर्शाए गए)
पंक्ति 1: पंक्ति 1:
[[कम्प्यूटर]] [[सॉफ्टवेयर]] की सहायता से एक [[भाषा]] या [[लिपि]] के शब्दों का किसी दूसरी भाषा या लिपि में ध्वन्यात्मक (फोनेटिक) परिवर्तन '''मशीनी लिप्यन्तरण''' (मशीन ट्रान्सलिटरेशन) कहलाता है। ''John'' को देवनागरी/हिन्दी में ''जॉन'' लिखना लिप्यन्तरण का एक उदाहरण है।
[[कंप्यूटर|कम्प्यूटर]] [[सॉफ्टवेयर]] की सहायता से एक [[भाषा]] या [[लिपि]] के शब्दों का किसी दूसरी भाषा या लिपि में ध्वन्यात्मक (फोनेटिक) परिवर्तन '''मशीनी लिप्यन्तरण''' (मशीन ट्रान्सलिटरेशन) कहलाता है। ''John'' को देवनागरी/हिन्दी में ''जॉन'' लिखना लिप्यन्तरण का एक उदाहरण है।


== उपयोग ==
== उपयोग ==
* कम्प्यूटर के इस युग में [[मशीनी अनुवाद]] के साथ-साथ मशीनी लिप्यन्तरण आजकल बहुत उपयोगी हो गया है। मशीनी अनुवाद करते समय जिन शब्दों के तुल्य शब्द मशीन के शब्दकोश में नहीं मिलते (Out of vocabulary words) उनको कुछ नियमों का पालन करते हुए केवल लिप्यन्तरित कर दिया जाता है। अधिकतर लिप्यंतरण सेवाएँ वेब आधारित हैं।
* कम्प्यूटर के इस युग में [[यान्त्रिक अनुवाद|मशीनी अनुवाद]] के साथ-साथ मशीनी लिप्यन्तरण आजकल बहुत उपयोगी हो गया है। मशीनी अनुवाद करते समय जिन शब्दों के तुल्य शब्द मशीन के शब्दकोश में नहीं मिलते (Out of vocabulary words) उनको कुछ नियमों का पालन करते हुए केवल लिप्यन्तरित कर दिया जाता है। अधिकतर लिप्यन्तरण सेवाएँ वेब आधारित हैं।


* नामवाचक [[संज्ञा|संज्ञाओं]] (प्रॉपर नाउन्स) का लिप्यन्तरण ही करना पड़ता है। जैसे Mc Donald को ''मैक डोनाल्ड'' लिखना पड़ता है।
* नामवाचक [[संज्ञा|संज्ञाओं]] (प्रॉपर नाउन्स) का लिप्यन्तरण ही करना पड़ता है। जैसे Mc Donald को ''मैक डोनाल्ड'' लिखना पड़ता है।


* कुछ तकनीकी शब्दों का अनुवाद करने के बजाय उन्हें केवल लिप्यन्त्तरित करना बेहतर माना जाता है। जैसे transistor को ''ट्रान्जिस्टर'' लिखना अधिक उचित होगा न कि transistor लिखना।
* कुछ तकनीकी शब्दों का अनुवाद करने के बजाय उन्हें केवल लिप्यन्तरित करना बेहतर माना जाता है। जैसे transistor को ''ट्रान्जिस्टर'' लिखना अधिक उचित होगा न कि transistor लिखना।


* भारतीय भाषाओं में अधिकांश शब्द समान हैं किन्तु भिन्न लिपि में लिखे होने के कारण उन्हें पढकर समझना/सीखना कठिन होता है। इनका केवल लिप्यन्तरण कर देने से दूसरी भारतीय भाषा समझने व सीखने में बहुत अधिक सुविधा मिल जाती है।
* भारतीय भाषाओं में अधिकांश शब्द समान हैं किन्तु भिन्न लिपि में लिखे होने के कारण उन्हें पढकर समझना/सीखना कठिन होता है। इनका केवल लिप्यन्तरण कर देने से दूसरी भारतीय भाषा समझने व सीखने में बहुत अधिक सुविधा मिल जाती है।
* लिप्यंतरण से दो भाषाओं के मध्य एक सेतु का निर्माण हो जाता है, जिससे दूसरी भाषा की लिपि नहीं जानने वाले लोग भी उस भाषा को समझ सकते हैं ।


== मशीनी लिप्यन्तरण की विधियाँ ==
== मशीनी लिप्यन्तरण की विधियाँ ==
* ) ध्वन्यात्मक प्रतिरूपण (फोनीनिक मैपिंग)
* 1) ध्वन्यात्मक प्रतिरूपण (फोनीनिक मैपिंग)
* ) शब्दकोश में शब्दयुग्म देखकर
* 2) शब्दकोश में शब्दयुग्म देखकर
* ) मशीन शिक्षण द्वारा (मशीन लर्निंग बेस्ड)
* 3) मशीन शिक्षण द्वारा (मशीन लर्निंग बेस्ड)
* ) नियमाधारित (रूल-बेस्ड)
* 4) नियमाधारित (रूल-बेस्ड)


== विभिन्न भारतीय भाषी लिप्यंतरण सेवाएँ ==
== विभिन्न भारतीय भाषी लिप्यन्तरण सेवाएँ ==
भारतीय भाषाऔं में लिप्यंतरण सेवा सर्वप्रथम लॅटिन कीबोर्ड से विभिन्न लिपियौं मे "ध्वन्यात्मक" कीकोड के रुप में विकास हुआ (उदाहरण "ka" दबाने पर "क" टाइप होना)। इस प्रकार के लिप्यंतरण का विकास भारतीय युनिकोड से पूर्व ही हो चुका था। यह विकास प्राथमिक रुप में लॅटिन कीबोर्ड से भारतीय ट्रेडिसनल फंट के सरल एण्ट्री के निमित्त विकसित हुआ था। भारतीय लिपियौं में अन्तर-लिप्यंतरण इस के बाद विकसित हुआ।
भारतीय भाषाऔं में लिप्यन्तरण सेवा सर्वप्रथम लॅटिन कीबोर्ड से विभिन्न लिपियौं मे "ध्वन्यात्मक" कीकोड के रूप में विकास हुआ (उदाहरण "ka" दबाने पर "क" टाइप होना)। इस प्रकार के लिप्यन्तरण का विकास भारतीय युनिकोड से पूर्व ही हो चुका था। यह विकास प्राथमिक रूप में लैटिन कीबोर्ड से भारतीय ट्रेडिसनल फॉण्ट के सरल एण्ट्री के निमित्त विकसित हुआ था। भारतीय लिपियौं में अन्तर-लिप्यन्तरण इस के बाद विकसित हुआ।


सर्वप्रथम भारतीय यान्त्रिक लिप्यन्तरण का विकास किस ने किया था, इस के बारे में आधिकारिक तथ्य उपलब्ध नहीं है। परन्तु अन्तरजाल के फैलाव व भारतीय युनिकोड के विकास के बाद भारतीय यान्त्रिक लिप्यन्तरण में एक प्रकार का उर्जा निर्माण कर दिया।
सर्वप्रथम भारतीय यान्त्रिक लिप्यन्तरण का विकास किस ने किया था, इस के बारे में आधिकारिक तथ्य उपलब्ध नहीं है। परन्तु अन्तरजाल के फैलाव व भारतीय युनिकोड के विकास के बाद भारतीय यान्त्रिक लिप्यन्तरण में एक प्रकार का उर्जा निर्माण कर दिया।
अन्तर-भारतीय भाषाऔं के मशीनी लिप्यंतरण में कन्नड-प्रमुख बरह सॉफ्टवॅर नें युनिकोड सहित विभिन्न ट्रेडिसनल फन्ट में यान्त्रिक लिप्यंतरण का सुबिधा उपलब्ध किया है। खुला स्रोत के [[आलोक कुमार]] द्वारा विभिन्न भारतीय भाषाओं के मध्य टैक्स्ट के लिप्यंतरण के लिए [[गिरगिट (लिप्यंतरण तन्त्र)|गिरगिट]] नाम से तंत्र बनाया गया था जो बहुत प्रसिद्ध रहा। इसके पश्चात पीयूष भट्ट जी द्वारा [[भोमियो]] नामक वेबसाइट बनायी गयी जो कि किसी वेबपेज के लिपि को रीयल टाइम में बदल कर दिखाता था। यह सेवा हिन्दी चिट्ठाकारों में काफी लोकप्रिय हुई। परन्तु कुछ समय बाद यह सेवा बन्द हो गई। इसके पश्चात आलोक कुमार तथा डॉ विपुल जैन ने [[गिरगिट का नयां संस्करण]] बनाया जो कि टैक्स्ट के अतिरिक्त वेबपेज की लिपि भी बदल कर दिखा सकता है। नवम्बर २००९ में [[गूगल]] ने भी विभिन्न भारतीय भाषाओं के मध्य [[गूगल लिपि परिवर्तक|लिप्यन्तरण सेवा]] का आरम्भ किया जिसमें कि कई लिपियाँ सम्मिलित हैं।
अन्तर-भारतीय भाषाओं के मशीनी लिप्यन्तरण में कन्नड-प्रमुख बरह सॉफ्टवॅर नें युनिकोड सहित विभिन्न ट्रेडिसनल फन्ट में यान्त्रिक लिप्यन्तरण का सुबिधा उपलब्ध किया है। खुला स्रोत के [[आलोक कुमार]] द्वारा विभिन्न भारतीय भाषाओं के मध्य टैक्स्ट के लिप्यंतरण के लिए [[गिरगिट (लिप्यंतरण तन्त्र)|गिरगिट]] नाम से तन्त्र बनाया गया था जो बहुत प्रसिद्ध रहा। इसके पश्चात पीयूष भट्ट जी द्वारा भोमियो नामक वेबसाइट बनायी गयी जो कि किसी वेबपेज के लिपि को रियल टाइम में बदल कर दिखाता था। यह सेवा हिन्दी चिट्ठाकारों में काफी लोकप्रिय हुई। परन्तु कुछ समय बाद यह सेवा बन्द हो गई। इसके पश्चात आलोक कुमार तथा डॉ विपुल जैन ने [[गिरगिट का नया संस्करण]] बनाया जो कि टैक्स्ट के अतिरिक्त वेबपेज की लिपि भी बदल कर दिखा सकता है। नवम्बर [[२००९|2009]] में [[गूगल]] ने भी विभिन्न भारतीय भाषाओं के मध्य [[गूगल लिपि परिवर्तक|लिप्यन्तरण सेवा]] का आरम्भ किया जिसमें कि कई लिपियाँ सम्मिलित हैं।


== बाहरी कड़ियाँ ==
== बाहरी कड़ियाँ ==
=== लेख ===
=== लेख ===
* [http://rcalvi.com/cu_archive/Transliteration/index.htm#why MACHINE TRANSLITERATION IN JAVA] - यहाँ देवनागरी सहित थाई, चीनी, जापानी, कोरियाई, रूसी आदि के लिप्यन्तरण (ट्रान्सक्रिप्शन) के बारे में विस्तृत विचार किया गया है और एक आनलाइन लिप्यन्तरण प्रोग्राम भी है।
* [https://web.archive.org/web/20101230153329/http://rcalvi.com/cu_archive/Transliteration/index.htm#why MACHINE TRANSLITERATION IN JAVA] - यहाँ देवनागरी सहित थाई, चीनी, जापानी, कोरियाई, रूसी आदि के लिप्यन्तरण (ट्रान्सक्रिप्शन) के बारे में विस्तृत विचार किया गया है और एक आनलाइन लिप्यन्तरण प्रोग्राम भी है।


=== लिप्यंतरण यन्त्र ===
=== लिप्यंतरण यन्त्र ===
* [http://www.ibiblio.org/sanskrit/tools/sanscript Sanskripta] - देवनागरी एवम् अन्य भारतीय भाषाओं का परस्पर लिप्यन्तरण का आनलाइन प्रोग्राम । यहाँ भारतीय भाषाओं और आईट्रन्स/हार्वर्ड-क्योटो आदि को भी परस्पर बदलने की सुविधा है।
* [https://web.archive.org/web/20100802083430/http://www.ibiblio.org/sanskrit/tools/sanscript Sanskripta] - देवनागरी एवं अन्य भारतीय भाषाओं का परस्पर लिप्यन्तरण का आनलाइन प्रोग्राम। यहाँ भारतीय भाषाओं और आईट्रन्स/हार्वर्ड-क्योटो आदि को भी परस्पर बदलने की सुविधा है।
* [http://devanaagarii.net/hi/girgit/ गिरगिट] - यूनिकोडित उड़िया, कन्नड़, गुजराती, गुरमुखी, तमिल, तेलुगु, बाङ्ग्ला या मलयालम का परस्पर लिपि परिवर्तक प्रोग्राम
* [https://web.archive.org/web/20100126012403/http://devanaagarii.net/hi/girgit/ गिरगिट] - यूनिकोडित उड़िया, कन्नड़, गुजराती, गुरमुखी, तमिल, तेलुगु, बांग्ला या मलयालम का परस्पर लिपि परिवर्तक प्रोग्राम
* [https://web.archive.org/web/20130323203825/http://sanskrit.jnu.ac.in/ile/index.jsp SCSS, JNU का Indian Language Transliterator]
* [http://minaret.info/test/transliterate.msp Unicode Transliteration Test Page]
* [https://web.archive.org/web/20100625021854/http://minaret.info/test/transliterate.msp Unicode Transliteration Test Page]
* [http://upodn.com/phun.asp Turn your text into fənɛ́tɪks (IPA / American)]
* [https://web.archive.org/web/20090830081950/http://upodn.com/phun.asp Turn your text into fənɛ́tɪks (IPA / American)]
* [https://addons.mozilla.org/en-US/firefox/addon/75925 NHM Indic Transliterator 1.0.10] - इस फायरफॉक्स एक्स्टेंशन के सहारे देवनागरी, तमिल, तेलुगू, मलयालम, कन्नड आदि लिपियों में लिखे किसी वेबसाइट को एक क्लिक में इनमें से ही किसी दूसरी लिपि में बदल कर देखा जा सकता है।
* [https://addons.mozilla.org/en-US/firefox/addon/75925 NHM Indic Transliterator 1.0.10]{{Dead link|date=जून 2020 |bot=InternetArchiveBot }} - इस फायरफॉक्स एक्स्टेंशन के सहारे देवनागरी, तमिल, तेलुगू, मलयालम, कन्नड आदि लिपियों में लिखे किसी वेबसाइट को एक क्लिक में इनमें से ही किसी दूसरी लिपि में बदल कर देखा जा सकता है।
*[http://padma.mozdev.org/index.html Padma: Transformer for Indic Scripts], [http://tidbits.co.in/blog/content/how-write-padma-conversion-file How to write a Padma conversion file?]
* [https://web.archive.org/web/20120413121130/http://padma.mozdev.org/index.html Padma: Transformer for Indic Scripts], [https://web.archive.org/web/20120410223448/http://tidbits.co.in/blog/content/how-write-padma-conversion-file How to write a Padma conversion file?]
* [http://scriptconv.googlelabs.com/ गूगल स्क्रिप्ट कन्वर्टर]
* [https://web.archive.org/web/20100804000235/http://www.sirppi.com/transliterate.php सिर्पी] - तमिल से विभिन्न लिपियौं में लिप्यन्तरण
* [http://bhomiyo.com भोमियो]
* [https://web.archive.org/web/20100412151347/http://rcalvi.com/cu_archive/Transliteration/demo.html जावा लिप्यंतरण] - यहाँ देवनागरी सहित थाई, चीनी, जापानी, कोरियाई, रूसी आदि के लिप्यन्तरण (ट्रान्सक्रिप्शन) सम्भव है। (फायरफॉक्स में नही चलता ; 27-04-2010)
* [http://girgit.chitthajagat.in/ गिरगिट का नया संस्करण]
* [https://web.archive.org/web/20150429035012/http://transliterations.info/CustomPage.aspx?node=317&link=236 IL Transliteration] (Many scripts)
* [http://www.baraha.com/ बरह]
* [http://www.sirppi.com/transliterate.php सिर्पी] - तमिल से विभिन्न लिपियौं में लिप्यन्तरण
* [http://rcalvi.com/cu_archive/Transliteration/demo.html जावा लिप्यंतरण] - यहाँ देवनागरी सहित थाई, चीनी, जापानी, कोरियाई, रूसी आदि के लिप्यन्तरण (ट्रान्सक्रिप्शन) सम्भव है। (फायरफॉक्स में नही चलता ; 27-04-2010)
* [http://www.transliterations.info/CustomPage.aspx?node=317&link=236 IL Transliteration] (Many scripts)


{{हिन्दी कम्प्यूटिंग}}
{{हिन्दी कम्प्यूटिंग}}



[[श्रेणी:भाषा]]
[[श्रेणी:भाषा]]
[[श्रेणी:संगणक]]
[[श्रेणी:कंप्यूटर]]
[[श्रेणी:हिन्दी कम्प्यूटिंग]]
[[श्रेणी:हिन्दी कम्प्यूटिंग]]
[[श्रेणी:लिप्यन्तरण]]
[[श्रेणी:लिप्यन्तरण]]

[[ar:نسخ آلي]]

03:28, 22 अप्रैल 2023 के समय का अवतरण

कम्प्यूटर सॉफ्टवेयर की सहायता से एक भाषा या लिपि के शब्दों का किसी दूसरी भाषा या लिपि में ध्वन्यात्मक (फोनेटिक) परिवर्तन मशीनी लिप्यन्तरण (मशीन ट्रान्सलिटरेशन) कहलाता है। John को देवनागरी/हिन्दी में जॉन लिखना लिप्यन्तरण का एक उदाहरण है।

  • कम्प्यूटर के इस युग में मशीनी अनुवाद के साथ-साथ मशीनी लिप्यन्तरण आजकल बहुत उपयोगी हो गया है। मशीनी अनुवाद करते समय जिन शब्दों के तुल्य शब्द मशीन के शब्दकोश में नहीं मिलते (Out of vocabulary words) उनको कुछ नियमों का पालन करते हुए केवल लिप्यन्तरित कर दिया जाता है। अधिकतर लिप्यन्तरण सेवाएँ वेब आधारित हैं।
  • नामवाचक संज्ञाओं (प्रॉपर नाउन्स) का लिप्यन्तरण ही करना पड़ता है। जैसे Mc Donald को मैक डोनाल्ड लिखना पड़ता है।
  • कुछ तकनीकी शब्दों का अनुवाद करने के बजाय उन्हें केवल लिप्यन्तरित करना बेहतर माना जाता है। जैसे transistor को ट्रान्जिस्टर लिखना अधिक उचित होगा न कि transistor लिखना।
  • भारतीय भाषाओं में अधिकांश शब्द समान हैं किन्तु भिन्न लिपि में लिखे होने के कारण उन्हें पढकर समझना/सीखना कठिन होता है। इनका केवल लिप्यन्तरण कर देने से दूसरी भारतीय भाषा समझने व सीखने में बहुत अधिक सुविधा मिल जाती है।
  • लिप्यंतरण से दो भाषाओं के मध्य एक सेतु का निर्माण हो जाता है, जिससे दूसरी भाषा की लिपि नहीं जानने वाले लोग भी उस भाषा को समझ सकते हैं ।

मशीनी लिप्यन्तरण की विधियाँ

[संपादित करें]
  • 1) ध्वन्यात्मक प्रतिरूपण (फोनीनिक मैपिंग)
  • 2) शब्दकोश में शब्दयुग्म देखकर
  • 3) मशीन शिक्षण द्वारा (मशीन लर्निंग बेस्ड)
  • 4) नियमाधारित (रूल-बेस्ड)

विभिन्न भारतीय भाषी लिप्यन्तरण सेवाएँ

[संपादित करें]

भारतीय भाषाऔं में लिप्यन्तरण सेवा सर्वप्रथम लॅटिन कीबोर्ड से विभिन्न लिपियौं मे "ध्वन्यात्मक" कीकोड के रूप में विकास हुआ (उदाहरण "ka" दबाने पर "क" टाइप होना)। इस प्रकार के लिप्यन्तरण का विकास भारतीय युनिकोड से पूर्व ही हो चुका था। यह विकास प्राथमिक रूप में लैटिन कीबोर्ड से भारतीय ट्रेडिसनल फॉण्ट के सरल एण्ट्री के निमित्त विकसित हुआ था। भारतीय लिपियौं में अन्तर-लिप्यन्तरण इस के बाद विकसित हुआ।

सर्वप्रथम भारतीय यान्त्रिक लिप्यन्तरण का विकास किस ने किया था, इस के बारे में आधिकारिक तथ्य उपलब्ध नहीं है। परन्तु अन्तरजाल के फैलाव व भारतीय युनिकोड के विकास के बाद भारतीय यान्त्रिक लिप्यन्तरण में एक प्रकार का उर्जा निर्माण कर दिया।

अन्तर-भारतीय भाषाओं के मशीनी लिप्यन्तरण में कन्नड-प्रमुख बरह सॉफ्टवॅर नें युनिकोड सहित विभिन्न ट्रेडिसनल फन्ट में यान्त्रिक लिप्यन्तरण का सुबिधा उपलब्ध किया है। खुला स्रोत के आलोक कुमार द्वारा विभिन्न भारतीय भाषाओं के मध्य टैक्स्ट के लिप्यंतरण के लिए गिरगिट नाम से तन्त्र बनाया गया था जो बहुत प्रसिद्ध रहा। इसके पश्चात पीयूष भट्ट जी द्वारा भोमियो नामक वेबसाइट बनायी गयी जो कि किसी वेबपेज के लिपि को रियल टाइम में बदल कर दिखाता था। यह सेवा हिन्दी चिट्ठाकारों में काफी लोकप्रिय हुई। परन्तु कुछ समय बाद यह सेवा बन्द हो गई। इसके पश्चात आलोक कुमार तथा डॉ विपुल जैन ने गिरगिट का नया संस्करण बनाया जो कि टैक्स्ट के अतिरिक्त वेबपेज की लिपि भी बदल कर दिखा सकता है। नवम्बर 2009 में गूगल ने भी विभिन्न भारतीय भाषाओं के मध्य लिप्यन्तरण सेवा का आरम्भ किया जिसमें कि कई लिपियाँ सम्मिलित हैं।

बाहरी कड़ियाँ

[संपादित करें]
  • MACHINE TRANSLITERATION IN JAVA - यहाँ देवनागरी सहित थाई, चीनी, जापानी, कोरियाई, रूसी आदि के लिप्यन्तरण (ट्रान्सक्रिप्शन) के बारे में विस्तृत विचार किया गया है और एक आनलाइन लिप्यन्तरण प्रोग्राम भी है।

लिप्यंतरण यन्त्र

[संपादित करें]
  • Sanskripta - देवनागरी एवं अन्य भारतीय भाषाओं का परस्पर लिप्यन्तरण का आनलाइन प्रोग्राम। यहाँ भारतीय भाषाओं और आईट्रन्स/हार्वर्ड-क्योटो आदि को भी परस्पर बदलने की सुविधा है।
  • गिरगिट - यूनिकोडित उड़िया, कन्नड़, गुजराती, गुरमुखी, तमिल, तेलुगु, बांग्ला या मलयालम का परस्पर लिपि परिवर्तक प्रोग्राम
  • SCSS, JNU का Indian Language Transliterator
  • Unicode Transliteration Test Page
  • Turn your text into fənɛ́tɪks (IPA / American)
  • NHM Indic Transliterator 1.0.10[मृत कड़ियाँ] - इस फायरफॉक्स एक्स्टेंशन के सहारे देवनागरी, तमिल, तेलुगू, मलयालम, कन्नड आदि लिपियों में लिखे किसी वेबसाइट को एक क्लिक में इनमें से ही किसी दूसरी लिपि में बदल कर देखा जा सकता है।
  • Padma: Transformer for Indic Scripts, How to write a Padma conversion file?
  • सिर्पी - तमिल से विभिन्न लिपियौं में लिप्यन्तरण
  • जावा लिप्यंतरण - यहाँ देवनागरी सहित थाई, चीनी, जापानी, कोरियाई, रूसी आदि के लिप्यन्तरण (ट्रान्सक्रिप्शन) सम्भव है। (फायरफॉक्स में नही चलता ; 27-04-2010)
  • IL Transliteration (Many scripts)