यूनीकोड से फोनीकोड : श्रुति क्रांति की ओर

25 Nov, 2016 . 1 min read

भारतीय भाषाएँ ध्वन्यात्मक (Phonetic) हैं। सभी भारतीय भाषाओं के लिये वर्णक्रम साम्य आई एस सी आई आई (ISCII) राष्ट्रीय कोड बनाया गया है। इस 8 बिट कोड में अंग्रेजी और एक भारतीय भाषा समाहित थी और भाषा बदल ए एल टी (ALT) कुँजी से लगभग 15 बड़ी आईटी कंपनियों के संयुक्त प्रयास से विश्व भाषाओं के लिये 16 बिट यूनीकोड कोड बनाया गया। इसमें भाषा बदल की जरूरत ही नहीं है। लेकिन यह लिपि पर आधारित है, जो-जो रूपिम आकृतियाँ अलग से प्रयोग में आती हैं उन्हें कोड में जगह दी गई है। 1991 में 9 कंपनियों ने यूनीकोड कंसोर्शियम बनाया। इसमें 2009 में 11 पूर्ण सदस्य, 4 संस्थागत, 27 एसोशिएट सदस्य हैं। भारत सरकार का सूचना प्रौद्योगिकी विभाग 2000 में सदस्य बना।

यूनीकोड (UNICODE) में इंटरनेशनल फोनेटिक एल्फाबेट (IPA) के संप्रतीक अलग-अलग पेजों में है, किसी विशेष क्रम में नहीं है। पर्याप्त भी नहीं है। इसलिये प्रस्तावित है फोनीकोड। इसकी मूल प्रेरणा ध्वन्यात्मक नागरी लिपि से मिली। ‘‘जैसा सुनो वैसा लिखो’’, ‘‘जैसा लिखा वैसा बोला’’ सिद्धांत नागरी लेखन में है। ध्वनि उच्चारण में उच्चारण का स्थान और उच्चारण की विधि मुख्य है। उच्चारण के स्थान (P) के अनुसार कंठ्य, तालव्य, मूर्धन्य, दंत्य, ओष्ठ्य 5 ध्वनि प्रकार माने गए हैं उच्चारण की विधि (Manner of articulation) (M) के अनुसार गले से वायु और विवर फैलाव के कम-अधिक होने के आधार पर अथवा नाक से वायु-नि:सरण के अनुसार 6 ध्वनि प्रकार माने गए- [(अल्प प्राण - अघोष) / (अप्र - अघ)], [(महाप्राण - अघोष) / (मप्र - अघ)], [(अल्पप्राण - घोष) / (अप्र - घ)], [(महाप्राण - घोष) / (मप्र - घ)], नासिक्य, अलिजिह्वा। इन ध्वनियों को व्यंजन कहा गया। व्यंजनों को स्वर ध्वनियों से मोड्युलेट कर सकते हैं। उच्चारण स्थान के आधार पर 5 प्रकार की स्वर ध्वनियाँ हैं। स्वर ध्वनियाँ हस्व, दीर्घ हो सकती हैं। स्वर ध्वनियाँ परस्पर योग से व्युत्पन्न स्वर ध्वनियाँ 4+4 बनेंगी। ‘अ’ की स्वर ध्वनि को आदि स्वर और ‘उ’ की स्वर ध्वनि को मध्य स्वर और ‘म’ की व्यंजन ध्वनि को व्यंजनांत माने तो (अ - उ - म) ध्वनि संयोज सभी ध्वनियों का द्योतक है, अथगत होने पर सभी संकल्पनाओं (Concepts) का।

पाणिनी ने स्वर और व्यंजन समूहों को उच्चारण स्थान और विधि के अनुसार अलग-अलग वर्गीकृत किया है। ध्वन्यात्मक नागरी वर्णमाला को पाणिनी सारणी (Panini Table) में दिखा सकते हैं। जिस प्रकार रसायन विज्ञान में मेंडलीफ टेबल परमाणु क्रम को दर्शाती है जिससे रासायनिक यौगिक क्रियाओं को समझना आसान होता है, उसी प्रकार ध्वनि यौगिकों को पाणिनी टेबल से समझना आसान होगा। वर्गीकरण से अन्य संभावित ध्वनियों को जोड़ना भी आसान है।

व्यंजन के तीन उच्चारण भेद मान लें जिनमें अंतर समझना मानव कानों से ही संभव हैं। इसी प्रकार मूल स्वर और व्युत्पन्न स्वर (ए, ओ) के तीन उच्चारण भेद अल्प, ह्स्व, दीर्घ मान सकते हैं, इन्हें सुनकर अंतर समझ सकते हैं। संयुक्त ‘स्वर + अ’ व्युत्पन्न ध्वनियाँ व्यंजन की भाँति हैं। इस प्रकार पहचाने जाने वाली स्वनिम/अक्षर ध्वनियों को नागरी लिपि के रूपिमों से प्रदर्शित कर सकते हैं।

अल्प नासिक्य ध्वनि को अनुस्वार 0^. का रूपिम और अल्प

अलिजिह्वा ध्वनि को विसर्ग 0^. का रूपिम दिया गया है। इन्हें स्वर श्रेणी में रखा गया है। स्वनिम - रूपिम का 1:1 (एक प्रति एक) निरूपण नागरी लिपि की विशेषता है। स्वर-स्वर, व्यंजन-स्वर, व्यंजन-व्यंजन - स्वरं संयोजन से जो स्वतंत्र ध्वनियाँ व्युत्पन्न होती हैं, उन्हें अक्षर कहते हैं। अक्षर का अंत किसी स्वर से होता है। यह स्वर तीन रूपों में हो सकता है- स्वर, स्वर-अनुस्वार, स्वर-विसर्ग। हलन्त को व्यंजन के साथ स्वरहीन योग मान सकते हैं। अक्षरांत को नए रूपिम मात्रा से दिखाते हैं। व्यंजन को हलन्त के साथ दिखाते हैं, जैसे- क्, ग् च् ..... म्.... ह्..... इन्हें शुद्ध व्यंजन भी कह सकते हैं।

वर्ण =
अक्षर =
A* = व्‍पुनरावृत्ति दर्शाता है
स्‍वर =
अकारांत व्‍यंजन =
संयुक्‍ताक्षर =
स्‍वरांत/मात्रा =
(ह्रस्‍व) मूल स्‍वर =
अल्‍प स्‍वर =
दीर्घ स्‍वर =
व्‍युत्‍पन्‍न स्‍वर = ........

ध्वनियों को और गहराई से भेद करके निरूपण हेतु अलग-अलग रूपिम संप्रतीक भी दिये जा सकते हैं। संस्कृत में यह भेद किया जाता है, जिससे उच्चारण शुद्ध रहे।

इन ध्वनियों को कोडित करने के लिये व्यंजनों के लिये
(25+4+4) × 3 = 87 = 90 कोड प्वाइंट
स्वरों के लिये
(5+1) × 3+2 = 20 कोड प्वाइंट

कोडन सुविधा एवं व्यावहारिकता की दृष्टि से व्यंजन भेद दो प्रकार के ही होते हैं, तो
(व्यंजन-स्वर) अक्षर = (20×2) × 20 = 1160

(द्वि व्यंजन-स्वर) अक्षर = 2×[(29×29)×20] = 33640
इनमें से लगभग 10 प्रतिशत अर्थात 3400 व्यावहारिक होंगे।
(त्रि व्यंजन-स्वर) अक्षर = (29×29×29)×20 = 487780
इनमें से लगभग 0.1 प्रतिशत अर्थात 500 व्यावहारिक होंगे = 500

इस प्रकार 1160+90+20 = 1270 सामान्य अक्षर 3400+500 = 3900 संयुक्ताक्षर ध्वनियों और लगभग 500 भावात्मक (Emotional) विशिष्ट ध्वनियों को भी फोनीकोड में कोडित कर सकते हैं। विशिष्ट संप्रतीकों को फोनीकोड में देख सकते हैं। फोनीकोड से यूनीकोड में परिवर्तित कर टैक्स्ट प्रिंट कर सकते हैं। स्पीच टू टैक्स्ट। यूनीकोड से फोनीकोड में परिवर्तित करके टैक्स्ट से स्पीच तैयार कर सकते हैं। फोनीकोड के हर कोड प्वाइंड के लिये स्पीच वेब फार्म संग्रहीत रहेगी। इस प्रकार नेचुरल (स्वाभाविक) स्पीच बनाने में आसानी होगी। स्वर विज्ञानी, भाषाविद और कम्प्यूटर स्पीच विशेषज्ञ की टीम फोनीकोड का मानक तैयार कर सकते हैं। भारतीय भाषाओं के लिये यह बहुत उपयोगी और आसान होगा।

स्पीच से स्पीच अनुवाद में फोनीकोड का प्रयोग उपयोगी होगा। फोनीकोड से यूनीकोड में बिना कन्वर्ट किए भी कंटेट स्टोर कर सकते हैं, इसमें मेमोरी भी कम लगेगी। 16-बिट कोड सभी भाषाओं के लिये उपयुक्त होगा। अक्षर (Syllable) कोडन होने से मेमोरी की आवश्यकता अनुमानत: एक तिहाई हो जाएगी। प्रोसेसिंग स्पीड भी बढ़ जाएगी। 19वीं सदी में औद्योगिक क्रांति में मशीनीकरण से उत्पादकता बढ़ी। 1930 के दशक से इलेक्ट्रॉनिक संचार और 1940 के दशक से कम्प्यूटर के आविष्कार से सूचना क्रांति का सूत्रपात हुआ। मानव-मशीन के बीच संवाद मुख्यत: की-बोर्ड के माध्यम से होता रहा है।

दो दशकों से प्रयास किए जा रहे हैं कि मानव-बोल मशीन समझ ले। यूनीकोड से विश्वभाषाओं को एक साथ रखा जा सका। फोनीकोड से मशीन मानव-बोल समझ सकेगी और मानव जैसा बोल सकेगी। इस प्रकार श्रुति क्रांति का आरंभ होगा।

Path Alias

/articles/yauunaikaoda-sae-phaonaikaoda-sarautai-karaantai-kai-ora

Post By: Hindi

Topic

Regions

उत्तर प्रदेश

प्रयागराज जिला