Spoken Tutorial Technology/Dubbing a spoken tutorial using Audacity and ffmpeg/Hindi
नमस्कार दोस्तों । इस मौखिक ट्यूटोरियल में आपका स्वागत है । हम देखेंगे के लिनक्स ऑपरेटिंग सिस्टम में किस तरह से एक भाषा से दूसरी भाषा में डब करे । इसके लिए आपको केवल एक हेडसेट अथवा माइक और स्पीकर्स की आवश्यकता होगी जिसे कंप्यूटर से जोड़ा जा सके ।
ऑडैसिटी ध्वनियों को रिकॉर्ड तथा एडिट याने संपादन करने के लिए एक फ्री और ओपन सोर्स सॉफ्टवेयर है । यह Mac OS X , माइक्रोसॉफ्ट विन्डोज़ , GNU/Linux तथा अन्य ऑपरेटिंग सिस्टम के लिए उपलब्ध है । आप इसे निःशुल्क इस साइट से डाउनलोड कर सकते हैं http://audacity.sourceforge.net/download/ ।
मैं उबंटू 10.04 संस्करण वाले ऑपरेटिंग सिस्टम का इस्तेमाल कर रही हूँ । मैंने पहले से ही ऑडैसिटी 1.3 संस्करण डाउनलोड किया है तथा इसे सिनैप्टिक पॅकेज मैनेजर द्वारा अपने PC में इंस्टाल याने स्थापित किया है । सॉफ्टवेयर को उबंटू लीनक्स में कैसे इंस्टाल करे इस पर ज्यादा जानकारी के लिए , इस वेबसाइट पर मौजूद उबंटू के स्पोकन ट्यूटोरियल्स को देखे ।
सबसे पहली चीज़ जो आपको करनी है वह है के मूल याने ओरिजिनल विडियो को सुने । फिर स्क्रिप्ट को इस तरह से अनुवाद करे के हर एक वाक्य का नर्रेशन टाइम वही हो या उससे कम जो मूल स्क्रिप्ट में उस वाक्य के लिए है । अगर ये आप हर एक वाक्य के लिए नहीं कर सकते तो ऐसा दो वाक्यों के संयोजन के लिए भी कर सकते है । याने के पहले वाक्य के अंत में अगर कोई बेमेल है , तो सिंक दूसरा वाक्य पूरी होने पर सही हो जाए । यह भी संभव है के कुछ शब्द या वाक्य ओरिजिनल में से छोड़ दे लेकिन हाँ उसका मतलब ना बदले । कृपया इस गतिविधि पर पर्याप्त समय बिताए ।
अब हम ऑडैसिटी को ओपन करते है । Applications(एप्लीकेशंस) पर क्लिक करे , फिर Sound&Video (साउंड एंड विडियो) , फिर Audacity(ऑडैसिटी) को रन करने के लिए उसे चुने ।
यह आपके स्क्रीन पर एक एम्प्टी प्रोजेक्ट ओपन करेगा । मेनू बार पर आप कई विकल्प याने ऑप्शंस देख सकते है जैसे के file (फाइल), edit (एडिट) , view (व्यू), transport (ट्रांसपोर्ट), tracks (ट्रैक्स) इत्यादि । हम इनमें से कुछ के बारे में सिखेंगे । मेन मेनू में आप VCR कंट्रोल्स देख सकते है – Pause (पॉज़), Play (प्ले) , Stop (स्टॉप) , Rewind (रिवाइंड) , Forward (फॉरवर्ड), Record (रिकॉर्ड)।
इसके बाद , Audio tools toolbar है , इसमें selection (सिलेक्शन) टूल तथा Time shift (टाइम शिफ्ट) टूल है जिनका हम इस ट्यूटोरियल में प्रयोग करेंगे । डिफॉल्ट रूप से selection tool सक्रिय याने के एक्टिव होता है ।
अब एक डबिंग करते है । मैं साइलैब पर एक ट्यूटोरियल है मैट्रिक्स ऑपरेशन जोकि इंग्लिश में है उसे प्ले करुँगी ।
और मुझे ऑडैसिटी के इस्तेमाल से हिंदी में डब करना है । मैंने पहले ही इसका अनुवाद किया है और समय को नोट किया है जैसे के पहले उल्लेख किया था । अब मैं यहाँ रिकॉर्ड करने वाली हूँ । रिकॉर्ड करने के लिए , Record बटन पर क्लिक करे और नरेशन को शुरू करे । (साइलैब के इस्तेमाल से मैट्रिक्स ऑपरेशन के इस ट्यूटोरियल में आप सबका स्वागत है । इस ट्यूटोरियल के अभ्यास के लिए आपके सिस्टम में साइलैब का संस्थापन होना आवश्यक है )
रिकॉर्डिंग को रोकने के लिए Stop बटन पर क्लिक करे ।
Audio timeline (ऑडियो टाइमलाइन) पर दो स्टीरियो ट्रैक्स है जहाँ स्पाइक या वेवफोरम्स में नैरेशन दिखाई देते है । स्टीरियो ट्रैक्स में बाई ओर एक सिंगल लेबल एरिया है तथा दाए तरफ दो वेवफोरम्स है जोकि दो इनपुट चैनल्स है – लेफ्ट चैनल तथा राइट चैनल ।
एक बार में ही रिकॉर्ड करे तो फिर आपको एक सिंगल ऑडियो ट्रैक मिलेगा । ध्यान दे के इस केस में वाक्यों के बीच एक सेकंड के लिए रुके ।
अब हर वाक्य की शुरुआत में क्लिप को छोटे क्लिप्स में विभाजित करे याने स्प्लिट करे । ऑडियो ट्रैक्स को छोटे क्लिप्स में विभाजित करने के लिए CTRL+I शोर्टकट है । मैं यहाँ ऑडियो स्प्लिट करुँगी ।
क्लिप को ट्रैक पर स्लाइड करे याने ले आए , उस वाक्य के टाइमिंग को मैच करने के लिए जो हमने पहले नोट किया था । time shift tool को चुने । देखिए के कर्सर में दोनों तरफ एरो है । मैं इस टाइम पर क्लिप को लती हूँ ।
ध्यान दे के आपको विपरीत दिशा में जाना है । याने के आखरी क्लिप से शुरू करके पहले पर आना है । ऐसा इसलिए क्योंकि जब तक आप जगह नहीं बनाएँगे , पिछली क्लिप अपनी जगह से नहीं हट सकती ।
अगले पंक्ति के नरेशन को शुरू करने के लिए , टाइमलाइन के किसी भी एक चैनल पर क्लिक करे । अब शुरू करने के लिए रिकॉर्ड बटन पर क्लिक करे । ( साइलैब कंसोल विंडो खोलिए ) ये दूसरा नैरेशन एक और स्टीरियो ट्रैक में आएगा । उसी तरह आप अलग अलग नैरेशन रिकॉर्ड कर सकते है जो अलग अलग ट्रैक्स में दिखाई देंगे ।
अब हम देखेंगे के कैसे इन नैरेशंस को जोड़े याने मर्ज करे या तो इन्हें एक सिंगल ट्रैक पर कैसे लाए । time shift tool को चुने । ऑडियो क्लिप पर राइट क्लिक करके उसे चुने और उसे पहली ऑडियो ट्रैक के अंत में ले आए याने ड्रैग एंड ड्रॉप करे । इसी तरह सभी क्लिप्स के लिए करे ।
लेबल एरिया में X बटन पर क्लिक करके हम एक ऑडियो ट्रैक को हटा सकते है । मैं दूसरे ऑडियो ट्रैक को हटाती हूँ जोकि अभी खाली है ।
क्लिप्स को पहली ट्रैक पर स्लाइड करते वक्त ध्यान रखे के क्लिप का बिगिन टाइम याने शुरुआती समय उसी वाक्य के बिगिन टाइम से मैच हो जैसे के पहले नोट किया था ।
एक बार जब वाक्यों के शुरुआत को उसके समय के मुताबिक सिंगक्रनाइज़ याने समकालिक किया हो , हम अपना प्रोजेक्ट सेव कर सकते है । ऐसा करने के लिए , file menu में जाए और save project as पर क्लिक करे ।
एक डाइअलॉग बॉक्स ओपन होगा । ok पर क्लिक करे । अब ये एक फाइल नेम के लिए पूछेगा । मैं यह फाइल नेम दे रही हूँ hindi _matrix operation .
अगला यह स्थान के लिए पूछेगा जहाँ इसे सेव करना है । मैं डेस्कटॉप चुनूंगी और सेव पर क्लिक करुँगी । यह प्रोजेक्ट को .aup ( डॉट aup) से सेव करेगा ।
अंत में जो ऑडियो फॉर्मेट चाहिए उसमें फ़ाइनल प्रोजेक्ट को एक्सपोर्ट करे जैसे के wav, mp3 इत्यादि । ऐसा करने के लिए मेनू बार पर जाए , file पर क्लिक करे । Export ऑप्शन चुने , उस पर क्लिक करे । यह एक फाइल नेम के लिए पूछेगा । मैं यह नाम दूंगी scilab_hindi _matrix_operation.
साथ ही जहाँ सेव करना है वह स्थान भी दे । फिर जिस फॉर्मेट में सेव करना है उसे चुने । मैं ogg फॉर्मेट पर क्लिक करुँगी , फिर सेव पर क्लिक करती हूँ ।
अब आपको Edit Metadata नामक एक बॉक्स मिलेगा । यहाँ आप आर्टिस्ट का नाम दे सकते है और अन्य जानकारी भी । अब ok पर क्लिक करे । फिर से ok पर क्लिक करे ।यह आपकी फ़ाइनल ऑडियो फाइल बनाएगा ।
ffmpeg एक ओपन सोर्स ऑडियो तथा विडियो कनवर्टर है जो अधिकांश मानक कोडेक्स का समर्थन करता है । यह जल्द ही और काफी आसानी से एक फाइल फॉर्मेट से दूसरे में कन्वर्ट कर सकता है याने बदल सकता है । http://ffmpeg.org/ से ffmpeg के लिए सोर्स कोड डाउनलोड कर सकते है ।
डाउनलोड पर क्लिक करे । नीचे स्क्रोल करे और उपयुक्त वाले को चुने ।
लीनक्स में पैकज को कैसे इंस्टाल करे इसे सिखने के लिए , इस वेबसाइट पर उपलब्ध उबंटू के स्पोकन ट्यूटोरियल्स को देखे ।
जब आपने ffmpeg को डाउनलोड तथा इंस्टाल कर लिए हो , आप सरल कमांड्स द्वारा विडियो या ऑडियो को एक मीडिया फाइल से अलग कर सकते है या ऑडियो तथा विडियो को दो अलग मीडिया फाइल्स से एक फाइल में जोड़ सकते है ।
चलिए टर्मिनल विंडो पर चलते है ।
मैं pwd टाइप करके एन्टर प्रेस करती हूँ । यह हमारी प्रेसेंट वर्किंग डाइरेक्टरी बताता है । एन्टर प्रेस करे । ls कमांड प्रेसेंट डाइरेक्टरी की सभी फाइल्स तथा फोल्डर्स दिखाता है । मैं इसे डेस्कटॉप डाइरेक्टरी (Desktop directory) में बदलती हूँ और टेस्ट(Test) । CTRL+L टर्मिनल स्क्रीन को क्लिअर करने के लिए । ls इस डाइरेक्टरी की फाइल्स दिखाने के लिए ।
अब मैं यह कमांड टर्मिनल में टाइप करती हूँ ffmpeg -i compiling.wmv TEST0.ogv
-i स्विच ffmpeg से कहता है के इसके बाद तुरंत जो फाइल है वह इनपुट फाइल है । यहाँ compiling.wmv इनपुट फाइल है ।
अगर -i ऑप्शन को छोड़ देते है तो ffmpeg उस फाइल को ओवरराइट करता है जब वह आउटपुट फाइल बनाने की कोशिश करता है । ffmpeg आउटपुट फाइल के एक्सटेंशन के प्रयोग से इस्तेमाल के लिए फॉर्मेट तथा कोडेक को तय करता है । लेकिन ऐसा हम कमांड लाइन परैमीटर्स के इस्तेमाल से भी कर सकते है । इनमें से कुछ को हम देखेंगे । यह कमांड विडियो को एक फॉर्मेट से दूसरे में बदलने के लिए उपयोगी है ।
इस कमांड को निष्पादित करने के लिए एन्टर प्रेस करे । इसे छोड़ देते है और आगे बढ़ते है ।
टर्मिनल विंडो में ffmpeg कमांड का इस्तेमाल करके मूल याने ओरिजिनल स्पोकन ट्यूटोरियल से विडियो अवयव याने विडियो कॉम्पोनेन्ट अलग कर सकते है ।
ऐसा करने है लिए टर्मिनल विंडो में यह कमांड टाइप करे - ffmpeg -i functions.ogv -an -vcodec copy TEST1.ogv
'-an' स्विच स्वचालित रूप से आउटपुट से ऑडियो हटा देता है तथा सिर्फ विडियो कॉम्पोनेन्ट को रखता है ।
TEST1.ogv आउटपुट फाइल है । एन्टर प्रेस करे । अब हमने विडियो कॉम्पोनेन्ट को अलग किया है याने विडियो में अब ओरिजिनल ऑडियो नहीं है ।
चलिए Test फोल्डर को ओपन करते है ।
Test1.ogv यहाँ है । मैं इस फाइल को प्ले करती हूँ ।
मैं टर्मिनल स्क्रीन को फिर से क्लिअर करती हूँ । अब कमांड टाइप करते है
ffmpeg -i functions_hindi.ogv -vn -acodec copy TEST2.ogg
-vn स्विच आउटपुट में से विडियो को हटा देता है और सिर्फ ऑडियो कॉम्पोनेन्ट रखता है । इस कमांड को निष्पादित करने के लिए एन्टर प्रेस करे ।
अब हमने ऑडियो अलग किया है याने के आउटपुट में अब ओरिजिनल विडियो नहीं है । अभी उसे चेक करते है । Test directory को फिर से ओपन करते है । TEST2.ogg यहाँ है । इसे प्ले करते है । ठीक है । मैं इसे क्लोज़ करती हूँ । टर्मिनल विंडो पर वापस चलते है । CTRL+L प्रेस करके स्क्रीन को क्लिअर करते है ।
अब देखते है किस तरह से ओरिजिनल ट्यूटोरियल के विडियो के साथ सेव की हुई ऑडियो मर्ज कर सकते है ।
टर्मिनल में टाइप करते है
ffmpeg -i TEST1.ogv -i TEST2.ogg -acodec libvorbis -vcodec copy FINAL.ogv
एन्टर प्रेस करे ।
यह एन्कोड कर रहा है । टर्मिनल को क्लिअर करते है । मैं Test directory को ओपन करती हूँ । यहाँ FINAL.ogv है जो हमने सेव की थी । चलिए अब इस फाइल को प्ले करते है ।
हम ओरिजिनल स्पोकन ट्यूटोरियल के मौजूदा ऑडियो की जगह डब की हुई ऑडियो को इन एडिटिंग पैकेजस के इस्तेमाल से ला सकते है जैसे के KdenLive, Kino, LiVES ।
हमारे डब्बिंग सहयोगियों के लिए चीज़े सरल बनाने के लिए , हम Python में एक GUI एप्लीकेशन बनाने की प्रक्रिया में है , जोकि ऊपर दिए सारे ffmpeg कमांड्स को निष्पादित करता है । उन्हें ब्राउज़ करके इनपुट फाइल को चुनना है , आउटपुट फाइल का नाम देना है तथा गतिविधि को चुनना है । सूचीबद्ध गतिविधियां है Extract Audio, Extract Video तथा Merge .
एप्लीकेशन तथा इसके लिए स्पोकन ट्यूटोरियल जल्द ही वेबसाइट पर उपलब्ध होगा ।
अभी के लिए बस इतना ही । चलिए इस ट्यूटोरियल को संक्षिप्त में बताते है । सिनैप्टिक पॅकेज मैनेजर से ऑडैसिटी को इंस्टाल करे । ओरिजिनल ट्यूटोरियल को सुने तथा हर एक वाक्य का शुरूआती समय याने बिगिन टाइम नोट करे । ऑडैसिटी ओपन करे । नरेशन शुरू करे और ध्यान रखे के वाक्यों के बीच उपयुक्त पॉज़ हो । एक बार में ही रिकॉर्ड करे । ऑडियो को वाक्यों में स्प्लिट करे । आखिर से शुरू करते हुए नोट किये टाइमिंग को मैच करने के लिए क्लिप्स को स्लाइड करे । जब यह हो जाये ऑडियो को ogg फॉर्मेट में सेव करे । ffmpeg कमांड्स के इस्तेमाल से ओरिजिनल ट्यूटोरियल से विडियो को अलग करे । डब की गयी ऑडियो तथा अलग किये विडियो को मर्ज करे याने जोड़े ताकि डब्बड ट्यूटोरियल बने ।
स्पोकन ट्यूटोरियल टॉक टू अ टीचर प्रोजेक्ट का हिस्सा है । और जो www.spoken-tutorial.org द्वारा समन्वित है तथा आई आई बॉम्बे द्वारा विकसित किया है । ICT के माध्यम से राष्ट्रीय साक्षरता मिशन द्वारा इस काम के लिए निधिकरण आता है जोकि MHRD , Government of India द्वारा शुरू किया था । अधिक जानकारी इस लिंक पर उपलब्ध है , http://spoken-tutorial.org/NMEICT-Intro. आई आई टी बाम्बे की तरफ से मैं सकीना शेख आपसे विदा लेती हूँ । इस ट्यूटोरियल में शामिल होने के लिए धन्यवाद ।