speech recognition - डेवलपर्स के लिए आवाज पहचान सॉफ्टवेयर




speech-recognition voice (11)

वैसे डॉक्स ने आखिरकार कहा, मुझे कुछ महीनों के लिए मेरी कलाई पर इसे आसान करना होगा। ऐसा होने के नाते कि मैं एक। NET डेवलपर हूं, यह मेरी आजीविका थोड़ी देर के लिए खत्म कर सकता है, कुछ ऐसा करने के लिए मुझे चिंता नहीं है उस ने कहा, क्या डेवलपर्स के लिए कोई अच्छे हैंड्सफ्री विकल्प हैं? किसी को भी वहाँ से बाहर किसी भी भाषण मान्यता सॉफ्टवेयर का उपयोग करने की सफलता मिली?

पोस्टस्क्रिप्ट: मैंने फिर से अपना हाथ पुनः प्राप्त कर लिया है जहां दो-हाथ की प्रोग्रामिंग समस्या नहीं है। ड्रैगन ने स्वाभाविक रूप से अच्छी तरह से काम किया, लेकिन धीमी गति से, कुंजीपटल की तरह नहीं, जहां मैं सोच रहा था की तुलना में तेजी से प्रोग्रामिंग कर रहा था।


एक और विचार है कि एक और अच्छा डेवलपर को इस कार्यक्रम के साथ जोड़ा जाए। यह मेरे लिए वास्तव में अच्छी तरह से काम किया मैं अपने हाथों को जरूरी धीमा करने के बिना आराम कर देता हूं, बेहतर गुणवत्ता वाले कोड का उत्पादन समाप्त करता हूं - या कम से कम इसकी समीक्षा करने के लिए नहीं।


कलाई के मुद्दे के रूप में, मैंने 10 साल पहले दोनों हाथों से माउस का प्रयोग किया।

यह आश्चर्यजनक रूप से आसान है, और काफी तनाव से राहत देता है। वर्तमान में, मैं एक लैपटॉप का उपयोग कर रहा हूं और टचपैड बटन दबाकर मेरे अंगूठे पर दबाव डाल रहा हूं।

सावधान रहे। ये समस्याएं एक से अधिक समय तक सोच सकती हैं।

ps आप एक टैग 'एर्गोनॉमिक्स' या कुछ जोड़ सकते हैं - शीर्षक को आवाज मान्यता के लिए विकसित करने के बारे में देखा जा सकता है


मुझे पता है कि मैं यहाँ थोड़ी दूर हूँ, और आवाज मान्यता सॉफ्टवेयर के बारे में कुछ नहीं पता; हालांकि, आपको अपने कीबोर्ड को डीवोरक लेआउट में बदलने की जांच करना उपयोगी हो सकता है, जिसे मैंने सुना है कलाई पर बहुत दयालु है

http://en.wikipedia.org/wiki/Dvorak_Simplified_Keyboard


मैंने कुछ साल पहले ड्रैगन की कोशिश की थी और यह मशगूल शब्दों और वाक्यांशों का एक दुःस्वप्न था - अनुशंसित नहीं। मैं समझता हूं कि उस समय में सबसे अच्छी बात यह थी कि मैं आशावादी न हो

एक साथी पीड़ित के रूप में, सिफारिशें होगी:

  1. एक नौकरी ढूंढें जो जितना संभव हो उतना ओ.टी. की मांग करें
  2. विभिन्न कीबोर्डों को आज़माएं मेरे अनुभव में, पूर्ण समय पर लैपटॉप पर काम करना सर्वोत्तम काम करता है
  3. कम-मध्यम तनाव भारोत्तोलन का कार्यक्रम शुरू करें।

मैंने माउस के लिए अपने बाएं हाथ का उपयोग करना शुरू कर दिया, यह न केवल मुझे थोड़ी मदद करता है, लेकिन मुझे अपने दाहिने हाथ का अधिक आज़ादी से उपयोग करने की इजाजत है, अगर आप बहुत सारे सामान लिखते हैं, जब आप कोड कोड करते हैं तो आपको बहुत मदद मिलती है .. आप स्क्रॉल कर सकते हैं और एक ही समय में लिखो ...

जब मेरी समस्याएं शुरू हुईं तो मैंने अपनी कलाई के नीचे एक पानी का बैग रखा, मुझे यह पसंद आया! जो बैग मैं था वह सही था, यह बहुत लंबा था और मैंने इसे कीबोर्ड से पहले रखा था इसलिए मैं अपनी कलाई वहाँ आराम कर सकता था ... एक दिन तक मैं उस पर कदम रखूं ...


मैंने 1 99 6 में ड्रैगन डिक्टेट का इस्तेमाल इसी कारण से किया था। यह धीमी गति से चल रहा था, लेकिन काम नहीं करने से बेहतर मुझे कोड के साथ 4x8 सफेद बोर्ड को भरकर कोड लिखना आसान हो गया और फिर किसी और को इसे टाइप करने में मिला। तब मैंने डीडी को डीबग करने के लिए उपयोग किया।

और जब आप उस पर हैं, तो आप आरएसआई के बारे में डेबोरा क्विल्टर की किताबों को देख सकते हैं। वे बहुत जानकारीपूर्ण हैं


यह वहाँ है, और यह काम करता है ...

वहाँ से बहुत कुछ भाषण मान्यता कार्यक्रम हैं, जिनमें से ड्रैगन ने स्वाभाविक रूप से बोलते हुए मुझे लगता है कि सबसे व्यापक रूप से इस्तेमाल किए जाने वाले लोगों में से एक है। मैंने इसे स्वयं का उपयोग किया है, और इसकी गुणवत्ता से प्रभावित हुआ है कि कुछ साल पहले, मुझे लगता है कि चीजें अब भी आगे बढ़ा दी हैं।

... लेकिन यह आसान नहीं है ...

हालांकि यह आश्चर्यजनक ढंग से काम करता है, मैं यह नहीं कहूंगा कि यह आसान समाधान है कार्यक्रम को प्रशिक्षित करने में समय लगता है, और फिर भी, यह गलतियां करता है। टाइपिंग की तुलना में यह गहराई से धीमी गति से है, इसलिए मुझे अपने आप से "कुंजीपटल को पकड़ो मत, कुंजीपटल को पकड़ो मत ..." कहने पड़े। (जिसके बाद मैं कीबोर्ड को किसी भी तरह से पकड़ लूँगा) मैं खुद को थोड़ा सा गड़गड़ाहट करते हैं, जो कुछ भी बेहतर नहीं बनाते, या ;-) विशेष रूप से पहले हफ्ते निराशाजनक हो सकते हैं यदि आप अपनी आवाज़ को बहुत अधिक बढ़ाते हैं तो आप आवाज से संबंधित समस्याओं को भी प्राप्त कर सकते हैं।

... खासकर प्रोग्रामर के लिए!

सब कुछ, सामान्य पाठ / गद्य लिखने वाले लोगों के लिए निश्चित रूप से एक व्यावहारिक समाधान है । एक प्रोग्रामर के रूप में, आप पूरी तरह अलग क्षेत्र में हैं, जिसके लिए कोई वास्तविक समाधान नहीं है। हालात अब तक बदल सकते हैं, लेकिन मुझे आश्चर्य होगा अगर उनके पास है।

समस्या क्या है? अधिकांश एसआर सॉफ्टवेयर को सामान्य भाषा को पहचानने के लिए बनाया गया है। प्रोग्रामर बहुत गुप्त सामग्री लिखते हैं, और यह मुश्किल है, यदि असंभव नहीं है, जो सामान्य भाषा और कोड के बीच रूपांतरण करता है, वह सॉफ़्टवेयर ढूंढने के लिए। उदाहरण के लिए, आप कैसे निर्देश करेंगे:

if (somevar == 'a')
{
   print('You pressed a!');
}

अपने औसत एसआर कार्यक्रम में दिए गए आदेशों का उपयोग करना, यह एक बहुत बड़ा दर्द है: "यदि अंतरिक्ष छोड़ दिया ब्रैकेट बराबर चिह्न बराबर चिन्ह एस्ट्रॉफी एक एस्ट्रॉफी वर्तनी ..."। और मैं आपके कोड को नेविगेट करने के बारे में भी बात नहीं कर रहा हूं। कभी देखा गया कि आप प्रोग्रामिंग करते समय कुंजीपटल का कितना उपयोग कर रहे हैं, और उस प्रयोग से कितना अलग है कि 'सामान्य' उपयोगकर्ता कीबोर्ड का उपयोग कैसे करता है?

कैसे इसे का सबसे अच्छा बनाने के लिए

इस प्रकार अब तक, मैंने केवल ड्रैगन नेचुरल स्पीकिंग (डीएनएस) के साथ काम किया है, इसलिए मैं केवल उस उत्पाद के लिए बात कर सकता हूं प्रोग्रामर जैसे लोगों के लिए लक्षित कुछ दिलचस्प ऐड-ऑन और वेबसाइटें हैं:

  • वोकला एक अनौपचारिक प्लगइन है जो आपको आसानी से अपने स्वयं के आदेशों को DNS में जोड़ सकते हैं। मैंने इसे आवश्यक पाया, मूल रूप से आप अन्य प्रोग्रामर द्वारा लिखे गए कमांड सेट भी पा सकते हैं, जैसे कि नेविगेट कोड यह पायथन में लिखे गए सॉफ़्टवेयर पैकेज पर आधारित है, इसलिए यहां कुछ और उन्नत और फैंसी पैकेज भी हैं। वोकला के संसाधन पृष्ठ को भी देखें (चेतावनी: जब मैंने इसे इस्तेमाल किया था, तो वोकला स्थापित करने में कुछ समस्याएं थीं, जानकारी के लिए नीचे समाचार समूह देखें!)
  • SpeechComputing.com एक मंच / समाचार समूह है जिसमें बहुत सारे दिलचस्प चर्चाएं हैं शुरू करने की अच्छी जगह।

अंतिम शब्द

ऐसा लगता है कि इस समस्या का सबसे अच्छा समाधान वास्तव में है:

  • वास्तविक कोडन के आसपास तरीके ढूंढें
  • पुनर्प्राप्त करने का प्रयास करें मैं इस पुस्तक की अनुशंसा करने के लिए कुछ हद तक अनिच्छुक हूँ, लेकिन ऐसा लगता है कि आरएसआई / कार्पल टनल और अन्य पुराने दर्द के मुद्दों के लिए आश्चर्यजनक रूप से अच्छी तरह काम करना है: जेई सरनो, माइंडबॉडी का नुस्खा मैं अभी इसके साथ काम कर रहा हूं, और मुझे लगता है कि यह निश्चित रूप से पढ़ने योग्य है।

ड्रैगन ने स्वाभाविक रूप से पसंदीदा और वोकला बोलते हुए Autohotkey जितना संभव हो सके स्वचालित रूप से। यद्यपि प्रोग्राम करने में आसान नहीं है मैंने कोशिश की; लगभग असंभव। जॉन सर्नो के हीलिंग बैक दर्द की जांच करें यह मुझे बेहतर बना दिया मैं पूरे दिन प्रोग्रामिंग के लिए वापस आ रहा हूँ!


यहाँ एक और बिट ऑफ-विषय, मैंने पाया है कि दो हिस्सों में बंधा हुआ केबोन और अन्य विशेष कीबोर्ड मदद करता है, बस चेक-आउट कुनेसीस। मैंने डायगो में ऐसे हार्डवेयर के बारे में जानकारी एकत्र की:

सीधे लिंक के बारे में क्या:

  • http://www.fentek-ind.com/ergo.htm - विभिन्न सामान
  • http://www.kinesis-ergo.com/contoured.htm - कुनेसीस एडवांटेज कंटोड कीबोर्ड (प्रोग्राममेबल!)
  • http://www.kinesis-ergo.com/foot.htm कुछ पैर स्विच कुंजीपटल से जोड़ा जा सकता है (उदाहरण के लिए विंडो स्विचिंग के लिए)
  • http://www.kinesis-ergo.com/freestyle.htm - अब तक, मैंने पाया है कि दो सामान्य कीबोर्ड का इस्तेमाल एक से बेहतर है, इसलिए मुझे लगता है कि भले ही फ़्रीस्टाइल भी काम कर सकता है
  • http://www.typematrix.com/ - एक अन्य समाधान
  • http://www.maltron.com/ - कभी-कभी जब एक हाथ एक हाथ से अन्य टाइपिंग से अधिक ग्रस्त होता है
  • http://www.keybowl.com/ - यह दिलचस्प भी दिखता है
  • मेरा मानना ​​है कि कई अन्य दिलचस्प समाधान हैं

एक और चीज़! व्यायाम के लिए ब्रेक के बारे में याद रखें नियमित व्यायाम (उदाहरण के लिए छोटे व्यायाम - हर आधे और घंटे अलग-अलग) वास्तव में वास्तव में चीजें बेहतर बनाती हैं!

  • http://www.workrave.org/ - यह आपको ब्रेक के बारे में याद दिलाएगा;)


सभी लिनक्स लोगों के लिए, मैं कुछ लिंक साझा करना चाहता हूं।

चलो साइमन से शुरू - खुला स्रोत भाषण मान्यता सॉफ्टवेयर:

और कुछ अन्य:

तथा