डेटा विश्लेषण और मॉडलिंग एल्गोरिदम के लिए Matlab/F#/ R के साथ आपके अनुभव




(4)

मैं थोड़ी देर के लिए एफ # का उपयोग कर रहा हूं, उन्हें सी ++ में कोडिंग से पहले एल्गोरिदम मॉडल करने के लिए और बाद में इसे सी ++ कोड के परिणामों की जांच करने और वास्तविक-विश्व रिकॉर्ड किए गए डेटा के खिलाफ भी उपयोग कर रहा हूं।

चीजों के मॉडलिंग पक्ष के लिए, यह बहुत आसान है, लेकिन 'डेटा मैशप' की तरह सामानों के लिए, सीएसवी और अन्य स्रोतों से डेटा खींचकर, आंकड़े उत्पन्न करना, चार्ट तैयार करना आदि। मेरे सहयोगी ने मुझे कोई अंत नहीं बताया ("आप क्यों हैं अपने आप को कोडिंग? यह मैटलैब में बनाया गया है ")।

और मेरे पास एक और सहयोगी है जो आर द्वारा कसम खाता है, जिसमें 'बिल्ट-इन' सामान भी शामिल है।

मुझे पता है कि MatLab, R और F # कड़ाई से तुलनीय नहीं हैं, इसलिए मैं एक 'सुविधा तुलना के बाहर गोली मार' के लिए नहीं पूछ रहा हूँ मुझे आश्चर्य है कि अन्य लोग इस तरह के पूर्व और बाद के विश्लेषण परिदृश्यों के लिए क्या उपयोग कर रहे हैं, और इसके साथ वे कितने खुश हैं।

(अगर कोई भी वहां है जो माइक्रोसॉफ्ट चार्ट्स को कुछ एफ # -friendly लपेटने पर काम कर रहा है, मुझे बताएं, मुझे भाग लेने में खुशी होगी ...)

(नोट: इस प्रश्न का उत्तर व्यक्तिपरक होगा, लेकिन अनुभव के आधार पर, कृपया)


मै MATLAB में अपने मॉडल का हमेशा प्रोटोटाइप करता हूं यदि मेरा प्रोटोटाइप पर्याप्त रूप से पर्याप्त है, तो मैं रिफैक्टर और यह किया है। यदि नहीं, तो मैं वापस जाने के लिए और सी में कुछ कार्यों को लागू करने के लिए MATLAB द्वारा बुलाया जाएगा इसके लिए निम्न स्तर की भाषा का ज्ञान आवश्यक है, जो मुझे लगता है कि हमेशा ऐसा मामला है कि अगर आप तकनीकी रूप से चुनौती दे रहे हैं, तो कुछ भी कर रहे हैं।

मुझे इस लिस्प स्वाद के बारे में चिंतित है अगर यह कभी जमीन से बाहर हो जाता है।


मैं आर का उपयोग करता हूं क्योंकि एक हाथ में यह सब कुछ बनाया गया है और दूसरी तरफ आप अभी भी लगभग सब कुछ हेरफेर कर सकते हैं या खरोंच से शुरू कर सकते हैं फिर भी, आर भारी गणनाओं के लिए धीमी गति से है (हालांकि मैं इसमें सभी मेरी मोंटे कार्लो सिमुलेशन करता हूं)

मैं कहूंगा कि सामान्य तौर पर गणितीय कार्यों की उपलब्धता के लिए Matlab सबसे अच्छा है, आर डेटा इनपुट / हेरफेर / विज़ुअलाइज़ेशन / विश्लेषण / आदि के लिए सबसे अच्छा है, और उच्च गति उप-रूट के लिए सी ++। आप जिस तरह से सी में आसानी से सी ++ (या सी, फॉरेन, ...) कोड को एकीकृत कर सकते हैं, क्यों नहीं आर में इनपुट डेटा को पढ़ा और उसे हेरफेर करें, सी ++ में मॉडल लागू करें, और आर में आउटपुट का विश्लेषण / विश्लेषण करें?


मैंने इन प्रयोजनों के लिए थोड़ा सा मैटैब और अजगर / पाइलाब के साथ काम किया है इन उपकरणों में 'अंतर्निर्मित' क्या है एक प्रोग्रामिंग वातावरण, एक खोल, और गइ टूल जो कि विभिन्न स्रोतों से डेटा को शीघ्रता से देखने के लिए डिज़ाइन किया गया है।

कुछ कमांड में, आप स्क्रीन पर इंटरैक्टिव भूखंडों में एक सीएसवी फ़ाइल होने से जा सकते हैं, फिर किसी भी प्रारूप में छवि निर्यात में जा सकते हैं। आपके द्वारा इसे लटकाने के बाद डेटा से विज़ुअलाइज़ेशन में जाने के लिए एक या दो मिनट लगते हैं। मुझे लगता है कि सी ++ दुनिया में यह असामान्य है (हालांकि मैंने कुछ प्रोफेसरों को बहुत प्रभावशाली कार्य-प्रवाह के साथ देखा है)।

मैंने आर की कोशिश की है, लेकिन मैं इसके बारे में ज्यादा उपयोगी नहीं कह सकता। ऐसा लगता है कि सुविधाओं के एक ही सेट के बारे में प्रस्ताव है, लेकिन यह समर्थन के लिए Google के लिए परेशानी हो सकती है।

यदि आप अपनी वर्तमान पद्धति का उपयोग करके डेटा से साकार करने के लिए कुछ मिनटों से अधिक समय खर्च कर रहे हैं, तो निश्चित रूप से इन वातावरणों में से एक को सीखना निश्चित रूप से आवश्यक है। सबसे अच्छा विकल्प आपके सहयोगियों, आपके काम के माहौल, अनुभव और आपके बजट पर निर्भर करता है।


यह वैज्ञानिक / सांख्यिकीय कंप्यूटिंग के लिए उपयुक्त कार्यात्मक भाषा के पिछले प्रश्न के लिए एक उचित निकटतम दोगुना है, ताकि आप वहां लंबे और विस्तृत उत्तर को समझना चाहें।

जवाब आपके अनुभव और पूर्व भाषा प्रशिक्षण पर अक्सर, के रूप में निर्भर करता है। मैं बहुत डेटा के लिए munging / मॉडलिंग / दृश्य के लिए आर पसंद करते हैं।





f#