在Python中是否有推荐的机器学习包?

在Python中是否有推荐的机器学习包?

在Python中是否有推荐的机器学习包? 我在使用C++和MATLAB实现各种机器学习和统计算法方面有以前的经验,但是在Python中做了一些工作,我对Python的可用包感到好奇。…


machine learning - 公开发布的垃圾邮件过滤器培训套装

我是机器学习的新手,而对于我的第一个项目,我想写一个朴素的贝叶斯垃圾邮件过滤器。 我想知道是否有任何公开的标记垃圾邮件/非垃圾邮件的培训集,最好是纯文本而不是关系数据库的转储(除非它们打印那些?)。 我知道这种公开可用的数据库存在于其他类型的文本分类中,特别是新闻文章文本。 我只是无法为电子邮件找到同样的东西。…


python - 使用scikit-learn在Naive Bayes分类器中混合分类和连续数据

我正在使用Python中的scikit-learn来开发一种分类算法来预测某些客户的性别。 除此之外,我想使用朴素贝叶斯分类器,但我的问题是我有混合的分类数据(例如:“在线注册”,“接受电子邮件通知”等)和连续数据(例如:“年龄”,“长度”)成员资格“等)。 我之前没有使用scikit,但我认为高斯朴素贝叶斯适用于连续数据,伯努利朴素贝叶斯可用于分类数据。 但是,由于我想在我的模型中同时拥有分类…


runtime error - 每个班级我都有三个以上的元素,但是我得到这个错误:在scikit-learn中class不能小于k=3

这是我的目标(y): target=[7,1,2,2,3,5,4, 1,3,1,4,4,6,6, 7,5,7,8,8,8,5, 3,3,6,2,7,7,1, 10,3,7,10,4,10, 2,2,2,7] 我不知道为什么当我执行时:...#将数据集分成两个相等的部分X_train,X_test,y_train,y_test=…


python - scikit.predict()默认阈值

我正在研究不平衡类(5%1)的分类问题。 我想预测班级,而不是概率。 在二进制分类问题中,scikit的classifier.predict()默认使用0.5吗? 如果没有,那么默认方法是什么? 如果是,我该如何更改? 在scikit中,一些分类器具有class_weight='auto'选项,但并非所有分类器都具有。 使用class_weight='auto',. class_weight…


machine learning - Scikit学习-fit_transform测试集

我正在努力使用Python中的随机森林与Scikit学习。 我的问题是,我用它来进行文本分类(3类-正/负/中性),我提取的功能主要是单词/单词,所以我需要将它们转换为数字特征。 我找到了一个方法来使用DictVectorizer的fit_transform:from sklearn.preprocessing import LabelEncoder from sklearn.metric…


python - sklearn中'transform'和'fit_transform'之间的区别是什么?

在sklearn-python工具箱中,有两个函数transform和fit_transform关于sklearn.decomposition.RandomizedPCA 。 两个功能的描述如下 但它们之间有什么区别?…


scikit learn - scikit学习:如何检查系数的意义

我尝试用SKLearn来做一个LR〜600的虚拟数据集,只有很少的区间变量(在我的数据集中有300 K行),结果造成混淆矩阵看起来很可疑。 我想检查返回的系数和方差分析的意义,但我找不到如何访问它。 有没有可能? 包含大量虚拟变量的数据的最佳策略是什么? 非常感谢!…


python - 如何将ScikitLearn分类器应用于大图像中的图块/窗口

给定是scikit学习中的训练分类器,例如RandomForestClassifier 。 分类器已经接受了大小如25x25的样本的培训。 我怎样才能很容易地应用到一个大的图像(例如640×480)的所有瓷砖/窗口? 我能做的是(提前慢码!) x_train=np.arange(25*25*1000).reshape(25,25,1000)#just some pseudo train…





learn是什么 sklearn python learn包 fit stable org learn http fit函数