在Python中是否有推荐的机器学习包?

在Python中是否有推荐的机器学习包?

在Python中是否有推荐的机器学习包? 我在使用C++和MATLAB实现各种机器学习和统计算法方面有以前的经验,但是在Python中做了一些工作,我对Python的可用包感到好奇。…


python - 二维阵列中的峰值检测

我正在帮助兽医诊所测量狗爪下的压力。 我使用Python进行数据分析,现在我试图将爪子分成(解剖)子区域。 我制作了每个爪子的二维数组,每个爪子随着时间的推移装载了每个传感器的最大值。 这里有一个爪子的例子,我用Excel绘制了我想检测的区域。 这些传感器周围有2 x 2个盒子,带有当地最大值,总和最大。 所以我尝试了一些实验,并决定简单地查找每列和每行的最大值(由于爪子的形状,不能看向一个…


用于特定应用的贝叶斯网络的pythonic实现

这就是我问这个问题的原因:去年我制作了一些C++代码来计算特定类型模型的后验概率(由贝叶斯网络描述)。 该模型工作得很好,其他一些人开始使用我的软件。 现在我想改进我的模型。 由于我已经为新模型编写了稍微不同的推理算法,因此我决定使用python,因为运行时并不重要,python可以让我制作更优雅和易于管理的代码。 通常在这种情况下我会在python中搜索现有的贝叶斯网络包,但我正在使用的推…


machine learning - 公开发布的垃圾邮件过滤器培训套装

我是机器学习的新手,而对于我的第一个项目,我想写一个朴素的贝叶斯垃圾邮件过滤器。 我想知道是否有任何公开的标记垃圾邮件/非垃圾邮件的培训集,最好是纯文本而不是关系数据库的转储(除非它们打印那些?)。 我知道这种公开可用的数据库存在于其他类型的文本分类中,特别是新闻文章文本。 我只是无法为电子邮件找到同样的东西。…


python - 大图:约2000万个样本,千兆字节的数据

我在这里遇到了一个问题(我的RAM):它无法保存我想要绘制的数据。 我有足够的高清空间。 是否有任何解决方案可以避免我的数据集“阴影”? 具体而言,我处理数字信号处理,我必须使用高采样率。 我的框架(GNU Radio)以二进制形式保存值(以避免使用太多的磁盘空间)。 我打开包装。 之后我需要策划。 我需要可缩放的图和交互式。 这是一个问题。 是否有任何优化潜力,或其他软件/编程语言(如R左右…


python - 在scikits机器学习中缺少值

scikit-learn中是否有可能缺少值? 他们应该如何代表? 我找不到任何关于这方面的文件。…



python - 在scikit-learn中将分类器保存到磁盘

如何将训练过的朴素贝叶斯分类器保存到磁盘并将其用于预测数据? 我从scikit-learn网站上获得了以下示例程序: from sklearn import datasets iris=datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb=GaussianNB() y_pred=gnb.fit(iri…


python - 如何获得scikit-learn分类器的最丰富的功能?

liblinear和nltk等机器学习包中的分类器提供了一个方法show_most_informative_features(),这对调试功能非常有用: viagra=None ok:spam=4.5:1.0 hello=True ok:spam=4.5:1.0 hello=None…


python - 如何使用弹性网?

这是关于回归正则化的初学者问题。 关于弹性网和套索回归的大多数信息在线复制来自维基百科的信息或Zou和Hastie的原始2005年论文(通过弹性网进行正则化和变量选择)。 简单理论的资源? 是否有一个简单易懂的解释,关于它的作用,何时以及为什么需要进行重新调整,以及如何使用它-对于那些没有统计倾向的人? 我理解原始论文是理想的来源,如果你能理解它,但是在某个地方更简单的问题和解决方案吗?…


python - joblib和pickle有什么不同的用例?

背景:我刚开始使用scikit-learn,并在页面底部阅读joblib,而不是pickle 。 使用joblib替换pickle(joblib.dump&joblib.load)可能会更有趣,这对于大数据更有效,但只能腌制到磁盘而不是字符串 我阅读了关于Pickle的问答,Python中pickle的常见用例,以及这里的社区是否可以分享joblib和pickle之间的区别? 什么时候应该用…




sklearn learn python install learn中文 github svm tutorial stable org