xlabel位置 - python title位置




我如何获得熊猫系列的元素智能逻辑NOT? (3)

@ unutbu的答案是现货,只是想添加一个警告,你的面具需要是dtype bool,而不是'object'。 也就是说,你的面具不可能有任何南瓜。 看到here - 即使你的面具现在是免费的,它仍然是'对象'类型。

“对象”系列的反转不会抛出错误,而是会得到一个无法正常工作的垃圾掩码。

In[1]: df = pd.DataFrame({'A':[True, False, np.nan], 'B':[True, False, True]})
In[2]: df.dropna(inplace=True)
In[3]: df['A']
Out[3]:
0    True
1   False
Name: A, dtype object
In[4]: ~df['A']
Out[4]:
0   -2
0   -1
Name: A, dtype object

在与同事谈论这个问题之后,我给出了一个解释:看起来熊猫正在恢复到按位运算符:

In [1]: ~True
Out[1]: -2

今天我有一个相对直接的问题。 我有一个包含布尔值的熊猫Series对象。 我怎样才能得到一个包含每个值的逻辑NOT的系列?

例如,考虑一系列包含:

True
True
True
False

我想要得到的系列将包含:

False
False
False
True

这看起来应该是相当简单的,但显然我错过了我今天的魔咒=(

谢谢!


你也可以使用numpy.invert

In [1]: import numpy as np

In [2]: import pandas as pd

In [3]: s = pd.Series([True, True, False, True])

In [4]: np.invert(s)
Out[4]: 
0    False
1    False
2     True
3    False

编辑:在性能上的差异出现在Ubuntu 12.04,Python 2.7,NumPy 1.7.0 - 似乎并不存在使用NumPy 1.6.2:

In [5]: %timeit (-s)
10000 loops, best of 3: 26.8 us per loop

In [6]: %timeit np.invert(s)
100000 loops, best of 3: 7.85 us per loop

In [7]: %timeit ~s
10000 loops, best of 3: 27.3 us per loop

要颠倒布尔系列,请使用~s

In [7]: s = pd.Series([True, True, False, True])

In [8]: ~s
Out[8]: 
0    False
1    False
2     True
3    False
dtype: bool

使用Python2.7,NumPy 1.8.0,Pandas 0.13.1:

In [119]: s = pd.Series([True, True, False, True]*10000)

In [10]:  %timeit np.invert(s)
10000 loops, best of 3: 91.8 µs per loop

In [11]: %timeit ~s
10000 loops, best of 3: 73.5 µs per loop

In [12]: %timeit (-s)
10000 loops, best of 3: 73.5 µs per loop

从Pandas 0.13.0开始,Series不再是numpy.ndarray子类; 他们现在是pd.NDFrame子类。 这可能与为什么np.invert(s)不再像~s-s那么快有关。

警告: timeit结果可能会因许多因素而异,包括硬件,编译器,操作系统,Python,NumPy和Pandas版本。







boolean-logic