python - 在熊猫数据框中选择列

python - 在熊猫数据框中选择列

我有不同列中的数据,但我不知道如何提取它以将其保存在另一个变量中。 index a b c 1 2 3 4 2 3 4 5 如何选择'b','c'并将其保存到df1中? 我试过了 df1=df['a':'b'] df1=df.ix[:, 'a':'b'] 没有任何工作。…


python - 使用del df.column_name从pandas DataFrame中删除列

当删除DataFrame中的列时,我使用: del df['column_name'] 这很有用。 为什么我不能使用: del df.column_name 正如你可以访问列/ Series作为df.column_name,我期望这个工作。…


python - 重置列的MultiIndex级别

是否有一个较短的方式删除列MultiIndex级别(在我的情况下, basic_amt),除了转置两次? In[704]: test Out[704]: basic_amt Faculty NSW QLD VIC All All 1 1 2 4 Full Time…


Python熊猫:选择数据框中全部为零的列

给定一个数据框如何找出只有0作为值的所有列? df 0 1 2 3 4 5 6 7 0 0 0 0 1 0 0 1 0 1 1 1 0 0 0 1 1 1 预期产出 2 4 0 0 0 1 0 0…


python - Pandas DataFrame Groupby两列并获得计数

我有一个以下格式的pandas数据帧: df=pd.DataFrame([[1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], list('AAABBBBABCBDDD'),[1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8],['x/y/z'…


python - 如何从sql查询创建一个大熊猫数据框,而不会耗尽内存?

我无法从MS SQL Server数据库中查询超过500万条记录的表。 我想能够选择所有的记录,但是我的代码在选择大量数据到内存时似乎失败了。 这工作: import pandas.io.sql as psql sql="SELECT TOP 1000000*FROM MyTable" data=psql.read_frame(sql, cnxn)...但这不起作用: sq…


python - 使用另一个数据框中的索引创建一个空数据框

我有一个包含多个列和行的数据框df1 。 简单的例子: TIME T1 T2 1 10 100 2 20 200 3 30 300 我想创建一个空的数据框df2以及稍后,添加带有计算结果的新列。 在这一刻,我的代码看起来像这样: df1=pd.read_csv("1.txt",index_col="TIME") d…



python - Pandas dataframe:删除名称中包含特定字符串的列

我有一个带有以下列名的pandas数据帧: Result1,Test1,Result2,Test2,Result3,Test3等...... 我想删除名称中包含单词“Test”的所有列。 这些列的数量不是静态的,而是取决于先前的函数。 我怎样才能做到这一点?…


python - 有没有办法(漂亮)打印整个熊猫系列/数据帧?

我在终端上使用了Series和DataFrames。 一个Series的默认__repr__返回一个减少的样本,有一些头部和尾部的值,但其余的缺失。 是否有内置的方式来漂亮地打印整个Series/DataFrame? 理想情况下,它将支持正确的对齐,也许支持列之间的边界,甚至可能为不同的列进行颜色编码。…


python - 重命名Pandas DataFrame索引

我有一个没有标题的csv文件,带有DateTime索引。 我想重命名索引和列名,但是使用df.rename()时,只重命名列名。 错误? 我的版本是0.12.0 In[2]: df=pd.read_csv(r'D:\Data\DataTimeSeries_csv//seriesSM.csv', header=None, parse_dates=[[0]], index_col=[0])…




pandas dataframe dataframe遍历 index dataframe教程 append dataframe是什么 csv spark column