[python] 从Numpy数组创建熊猫数据框:如何指定索引列和列标题?


Answers

我同意约里斯的观点。 看起来你应该以不同的方式做这件事,比如使用numpy记录数组 。 从这个伟大的答案修改“选项2”,你可以这样做:

import pandas
import numpy

dtype = [('Col1','int32'), ('Col2','float32'), ('Col3','float32')]
values = numpy.zeros(20, dtype=dtype)
index = ['Row'+str(i) for i in range(1, len(values)+1)]

df = pandas.DataFrame(values, index=index)
Question

我有一个由列表列表组成的Numpy数组,它表示一个具有行标签和列名称的二维数组,如下所示:

data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]])

我希望生成的DataFrame将Row1和Row2作为索引值,将Col1,Col2作为标题值

我可以如下指定索引:

df = pd.DataFrame(data,index=data[:,0]),

但是我不确定如何最好地分配列标题。




Links