我有以下元组列表,

a=[('1A34', 'RBP', 0.0, 1.0, 0.0, 0.0, 0.0, 0.0),
   ('1A9N', 'RBP', 0.0456267, 0.0539268, 0.331932, 0.0464031, 4.41336e-06, 0.522107),
   ('1AQ3', 'RBP', 0.0444479, 0.201112, 0.268581, 0.0049757, 1.28505e-12, 0.480883),
   ('1AQ4', 'RBP', 0.0177232, 0.363746, 0.308995, 0.00169861, 0.0, 0.307837)]


我想要做的是创建一个形状为(4,8)的numpy nd.array
看起来像这样:

array([['1A34', 'RBP', 0.0, 1.0, 0.0, 0.0, 0.0, 0.0],
       ['1A9N', 'RBP', 0.0456267, 0.0539268, 0.331932, 0.0464031, 4.41336e-06, 0.522107],
       ['1AQ3', 'RBP', 0.0444479, 0.201112, 0.268581, 0.0049757, 1.28505e-12, 0.480883],
       ['1AQ4', 'RBP', 0.0177232, 0.363746, 0.308995, 0.00169861, 0.0, 0.307837]])


我尝试了以下代码:

import numpy as np
x = np.array(a, dtype=('a10,a10,f4,f4,f4,f4,f4,f4'))


但是它改成这样的形状:

In [37]: x.shape
Out[37]: (4,)


什么是正确的方法?

最佳答案

到目前为止,您已经完成的工作是最合乎逻辑的方法。要实现您的要求,您需要创建一个对象数组:

z = np.array(a,dtype=np.object)
print z.shape
# (4, 8)


您所要求的是一个按列具有可变数据类型的数组。这正是使用np.array(a, dtype=('a10,a10,f4,f4,f4,f4,f4,f4'))实现的。在内部,您可以将此数组想像成C语言中的结构数组,即dtype=('a10,a10,f4,f4,f4,f4,f4,f4')实例的一维数组。

通过使用object数组,您可以请求numpy将所有内容作为一个简单的python对象处理。

10-08 15:51