使用psycopg2,我以这种形式获得查询结果:
[(15002325,24,20,1393,-67333094L,
38,4,493.48763257822799,
493.63348372593703),(15002339、76、20、1393,-67333094L,91、3,
499.95845909922201、499.970048093743),(15002431、24、20、1394,-67333094L,
38,4,493.493464900383,
493.63348372593703),(15002483、76、20、1394,-67333094L,91、3,
499.959042442434,499.97304310494502)]
我正在尝试将此嵌套元组/列表转换为带有RPY2的R数据帧:具有名称的九列和四行数据(此嵌套列表中的元素数)
但是我不明白如何,我正在尝试使用tagsList(进入RPY2容器库),但是没有成功..似乎带标签的列表只能一张一张地列出。
谢谢!
最佳答案
import rpy2.robjects as ro
r=ro.r
data=[(15002325, 24, 20, 1393, -67333094L, 38, 4, 493.48763257822799, 493.63348372593703), (15002339, 76, 20, 1393, -67333094L, 91, 3, 499.95845909922201, 499.970048093743), (15002431, 24, 20, 1394, -67333094L, 38, 4, 493.493464900383, 493.63348372593703), (15002483, 76, 20, 1394, -67333094L, 91, 3, 499.959042442434, 499.97304310494502)]
columns=zip(*data)
columns=[ro.FloatVector(col) for col in columns]
names=['col{i}'.format(i=i) for i in range(9)]
dataf = r['data.frame'](**dict(zip(names,columns)))
print(dataf)
# col8 col6 col7 col4 col5 col2 col3 col0 col1
# 1 493.6335 4 493.4876 -67333094 38 20 1393 15002325 24
# 2 499.9700 3 499.9585 -67333094 91 20 1393 15002339 76
# 3 493.6335 4 493.4935 -67333094 38 20 1394 15002431 24
# 4 499.9730 3 499.9590 -67333094 91 20 1394 15002483 76
请注意,这里有一个R interface for postgresql,这可能比通过Python和rpy2提供一种更简洁的方法。
如果需要Python,另一种可能性是找出从postgresql加载数据所需的R命令,然后使用
ro.r
在Python中调用它们。