我在合并服务数据帧时遇到问题。我下载了一些历史交易数据并将其保存到一个csv文件中。所以现在我想将cvs文件中的数据读取到几个数据帧中并提取一些收盘价。
我创建了一个名为read_dataset的函数,该函数将数据读入数据框并返回该数据框。
结合for循环,我将所有数据帧存储在dict中。 Dict键是货币的缩写(请参见coin_list数据框)。
# List of available coins, saved in a DataFrame called coin_list
coins = { 'Bitcoin': 'BTC', 'Ethereum': 'ETH', 'Ripple': 'XRP', 'BitcoinCash': 'BCH', 'Litecoin':'LTC', 'EOS': 'EOS',
'Tronix': 'TRX', 'Stellar' : 'XLM', 'Neo' : 'NEO', 'Cardano': 'ADA', 'IOTA' : 'IOT', 'Monero': 'XMR'}
# Create a coin list as Dataframe of the dictionary above
coin_list = pd.DataFrame(list(coins.items()), index = np.arange(0,12), columns=('Currency', 'Abbreviation'), dtype=str)
# Read data into DataFrames
def read_dataset (filename):
print('Reading data from %s' % filename)
file = pd.read_csv(filename)
file = file.drop('Unnamed: 0', axis=1)
return file
# Read all cryptocurrency data into a dictionary of dataframes.
currency_data = {}
df = pd.DataFrame()
for currency in coin_list['Abbreviation']:
df = read_dataset(currency + '_historical_data_daily_updated')
df = df.set_index('Timestamp')
currency_data[currency] = df
currency_data
Out:
{'ADA': close high low open volumefrom volumeto
Timestamp
2017-12-30 0.5900 0.6941 0.4200 0.4955 24118261.70 14016860.69
2017-12-31 0.7100 0.7400 0.5900 0.5900 13107255.34 8971147.70
2018-01-01 0.7022 0.7150 0.6320 0.7100 13805601.70 9403559.91
2018-01-02 0.7620 0.8000 0.6750 0.7022 8440669.40 6292466.84
因此,在创建dict currency_data之后,我要访问并分离currency_data中包含的数据框。因此,我想创建一个for循环,以将例如数据帧的所有收盘价合并为一个数据帧。
有谁知道我如何实现这一目标?
我可以使用以下代码对两个数据帧执行此操作,但无法将其转换为for循环。
a = pd.DataFrame()
a['ADA closeprice'] = currency_data['ADA']['close']
b = pd.DataFrame()
b['BTC closeprice'] = currency_data['BTC']['close']
c = pd.merge(a, b, left_index=True, right_index=True)
c.drop_duplicates()
c.head()
ADA closeprice BTC closeprice
Timestamp
2017-12-30 0.5900 12531.52
2017-12-31 0.7100 13850.40
2018-01-01 0.7022 13444.88
2018-01-02 0.7620 14754.13
2018-01-03 1.1000 15156.62
还是有更好的方法从cvs文件创建不同的数据帧并将其存储在dict中?
谢谢你的帮助!
最佳答案
考虑从您的数据帧字典中构建一个更大的主数据帧,然后通过诸如close之类的列名运行DataFrame.filter
:
master_df = pd.concat(currency_data, axis=1)
# RENAME COLUMNS USING itertools.product
all_cols = map(lambda x: "_".join(x), product(master_df.columns.levels[0].values,
master_df.columns.levels[1].values))
master_df.columns = all_cols
df_close = master_df.filter(regex='_close')
数据(随机产生的种子可复制)
import numpy as np
import pandas as pd
from itertools import product
coins = { 'Bitcoin': 'BTC', 'Ethereum': 'ETH', 'Ripple': 'XRP', 'BitcoinCash': 'BCH', 'Litecoin':'LTC', 'EOS': 'EOS',
'Tronix': 'TRX', 'Stellar' : 'XLM', 'Neo' : 'NEO', 'Cardano': 'ADA', 'IOTA' : 'IOT', 'Monero': 'XMR'}
currency_data = {}
np.random.seed(788)
for k, v in coins.items():
currency_data[v] = pd.DataFrame({'open': abs(np.random.randn(50)),
'close': abs(np.random.randn(50)),
'high': abs(np.random.randn(50)),
'low': abs(np.random.randn(50)),
'volumefrom': abs(np.random.randn(50)) * 50,
'volumeto': abs(np.random.randn(50)) * 100},
index = pd.date_range("2018-01-01", "2018-02-19", freq="D"),
columns = ['open','close','low','high','volumefrom', 'volumeto'])
输出量
print(df_close.head(10))
# ADA_close BCH_close BTC_close EOS_close ETH_close IOT_close LTC_close NEO_close TRX_close XLM_close XMR_close XRP_close
# 2018-01-01 0.650955 1.547163 0.796460 0.526820 0.191777 1.310333 0.322086 0.216098 1.231339 1.008557 1.452984 1.674484
# 2018-01-02 0.115062 0.912895 0.163012 0.962510 0.486295 0.314905 0.345002 0.148462 0.487662 0.052015 0.461620 1.673353
# 2018-01-03 1.001747 0.181435 0.439193 2.419863 0.856715 0.374709 0.277737 1.115768 0.068189 0.217582 0.501237 0.287705
# 2018-01-04 0.850843 0.194079 0.187193 0.662573 0.480762 0.488702 0.039885 0.603018 0.555557 1.136274 0.804600 0.147496
# 2018-01-05 1.195504 0.839676 0.997530 0.393851 0.606223 0.754789 1.723055 3.001308 1.601807 1.239889 0.384320 1.712975
# 2018-01-06 0.694929 0.598245 0.412835 0.694578 1.416549 0.895094 1.266500 0.168239 1.133783 0.616416 0.836242 0.654971
# 2018-01-07 0.274282 0.274834 0.760970 0.647609 2.189674 0.898377 0.932951 0.439612 1.252156 0.815973 0.051374 1.984519
# 2018-01-08 0.294268 0.786343 0.548222 2.548036 1.313609 0.348784 0.091552 0.441314 0.908229 1.175537 1.213839 1.375724
# 2018-01-09 1.383939 0.129143 0.650033 1.251369 1.064297 0.619202 1.275862 0.323824 0.083908 0.677591 0.774429 1.435533
# 2018-01-10 0.426915 1.723191 0.008422 0.650916 1.431050 0.218723 0.292402 0.030168 1.169357 0.833438 1.048405 0.270780
关于python - Python-从csv文件创建数据框并将这些数据框合并在一起,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/49731163/