- 2025年05月31日
- 星期六

我有一个大型的pandas数据帧(大小= 3 GB): x = read.table(‘big_table.txt’, sep=’t’, header=0, index_col=0) 因为我在内存限制下工作,所以我对数据帧进行了子集化: rows = calculate_rows() # a function that calculates what rows I need cols = ca

我有一个pandas数据帧,具有以下结构: import numpy as npimport pandas as pdmyData = pd.DataFrame({x: [1.2,2.4,5.3,2.3,4.1], y: [6.7,7.5,8.1,5.3,8.3], condition:[1,1,np.nan,np.nan,1],calculation: [np.nan]*5}

我有这样的时间序: times | data 1994-07-25 15:15:00.000 | 165 1994-07-25 16:00:00.000 | 165 1994-07-26 18:45:00.000 | 165 1994-07-27 15:15:00.000 | 165 1994-07-27 16:00:00

我有两个想要合并的数据帧.DF1有这种形式index c1 c2 a1 1 2 a1 2 1 a1 3 1 b1 5 2 b1 4 7 DF2是另一组数据,它共享索引的精简版本index c3 c4 a1 9 10 b1 7 8 我想用DF2中的数据填充DF1index c1 c2 c3 c