shift
函数是对数据进行移动的操作,假如现在有一个DataFrame数据df,如下所示:
1 | index value1 |
那么如果执行以下代码:
1 | df.shift() |
就会变成如下:
1 | index value1 |
看一下函数原型:
1 | DataFrame.shift(periods=1, freq=None, axis=0) |
参数:
periods:类型为int,表示移动的幅度,可以是正数,也可以是负数,默认值是1,1就表示移动一次,注意这里移动的都是数据,而索引是不移动的,移动之后没有对应值的,就赋值为NaN。
执行以下代码:1
df.shift(2)
就会得到:
1
2
3
4
5index value1
A NaN
B NaN
C 0
D 1执行:
1
df.shift(-1)
会得到:
1
2
3
4
5index value1
A 1
B 2
C 3
D NaNfreq: DateOffset, timedelta, or time rule string,可选参数,默认值为None,只适用于时间序列,如果这个参数存在,那么会按照参数值移动时间索引,而数据值没有发生变化。
例如现在有df1如下:1
2
3
4
5index value1
2016-06-01 0
2016-06-02 1
2016-06-03 2
2016-06-04 3执行:
1
df1.shift(periods=1,freq=datetime.timedelta(1))
会得到:
1
2
3
4
5
6index | value1
—-|—-
2016-06-02 | 0
2016-06-03 | 1
2016-06-04 | 2
2016-06-05 | 3axis:{0, 1, ‘index’, ‘columns’},表示移动的方向,如果是0或者’index’表示上下移动,如果是1或者’columns’,则会左右移动。