IT

판다 데이터 프레임에서 인덱스를 재설정하려면 어떻게 해야 합니까?

itgroup 2023. 1. 12. 22:11
반응형

판다 데이터 프레임에서 인덱스를 재설정하려면 어떻게 해야 합니까?

데이터 프레임에서 행을 몇 개 삭제합니다.그 결과 인덱스가 다음과 같은 데이터 프레임을 얻을 수 있습니다.[1,5,6,10,11]리셋을 하고 싶습니다.[0,1,2,3,4]어떻게 해야 하죠?


다음의 기능이 동작하고 있는 것 같습니다.

df = df.reset_index()
del df['index']

다음 기능이 작동하지 않습니다.

df = df.reindex()

DataFrame.reset_index 네가 찾고 있는 거야열로 저장하지 않으려면 다음을 수행합니다.

df = df.reset_index(drop=True)

재할당을 원하지 않는 경우:

df.reset_index(drop=True, inplace=True)

다른 솔루션이 할당되어 있다RangeIndex또는range:

df.index = pd.RangeIndex(len(df.index))

df.index = range(len(df.index))

고속화:

df = pd.DataFrame({'a':[8,7], 'c':[2,4]}, index=[7,8])
df = pd.concat([df]*10000)
print (df.head())

In [298]: %timeit df1 = df.reset_index(drop=True)
The slowest run took 7.26 times longer than the fastest. This could mean that an intermediate result is being cached.
10000 loops, best of 3: 105 µs per loop

In [299]: %timeit df.index = pd.RangeIndex(len(df.index))
The slowest run took 15.05 times longer than the fastest. This could mean that an intermediate result is being cached.
100000 loops, best of 3: 7.84 µs per loop

In [300]: %timeit df.index = range(len(df.index))
The slowest run took 7.10 times longer than the fastest. This could mean that an intermediate result is being cached.
100000 loops, best of 3: 14.2 µs per loop
data1.reset_index(inplace=True)

언급URL : https://stackoverflow.com/questions/20490274/how-to-reset-index-in-a-pandas-dataframe

반응형