2019年4月24日 星期三

pandas Dataframe操作

import pandas as pd
df = pd.read_excel('b.xlsx', 'Acceptance')
df[df['Config 3'].notna()]

裡面的df['Config 3'].notna()是filter的方式,結果是列出所有Config13欄位不是na的 rows

Pandas的Series是縱向的,例如某個Column的值的列表

pandas兩個主要的data structure
DataFrame和Series
DataFrame就是Series的容器
Series就是純量的容器

Indexing / Selection

The basics of indexing are as follows:
OperationSyntaxResult
Select columndf[col]Series
Select row by labeldf.loc[label]Series
Select row by integer locationdf.iloc[loc]Series
Slice rowsdf[5:10]DataFrame
Select rows by boolean vectordf[bool_vec]DataFrame

如果要一個row一個row去做動作
df.iterrows()