陳冠丞python的AI模式,pandas dataframe
GOOGLE AI模式在撰寫模式貼上
Pandas DataFrame 是 Python 中最核心的雙維度表格型資料結構,類似於 Excel 試算表或 SQL 資料表。它包含有序的欄位(Columns)與橫列(Rows),且每欄可以儲存不同的資料型態(如整數、字串、浮點數)。 [1, 2, 3]python
import pandas as pd
# 方法 A:使用字典建立(Key 為欄位名,Value 為資料列表)
data = {
"Name": ["Mike", "Sherry", "Cindy"],
"Age": [20, 21, 19]
}
df = pd.DataFrame(data)
# 方法 B:讀取 CSV 檔案
# df = pd.read_csv('data.csv')
請謹慎使用程式碼。
2. 核心屬性與檢視方法
df.shape:傳回資料列數與欄數的元組(Tuple)。df.columns:列出所有欄位名稱。df.index:列出列索引標籤。df.info():顯示資料型態、記憶體用量與非空值計數。df.head(n):預覽前 n 筆資料(預設為 5 筆)。df.describe():輸出數值欄位的統計資訊(如平均值、標準差)。 [1, 2, 3, 4, 5]
3. 資料篩選與選取
- 選取特定欄位:
df['Name'](傳回單維度的 Pandas Series)。 - 標籤選取(.loc):
df.loc[0]根據行或列的名稱/標籤提取資料。 - 座標選取(.iloc):
df.iloc[0, 1]嚴格依據整數位置索引進行切片選取。 - 條件篩選:
df[df['Age'] > 20]篩選出符合特定布林條件的資料列。 [1, 2, 3, 4, 5]
4. 常見資料操作
- 新增欄位:
df['New_Column'] = value直接賦值即可追加至最後一欄。 - 重設索引:
df.reset_index(drop=True)清除因篩選或排序造成跳號的索引。 - 合併表格:
df1.merge(df2, on='Key')執行類似 SQL 的關聯式欄位合併。 [1]
