陳冠丞python的AI模式,pandas dataframe

 

GOOGLE AI模式在撰寫模式貼上

Pandas DataFrame 是 Python 中最核心的雙維度表格型資料結構,類似於 Excel 試算表或 SQL 資料表。它包含有序的欄位(Columns)與橫列(Rows),且每欄可以儲存不同的資料型態(如整數、字串、浮點數)。 [123]
1. 建立 DataFrame [12]
開發者通常透過 W3Schools Pandas 課程 學習基礎建置,最常見的方法是傳入 Python 字典或讀取外部檔案: [1234]
python
import pandas as pd

# 方法 A:使用字典建立(Key 為欄位名,Value 為資料列表)
data = {
    "Name": ["Mike", "Sherry", "Cindy"],
    "Age": [20, 21, 19]
}
df = pd.DataFrame(data)

# 方法 B:讀取 CSV 檔案
# df = pd.read_csv('data.csv')
請謹慎使用程式碼。
2. 核心屬性與檢視方法
建立物件後,可利用 Pandas 官方 API 說明 提供的屬性快速掌握資料輪廓: [1234]
  • df.shape:傳回資料列數與欄數的元組(Tuple)。
  • df.columns:列出所有欄位名稱。
  • df.index:列出列索引標籤。
  • df.info():顯示資料型態、記憶體用量與非空值計數。
  • df.head(n):預覽前 n 筆資料(預設為 5 筆)。
  • df.describe():輸出數值欄位的統計資訊(如平均值、標準差)。 [12345]
3. 資料篩選與選取
根據 Pandas 索引指南,主要選取方式分為標籤定位與位置定位: [123]
  • 選取特定欄位df['Name'](傳回單維度的 Pandas Series)。
  • 標籤選取(.loc)df.loc[0] 根據行或列的名稱/標籤提取資料。
  • 座標選取(.iloc)df.iloc[0, 1] 嚴格依據整數位置索引進行切片選取。
  • 條件篩選df[df['Age'] > 20] 篩選出符合特定布林條件的資料列。 [12345]
4. 常見資料操作
處理實際專案時,經常需要重新調整資料結構: [12]
  • 新增欄位df['New_Column'] = value 直接賦值即可追加至最後一欄。
  • 重設索引df.reset_index(drop=True) 清除因篩選或排序造成跳號的索引。
  • 合併表格df1.merge(df2, on='Key') 執行類似 SQL 的關聯式欄位合併。 [1]

留言

這個網誌中的熱門文章

陳冠丞2025年第三次期貨交易理論與實務

陳冠丞「python讀入csv檔案計算黃金交叉和死亡交叉」

陳冠丞python讀取CSV