Pandas pd.Series() 函数
pd.Series()
是 Pandas 库中的一个核心函数,用于创建一维数组(类似于列表或 NumPy 数组),但它比普通数组更强大。Series
可以存储任何数据类型(如整数、字符串、浮点数等),并且每个元素都有一个与之关联的索引(index),这使得数据操作更加灵活。
pd.Series() 的基本语法
pd.Series(data, index=None, dtype=None, name=None, copy=False)
参数说明:
- data:数据,可以是列表、字典、NumPy 数组等。
- index:索引,用于标记数据。如果不指定,默认从 0 开始。
- dtype:数据类型,如
int
、float
、str
等。 - name:Series 的名称,通常用于标记数据。
- copy:是否复制数据,默认为
False
。
如何使用 pd.Series()?
示例 1:从列表创建 Series
实例
import pandas as pd
# 创建一个简单的 Series
data = [10, 20, 30, 40]
s = pd.Series(data)
print(s)
# 创建一个简单的 Series
data = [10, 20, 30, 40]
s = pd.Series(data)
print(s)
输出:
0 10 1 20 2 30 3 40 dtype: int64
解释:
- 数据
[10, 20, 30, 40]
被转换为一个 Series。 - 默认索引从 0 开始。
示例 2:指定索引
实例
# 创建 Series 并指定索引
data = [10, 20, 30, 40]
index = ['a', 'b', 'c', 'd']
s = pd.Series(data, index=index)
print(s)
data = [10, 20, 30, 40]
index = ['a', 'b', 'c', 'd']
s = pd.Series(data, index=index)
print(s)
输出:
a 10 b 20 c 30 d 40 dtype: int64
解释:
- 索引被指定为
['a', 'b', 'c', 'd']
,而不是默认的 0, 1, 2, 3。
示例 3:从字典创建 Series
实例
# 从字典创建 Series
data = {'a': 10, 'b': 20, 'c': 30, 'd': 40}
s = pd.Series(data)
print(s)
data = {'a': 10, 'b': 20, 'c': 30, 'd': 40}
s = pd.Series(data)
print(s)
输出:
a 10 b 20 c 30 d 40 dtype: int64
解释:
- 字典的键自动成为 Series 的索引,值成为数据。
示例 4:指定数据类型
实例
# 创建 Series 并指定数据类型为浮点数
data = [10, 20, 30, 40]
s = pd.Series(data, dtype=float)
print(s)
data = [10, 20, 30, 40]
s = pd.Series(data, dtype=float)
print(s)
输出:
0 10.0 1 20.0 2 30.0 3 40.0 dtype: float64
解释:
- 数据类型被指定为
float
,因此所有值都显示为浮点数。
Series 的常用操作
1. 访问数据
可以通过索引访问 Series 中的数据。
实例
s = pd.Series([10, 20, 30, 40], index=['a', 'b', 'c', 'd'])
print(s['b']) # 输出:20
print(s['b']) # 输出:20
2. 修改数据
可以通过索引修改 Series 中的数据。
实例
s['b'] = 25
print(s)
print(s)
输出:
a 10 b 25 c 30 d 40 dtype: int64
3. 切片操作
可以对 Series 进行切片操作。
实例
print(s['b':'d'])
输出:
b 25 c 30 d 40 dtype: int64
4. 数学运算
可以对 Series 进行数学运算。
实例
print(s * 2)
输出:
a 20 b 50 c 60 d 80 dtype: int64
点我分享笔记