python怎么分组_python分组聚合

激活谷笔记 • 2025-04-27 10:42 • 阅读 143

在Python中，您可以使用`pandas`库来按照日期对数据进行分组。以下是一些示例代码，展示了如何使用`pandas`进行日期分组：

按天分组

 import pandas as pd 创建一个示例数据框 data = { 'date': pd.date_range（start='2020-04-01', end='2020-04-30'）, 'name': ['name' + str（i） for i in range（len（data['date']））], 'age': [random.randint（10, 71） for _ in range（len（data['date']））], 'city': ['city' + str（i） for i in range（len（data['date']））], 'gender': [random.choice（['m', 'wm']） for _ in range（len（data['date']））] } df = pd.DataFrame（data） 按天分组 grouped_by_day = df.groupby（df['date'].dt.date） 打印分组结果 for date, group in grouped_by_day: print（f"Date: {date}"） print（group） print（"\n"）

按月分组

 添加一个day_month变量来表示每个月的第一天 df['day_month'] = df['date'].dt.to_period（'M'）.dt.to_timestamp（） 按月分组 grouped_by_month = df.groupby（df['day_month']） 打印分组结果 for month, group in grouped_by_month: print（f"Month: {month}"） print（group） print（"\n"）

按小时分组

 按小时分组 grouped_by_hour = df.groupby（df['date'].dt.hour） 打印分组结果 for hour, group in grouped_by_hour: print（f"Hour: {hour}"） print（group） print（"\n"）

自定义时间间隔分组

 自定义时间间隔分组，例如每1秒 df['timestamp'] = df['date'].astype（int） // 109 将日期时间转换为Unix时间戳 grouped_by_second = df.groupby（df['timestamp'].astype（int） // 103） 每1秒一个组 打印分组结果 for second, group in grouped_by_second: print（f"Second: {second}"） print（group） print（"\n"）

以上示例展示了如何使用`pandas`的`groupby`方法按照不同的时间粒度对数据进行分组。您可以根据需要调整分组依据，例如按年、周、日等。

python怎么分组_python分组聚合

相关推荐