python绘制柱状图,并添加标签
目录
- 1. 绘图
- 2. 解读
-
- 2.1 绘制标签
- 2.2 代码解读
- 2.3 xytext=(0, 3)
- 2.4 textcoords=”offset points”
- 3.标签获取(解读)
1. 绘图
利用下面的代码,绘制柱状图。
# season number , warning!!! not percent
def season_number(data_all_profile, output_num_season_png, sector_id=None, terrain=None, label=None):
df_season = data_all_profile['season'].value_counts()
# 希望的排序列表
desired_order = ['spring', 'summer', 'autumn', 'winter']
# 使用reindex方法按指定顺序重新排序
sorted_result = df_season.reindex(desired_order)
df_season = pd.DataFrame(sorted_result)
df_season.rename(columns={'season': 'count'}, inplace=True)
df_season = df_season.reset_index().rename(columns={'index': 'season'})
# 创建柱状图
plt.figure(figsize=(5, 3))
bars = plt.bar(df_season['season'], df_season['count'], width=0.3)
# 添加数据标签
for bar in bars:
height = bar.get_height()
plt.annotate(f'{height}',
xy=(bar.get_x() + bar.get_width() / 2, height),
xytext=(0, 3), # 3 points vertical offset
textcoords="offset points",
ha='center', va='bottom')
# 调整y轴上限,以确保标签可见
plt.ylim(0, max(df_season['count']) * 1.1)
plt.xticks(rotation=0)
plt.xlabel('season', fontsize=11)
plt.ylabel('数量(个)', fontsize=11)
plt.title('各季节风廓线数量分布')
plt.title(f'{terrain}-区域{sector_id}各季节风廓线数量分布')
plt.tight_layout()
plt.savefig(output_num_season_png) # 将图片保存为 output.png 文件
plt.close()

2. 解读
2.1 绘制标签
难点:绘制标签
# 添加数据标签
for bar in bars:
height = bar.get_height()
plt.annotate(f'{height}',
xy=(bar.get_x() + bar.get_width() / 2, height),
xytext=(0, 3), # 3 points vertical offset
textcoords="offset points",
ha='center', va='bottom')
bar.get_height()用于获取柱子的高度,也就是柱状图中每个柱子的高度值。在上面的代码中,我们使用这个高度值来确定要在柱子上方添加的数据标签的位置。
具体来说,这行代码:
height = bar.get_height()
将height设置为当前柱子的高度。然后,在plt.annotate()函数中,我们使用xy参数将标签的位置设置在柱子的中间,而height表示了柱子的高度,因此数据标签会被添加到每个柱子的中间位置,以显示柱子所代表的数据值。
这是一种常见的用法,用于在柱状图中添加数据标签。
2.2 代码解读
解释:xy=(bar.get_x() + bar.get_width() / 2, height)
代码 xy=(bar.get_x() + bar.get_width() / 2, height) 主要用于确定要放置数据标签的位置,具体来说:
- bar.get_x() 获取柱子的左边界的 x 坐标。
- bar.get_width() 获取柱子的宽度。
- bar.get_x() + bar.get_width() / 2 计算出柱子的中心 x 坐标。
- height 是柱子的高度,即柱子所代表的数据值。
这行代码将数据标签的位置设置为柱子的中心,横坐标为柱子中心的 x 坐标,纵坐标为柱子的高度,这样标签就会位于柱子的顶部中央,以显示柱子所代表的具体数据值。
例如,假设某个柱子的左边界的 x 坐标是 10,宽度是 2,高度是 20,那么这行代码的计算如下:
- bar.get_x() 得到 10。
- bar.get_width() 得到 2。
- bar.get_x() + bar.get_width() / 2 得到 11,这是柱子的中心 x 坐标。
- height 得到 20,柱子的高度。
因此,xy参数被设置为 (11, 20),这是数据标签的位置,使得标签位于柱子的中央顶部,以显示数据值 20。这种方法可确保数据标签位于柱子的合适位置,使得图表更易于理解。
2.3 xytext=(0, 3)
xytext 参数用于指定标签文本的偏移量,它是一个二元组,表示文本相对于 xy 参数指定的坐标的偏移量,其中第一个值表示水平偏移,第二个值表示垂直偏移。
在代码中,xytext=(0, 3) 的含义是:
- 水平偏移为 0,表示标签文本在水平方向上不进行偏移。
- 垂直偏移为 3,表示标签文本在垂直方向上相对于 xy 参数指定的坐标向上偏移 3 个单位。
这个偏移的目的是为了让数据标签稍微上移一点,以使标签文本不会与柱子的顶部重叠,从而更清晰地显示数据标签。通过微小的垂直偏移,可以改善标签的可读性,确保它们不会覆盖柱子或其他元素。
您可以根据需要调整 xytext 参数的值,以更好地控制标签的位置和外观。
2.4 textcoords=“offset points”
textcoords=”offset points” 是 annotate 函数中的一个参数,用于指定文本注释的坐标系统。具体来说,它告诉函数如何解释 xy 和 xytext 参数中的坐标值。
在这种情况下,textcoords 被设置为 “offset points”,意味着 xy 和 xytext 中的坐标值将被解释为以点(points)为单位的偏移量。这是为了方便指定相对于柱子或数据点的偏移量,而不是使用绝对的坐标值。
例如,如果您设置 xy=(11, 20) 和 xytext=(0, 3),那么这意味着:
- xy=(11, 20) 表示数据标签的基准点位于柱子中心的水平位置 x=11,垂直位置 y=20。
- xytext=(0, 3) 表示相对于 xy 指定的点,文本标签将向水平和垂直方向分别偏移 0 个点和 3 个点。
通过这种方式,您可以方便地指定相对于数据点的偏移量,以更好地控制标签的位置。如果您选择其他坐标系统,例如 “figure fraction” 或 “axes fraction”,那么坐标值将被解释为相对于图形或轴的比例位置。
ha 和 va 是 annotate 函数中的参数,用于控制文本注释(标签)的水平对齐和垂直对齐方式。
-
ha 表示水平对齐方式,它有以下可能的取值:
- ‘center’:文本水平居中对齐,默认值。
- ‘left’:文本左对齐。
- ‘right’:文本右对齐。
-
va 表示垂直对齐方式,它有以下可能的取值:
- ‘center’:文本垂直居中对齐,默认值。
- ‘top’:文本顶部对齐。
- ‘bottom’:文本底部对齐。
在您提供的代码中,ha=’center’ 表示文本水平居中对齐,va=’bottom’ 表示文本底部对齐。这意味着数据标签的文本将以底部对齐到 xy 指定的点。通常,这是一个常见的设置,以确保标签文本在柱子或数据点的底部显示,使其更易于阅读。
如果需要,您可以根据需要更改这些参数,以调整标签的水平和垂直对齐方式,以满足您的可视化需求。例如,将 va 设置为 ‘center’ 将使文本垂直居中对齐,而将 ha 设置为 ‘left’ 将使文本左对齐。
3.标签获取(解读)
for category in normalized_table_T.index:
for i, value in enumerate(normalized_table_T.loc[category]):
plt.text(i, value, f'{value:.2f}', ha='center', va='bottom', fontsize=10,
color=colors[normalized_table_T.index.get_loc(category)])
这段代码主要是用于在图表上为每个数据点添加文本标签。下面是对代码的逐行解读:
-
for category in normalized_table_T.index::这一行是遍历normalized_table_T的索引,其中normalized_table_T是一个pandas DataFrame。
-
for i, value in enumerate(normalized_table_T.loc[category])::这一行是遍历给定类别category下的所有值。enumerate用于获取每个值的索引i和值value。
-
plt.text(i, value, f'{value:.2f}’, ha=’center’, va=’bottom’, fontsize=10, color=colors[normalized_table_T.index.get_loc(category)]):这一行是用于在图表上添加文本标签的。
- i, value:这是文本标签的位置。i是x坐标,value是y坐标。
- f'{value:.2f}’:这是要显示的文本,它使用f-string格式化,显示value的值并保留两位小数。
- ha=’center’, va=’bottom’:这些是文本对齐选项。ha是水平对齐方式,这里设置为居中;va是垂直对齐方式,这里设置为底部。
- fontsize=10:设置字体大小为10。
- color=colors[normalized_table_T.index.get_loc(category)]:设置文本颜色。它从colors列表中获取一个颜色值,这个列表应该事先定义好了。normalized_table_T.index.get_loc(category)获取category在normalized_table_T索引中的位置,然后用这个位置从colors列表中获取颜色。
总的来说,这段代码遍历一个名为normalized_table_T的DataFrame,并在每个数据点上添加一个显示其值的文本标签,这些标签在图表上是居中且位于数据点的下方,字体大小为10,颜色根据类别从colors列表中获取。
本文来自网络,不代表协通编程立场,如若转载,请注明出处:https://net2asp.com/c5013da01d.html
