如何为 size() 列指定名称?

2025-02-27 09:07:00
admin
原创
22
摘要:问题描述:我正在使用.size()groupby 结果来计算每个组中有多少个项目。我希望将结果保存到新的列名中,而无需手动编辑列名数组,该怎么做?这是我尝试过的:grpd = df.groupby(['A','B']) grpd['size'] = grpd.size() grpd 我得到的错误是:TypeE...

问题描述:

我正在使用.size()groupby 结果来计算每个组中有多少个项目。

我希望将结果保存到新的列名中,而无需手动编辑列名数组,该怎么做?

这是我尝试过的:

grpd = df.groupby(['A','B'])
grpd['size'] = grpd.size()
grpd

我得到的错误是:

TypeError:'DataFrameGroupBy'对象不支持项目分配(在第二行)


解决方案 1:

DataFrameGroupBy 对象的内置方法.size()实际上返回的是具有组大小的 Series 对象,而不是 DataFrame。如果您想要一个 DataFrame,其列是组大小,按组索引,具有自定义名称,则可以使用该.to_frame()方法并使用所需的列名作为其参数。

grpd = df.groupby(['A','B']).size().to_frame('size')

如果您希望这些组再次成为列,您可以.reset_index()在末尾添加。

解决方案 2:

您需要-与以前相同:transform size`len`df

注意:

这里需要在后面添加一列groupby,否则会出现错误。因为GroupBy.sizecountNaN也是,所以使用哪一列并不重要。所有列的工作方式都相同。

import pandas as pd

df = pd.DataFrame({'A': ['x', 'x', 'x','y','y']
                , 'B': ['a', 'c', 'c','b','b']})
print (df)
   A  B
0  x  a
1  x  c
2  x  c
3  y  b
4  y  b

df['size'] = df.groupby(['A', 'B'])['A'].transform('size')
print (df)
   A  B  size
0  x  a     1
1  x  c     2
2  x  c     2
3  y  b     2
4  y  b     2

如果需要在聚合中设置列名df--len显然与以前df一样:

import pandas as pd

df = pd.DataFrame({'A': ['x', 'x', 'x','y','y']
                , 'B': ['a', 'c', 'c','b','b']})
print (df)
   A  B
0  x  a
1  x  c
2  x  c
3  y  b
4  y  b

df = df.groupby(['A', 'B']).size().reset_index(name='Size')
print (df)
   A  B  Size
0  x  a     1
1  x  c     2
2  y  b     2

解决方案 3:

结果df.groupby(...)不是 DataFrame。要返回 DataFrame,您必须对每个组应用函数、转换组中的每个元素或筛选组。

看起来您想要一个 DataFrame,其中包含 (1) 所有原始数据df和 (2) 每个组中数据的数量。这些东西的长度不同,因此如果它们需要放入同一个 DataFrame,您需要重复列出大小,即每个组中的每一行。

df['size'] = df.groupby(['A','B']).transform(np.size)

(附言:如果您能展示简洁的样本输入和预期结果,将会很有帮助。)

解决方案 4:

您可以设置as_index参数来groupby获取FalseDataFrame 而不是 Series:

df = pd.DataFrame({'A': ['a', 'a', 'b', 'b'], 'B': [1, 2, 2, 2]})

df.groupby(['A', 'B'], as_index=False).size()

输出:

   A  B  size
0  a  1     1
1  a  2     1
2  b  2     2

解决方案 5:

假设 n 是数据框的名称,cst 是重复项的数量。下面的代码给出了下一列中的计数

cstn=Counter(n.cst)
cstlist = pd.DataFrame.from_dict(cstn, orient='index').reset_index()
cstlist.columns=['name','cnt']
n['cnt']=n['cst'].map(cstlist.loc[:, ['name','cnt']].set_index('name').iloc[:,0].to_dict())

希望这会有用

相关推荐
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1289  
  IPD(Integrated Product Development)流程作为一种先进的产品开发管理模式,在众多企业中得到了广泛应用。其中,技术评审(TR,Technical Review)环节至关重要,它不仅是对技术方案的评估,更是激发创新思维、推动产品创新的关键节点。深入理解TR在IPD流程中的创新思维及其应用实践...
IPD流程中TR   9  
  IPD(Integrated Product Development)产品开发流程作为一种先进的产品开发管理模式,在众多企业中得到了广泛应用。它打破了传统产品开发过程中部门之间的壁垒,将市场、研发、生产、销售等各个环节有机整合在一起,形成一个高效协同的整体。通过这种方式,企业能够更快速、更精准地开发出满足市场需求的产品...
IPD管理流程   11  
  IPD(Integrated Product Development)流程作为一种先进的产品开发管理模式,在众多企业中得到了广泛应用。其中,技术评审(TR,Technical Review)环节在整个IPD流程里占据着关键位置,对项目的成功有着深远影响。深入探讨TR与项目成功的关系,有助于企业更好地运用IPD流程,提升...
IPD项目管理   8  
  IPD研发管理体系旨在打破部门墙,实现跨部门协同,确保产品开发以市场和客户需求为导向,高效、高质量地推出满足市场需求的产品。在这一体系下,产品创新可拆解为三个关键步骤,它们环环相扣,共同推动企业的产品不断迭代升级,在激烈的市场竞争中占据优势。这三个步骤分别聚焦于洞察市场机会、规划产品战略以及执行开发与验证,每一步都蕴含...
IPD框架   10  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用