访问 ElementTree 节点的父节点-IT科技

访问 ElementTree 节点的父节点

2025-02-20 09:23:00

admin

原创

摘要：问题描述：我正在使用内置的 Python ElementTree 模块。访问子节点很简单，但是父节点或兄弟节点呢？ - 可以在不遍历整个树的情况下有效地完成此操作吗？解决方案 1：没有以属性形式提供的直接支持，但您也许可以使用此处parent描述的模式来实现所需的效果。建议使用以下一行代码（从链接的帖子更新到...

问题描述：

我正在使用内置的 Python ElementTree 模块。访问子节点很简单，但是父节点或兄弟节点呢？ - 可以在不遍历整个树的情况下有效地完成此操作吗？

解决方案 1：

没有以属性形式提供的直接支持，但您也许可以使用此处parent描述的模式来实现所需的效果。建议使用以下一行代码（从链接的帖子更新到 Python 3.8）为整个树创建子到父的映射，使用方法：xml.etree.ElementTree.Element.iter

parent_map = {c: p for p in tree.iter() for c in p}

解决方案 2：

Vinay 的答案应该仍然有效，但对于 Python 2.7+ 和 3.2+，建议如下：

parent_map = {c:p for p in tree.iter() for c in p}

getiterator()已被弃用，取而代之的是iter()，最好使用新的dict列表理解构造函数。

其次，在构建 XML 文档时，一个子文档可能会有多个父文档，不过一旦序列化文档，父文档就会被删除。如果这很重要，您可以尝试以下方法：

parent_map = {}
for p in tree.iter():
    for c in p:
        if c in parent_map:
            parent_map[c].append(p)
            # Or raise, if you don't want to allow this.
        else:
            parent_map[c] = [p]
            # Or parent_map[c] = p if you don't want to allow this

解决方案 3：

您可以...在 ElementTree 中使用 xpath 符号。

<parent>
     <child id="123">data1</child>
</parent>

xml.findall('.//child[@id="123"]...')
>> [<Element 'parent'>]

解决方案 4：

正如在使用 find 方法 (xml.etree.ElementTree) 后获取父元素中提到的那样，您必须对父元素进行间接搜索。拥有 xml：

<a>
 <b>
  <c>data</c>
  <d>data</d>    
 </b>
</a>

假设您已经将 etree 元素创建到xml变量中，则可以使用：

 In[1] parent = xml.find('.//c/..')
 In[2] child = parent.find('./c')

导致：

Out[1]: <Element 'b' at 0x00XXXXXX> 
Out[2]: <Element 'c' at 0x00XXXXXX>

较高等级的父母将被发现为secondparent=xml.find('.//c/../..')：<Element 'a' at 0x00XXXXXX>

解决方案 5：

在这里粘贴我的回答来自https://stackoverflow.com/a/54943960/492336：

我遇到过类似的问题，于是想出了一些办法。结果发现没有什么可以阻止我们自己添加父级信息。我们可以在不再需要时将其删除。

def addParentInfo(et):
    for child in et:
        child.attrib['__my_parent__'] = et
        addParentInfo(child)

def stripParentInfo(et):
    for child in et:
        child.attrib.pop('__my_parent__', 'None')
        stripParentInfo(child)

def getParent(et):
    if '__my_parent__' in et.attrib:
        return et.attrib['__my_parent__']
    else:
        return None

# Example usage

tree = ...
addParentInfo(tree.getroot())
el = tree.findall(...)[0]
parent = getParent(el)
while parent:
    doSomethingWith(parent)
    parent = getParent(parent)
stripParentInfo(tree.getroot())

解决方案 6：

XPath'..' 选择器不能用于在 3.5.3 和 3.6.1 上检索父节点（至少在 OSX 上），例如在交互模式下：

import xml.etree.ElementTree as ET
root = ET.fromstring('<parent><child></child></parent>')
child = root.find('child')
parent = child.find('..') # retrieve the parent
parent is None # unexpected answer True

最后的答案打破了所有希望......

解决方案 7：

得到了以下人的答复

https://towardsdatascience.com/processing-xml-in-python-elementtree-c8992941efd2

提示：在 XPath 中使用‘...’返回当前元素的父元素。


for object_book in root.findall('.//*[@name="The Hunger Games"]...'):
    print(object_book)

解决方案 8：

迄今为止发布的大多数解决方案

要么使用 XPath…但 Python 一般不支持使用 XPath 查找祖先（见注释），
或者在构建整个树之后对其进行后处理（例如这个答案或那个答案）...但这需要解析和构建整个树，这对于大型 XML 数据（例如 Wikipedia 转储）来说可能是不可取的。

如果您以增量方式解析 XML，例如使用xml.etree.ElementTree.iterparse
或，则可以通过跟踪标签（和事件）xml.etree.ElementTree.XMLPullParser的开始和结束来跟踪当前路径（从根节点到当前节点）。例如：start`end`

import xml.etree.ElementTree as ET

current_path = [ ]

for event, elem in ET.iterparse('test.xml', events=['start', 'end']):
    # opening tag:
    if event == 'start':
        current_path.append(elem)
    # closing tag:
    else:
        assert event == 'end'
        assert len(current_path) > 0 and current_path[-1] is elem
        current_path.pop()
        parent = current_path[-1] if len(current_path) > 0 else None
        # `elem` is the current element (fully built),
        # `parent` is its parent (some of its children after `elem`
        # might not have been parsed yet)
        #
        # ... do something ...

解决方案 9：

如果您使用 lxml，我可以使用以下命令获取父元素：

parent_node = next(child_node.iterancestors())

如果元素没有祖先，则会引发StopIteration异常 - 因此，如果您遇到这种情况，请做好捕获该异常的准备。

解决方案 10：

import xml.etree.ElementTree as ET

f1 = "yourFile"

xmlTree = ET.parse(f1)

for root in xmlTree.getroot():
    print(root.tag)

解决方案 11：

另一种方法是如果只想要一个子元素的父元素并且也知道子元素的 xpath。

parentElement = subElement.find(xpath+"/..")

解决方案 12：

查看 19.7.2.2. 部分：支持的 XPath 语法...

使用路径查找节点的父节点：

parent_node = node.find('..')