Python 中的目录树列表
- 2025-01-09 08:46:00
- admin 原创
- 79
问题描述:
如何在 Python 中获取给定目录中的所有文件(和目录)的列表?
解决方案 1:
这是遍历目录树中每个文件和目录的方法:
import os
for dirname, dirnames, filenames in os.walk('.'):
# print path to all subdirectories first.
for subdirname in dirnames:
print(os.path.join(dirname, subdirname))
# print path to all filenames.
for filename in filenames:
print(os.path.join(dirname, filename))
# Advanced usage:
# editing the 'dirnames' list will stop os.walk() from recursing into there.
if '.git' in dirnames:
# don't go into any .git directories.
dirnames.remove('.git')
解决方案 2:
您可以使用
os.listdir(path)
请参阅此处以获取更多操作系统功能:
Python 2 文档: https: //docs.python.org/2/library/os.html#os.listdir
Python 3 文档:https ://docs.python.org/3/library/os.html#os.listdir
解决方案 3:
这是我经常使用的辅助函数:
import os
def listdir_fullpath(d):
return [os.path.join(d, f) for f in os.listdir(d)]
解决方案 4:
import os
for filename in os.listdir("C:\\temp"):
print filename
解决方案 5:
如果你需要通配符能力,这里也有相应的模块。例如:
import glob
glob.glob('./[0-9].*')
将返回类似以下内容:
['./1.gif', './2.txt']
请参阅此处的文档。
解决方案 6:
对于当前工作目录中的文件,没有指定路径
蟒蛇2.7:
import os
os.listdir('.')
Python 3.x:
import os
os.listdir()
解决方案 7:
尝试一下:
import os
for top, dirs, files in os.walk('./'):
for nm in files:
print os.path.join(top, nm)
解决方案 8:
虽然os.listdir()
生成文件和目录名称列表已经足够了,但一旦有了这些名称,您通常还想做更多的事情 - 而在 Python3 中,pathlib使其他工作变得简单。让我们来看看,看看您是否和我一样喜欢它。
要列出目录内容,请构造一个 Path 对象并获取迭代器:
In [16]: Path('/etc').iterdir()
Out[16]: <generator object Path.iterdir at 0x110853fc0>
如果我们只想要一个事物名称的列表:
In [17]: [x.name for x in Path('/etc').iterdir()]
Out[17]:
['emond.d',
'ntp-restrict.conf',
'periodic',
如果你只想要目录:
In [18]: [x.name for x in Path('/etc').iterdir() if x.is_dir()]
Out[18]:
['emond.d',
'periodic',
'mach_init.d',
如果您想要该树中所有 conf 文件的名称:
In [20]: [x.name for x in Path('/etc').glob('**/*.conf')]
Out[20]:
['ntp-restrict.conf',
'dnsextd.conf',
'syslog.conf',
如果您想要树中 >= 1K 的配置文件列表:
In [23]: [x.name for x in Path('/etc').glob('**/*.conf') if x.stat().st_size > 1024]
Out[23]:
['dnsextd.conf',
'pf.conf',
'autofs.conf',
解析相对路径变得容易:
In [32]: Path('../Operational Metrics.md').resolve()
Out[32]: PosixPath('/Users/starver/code/xxxx/Operational Metrics.md')
使用路径导航非常清晰(尽管出乎意料):
In [10]: p = Path('.')
In [11]: core = p / 'web' / 'core'
In [13]: [x for x in core.iterdir() if x.is_file()]
Out[13]:
[PosixPath('web/core/metrics.py'),
PosixPath('web/core/services.py'),
PosixPath('web/core/querysets.py'),
解决方案 9:
递归实现
import os
def scan_dir(dir):
for name in os.listdir(dir):
path = os.path.join(dir, name)
if os.path.isfile(path):
print path
else:
scan_dir(path)
解决方案 10:
这是另一种选择。
os.scandir(path='.')
它返回与路径给定的目录中的条目(以及文件属性信息)相对应的 os.DirEntry 对象的迭代器。
例子:
with os.scandir(path) as it:
for entry in it:
if not entry.name.startswith('.'):
print(entry.name)
使用 scandir() 代替 listdir() 可以显著提高需要文件类型或文件属性信息的代码的性能,因为如果操作系统在扫描目录时提供这些信息,os.DirEntry 对象就会公开这些信息。所有 os.DirEntry 方法都可以执行系统调用,但 is_dir() 和 is_file() 通常只需要对符号链接进行系统调用;os.DirEntry.stat() 在 Unix 上始终需要系统调用,但在 Windows 上只需要对符号链接进行系统调用。
Python 文档
解决方案 11:
我写了一个长版本,其中包含我可能需要的所有选项:http://sam.nipl.net/code/python/find.py
我想它也适合这里:
#!/usr/bin/env python
import os
import sys
def ls(dir, hidden=False, relative=True):
nodes = []
for nm in os.listdir(dir):
if not hidden and nm.startswith('.'):
continue
if not relative:
nm = os.path.join(dir, nm)
nodes.append(nm)
nodes.sort()
return nodes
def find(root, files=True, dirs=False, hidden=False, relative=True, topdown=True):
root = os.path.join(root, '') # add slash if not there
for parent, ldirs, lfiles in os.walk(root, topdown=topdown):
if relative:
parent = parent[len(root):]
if dirs and parent:
yield os.path.join(parent, '')
if not hidden:
lfiles = [nm for nm in lfiles if not nm.startswith('.')]
ldirs[:] = [nm for nm in ldirs if not nm.startswith('.')] # in place
if files:
lfiles.sort()
for nm in lfiles:
nm = os.path.join(parent, nm)
yield nm
def test(root):
print "* directory listing, with hidden files:"
print ls(root, hidden=True)
print
print "* recursive listing, with dirs, but no hidden files:"
for f in find(root, dirs=True):
print f
print
if __name__ == "__main__":
test(*sys.argv[1:])
解决方案 12:
与我合作的是一个来自本页其他地方 Saleh 答案的修改版本。
代码如下:
dir = 'given_directory_name'
filenames = [os.path.abspath(os.path.join(dir,i)) for i in os.listdir(dir)]
解决方案 13:
一个很好的单行代码,可以递归列出文件。我在 setup.py package_data 指令中使用了这个:
import os
[os.path.join(x[0],y) for x in os.walk('<some_directory>') for y in x[2]]
我知道这不是问题的答案,但可能会有用
解决方案 14:
对于 Python 2
#!/bin/python2
import os
def scan_dir(path):
print map(os.path.abspath, os.listdir(pwd))
对于 Python 3
对于过滤器和映射,需要用 list() 包装它们
#!/bin/python3
import os
def scan_dir(path):
print(list(map(os.path.abspath, os.listdir(pwd))))
现在的建议是,您用生成器表达式或列表推导式替换 map 和 filter 的使用:
#!/bin/python
import os
def scan_dir(path):
print([os.path.abspath(f) for f in os.listdir(path)])
解决方案 15:
下面的代码将列出目录和目录中的文件
def print_directory_contents(sPath):
import os
for sChild in os.listdir(sPath):
sChildPath = os.path.join(sPath,sChild)
if os.path.isdir(sChildPath):
print_directory_contents(sChildPath)
else:
print(sChildPath)
解决方案 16:
#import modules
import os
_CURRENT_DIR = '.'
def rec_tree_traverse(curr_dir, indent):
"recurcive function to traverse the directory"
#print "[traverse_tree]"
try :
dfList = [os.path.join(curr_dir, f_or_d) for f_or_d in os.listdir(curr_dir)]
except:
print "wrong path name/directory name"
return
for file_or_dir in dfList:
if os.path.isdir(file_or_dir):
#print "dir : ",
print indent, file_or_dir,"\\\"
rec_tree_traverse(file_or_dir, indent*2)
if os.path.isfile(file_or_dir):
#print "file : ",
print indent, file_or_dir
#end if for loop
#end of traverse_tree()
def main():
base_dir = _CURRENT_DIR
rec_tree_traverse(base_dir," ")
raw_input("enter any key to exit....")
#end of main()
if __name__ == '__main__':
main()
解决方案 17:
仅供参考添加扩展名或 ext 文件导入操作系统的过滤器
path = '.'
for dirname, dirnames, filenames in os.walk(path):
# print path to all filenames with extension py.
for filename in filenames:
fname_path = os.path.join(dirname, filename)
fext = os.path.splitext(fname_path)[1]
if fext == '.py':
print fname_path
else:
continue
解决方案 18:
如果想通了,我会把它扔进去。进行通配符搜索的简单而肮脏的方法。
import re
import os
[a for a in os.listdir(".") if re.search("^.*.py$",a)]
解决方案 19:
以下是一行 Python 版本:
import os
dir = 'given_directory_name'
filenames = [os.path.join(os.path.dirname(os.path.abspath(__file__)),dir,i) for i in os.listdir(dir)]
此代码列出了给定目录名中所有文件和目录的完整路径。
解决方案 20:
我知道这是一个老问题。如果你使用的是 liunx 机器,这是我遇到的一个巧妙的方法。
import subprocess
print(subprocess.check_output(["ls", "/"]).decode("utf8"))
解决方案 21:
最简单的方法:
list_output_files = [os.getcwd()+"\\\"+f for f in os.listdir(os.getcwd())]