如何在 python 中获取按创建日期排序的目录列表?

2024-12-31 08:38:00
admin
原创
46
摘要:问题描述:在 Windows 机器上使用 python 获取目录中所有文件列表(按日期[创建|修改]排序)的最佳方法是什么?解决方案 1:我以前曾使用 Python 脚本做过这样的事情,以确定目录中最后更新的文件:import glob import os search_dir = "/mydir...

问题描述:

在 Windows 机器上使用 python 获取目录中所有文件列表(按日期[创建|修改]排序)的最佳方法是什么?


解决方案 1:

我以前曾使用 Python 脚本做过这样的事情,以确定目录中最后更新的文件:

import glob
import os

search_dir = "/mydir/"
# remove anything from the list that is not a file (directories, symlinks)
# thanks to J.F. Sebastion for pointing out that the requirement was a list 
# of files (presumably not including directories)  
files = list(filter(os.path.isfile, glob.glob(search_dir + "*")))
files.sort(key=lambda x: os.path.getmtime(x))

这应该可以根据文件修改时间完成您要查找的操作。

编辑:请注意,如果需要,您还可以使用 os.listdir() 代替 glob.glob() - 我在原始代码中使用 glob 的原因是我想使用 glob 仅搜索具有特定文件扩展名集的文件,而 glob() 更适合。要使用 listdir,它看起来如下:

import os

search_dir = "/mydir/"
os.chdir(search_dir)
files = filter(os.path.isfile, os.listdir(search_dir))
files = [os.path.join(search_dir, f) for f in files] # add path to each file
files.sort(key=lambda x: os.path.getmtime(x))

解决方案 2:

更新dirpath:在 Python 3 中按修改日期对的条目进行排序:

import os
from pathlib import Path

paths = sorted(Path(dirpath).iterdir(), key=os.path.getmtime)

(将@Pygirl 的回答放在这里以提高可见度)

如果您已经有文件名列表files,则在 Windows 上按创建时间对其进行排序(确保列表包含绝对路径):

files.sort(key=os.path.getctime)

您可以获取的文件列表,例如,使用@Jay 的答案glob中所示的内容。


旧答案这是@Greg Hewgill答案
的更详细版本。它最符合问题要求。它区分了创建日期和修改日期(至少在 Windows 上)。

#!/usr/bin/env python
from stat import S_ISREG, ST_CTIME, ST_MODE
import os, sys, time

# path to the directory (relative or absolute)
dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'

# get all entries in the directory w/ stats
entries = (os.path.join(dirpath, fn) for fn in os.listdir(dirpath))
entries = ((os.stat(path), path) for path in entries)

# leave only regular files, insert creation date
entries = ((stat[ST_CTIME], path)
           for stat, path in entries if S_ISREG(stat[ST_MODE]))
#NOTE: on Windows `ST_CTIME` is a creation date 
#  but on Unix it could be something else
#NOTE: use `ST_MTIME` to sort by a modification date
        
for cdate, path in sorted(entries):
    print time.ctime(cdate), os.path.basename(path)

例子:

$ python stat_creation_date.py
Thu Feb 11 13:31:07 2009 stat_creation_date.py

解决方案 3:

有一个os.path.getmtime函数可以给出自纪元以来的秒数,并且应该比 更快os.stat

import os 

os.chdir(directory)
sorted(filter(os.path.isfile, os.listdir('.')), key=os.path.getmtime)

解决方案 4:

这是我的版本:

def getfiles(dirpath):
    a = [s for s in os.listdir(dirpath)
         if os.path.isfile(os.path.join(dirpath, s))]
    a.sort(key=lambda s: os.path.getmtime(os.path.join(dirpath, s)))
    return a

首先,我们建立一个文件名列表。isfile() 用于跳过目录;如果需要包含目录,则可以省略它。然后,我们使用修改日期作为键,就地对列表进行排序。

解决方案 5:

以下是一行代码:

import os
import time
from pprint import pprint

pprint([(x[0], time.ctime(x[1].st_ctime)) for x in sorted([(fn, os.stat(fn)) for fn in os.listdir(".")], key = lambda x: x[1].st_ctime)])

这将调用 os.listdir() 来获取文件名列表,然后对每个文件名调用 os.stat() 来获取创建时间,然后根据创建时间进行排序。

请注意,此方法仅对每个文件调用一次 os.stat(),这比在排序中的每个比较中调用它更有效。

解决方案 6:

在 Python 3.5+ 中

from pathlib import Path
sorted(Path('.').iterdir(), key=lambda f: f.stat().st_mtime)

解决方案 7:

不改变目录:

import os    

path = '/path/to/files/'
name_list = os.listdir(path)
full_list = [os.path.join(path,i) for i in name_list]
time_sorted_list = sorted(full_list, key=os.path.getmtime)

print time_sorted_list

# if you want just the filenames sorted, simply remove the dir from each
sorted_filename_list = [ os.path.basename(i) for i in time_sorted_list]
print sorted_filename_list

解决方案 8:

from pathlib import Path
import os

sorted(Path('./').iterdir(), key=lambda t: t.stat().st_mtime)

或者

sorted(Path('./').iterdir(), key=os.path.getmtime)

或者

sorted(os.scandir('./'), key=lambda t: t.stat().st_mtime)

其中 m 时间是修改时间。

解决方案 9:

如果您想按日期顺序读取具有特定扩展名的文件,这是我使用不带过滤器的 glob 的答案(Python 3)。

dataset_path='/mydir/'   
files = glob.glob(dataset_path+"/morepath/*.extension")   
files.sort(key=os.path.getmtime)

解决方案 10:

# *** the shortest and best way ***
# getmtime --> sort by modified time
# getctime --> sort by created time

import glob,os

lst_files = glob.glob("*.txt")
lst_files.sort(key=os.path.getmtime)
print("
".join(lst_files))

解决方案 11:

sorted(filter(os.path.isfile, os.listdir('.')), 
    key=lambda p: os.stat(p).st_mtime)

您可以使用os.walk('.').next()[-1]而不是 进行过滤os.path.isfile,但这会在列表中留下无效的符号链接,并os.stat会失败。

解决方案 12:

为了完整性os.scandir(比 快 2 倍pathlib):

import os
sorted(os.scandir('/tmp/test'), key=lambda d: d.stat().st_mtime)

解决方案 13:

这是学习的基本步骤:

import os, stat, sys
import time

dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'

listdir = os.listdir(dirpath)

for i in listdir:
    os.chdir(dirpath)
    data_001 = os.path.realpath(i)
    listdir_stat1 = os.stat(data_001)
    listdir_stat2 = ((os.stat(data_001), data_001))
    print time.ctime(listdir_stat1.st_ctime), data_001

解决方案 14:

如果该文件是一个不存在文件的符号链接,Alex Coventry 的答案将产生异常,以下代码可以纠正该答案:

import time
import datetime
sorted(filter(os.path.isfile, os.listdir('.')), 
    key=lambda p: os.path.exists(p) and os.stat(p).st_mtime or time.mktime(datetime.now().timetuple())

当文件不存在时,将使用 now(),并且符号链接将位于列表的最后。

解决方案 15:

这是我的版本:

import os

folder_path = r'D:Moviesextra
ewdramas' # your path
os.chdir(folder_path) # make the path active
x = sorted(os.listdir(), key=os.path.getctime)  # sorted using creation time

folder = 0

for folder in range(len(x)):
    print(x[folder]) # print all the foldername inside the folder_path
    folder = +1

解决方案 16:

以下是几行简单的代码,用于查找扩展名并提供排序选项

def get_sorted_files(src_dir, regex_ext='*', sort_reverse=False): 
    files_to_evaluate = [os.path.join(src_dir, f) for f in os.listdir(src_dir) if re.search(r'.*.({})$'.format(regex_ext), f)]
    files_to_evaluate.sort(key=os.path.getmtime, reverse=sort_reverse)
    return files_to_evaluate

解决方案 17:

在路径中添加文件目录/文件夹,如果要获取特定文件类型,请添加文件扩展名,然后按时间顺序获取文件名。这对我来说很有效。

import glob, os
from pathlib import Path
path = os.path.expanduser(file_location+"/"+date_file)  
os.chdir(path)    
saved_file=glob.glob('*.xlsx')
saved_file.sort(key=os.path.getmtime)

print(saved_file)

解决方案 18:

结果是按上次修改时间排序os.listdir,但是是反向的,因此您可以执行以下操作:

import os
last_modified=os.listdir()[::-1]

解决方案 19:

也许你应该使用 shell 命令。在 Unix/Linux 中,使用 sort 管道的 find 可能能够完成你想要的操作。

相关推荐
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1000  
  华为作为全球领先的信息与通信技术(ICT)解决方案提供商,其全球化项目的成功离不开高效的项目管理方法。其中,集成产品开发(IPD)流程是华为项目管理体系的核心组成部分。IPD流程不仅帮助华为在复杂的全球化项目中实现了资源的高效整合,还通过跨部门协作和持续优化,确保了项目的高质量交付。本文将通过具体案例,分析华为IPD流...
IPD测试流程   0  
  IPD(Integrated Product Development)是一种以跨职能团队协作为核心的产品开发流程,旨在通过整合资源、优化流程和提高决策效率,实现产品从概念到市场的快速、高效交付。IPD流程的核心思想是将传统的串行开发模式转变为并行开发模式,通过跨部门协作和早期风险识别,减少开发周期中的浪费和返工。这种方...
IPD流程分为几个阶段   0  
  华为的集成产品开发(IPD)流程是企业项目管理中的经典实践,其核心在于通过跨部门协同实现高效的产品开发。IPD流程强调从市场需求到产品交付的全生命周期管理,而跨部门沟通则是这一流程成功的关键。在华为的实践中,跨部门沟通不仅仅是信息的传递,更是团队协作、目标对齐和资源整合的重要手段。本文将深入探讨IPD流程中的跨部门沟通...
IPD项目管理咨询   0  
  IPD流程全称是集成产品开发(Integrated Product Development),它是一种以客户需求为导向、跨部门协作的产品开发模式。与传统产品开发模式相比,IPD强调在产品开发的早期阶段就整合市场、研发、制造、采购等多个部门的资源和能力,通过并行工程和协同工作来提升开发效率。IPD流程的核心在于打破部门壁...
IPD产品开发流程   0  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用