更快的 strptime?
- 2025-01-13 08:53:00
- admin 原创
- 112
问题描述:
我有一段代码,可以读取大量“YYYY-MM-DD”格式的日期。解析所有这些日期,以便可以添加一天、两天或三天,然后以相同格式写回,这会大大减慢速度。
3214657 14.330 0.000 103.698 0.000 trade.py:56(effective)
3218418 34.757 0.000 66.155 0.000 _strptime.py:295(_strptime)
day = datetime.datetime.strptime(endofdaydate, "%Y-%m-%d").date()
有什么建议可以使其速度稍微(或大幅)加快?
解决方案 1:
7 倍的量够吗?
datetime.datetime.strptime(a, '%Y-%m-%d').date() # 8.87us
datetime.date(*map(int, a.split('-'))) # 1.28us
编辑:明确切片的好主意:
datetime.date(int(a[:4]), int(a[5:7]), int(a[8:10])) # 1.06us
这就是因子 8。
解决方案 2:
Python 3.7+:fromisoformat()
从 Python 3.7 开始,datetime
类有一个方法fromisoformat
。需要注意的是,这也可以应用于这个问题:
性能与……strptime()
与正常情况相比,显式字符串切片可能会使您的性能提高约 9 倍,但使用内置strptime
方法可以使性能提高约90 倍!fromisoformat
%timeit isofmt(datelist)
569 µs ± 8.45 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
%timeit slice2int(datelist)
5.51 ms ± 48.9 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
%timeit normalstrptime(datelist)
52.1 ms ± 1.27 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
from datetime import datetime, timedelta
base, n = datetime(2000, 1, 1, 1, 2, 3, 420001), 10000
datelist = [(base + timedelta(days=i)).strftime('%Y-%m-%d') for i in range(n)]
def isofmt(l):
return list(map(datetime.fromisoformat, l))
def slice2int(l):
def slicer(t):
return datetime(int(t[:4]), int(t[5:7]), int(t[8:10]))
return list(map(slicer, l))
def normalstrptime(l):
return [datetime.strptime(t, '%Y-%m-%d') for t in l]
print(isofmt(datelist[0:1]))
print(slice2int(datelist[0:1]))
print(normalstrptime(datelist[0:1]))
# [datetime.datetime(2000, 1, 1, 0, 0)]
# [datetime.datetime(2000, 1, 1, 0, 0)]
# [datetime.datetime(2000, 1, 1, 0, 0)]
Python 3.8.3rc1 x64 / Win10
解决方案 3:
对于 ISO 格式的无时区字符串,例如:"2021-01-04T14:30:03.123"
:
datetime.datetime(int(d[:4]), int(d[5:7]), int(d[8:10]), int(d[11:13]), int(d[14:16]), int(d[17:19]), int(d[20:]))
好像跑得比还快strptime()
。
相关推荐
热门文章
项目管理软件有哪些?
热门标签
云禅道AD