2020年10月5日,在全国人员欢度国庆节和中秋节时,Python 3.9 悄摸摸地正式发布了。我们来一起来看看,这个版本有哪些好玩的新特性,以及对我们部门目前的产品可能会带来哪些影响。

因为jupyter notebook/lab等工具还没有相应适配到python 3.9,所以我们还无法使用,因此本文就使用python 的交互行来演示。

Python 3.9 官方文档, What’s New in Python 3.9 ,其文字组织的很好,我们接下来也按照这个顺序来讲解,依次是,release highlights, new features, new modules, improve modules, optimizations, deprecated, removed.大家注意看下,这个文字组织顺序,其实在我们产品发布时,也是适用的。先讲这个版本有什么吸引人的highlights,然后介绍新版本的新内容,最后介绍deprecated / removed,提醒大家升级时需要注意什么,条理很清晰。

安装

到2020年10月9日为止,anaconda上还没有任何channel支持对python 3.9的直接安装,所以想尝鲜,有2种方法:

1.到http://python.org上下载安装包

2.到anaconda的conda-forge channel下载安装文件

我们使用第二种方法,安装文件下载链接见 References。

	$ conda create -n py39 -c conda-forge -y
	$ conda activate py39
	$ conda install python-3.9.0-h60c2a47_1_cpython.tar.bz2

	$ which python
	/d/Anaconda3/envs/py39/python
	$ python -V
	Python 3.9.0

Release Highlights

Python 3.9 内容包括:

  • 3个新的语法特性
  • 1个新的内置特性
  • 2个新的标准库特性
  • 6点解释器提升
  • 2个新的库模块

如果把以上所有内容都过一遍,可能需要1-2小时。我们这里就挑一些与我们部门产品开发相关的内容,具体来讲一讲,其它内容如果有兴趣,可以自行去读读。

New Features

Dictionary Merge & Update Operators

dict类提供了merge (|) 和 update (|=) 操作符。

	# py38
	>>> x = {"key1": "value1 from x", "key2": "value2 from x"}
	>>> y = {"key2": "value2 from y", "key3": "value3 from y"}
	>>> {**x, **y}
	{'key1': 'value1 from x', 'key2': 'value2 from y', 'key3': 'value3 from y'}
	>>> x.update(y)
	>>> x
	{'key1': 'value1 from x', 'key2': 'value2 from y', 'key3': 'value3 from y'}

	# py39
	>>> x = {"key1": "value1 from x", "key2": "value2 from x"}
	>>> y = {"key2": "value2 from y", "key3": "value3 from y"}
	>>> x | y
	{'key1': 'value1 from x', 'key2': 'value2 from y', 'key3': 'value3 from y'}
	>>> y | x
	{'key2': 'value2 from x', 'key3': 'value3 from y', 'key1': 'value1 from x'}

这在dict操作时,会更方便。

New string methods to remove prefixes and suffixes

	>>> "NavyXie".removeprefix("Navy")
	'Xie'
	>>> "NavyXie".removesuffix("Xie")
	'Navy'

这在string删除不需要的prefix 或 suffix时,会更方便。

Type hinting generics in standard collections

在type annotation中,可以使用内置的collection类型,如list和dict,而不用导入相应的大写类型,如 typing.List 或 typing.Dict。

	def greet_all(names: list[str]) -> None:
	    for name in names:
	        print("Hello", name)

Annotation是python 3.0 引入的特征,是做什么用的呢?与Java / C / C++ / Swift等强类型语言不同,Python和JavaScript都是弱类型语言,这里类型annotation并不会在解析或运行时强制要求传参的类型,而只是帮助开发者的代码阅读和维护。

另外,如果我们使用python 3.7引入的库,dataclasses,时,就会发现,type annotation在定义一个data类时,是强制要求的,比如:

	>>> from dataclasses import dataclass
	>>> @dataclass
	... def TestClass:
	...    name: str
	...
	>>> TestClass.__annotations__
	{'name': <class 'str'>}

这个时候就会比较有用,我们可以这样写:

	names: list[str]

而不用像之前那样:

	names: List[str]

新的解析器

Python 3.9 开始使用新的解析器,基于 PEG,而取代LL(1)。两者的性能相差不大,但PEG更灵活。从这里我们可以推断,从Python 3.10开始,将会引入更多新的语言特性。

zoneinfo

这个新模块,在我们操作时区时,会比较方便。之前我们处理timezone时,需要通过pytz包,比如:

	# py38
	import pytz
	from datetime import datetime

	tz = pytz.timezone("America/Los_Angeles")
	start_time = datetime.now(tz)

现在可以通过标准库中的zoneinfo模块,比如:

	from zoneinfo import ZoneInfo

	tz = ZoneInfo("America/Los_Angeles")

其它变化

在python 3.8中,Vectorcall协议被临时引入,3.9中,对内置类型,包括,range, tuple, set, frozenset, list, dict,都使用vectorcall协议进行了优化。但有趣的是,从性能优化报告中,我们可以看到,从3.8到3.9的性能并没有什么提升,甚至有小幅下降。

	Python version                       3.4     3.5     3.6     3.7     3.8    3.9
	--------------                       ---     ---     ---     ---     ---    ---

	Variable and attribute read access:
	    read_local                       7.1     7.1     5.4     5.1     3.9    4.0
	    read_nonlocal                    7.1     8.1     5.8     5.4     4.4    4.8
	    read_global                     15.5    19.0    14.3    13.6     7.6    7.7
	    read_builtin                    21.1    21.6    18.5    19.0     7.5    7.7
	    read_classvar_from_class        25.6    26.5    20.7    19.5    18.4   18.6
	    read_classvar_from_instance     22.8    23.5    18.8    17.1    16.4   20.1
	    read_instancevar                32.4    33.1    28.0    26.3    25.4   27.7
	    read_instancevar_slots          27.8    31.3    20.8    20.8    20.2   24.5
	    read_namedtuple                 73.8    57.5    45.0    46.8    18.4   23.2
	    read_boundmethod                37.6    37.9    29.6    26.9    27.7   45.9

	Variable and attribute write access:
	    write_local                      8.7     9.3     5.5     5.3     4.3    4.2
	    write_nonlocal                  10.5    11.1     5.6     5.5     4.7    4.9
	    write_global                    19.7    21.2    18.0    18.0    15.8   17.2
	    write_classvar                  92.9    96.0   104.6   102.1    39.2   43.2
	    write_instancevar               44.6    45.8    40.0    38.9    35.5   40.7
	    write_instancevar_slots         35.6    36.1    27.3    26.6    25.7   27.7

	Data structure read access:
	    read_list                       24.2    24.5    20.8    20.8    19.0   21.1
	    read_deque                      24.7    25.5    20.2    20.6    19.8   21.6
	    read_dict                       24.3    25.7    22.3    23.0    21.0   22.5
	    read_strdict                    22.6    24.3    19.5    21.2    18.9   21.6

	Data structure write access:
	    write_list                      27.1    28.5    22.5    21.6    20.0   21.6
	    write_deque                     28.7    30.1    22.7    21.8    23.5   23.2
	    write_dict                      31.4    33.3    29.3    29.2    24.7   27.8
	    write_strdict                   28.4    29.9    27.5    25.2    23.1   29.8

	Stack (or queue) operations:
	    list_append_pop                 93.4   112.7    75.4    74.2    50.8   53.9
	    deque_append_pop                43.5    57.0    49.4    49.2    42.5   45.5
	    deque_append_popleft            43.7    57.3    49.7    49.7    42.8   45.5

	Timing loop:
	    loop_overhead                    0.5     0.6     0.4     0.3     0.3    0.3

备注:以上结果是python 官方 benchmark, Tools/scripts/var_access_benchmark.py, 的运行结果,单位为纳秒,硬件为Intel® Core™ i7-4960HQ 处理器,OS为macOS 64-bit。

注意 Deprecated / Removed

我提取了一些与我们部门产品可能相关度比较高的几点:

(1)Python 3.9 是提供 Python 2向后兼容的最后一个版本,所以在下个版本 Python 3.10 将不在兼容 Python 2。

(2)threading.Thread类的 isAlive() 方法被删除,用is_alive()取代。

(3)base64.encodestring() 和 base64.decodestring() 被删除,用base64.encodebytes() 和 base64.decodebytes() 取代。

(4)json.loads()的encoding参数被删除,encoding必须为UTF-8, UTF-16或UTF-32.

复习 Python 3.8 的几点特性

最后,我们再复习下 python 3.8 的几点新特性,如果工作中没有尝试过,那就马上试试吧。

  • 海象操作符 :=
	if (n := len(a)) > 10:
	    print(f"List is too long ({n} elements, expected <= 10)")
  • Positional-only 参数
	def f(a, b, /, c, d, *, e, f):
	    print(a, b, c, d, e, f)
  • f-string支持 =
	>>> user = 'eric_idle'
	>>> member_since = date(1975, 7, 31)
	>>> f'{user=} {member_since=}'
	"user='eric_idle' member_since=datetime.date(1975, 7, 31)"

	>>> delta = date.today() - member_since
	>>> f'{user=!s}  {delta.days=:,d}'
	'user=eric_idle  delta.days=16,075'

	>>> print(f'{theta=}  {cos(radians(theta))=:.3f}')
	theta=30  cos(radians(theta))=0.866

References

  • What’s new in python 3.9, https://docs.python.org/3/whatsnew/3.9.html

  • What’s new in python 3.8, https://docs.python.org/3/whatsnew/3.8.html

  • Conda-forge python files, https://anaconda.org/conda-forge/python/files

  • Python 3.9 tar, https://anaconda.org/conda-forge/python/3.9.0/download/win-64/python-3.9.0-h60c2a47_1_cpython.tar.bz2

点击关注,第一时间了解华为云新鲜技术~

04-22 14:58