图灵奖得主David Patterson:将Python重写为C,性能最高提升1000倍!

简介:

2017年图灵奖得主之一、加州大学教授、Google工程师和RISC先驱David Patterson表示,没有什么是比现在从事计算机系统结构更好的时候了。

那是因为,摩尔定律真的结束了,他说:“如果摩尔定律仍然有效,那我们现在就落后了15倍。我们正处于后摩尔定律时代(post-Moore’s Law era)。”

上周,在圣何塞举行的2018年@Scale会议上,Patterson表示,“我们已经处于性能增长的最后阶段。当性能每18个月翻一番时,人们就会丢掉用得好好的台式电脑,因为他们朋友的新电脑速度要快得多得多。”

但去年,Patterson曾说,“运行单个程序的性能只增长了3%,因此它是每20年翻一番。如果你只是坐在那里等着芯片变得更快,你将不得不等待很长的时间。”

对于像Patterson这样的计算机架构师来说,这实际上是个好消息。他同时指出,这也是软件工程师创新的好机会。“专为处理特定类型计算问题而定制的革命性的新硬件架构和新软件语言,正等待我们去开发,”Patterson说:“这些事情你只要去做,就有机会拿图灵奖。”

作为软件方面的一个例子,Patterson表示将Python重写为C可以使性能提高50倍。加上其他一些优化方法,速度会急剧增加,与原始Python程序相比性能提高1000倍也是完全有可能的

在硬件方面,Patterson认为特定领域架构(domain-specific architectures,DSA)运行得更好。他说:“这不是魔术,只是我们能做的一些事情。”例如,应用程序并不都需要用同样精度的计算。他说,对于有些应用,你可以使用比常规的IEEE 754标准更低精度的浮点运算。

Patterson说,机器学习是现在应用这种新架构和语言的最大机会。“如果你是做硬件的,”他说,“你希望你的朋友都恨不得要更多更多的计算机。”而机器学习对于计算来说是“贪婪的,我们太喜欢了”。

他说,如今,关于哪种类型的计算机架构最适合机器学习,业界有很多争议,有很多公司在不同的架构上下注。谷歌拥有张量处理单元(TPU),每个芯片有一个核心和用软件控制的内存(而非缓存),英伟达的GPU则拥有80多个内核;微软正在走FPGA的路线。

至于英特尔,Patterson表示他们“在所有的赛道上都下了注”,为机器学习推销传统的CPU,收购Altera(这家公司向微软提供FPGA),并且收购Nervana,后者专注于开发神经网络专用处理器(类似于谷歌的TPU)。

除了这些大公司外,Patterson表示至少还有45家硬件初创公司都在解决这个问题,即设计机器学习专用架构。最终,他说,市场将决定一切。

“现在,”他说,“是计算机系统结构的黄金时代。”



原文发布时间为:2018-09-18

本文作者:李静怡

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。

原文链接:图灵奖得主David Patterson:将Python重写为C,性能最高提升1000倍!

相关文章
|
6月前
|
机器学习/深度学习 数据采集 算法
Python AutoML框架选型攻略:7个工具性能对比与应用指南
本文系统介绍了主流Python AutoML库的技术特点与适用场景,涵盖AutoGluon、PyCaret、TPOT、Auto-sklearn、H2O AutoML及AutoKeras等工具,帮助开发者根据项目需求高效选择自动化机器学习方案。
708 1
|
8月前
|
数据采集 测试技术 C++
无headers爬虫 vs 带headers爬虫:Python性能对比
无headers爬虫 vs 带headers爬虫:Python性能对比
|
4月前
|
数据采集 存储 Web App开发
Python爬虫库性能与选型实战指南:从需求到落地的全链路解析
本文深入解析Python爬虫库的性能与选型策略,涵盖需求分析、技术评估与实战案例,助你构建高效稳定的数据采集系统。
414 0
|
7月前
|
网络协议 API 开发者
分析http.client与requests在Python中的性能差异并优化。
合理地选择 `http.client`和 `requests`库以及在此基础上优化代码,可以帮助你的Python网络编程更加顺利,无论是在性能还是在易用性上。我们通常推荐使用 `requests`库,因为它的易用性。对于需要大量详细控制的任务,或者对性能有严格要求的情况,可以考虑使用 `http.client`库。同时,不断优化并管理员连接、设定合理超时和重试都是提高网络访问效率和稳定性的好方式。
188 19
|
6月前
|
网络协议 API Python
解析http.client与requests在Python中的性能比较和改进策略。
最后,需要明确的是,这两种库各有其优点和适用场景。`http.client` 更适合于基础且并行的请求,`requests` 则因其易用且强大的功能,更适用于复杂的 HTTP 场景。对于哪种更适合你的应用,可能需要你自己进行实际的测试来确定。
187 10
|
机器学习/深度学习 Python
堆叠集成策略的原理、实现方法及Python应用。堆叠通过多层模型组合,先用不同基础模型生成预测,再用元学习器整合这些预测,提升模型性能
本文深入探讨了堆叠集成策略的原理、实现方法及Python应用。堆叠通过多层模型组合,先用不同基础模型生成预测,再用元学习器整合这些预测,提升模型性能。文章详细介绍了堆叠的实现步骤,包括数据准备、基础模型训练、新训练集构建及元学习器训练,并讨论了其优缺点。
765 3
|
11月前
|
测试技术 数据库 Python
Python装饰器实战:打造高效性能计时工具
在数据分析中,处理大规模数据时,分析代码性能至关重要。本文介绍如何使用Python装饰器实现性能计时工具,在不改变现有代码的基础上,方便快速地测试函数执行时间。该方法具有侵入性小、复用性强、灵活度高等优点,有助于快速发现性能瓶颈并优化代码。通过设置循环次数参数,可以更准确地评估函数的平均执行时间,提升开发效率。
287 61
Python装饰器实战:打造高效性能计时工具
|
9月前
|
缓存 并行计算 数据处理
全面提升Python性能的十三种优化技巧
通过应用上述十三种优化技巧,开发者可以显著提高Python代码的执行效率和性能。每个技巧都针对特定的性能瓶颈进行优化,从内存管理到并行计算,再到使用高效的数值计算库。这些优化不仅能提升代码的运行速度,还能提高代码的可读性和可维护性。希望这些技巧能帮助开发者在实际项目中实现更高效的Python编程。
735 22
|
11月前
|
并行计算 安全 Java
Python GIL(全局解释器锁)机制对多线程性能影响的深度分析
在Python开发中,GIL(全局解释器锁)一直备受关注。本文基于CPython解释器,探讨GIL的技术本质及其对程序性能的影响。GIL确保同一时刻只有一个线程执行代码,以保护内存管理的安全性,但也限制了多线程并行计算的效率。文章分析了GIL的必要性、局限性,并介绍了多进程、异步编程等替代方案。尽管Python 3.13计划移除GIL,但该特性至少要到2028年才会默认禁用,因此理解GIL仍至关重要。
886 16
Python GIL(全局解释器锁)机制对多线程性能影响的深度分析
|
缓存 并行计算 算法
如何提高 Python 高阶函数的性能?
【10月更文挑战第2天】
284 157

推荐镜像

更多