备案控制台

开发者社区 Python中文社区文章正文

看到那个Edward 了吗？对！其实它是个Python库

2018-03-16 1355

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

今天，谷歌联合Columbia University、Adobe（就是你们知道的那个Adobe）提出深度概率编程语言Edward，我就其发布Edward的专业论文，给大家介绍一下，这个秒天秒地秒空气的牛逼哄哄的新语言（框架）。

为什么开发Edward？

因为现在的概率编程语言啊，

Too Young！Too Simple！

原文是这样的：

Rather, most existing probabilistic programming languages treat the inference engine as a black box,abstracted away from the model. These cannot capture the recent advances in probabilistic inference that reuse the model’s representation.

就是因为如今的概率编程语言，把引擎设置为一个黑箱。

其实这是把难度降低了，毕竟我们绝大多数用Keras这类框架的人，根本不去在意这个问题。而我们这些玩弄Keras的怪蜀黍们的应对的策略也很奔放——直接把Keras的源代码撬开改！

某科技媒体上的文章，说Edward是深度概率编程语言，然而，官网是这样的：

也就是说...这...是Python库啊。。。

Python库啊。。。

至少现在看，确实是Python库的吧。。。

文档中提到，支持的模型：

Directed graphical models
Neural networks (via libraries such as Keras and TensorFlow Slim)
Conditionally specified undirected models
Bayesian nonparametrics and probabilistic programs

也就是支持

定向图模型
神经网络（通过 Keras 和 TensorFlow Slim 等库）
条件特定的无向模型
贝叶斯非参数和概率程序

其实我还是觉得，就神经网络而言，Keras的易用性真的是太棒了！

在这里提一下，想上Edward之前先看看自己的Tensorflow的版本，Tensorflow作为一个日新月异的深度学习框架，肯定有不少人表示——给老子上最新的！

所以。。。你们就要GG了。。。

我不是针对你，我是说所有想玩Edward的同时还追求Tensorflow的，都要把版本弄回来。。。

在arXiv的论文中提到：

他的效率高很多，举个例子就是：他做蒙特卡罗哈密顿方法，效率比别人高35倍

在Edward里，随机变量的地位很高，是类对象。

先科普一个常识，张量，就是Tensor，就是Tensorflow的那个Tensor，也就是多维数组。

另外，每个随机变量与张量相关联，其表示单个样本方法，例如以计算对数密度和该关联将随机变量嵌入到计算图形中，其中节点表示张量和边际上的操作，表示张量在它们之间通信的符号框架。

而这种设计有助于在计算图框架中开发概率程序，也是Edward堪称“语言”的地方吧。所有的计算都可以在图表上表示。这使得很容易组成具有复杂确定性结构的随机变量，比如说深层神经网络，一组不同的数学运算以及在同一框架上构建的第三方库。噢对了，这种的设计还能使随机变量的组合能够捕获复杂的随机结构。

举个例子：

随机变量是50维的，由随机张量参数化。获取对象运行图形：它从生成过程模拟并输出50个元素的二进制向量。

现在来实操一番：

当然了，安装的方法也是熟悉的味道。。

pip install edward

首先，定一个小目标，比如弄50个小数据

我们把y设置为一个在x附近有一丢丢摆动的正弦值。

定义一个两层贝叶斯网络，用tanh来定义非线性的神经网络

可能画出来会比较直观一点

是吧，跟段子一般的简单。接下来我们从数据反怼出模型，用边分推理对权重和偏差指定正态近似。

在这里科普一下什么是变分推理：

变分推断是一类用于贝叶斯估计和机器学习领域中近似计算复杂（intractable）积分的技术，变分推断限制近似分布的类型，从而得到一种局部的最优，但具有确定解的近似后验分布。需要提一下的是，虽然都是通过抽取大量的样本估计真实的后验分布，但是变分推断和猛上之后的蒙特卡洛方法是有大大的区别的。

在Edward中的变分推理的实现方法是酱紫的：

既然提到了Monte Carlo嘛。。。

在Edward中的Monte Carlo的实现是这样的。。。

其中，T为样本数量。

好的，那么我们就来做一个：

定义tf.Variable允许变分因子的参数变化。

它们都被初始化为0.用softplus transformation，使标准偏差参数被调整为大于零。

用Kullback-Leibler散度运行变分推理，以推断模型的给定数据的潜在变量。

科普时间到：

Kullback-Leibler散度也称为辨别信息，信息散度，信息增益，相对熵，KLIC，KL散度（我也不知道为什么名字那么的长啊长）。

它是在两个概率分布P和Q之间的差异的测量。在P和Q中不对称。P通常表示数据的“真实”分布，观察或精确计算的理论分布，而Q通常表示理论、模型、描述或近似。

我们就做个。。。1000次迭代吧？

最后，评价模型拟合水平。

贝叶斯神经网络定义了神经网络上的分布，因此我们可以执行图形检查，将模型打印出来，看看是不是和我们一开始定义的模型，也就是一个在余弦曲线上摆动有一定的摆动的图样。

显然，该模型真的已捕获观察域中x和y之间的余弦关系。

即，模型拟合通过。

原则上，就这么简单的通过了，但是Edward在安装的时候确实废了我不少心血，同时在调整模型的时候屡次GG，觉得。。。虽然它是个很棒的工具，从效率上来看（至少官方公布的效率，绝对是扛把子级别的）

原文发布时间为：2017-01-23

本文作者：那只猫

本文来自云栖社区合作伙伴“Python中文社区”，了解相关信息可以关注“Python中文社区”微信公众号

文章标签：

Python

机器学习/深度学习

算法框架/工具

TensorFlow

关键词：

Python库

青衫无名

目录

相关文章

vohelon

|

25天前

|

XML JSON 数据库

Python的标准库

Python的标准库

vohelon

162 77 77

游客762btuqu5wybw666

|

2月前

|

调度开发者 Python

Python中的异步编程：理解asyncio库

在Python的世界里，异步编程是一种高效处理I/O密集型任务的方法。本文将深入探讨Python的asyncio库，它是实现异步编程的核心。我们将从asyncio的基本概念出发，逐步解析事件循环、协程、任务和期货的概念，并通过实例展示如何使用asyncio来编写异步代码。不同于传统的同步编程，异步编程能够让程序在等待I/O操作完成时释放资源去处理其他任务，从而提高程序的整体效率和响应速度。

游客762btuqu5wybw666

69 0 0

土木林森

|

2月前

|

数据采集存储数据挖掘

Python数据分析：Pandas库的高效数据处理技巧

【10月更文挑战第27天】在数据分析领域，Python的Pandas库因其强大的数据处理能力而备受青睐。本文介绍了Pandas在数据导入、清洗、转换、聚合、时间序列分析和数据合并等方面的高效技巧，帮助数据分析师快速处理复杂数据集，提高工作效率。

土木林森

85 0 0

冷冻工厂

|

2月前

|

机器学习/深度学习算法数据挖掘

数据分析的 10 个最佳 Python 库

数据分析的 10 个最佳 Python 库

冷冻工厂

102 4 4

数据分析的 10 个最佳 Python 库

vohelon

|

26天前

|

XML JSON 数据库

Python的标准库

Python的标准库

vohelon

47 11 11

蚝油菜花

|

2月前

|

人工智能 API 开发工具

aisuite：吴恩达发布开源Python库，一个接口调用多个大模型

吴恩达发布的开源Python库aisuite，提供了一个统一的接口来调用多个大型语言模型（LLM）服务。支持包括OpenAI、Anthropic、Azure等在内的11个模型平台，简化了多模型管理和测试的工作，促进了人工智能技术的应用和发展。

蚝油菜花

133 1 1

aisuite：吴恩达发布开源Python库，一个接口调用多个大模型

小白的大数据之旅

|

2月前

|

XML 存储数据库

Python中的xmltodict库

xmltodict是Python中用于处理XML数据的强大库，可将XML数据与Python字典相互转换，适用于Web服务、配置文件读取及数据转换等场景。通过`parse`和`unparse`函数，轻松实现XML与字典间的转换，支持复杂结构和属性处理，并能有效管理错误。此外，还提供了实战案例，展示如何从XML配置文件中读取数据库连接信息并使用。

小白的大数据之旅

47 8 8

Python中的xmltodict库

蓝易云

|

26天前

|

数据可视化 Python

以下是一些常用的图表类型及其Python代码示例，使用Matplotlib和Seaborn库。

通过这些思维导图和分析说明表，您可以更直观地理解和选择适合的数据可视化图表类型，帮助更有效地展示和分析数据。

蓝易云

64 8 8

蚝油菜花

|

2月前

|

存储人工智能搜索推荐

Memoripy：支持 AI 应用上下文感知的记忆管理 Python 库

Memoripy 是一个 Python 库，用于管理 AI 应用中的上下文感知记忆，支持短期和长期存储，兼容 OpenAI 和 Ollama API。

蚝油菜花

100 6 6

Memoripy：支持 AI 应用上下文感知的记忆管理 Python 库

站大爷

|

1月前

|

安全 API 文件存储

Yagmail邮件发送库：如何用Python实现自动化邮件营销？

本文详细介绍了如何使用Yagmail库实现自动化邮件营销。Yagmail是一个简洁强大的Python库，能简化邮件发送流程，支持文本、HTML邮件及附件发送，适用于数字营销场景。文章涵盖了Yagmail的基本使用、高级功能、案例分析及最佳实践，帮助读者轻松上手。

站大爷

35 4 4

Python中文社区

热门文章

最新文章

使用Python实现智能食品库存管理的深度学习模型

Python实现常用办公文件格式转换

猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法

pyenv 管理多个 Python 版本(1)

Python编程数据结构的深入理解

Python的标准库

利用Python内置函数实现的冒泡排序算法

使用Python实现智能食品消费习惯分析的深度学习模型

使用Python实现深度学习模型的分布式训练

在 Python 中，如何将日期时间类型转换为字符串？

Python 密码学实用指南（全）（2）

【python】习题第10周

【python】习题第8周

【python】习题第7周（上）

【python】习题 6-10周（下）

【python】习题 6-10周（中）

Python 入门指南（七）（4）

【python】习题 1-5周（中）

【python】习题 1-5周（上）

Python 入门指南（七）（2）

相关课程

更多

Python爬虫实战

Python开发基础入门

Python常用数据科学库

Python网络爬虫实战

Python完全自学手册图文教程

Python基础快速入门实战教程

相关电子书

更多

From Python Scikit-Learn to Sc

Data Pre-Processing in Python:

双剑合璧-Python和大数据计算平台的结合

相关实验场景

更多

用Python画圣诞树

Python选择及循环结构

云端Python及基本操作

Python网络通信程序典型应用

Python新手入门（Anolis OS）

Python新手入门

推荐镜像

更多

python-release

nodejs-release

composer

下一篇

阿里云无影云电脑免费试用，最长可试用3个月