早期的web应用非常简单,可以直接加载js的形式去实现。随着需求的越来越多,应用越做越大,需要模块化去管理项目中的js、css、图片等资源。这里有很多大家熟悉的模块化标准, CJS、AMD、CMD、UMD 等等。模块化提供了我们更好的方式来组织和维护函数以及变量。而在 npm 生态开发的背景下,CJS 模块是开发过程中接触最多也是无法避免的。但由于浏览器并不能直接执行基于 CJS 打包的模块,因此类似 webpack 等打包工具便应运而生。随着webpack 大有一统构建工具的趋势下,JavaScript 官方的标准化模块系统ESM完成了。本文主要介绍下模块化标准间差异、基本加载原理。
模块化发展
1、为何要模块化
仔细想想,用 JavaScript 编码就是管理变量。这一切都是关于为变量赋值,或为变量添加数字,或将两个变量组合在一起并将它们放入另一个变量中。
如果代码中仅有少量的变量,那么组织起来其实是很简单的。一旦有很多的变量,我们会通过函数作用域去组织变量。因为函数作用域的缘故,一个函数无法访问另一个函数中定义的变量。
如果只维护少量变量非常简单。但是如果有很多的变量,我们就需要用一种方法来帮助做到这一点,叫做作用域。由于作用域在 JavaScript 中的工作方式,函数不能访问在其他函数中定义的变量。
这种方式是很有效的。在写一个函数的时候,只需要考虑当前函数,而不必担心其它函数可能会改变当前函数的变量。如果想要函数之间共享变量要怎么办呢?一种通用的做法是全局作用域。
在 jQuery 时代这种提升做法相当普遍。在我们加载任何 jQuery 插件之前,我们必须确保 jQuery 已经存在于全局作用域。
所有的 <script>
必须以正确的顺序排列,必须保证被依赖的变量先加载。如果排列错了,那么在运行过程中,应用将会抛出错误,并且停止继续运行。
代码之间的依赖是不透明的。这使得代码维护变得困难。代码变得充满不确定性。任何函数都可能依赖全局作用域中的任何变量。
其次,由于变量存在于全局作用域,所以任何代码都可以改变它。
2、模块化的作用
模块化为你提供了一种更好的方式来组织变量和函数。可以把相关的变量和函数放在一起组成一个模块。这种实现形式可以把函数和变量放在模块作用域中。模块作用域还提供一种暴露变量给其他模块使用的方式。模块可以明确地指定哪些变量、类或函数对外暴露。
对外暴露的过程称为导出。一旦导出,其他模块就可以明确地声称它们依赖这些导出的变量、类或者函数。
因为这是一种明确的关系,所以你可以很简单地辨别哪些代码能移除,哪些不能移除。
拥有了在模块之间导出和导入变量的能力之后,你就可以把代码分割成更小的、可以独立运行地代码块了。基于这些代码块,你就可以像搭乐高积木一样,创建所有不同类型的应用。比较流程的规范有CommonJS,AMD,CMD,ES,UMD等
3、现有模块标准
CJS
是 CommonJS
的缩写。只适用于node端:
const _ = require('lodash'); module.exports = function doSomething(n) { }
AMD
代表异步模块定义。在浏览器端有效:
define(['dep1', 'dep2'], function (dep1, dep2) { return function () {}; });
UMD
代表通用模块定义(Universal Module Definition
):
(function (root, factory) { if (typeof define === 'function' && define.amd) { // AMD. Register as an anonymous module. define([], factory); } else if (typeof module === 'object' && module.exports) { // Node. Does not work with strict CommonJS, but // only CommonJS-like environments that support module.exports, // like Node. module.exports = factory(); } else { // Browser globals (root is window) root.returnExports = factory(); } }(typeof self !== 'undefined' ? self : this, function () { // Just return a value to define the module export. // This example returns an object, but the module // can return a function as the exported value. return {}; }));
什么是 ESM
简介
ESM是ES6提出的标准模块系统,ECMAScript mod
<script type="module"> import { html, Component, render } from 'https://unpkg.com/htm/preact/standalone.module.js'; class App extends Component { state = { count: 0 } add = () => { this.setState({ count: this.state.count + 1 }); } render() { return html` <div class="app"> <div>count: ${this.state.count}</div> <button onClick=${this.add}>Add Todo</button> </div> `; } } render(html`<${App} page="All" />`, document.body); </script>
思考:上述代码和在webpack中开发有啥区别?
2、浏览器端技术实现
回顾下Webpack执行流程
- 本地模块化解析(通过webpack或者babel,将import解析成cjs)
- 将各个库打包成一个js boundle
- 开启服务,托管资源
- 浏览器获取资源
- 执行代码
浏览器端ESM执行流程
- 开启服务,托管资源(ES源码)
- 加载入口文件,浏览器模块化解析
- 构建
- 遍历依赖树,先解析文件,然后找出依赖,最后又定位并加载这些依赖,如此往复。(下载所有的js)
- 模块映射
当加载器要从一个 URL 加载文件时,它会把 URL 记录到模块映射中,并把它标记为正在下载的文件。然后它会发出这个文件请求并继续开始获取下一个文件。 - 解析模块
所有的模块都按照严格模式来解析的。不同文件类型按照不同的解析方式称。在浏览器中,通过type="module"
属性告诉浏览器这个文件需要被解析为一个模块。不过在 Node 中,我们并不使用 HTML 标签,所以也没办法通过type
属性来辨别。社区提出一种解决办法是使用.mjs
拓展名。
- 运行
采用深度优先的后序遍历方式,顺着关系图到达最底端没有任何依赖的模块,然后设置它们的导出。模块映射会以 URL 为索引来缓存模块,以确保每个模块只有一个模块记录。这保证了每个模块只会运行一次。
3、为什么火起来
- ES语法基本确定
- http2普及
- 新浏览器普及
- 开发与发布代码一致
- 启动快
- 全新加载模式
目前浏览器支持:
目前只有5%的浏览器不兼容es相关规范。
4、为什么还没火起来
- 部分浏览器的兼容性
- 历史包袱悠久
- 生态不完善
实战
当我们在项目中使用需要考虑以下几个问题点
1. 代码开发需要基于es开发
let a = 1; new Promise() () => {} ...
2. 依赖库加载
- node_modules代码服务化
- 兼容cjs
- 加载包内部es目录
- cjstoesm
- CDN(network for npm)
3. 兼容不支持的浏览器
type="module"
实现
- 如果浏览器不支持,他只识别
type="text/javascript"
不识别type="module"
,故不下载js;如果支持,则会下载js - 如果浏览器不支持,则会忽略nomodule,下载js;如果支持,则不会下载js
<script type="module" src="app.js"></script> <script nomodule src="app-bundle.js"></script>
- systemjs实现https://github.com/systemjs/systemjs
<script src="system.js"></script> <script type="systemjs-importmap"> { "imports": { "lodash": "https://unpkg.com/lodash@4.17.10/lodash.js" } } </script> <script type="systemjs-module" src="/js/main.js"></script>
4. jsx支持
- 通过其他开源库
<script type="module"> import { html, Component, render } from 'https://unpkg.com/htm/preact/standalone.module.js'; class App extends Component { render() { return html` <div class="app"> </div> `; } } render(html`<${App} page="All" />`, document.body); </script>
- 本地语法糖解析
<APP {...Props}/> => React.createElement(App, {...props})
现有脚手架
1. snowpack
- 托管node_modules
- 支持图片、css等资源
- JSX 和 Typescript 编译
- HMR
- ...
2. vite
目前snowpack的作者后续可能不再维护了,所以推荐大家使用vite
ESM 未来
2018 年 5 月 Firefox 60 发布后,所有的主流浏览器就都默认支持 ESM 了。Node 也正在添加 ESM 支持,为此还成立了工作小组来专门研究 CJS 和 ESM 之间的兼容性问题。所以,在未来你可以直接在 <script>
标签中使用 type="module"
,并且在代码中使用 import
和 export
。同时,更多的模块功能也正在研究中。比如动态导入提案已经处于 Stage 3 状态;import.meta
也被提出以便 Node.js 对 ESM 的支持;模块定位提案 也致力于解决浏览器和 Node.js 之间的差异。
相信在不久的未来,跟模块一起玩耍将会变成一件更加愉快的事!
node v10以上版本全部支持ESM https://kentcdodds.com/blog/super-simple-start-to-es-modules-in-node-js
相关参考
ECMAScript modules in browsers https://jakearchibald.com/2017/es-modules-in-browsers/
JavaScript 模块现状 https://zhuanlan.zhihu.com/p/26567790
基于esm、html、unpkg的前端开发模式:https://github.com/developit/htm
How I Build JavaScript Apps In 2021:https://timdaub.github.io/2021/01/16/web-principles/
Find out how much turning on modern JS could save. https://estimator.dev/
什么是amd、commonjs、umd、esm? https://zhuanlan.zhihu.com/p/96718777
ES modules: A cartoon deep-dive:https://hacks.mozilla.org/2018/03/es-modules-a-cartoon-deep-dive/
import.map:https://github.com/WICG/import-maps
面对 ESM 的开发模式,webpack 还有还手之力吗? https://topic.atatech.org/articles/202736