终于搞懂了 ESM 和 CJS 互相转换

简介: 终于搞懂了 ESM 和 CJS 互相转换

ESM 和 CJS 是我们常用的模块格式,两种模块系统具有不同的语法和加载机制。在项目中,我们可能会遇到 ESM 和 CJS 转换的场景:

  • ESM 引入只支持 CJS 的库
  • 开发 npm 库的时候,写 ESM 然后编译成 CJS。
  • ……

最近在项目中也刚好遇到的转换上的一些问题,于是就研究了一下

本文将介绍 ESM 和 CJS 之间转换,帮助大家加深对它们的了解,并从中了解它们之间转换的细节与局限性


ESM 转 CJS


ESM 转 CJS 的使用场景非常常见,例如:


  • npm 库,需要同时提供 ESM 和 CJS,供开发者自行选择使用。一般是用 ESM 开发,然后同时输出 ESM 和 CJS
  • 使用 ESM 进行开发,但最后由于兼容性、性能等原因,编译成 CJS 在线上运行。例如:利用 Vite、webpack 等构建工具进行开发 开发

各大工具,如 TSC、Babel、Vite、webpack、Rollup 等,都自带了 ESM 转 CJS 的能力。


export 的转换


  • 情况一,只有默认导出


export default 666

Rollup 会转换成


modules.exports = 666

很好理解,modules.exports 导出的整个东西就是默认导出

用 CJS 引用该模块的方式:


const lib = require('lib')
console.log(lib)
// 666
  • 情况二,只有命名导出


export const a = 123
export const b = 234

转换成


module.exports.a = 123
module.exports.b = 234

命名导出用 module.exports.xxx 一个个导出就行

用 CJS 引用该模块的方式:


const {a, b} = require('lib')
console.log(a, b)
// 123 234
  • 情况三:默认导出和命名导出同时存在


export default 666
export const a = 123
export const b = 234

这时候会发现,前面两种情况的转换思路不能用了,你不能这样转换


modules.exports = 666
module.exports.a = 123
module.exports.b = 234

毕竟 modules.exports 不是对象,因此设置不了属性。

那莫得办法了,只能这样表示了:

  • module.exports.default 为默认导出
  • module.exports.xxx 其他为命名导出

为了跟前两种情况做区分,因此还要新增一个标记__esModule

于是就会编译成这样的代码:


+ Object.defineProperty(exports, '__esModule', { value: true })
+ module.exports.default = 666
- module.exports = 666
module.exports.a = 123
module.exports.b = 234

用 CJS 引用该模块的方式:


const lib = require('lib')
console.log(lib.default, lib.a, lib.b)
// 666 123 234

在这种情况下,必须要用 .default 访问默认导出

但这样子看起来非常的别扭,但是没有办法,混用默认导出和命名导出是有代价的。

为什么我们项目中,从来就遇到过该问题?

一般情况下,我们使用 ESM 写项目,然后编译成 CJS

假如,我们写的代码引用了上述的代码(默认导出和命名导出混用):


// foo.js
import lib from 'lib'
import {a, b} from 'lib'
console.log(lib, a, b)

这段代码,会被转换成:


'use strict';
var lib = require('lib');
function _interopDefault (e) { 
  return e && e.__esModule ? e : { default: e }; 
}
var lib__default = /*#__PURE__*/_interopDefault(lib);
console.log(lib__default.default, lib.a, lib.b);

_interopDefault 函数会自动根据 __esModule,将导出对象标准化使 .default 一定为默认导出

  • 如果有 __esModule,那就不用处理
  • 没有  __esModule,就将其放到 default 属性中,作为默认导出

1686403533839.png

工具在转译 lib.js 的同时,也会转译引入它的 foo.js会加上标准化 require 对象的逻辑

我们的项目,在编译的时候,全部 ESM 模块都转为 CJS(不是只转换一个,不转另外一个) ,在这个过程中它自动屏蔽了模块默认导出的差异,由于编译工具已经帮我们处理好,因此我们没有任何感知。

如果我们直接写 CJS,去引入 ESM 转换后的 CJS,就需要自行处理该问题

要想尽量避免这种情况,建议全部都使用命名导出,由于没有默认导出,就不需要担心默认导出是 module.exports 还是 module.exports.default,都用以下方式进行引入即可:


const {a, b} = require('lib')

这样开发者在任何情况下都没有心智负担。


import 的转换


其实上一小节已经讲了


import lib from 'lib'
import {a, b} from 'lib'
console.log(lib, a, b)

会被转换成


'use strict';
var lib = require('lib');
function _interopDefault (e) { 
  return e && e.__esModule ? e : { default: e }; 
}
var lib__default = /*#__PURE__*/_interopDefault(lib);
console.log(lib__default.default, lib.a, lib.b);

加上 _interopDefault屏蔽了不同情况下默认导出的差异,因此如果所有代码都是从 ESM 转 CJS,就不用担心默认导出的差异问题。


小结


其实 ESM 转 CJS,不同的工具的输出会稍微有些不同。以上是 Rollup 的的转换方式,个人认为这种更为简洁,而 TSC 的转换则更复杂。

不过这些工具的思路都是相同的,都遵守 __esModule 的约定,标记 __esModule 的模块默认导出是 .default

ESM 转 CJS 有哪些局限性?

存在以下情况可能无法进行转换:

  • 存在循环依赖
  • import.meta,这个特性只能在 ESM 中使用

CJS 转 ESM


CJS 转 ESM 的场景不多,一般不会用 CJS 写 npm 库然后输出 ESM;用 CJS 写的库,当时不会输出 ESM。新写的 npm 库,一般来说也是用 ESM 写。

因此一般只有写 ESM 项目,引入了一个只有 CJS 的库时,且编译出 ESM 时,才会用到 CJS 转 ESM。

为什么我们用 webpack 写 ESM,然后引入 CJS 的时候,基本上没遇到什么问题?

要运行 ESM 引入 CJS 的代码,有两种方式:

  • 把 ESM 转 CJS,然后运行 CJS
  • 把 CJS 转成 ESM,然后运行 ESM

因为 webpack 是前者,ESM 转 CJS 能够很好地进行转换。

CJS 转 ESM,没有一种统一的转换标准(相对来说,ESM 转 CJS 有 __esModule 约定),不同的工具和库,可能转换出来的结果是不一样的,可能会导致代码不兼容


export 的转换


场景一:


module.exports = {
    a: 3,
    b: 4
}

Rollup 会转换成


var lib = {
    a: 3,
    b: 4
};
export { lib as default };
module.exports 会被当做默认导出

而 esbuild 会这样转换


var __getOwnPropNames = Object.getOwnPropertyNames;
var __commonJS = (cb, mod) => function __require() {
  return mod || (0, cb[__getOwnPropNames(cb)[0]])((mod = { exports: {} }).exports, mod), mod.exports;
};
var require_lib = __commonJS({
  "src/cjs/lib.js"(exports, module) {
    module.exports = {
      a: 3,
      b: 4
    };
  }
});
export default require_lib();

esbuild 会给代码包一层辅助函数,然后将代码搬过去就好了。好处是,这样编译工具就不需要考虑代码的真正意义,直接简单包一层即可

这种情况下,虽然 Rollup 和 esbuild 转换的代码不太相同,但代码的运行结果是相同

场景二:

Rollup 会转换成:


var lib = {};
var c = lib.c =123;
export { c, lib as default };

Rollup 会转换成默认导出和命名导出。

esbuild 则转换成:


var __getOwnPropNames = Object.getOwnPropertyNames;
var __commonJS = (cb, mod) => function __require() {
  return mod || (0, cb[__getOwnPropNames(cb)[0]])((mod = { exports: {} }).exports, mod), mod.exports;
};
var require_lib = __commonJS({
  "src/cjs/lib.js"(exports) {
    exports.d = 666;
  }
});
export default require_lib();

仍然是包一层辅助函数,但 esbuild 全部都当做默认导出

在这种情况下,Rollup 和 esbuild 转换的代码,其运行结果是不同的

场景三:


exports.d = 123
module.exports = {
    a: 3,
    b: 4
}
exports.c =123

exports.d = 123 其实是无效的

Rollup 会编译成这样:


var libExports = {};
var lib$1 = {
  get exports(){ return libExports; },
  set exports(v){ libExports = v; },
};
(function (module, exports) {
  exports.d =123;
  module.exports = {
      a: 3,
      b: 4
  };
  exports.c =123;
} (lib$1, libExports));
var lib = libExports;
export { lib as default };

此时 Rollup 也会加上一层辅助函数

而 esbuild 仍然是加一层辅助函数


var __getOwnPropNames = Object.getOwnPropertyNames;
var __commonJS = (cb, mod) => function __require() {
  return mod || (0, cb[__getOwnPropNames(cb)[0]])((mod = { exports: {} }).exports, mod), mod.exports;
};
var require_lib = __commonJS({
  "src/cjs/lib.js"(exports, module) {
    exports.d = 666;
    module.exports = {
      a: 3,
      b: 4
    };
    exports.c = 666;
  }
});
export default require_lib();

辅助函数的好处之前也说了,不需要关注代码逻辑,可以看到,即使 exports.d = 666; 是一行无效语句,照样执行也是没有问题的,不需要先分析出代码的语义

总体对比下来,esbuild 的处理还是相对简单的

require 的转换


const lib = require('./lib')
const {c} = require('./lib')
console.info(lib,c)

Rollup 转换成:


import require$$0 from './lib';
const lib = require$$0;
const {c} = require$$0;
console.info(lib,c);

require 的转换比较简单,不管你解不解构,反正我就只有默认引入

而 esbuild。。。还不支持,干脆就报错了

1686403404114.png

小结


为什么工具的转换结果是不同的?

CJS 转换成 ESM 是有歧义的


module.export.a = 123
module.export.b = 345

等价于


module.export = {
    a: 123,
    b: 345,
}

那么它是默认导出,还是命名导出呢?都行

本质上,是因为 CJS 只有一个导出方式,不确定它对应的是 ESM 的命名导出还是默认导出

用一个形象点的例子就是,女朋友回了一句哦,但是你不知道女朋友是想说肯定的意思,还是表示无语的意思、还是其他别的意思。。。

对于 require


const {c} = require('./lib')

你说这个是默认导入呢?还是命名导入?好像也都行。。。

正是由于这个歧义,且没有一个标准去规范这个转换行为,因此不同工具的转换结果是不同的

CJS 转换成 ESM 有哪些局限性?

  • 不同工具的转换结果不同
  • CJS 模块可以使用 require.resolve 方法查找模块的路径,而 ESM 模块不可以
  • CJS 模块可以导入和导出非 JavaScript 文件,例如 JSON
  • CJS 在运行时导入导出,支持运行时改变导入导出的内容,以下代码是合法的:


module.exports.a = 123
if( Date.now() % 2){
    module.exports.b = 234
}

由于没有统一的标准,CJS 转 ESM 的工具,相对来说少了很多,目前仅有少量工具能够进行转换esbuildbabel-plugin-transform-commonjs@rollup/commonjs

有时候 Vite 使用一些 CJS 包不兼容,也是因为有些 CJS 转不了 ESM。但幸运的是,目前大部分常见的 npm 包,都已经支持 ESM,或者能够比较好的被转换成 ESM,因此也不需要太担心 Vite 的问题。


最后


如果这篇文章对您有所帮助,可以点赞加收藏👍,您的鼓励是我创作路上的最大的动力。也可以关注我的公众号订阅后续的文章:Candy 的修仙秘籍(点击可跳转)

另外,腾讯的实习生校招也开始了,感兴趣的也可以通过公众号找我内推(内推前先不要在官网填简历)。

目录
相关文章
|
13天前
|
JavaScript 前端开发
多种模块格式,包括 ES, CommonJS, UMD, AMD, SystemJS 和 IIFE的区别点分别是什么?
【10月更文挑战第20天】在实际应用中,选择合适的模块格式需要根据项目的需求、目标环境以及开发团队的习惯等因素来综合考虑。不同的模块格式都有其自身的优势和适用场景,合理选择可以提高代码的组织性、可维护性和性能。
20 8
|
3月前
|
JSON JavaScript 前端开发
JS 和 ES6 补充学习
【8月更文挑战第21天】
35 4
|
12月前
|
JavaScript 编译器
Babel对ES6模块化代码转换、ES6模块化引入NPM包
Babel对ES6模块化代码转换、ES6模块化引入NPM包
94 0
|
6月前
|
JavaScript 前端开发 Shell
stylus详解与引入的例子
stylus详解与引入的例子
|
6月前
|
JavaScript 前端开发
前端 JS 经典:ES6 和 CommonJs 用法
前端 JS 经典:ES6 和 CommonJs 用法
37 0
|
自然语言处理 前端开发 JavaScript
Babel 的工作原理以及怎么写一个 Babel 插件
Babel 的工作原理以及怎么写一个 Babel 插件
205 0
|
6月前
|
JavaScript
JS模块化规范之ES6及UMD
JS模块化规范之ES6及UMD
86 3
|
11月前
|
编解码 前端开发
ES6学习(一)— Babel转码器的使用和配置
ES6学习(一)— Babel转码器的使用和配置
|
JavaScript 前端开发 编译器
🎖️使用 esbuild 简化 TypeScript 构建并跳过 tsc/tsx
JavaScript 生态系统一直在不断创新,最近的一位游戏规则改变者是 esbuild,这是一个极速的 JavaScript 和 TypeScript 打包器。
1012 0
|
缓存 JavaScript
本想搞清楚ESM和CJS模块的互相转换问题,没想到写完我的问题更多了
本来只是好奇打包工具是如何转换ESM和CJS模块的,没想到带着这个问题阅读完编译的代码后,我的问题更多了。
382 0