Go-Excelize API源码阅读(三)——OpenReader()
开源摘星计划(WeOpen Star) 是由腾源会 2022 年推出的全新项目,旨在为开源人提供成长激励,为开源项目提供成长支持,助力开发者更好地了解开源,更快地跨越鸿沟,参与到开源的具体贡献与实践中。
不管你是开源萌新,还是希望更深度参与开源贡献的老兵,跟随“开源摘星计划”开启你的开源之旅,从一篇学习笔记、到一段代码的提交,不断挖掘自己的潜能,最终成长为开源社区的“闪亮之星”。
我们将同你一起,探索更多的可能性!
项目地址: WeOpen-Star:https://github.com/weopenprojects/WeOpen-Star
一、Go-Excelize简介
Excelize 是 Go 语言编写的用于操作 Office Excel 文档基础库,基于 ECMA-376,ISO/IEC 29500 国际标准。可以使用它来读取、写入由 Microsoft Excel™ 2007 及以上版本创建的电子表格文档。支持 XLAM / XLSM / XLSX / XLTM / XLTX 等多种文档格式,高度兼容带有样式、图片(表)、透视表、切片器等复杂组件的文档,并提供流式读写 API,用于处理包含大规模数据的工作簿。可应用于各类报表平台、云计算、边缘计算等系统。使用本类库要求使用的 Go 语言为 1.15 或更高版本。
二、OpenReader()
func OpenReader(r io.Reader, opt ...Options) (*File, error)
OpenReader 的作用是从 io.Reader 读取数据流。
func OpenReader(r io.Reader, opt ...Options) (*File, error) {
b, err := ioutil.ReadAll(r)
if err != nil {
return nil, err
}
f := newFile()
f.options = parseOptions(opt...)
if f.options.UnzipSizeLimit == 0 {
f.options.UnzipSizeLimit = UnzipSizeLimit
if f.options.UnzipXMLSizeLimit > f.options.UnzipSizeLimit {
f.options.UnzipSizeLimit = f.options.UnzipXMLSizeLimit
}
}
if f.options.UnzipXMLSizeLimit == 0 {
f.options.UnzipXMLSizeLimit = StreamChunkSize
if f.options.UnzipSizeLimit < f.options.UnzipXMLSizeLimit {
f.options.UnzipXMLSizeLimit = f.options.UnzipSizeLimit
}
}
if f.options.UnzipXMLSizeLimit > f.options.UnzipSizeLimit {
return nil, ErrOptionsUnzipSizeLimit
}
if bytes.Contains(b, oleIdentifier) {
if b, err = Decrypt(b, f.options); err != nil {
return nil, ErrWorkbookFileFormat
}
}
zr, err := zip.NewReader(bytes.NewReader(b), int64(len(b)))
if err != nil {
if len(f.options.Password) > 0 {
return nil, ErrWorkbookPassword
}
return nil, err
}
file, sheetCount, err := f.ReadZipReader(zr)
if err != nil {
return nil, err
}
f.SheetCount = sheetCount
for k, v := range file {
f.Pkg.Store(k, v)
}
f.CalcChain = f.calcChainReader()
f.sheetMap = f.getSheetMap()
f.Styles = f.stylesReader()
f.Theme = f.themeReader()
return f, nil
}
ioutil.ReadAll(r)先从 io.Reader 读取整条数据流,newFile()创建一个 Excel 工作薄。
f.options.UnzipSizeLimit: UnzipSizeLimit指定了打开电子表格时的解压大小限制,以字节为单位,这个值应该大于或等于 UnzipXMLSizeLimit,默认的大小限制是16GB。
f.options.UnzipXMLSizeLimit:UnzipXMLSizeLimit指定解压工作表和共享字符串表的内存限制,单位为字节,当文件大小超过此值时,工作表的XML将被解压到系统的临时目录中,此值应小于或等于UnzipSizeLimit,默认值为 16MB。
UnzipSizeLimit = 1000 << 24
StreamChunkSize = 1 << 24
然后判断读取的数据流中是不是包含oleIdentifier = []byte{0xd0, 0xcf, 0x11, 0xe0, 0xa1, 0xb1, 0x1a, 0xe1}
这是OLE 程序标识符,具体查看微软文档:https://docs.microsoft.com/zh-cn/office/vba/outlook/concepts/getting-started/ole-programmatic-identifiers-outlook
zip.NewReader返回一个从bytes.NewReader(b)读取的新的阅读器,它被赋值为给定的字节大小int64(len(b))。
f.ReadZipReader(zr)中ReadZipReader通过给定的选项提取电子表格。给定的选项主要是密码等:
type Options struct {
MaxCalcIterations uint
Password string
RawCellValue bool
UnzipSizeLimit int64
UnzipXMLSizeLimit int64
}
后面和新建文件API差不多NewFile()
,给 f 结构体的成员赋值。
三、结语
这里是老岳,这是Go语言相关源码的解读第三篇,我会不断努力,给大家带来更多类似的文章,恳请大家不吝赐教。