kaldi脚本、kaldi脚本运行、kaldi脚本运行失败

简介: <p>  Kaldi脚本是kaldi的功能核心,在kaldi编译后,会编译出很多可执行文件,这些文件在脚本里调用生成各种模型结果,这些可执行文件也有一些辅助文件,比如fstdraw和fstprint等等。</p><p>  这些脚本里通常第一个步骤是数据准备过程,这个过程可以通过命令下载网上的数据,也可以指定数据目录来使用本地数据,有了数据,就是一些_prep类脚本命令,比如timit_data_prep.sh,这个脚本里下段代码:。</p>

  Kaldi脚本是kaldi的功能核心,在kaldi编译后,会编译出很多可执行文件,这些文件在脚本里调用生成各种模型结果,这些可执行文件也有一些辅助文件,比如fstdraw和fstprint等等。

  这些脚本里通常第一个步骤是数据准备过程,这个过程可以通过命令下载网上的数据,也可以指定数据目录来使用本地数据,有了数据,就是一些_prep类脚本命令,比如timit_data_prep.sh,这个脚本里下段代码:。

  #生成文本标签

  cat $tmpdir/${x}.trans | sort > $prepare_dir/$x/${y}_text || exit 1;

  if [ $y==phn ]; then

  cp $prepare_dir/$x/${y}_text $prepare_dir/$x/${y}_text.tmp

  python local/normalize_phone.py --map $map_file --to $phoneme_map --src $prepare_dir/$x/${y}_text.tmp --tgt $prepare_dir/$x/${y}_text

  rm -f $prepare_dir/$x/${y}_text.tmp

  cp $prepare_dir/$x/${y}_text $prepare_dir/$x/transcript_${y}_text

  fi

  比如cat行,先cat显示文件,文件内容按管道输出,sort排序后再输出到_text文件,如果遇到错误exit 1返回。

  if段里调用python脚本来处理数据文件,python的切片和矩阵数据功能非常强,处理数据代码简单还好理解。

  从上面代码片段就知道了kaldi脚本的特点,shell编程和python编程结合来处理数据,而shell编程初学者很少用到,python编程复杂环境初学者也很少接触,所以初学者一般很难耐心看kaldi脚本,遇到问题就很难解决。

目录
相关文章
|
7月前
|
机器学习/深度学习 缓存 前端开发
强大的项目-秒变 Python 脚本为 ML 工具
强大的项目-秒变 Python 脚本为 ML 工具
|
人工智能 数据挖掘 API
AutoGen完整教程和加载本地LLM示例
Autogen是一个卓越的人工智能系统,它可以创建多个人工智能代理,这些代理能够协作完成任务,包括自动生成代码,并有效地执行任务。
756 0
|
4月前
|
机器学习/深度学习 XML 搜索推荐
图像自动化保存工具:Python脚本开发指南
图像自动化保存工具:Python脚本开发指南
|
4月前
|
编译器 Linux TensorFlow
【Deepin 20系统】Tensorflow2.x离线下载cifar-10-python.tar.gz如何配置使用cifar10.load_data()
文章讨论了在Deepin 20系统上使用Tensorflow 2.x时,如何通过离线方式配置使用CIFAR-10数据集。
52 0
|
5月前
|
语音技术 开发者 Python
语音识别,python运行H ~W~,要使用英符,执行Python的流程是输入Python,回车,解释器的两大功能,翻译代码,提交计算机运算,多行代码运行,写一个py文件,pycharm安
语音识别,python运行H ~W~,要使用英符,执行Python的流程是输入Python,回车,解释器的两大功能,翻译代码,提交计算机运算,多行代码运行,写一个py文件,pycharm安
|
测试技术 Python
【python脚本】ICer的脚本入门训练——svn_back
【python脚本】ICer的脚本入门训练——svn_back
|
7月前
|
测试技术
如何用RIDE写自动化脚本
本文介绍如何用RIDE写自动化脚本。
157 0
|
前端开发 芯片 Python
【python脚本】ICer的脚本入门训练——gen_tc
【python脚本】ICer的脚本入门训练——gen_tc
|
机器学习/深度学习 数据可视化 API
深度学习部署:Windows安装pycocotools报错解决方法
 pycocotools即python api tools of COCO。COCO是一个大型的图像数据集,用于目标检测、分割、人的关键点检测、素材分割和标题生成
1337 0
|
机器学习/深度学习 存储 监控
在python中使用SageMaker Debugger进行机器学习模型的开发调试(二)
在python中使用SageMaker Debugger进行机器学习模型的开发调试
166 0
在python中使用SageMaker Debugger进行机器学习模型的开发调试(二)