并行计算

首页 标签 并行计算
# 并行计算 #
关注
5060内容
【DSW Gallery】DSW镜像使用入门
介绍DSW中如何使用官方镜像、自定义镜像、第三方镜像地址来启动服务。DSW环境进行定制修改之后还可以选择停机保存环境或者保存镜像到ACR镜像仓库。
【强化学习】常用算法之一 “A3C”
A3C(Asynchronous Advantage Actor-Critic)算法是一种在强化学习领域中应用广泛的算法,它结合了策略梯度方法和价值函数的学习,用于近似解决马尔可夫决策过程(Markov Decision Process)问题。A3C算法在近年来备受关注,因为它在处理大规模连续动作空间和高维状态空间方面具有出色的性能。A3C算法是一种基于策略梯度的强化学习算法,通过多个并行的智能体异步地与环境交互,并利用Actor和Critic网络实现策略和价值的近似,从而实现快速而稳定的强化学习训练。
加速你的应用:全面指南 FastAPI 多线程的使用技巧
在现代网络应用中,高性能和快速响应是至关重要的,Python 的 FastAPI 框架以其出色的性能和简单易用的特点,成为了许多开发者的首选。然而,在某些场景下,单线程运行可能无法满足需求,这时候就需要考虑使用多线程来提高应用的并发性能。本文将介绍 FastAPI 框架中多线程的使用方法,包括常见需求场景、问题解决方法以及实践案例。
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽
君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的FunAsr。 FunAsr主要依托达摩院发布的Paraformer非自回归端到端语音识别模型,它具有高精度、高效率、便捷部署的优点,支持快速构建语音识别服务,最重要的是,FunASR支持标点符号识别、低语音识别、音频-视觉语音识别等功能,也就是说,它不仅可以实现语音转写,还能在转写后进行标注,一石二鸟。
|
8月前
|
Matplotlib性能优化:提升图表渲染速度
【4月更文挑战第17天】提升 Matplotlib 渲染速度的技巧:1) 减少数据点;2) 使用矢量化操作;3) 减少图表元素;4) 增量渲染;5) 优化图像保存;6) 更换更快的后端;7) 并行处理;8) 避免循环内绘图;9) 利用缓存;10) 使用专业图形工具。注意根据具体需求调整优化策略。
一次性能优化引发的线上xgboost事故
线上风控模型服务因活动流量增加出现超时,初步通过增加节点缓解,但仍有超时问题。分析发现,服务使用Python Flask和XGBoost,原启动方式(flask manager的run方法)不适合生产环境,应改用uwsgi。集成uwsgi后,线上出现概率值异常,所有用户得分相同。回滚线上环境,问题依旧存在,怀疑是uwsgi的多线程问题。通过日志追踪,发现在转换为xgboost矩阵时,特征值变为0,导致相同概率。
|
7月前
| |
来自: 弹性计算
AVX 指令集简介及其与 SSE 的对比
本文介绍了AVX指令集在高性能计算中的重要性,它是Intel于2011年推出的一种SIMD技术,扩展了SSE指令集,将向量宽度增至256位,支持更多数据类型和浮点精度控制。主要差异包括向量宽度、数据类型扩展、指令集增加和精度控制。文中通过C代码示例展示了如何使用AVX进行向量加法。AVX对科学计算、图像处理和机器学习等领域提供了显著的性能提升。编译时需确保编译器支持AVX标志。
免费试用