视觉智能开放平台的搜索结果_文章_第2页-阿里云开发者社区

老乡别走

|

2月前

|

博文

|

来自：视觉智能

高效率办公PDF批量处理：批量OCR识别PDF区域文字内容，用PDF内容批量改名或导出表格的货物运单应用案例

针对铁路货运物流单存档需求，本项目基于WPF与飞桨OCR技术，实现批量图片多区域文字识别与自动重命名。用户可自定义识别区域，系统提取关键信息（如车号、批次号）并生成规范文件名，提升档案管理效率与检索准确性，支持PDF及图像文件处理。

# 视觉智能开放平台 # 机器学习/深度学习 # 文字识别 # Shell # C# # Python

一个程序员

|

3月前

|

博文

|

来自：视觉智能

pytorch基于AnimeFace128数据集训练DCGAN

基于AnimeFace128数据集，使用PyTorch构建DCGAN生成动漫人脸。包含生成器与判别器网络设计、数据加载及训练流程，通过对抗学习生成64×64清晰图像。

# 视觉智能开放平台 # 机器学习/深度学习 # PyTorch # 算法框架/工具

一个程序员

|

3月前

|

博文

|

来自：视觉智能

Python图片上采样工具 - RealESRGANer

Real-ESRGAN基于深度学习实现图像超分辨率放大，有效改善传统PIL缩放的模糊问题。支持多种模型版本，推荐使用魔搭社区提供的预训练模型，适用于将小图高质量放大至大图，放大倍率越低效果越佳。

# 视觉智能开放平台 # 机器学习/深度学习 # 编解码 # Python

Lethehong-44459

|

3月前

|

博文

|

来自：视觉智能

AI Ping：精准可靠的大模型服务性能评测平台

AI Ping是清华系团队推出的“大模型服务评测平台”，被誉为“AI界的大众点评”。汇聚230+模型服务，7×24小时监测性能数据，以吞吐量、延迟等硬指标助力开发者科学选型。界面简洁，数据可视化强，支持多模型对比，横向对标国内外主流平台，为AI应用落地提供权威参考。

# 视觉智能开放平台 # 人工智能 # 数据可视化 # 前端开发 # 开发者 # UED

1652126143653740

|

4月前

|

博文

|

来自：视觉智能

OBS美颜美肌插件安装使用教程

软件是不自带美颜插件的，可以安装OBS-Studio-29.1.3安装包，就自带美颜功能的插件。在OBS软件【插件中心】菜单下,打开【打开插件中心】，安装美颜摄像头注册即可。在OBS软件【停靠窗口】菜单下，打开【美颜参数控制面板】的美颜窗口。插件里面有自带教程，可以自行学习。

# 视觉智能开放平台

modelscope

|

4月前

|

博文

|

来自： ModelScope模型即服务

腾讯混元最新开源：一张图，秒变游戏大片

有没有想过，随手拍的一张风景照，下一秒就能变成可操控的游戏开放世界？

# 视觉智能开放平台 # 机器人 # 图形学 # 开发者 # Windows # 内存技术

格林威

|

5月前

|

博文

|

来自：视觉智能

Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现裂缝的检测识别（C#代码UI界面版）

本项目基于YOLOv8模型与C#界面，结合Baumer工业相机，实现裂缝的高效检测识别。支持图像、视频及摄像头输入，具备高精度与实时性，适用于桥梁、路面、隧道等多种工业场景。

# 视觉智能开放平台 # 机器学习/深度学习 # 算法 # 定位技术 # C# # 计算机视觉

老乡别走

|

5月前

|

博文

|

来自：视觉智能

【繁体图片文字识别】竖排的繁体图片文字识别翻译，竖排的繁体图片文字如何识别，竖排繁体图片识别后转横排，竖排的繁体识别比较友好的方法

竖排繁体文字识别系统适用于古籍数字化、港澳台文档、书法作品、历史档案及学术研究等场景，支持图像预处理、自动旋转、OCR识别、竖转横与繁转简。通过咕嘎OCR与OpenCC技术，实现高效精准的文字转换与编辑。

# 视觉智能开放平台 # 机器学习/深度学习 # 缓存 # 文字识别 # 算法 # Python

yukiji0701

|

5月前

|

博文

|

来自：视觉智能

AI视觉新突破：多角度理解3D世界的算法原理全解析

多视角条件扩散算法通过多张图片输入生成高质量3D模型，克服了单图建模背面细节缺失的问题。该技术模拟人类多角度观察方式，结合跨视图注意力机制与一致性损失优化，大幅提升几何精度与纹理保真度，成为AI 3D生成的重要突破。

# 云解析DNS # 视觉智能开放平台 # 机器学习/深度学习 # 人工智能 # 编解码 # 算法 # PyTorch

老乡别走

|

5月前

|

博文

|

来自：视觉智能

【PDF提取内容改名】批量提取PDF指定区域内容重命名PDF文件，PDF自动提取内容命名的方案和详细步骤

本工具可批量提取PDF中的合同编号、日期、发票号等关键信息，支持PDF自定义区域提取并自动重命名文件，适用于合同管理、发票处理、文档归档和数据录入场景。基于iTextSharp库实现，提供完整代码示例与百度、腾讯网盘下载链接，助力高效处理PDF文档。

# 视觉智能开放平台 # C#

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

视觉智能开放平台