|
1月前
|
SQL 人工智能 运维
|

Aloudata:从 A lot of data,到 AI on data

我们做的其实一直是同一件事: 先解决数据生产力的问题,让好数据更高效地被生产出来; 今天再进一步,让这些好数据不只是被人用,也能被 Agent 用。

153 1
|
1月前
|
测试技术 芯片
|

5V升压8.4V2A充电芯片在不同环境温度下的表现

这是一个PW4253、8.4V/2A的测试板,5V升压8.4V给两串锂电池充电,测试工具:万用表、电路板、电池模拟仪、直流电源供应器、红外温度仪、热电偶温度仪等。

123 0
|
1月前
|
算法 API 数据处理
|

闲鱼商品详情API数据解析

本API详解闲鱼商品详情接口(xianyu.item.get),涵盖标准返回结构、关键字段(num_iid、price、condition、seller等)、解析要点及常见坑,含MD5签名实现与错误处理示例,助力快速开发入库。

364 1
|
1月前
|
人工智能 安全 数据可视化
|

Windows 全版本 OpenClaw 搭建教程 零代码可视化一键部署

OpenClaw(小龙虾)是2026年热门开源AI自动化工具,支持Win10/11本地离线运行。零代码、全图形化、内置依赖、多模型切换、大Token额度,5–10分钟一键部署。数据不出设备,安全可控,适配办公全场景。(239字)

233 1
|
1月前
|
数据采集 监控 网络协议
|

生产级Go高并发爬虫实战:突破 net/http 长连接与隧道代理IP切换陷阱

在Go分布式爬虫中,代理IP“冻结”常因`net/http`连接复用机制与隧道代理冲突所致。本文剖析HTTPS CONNECT隧道KeepAlive、Transport连接池两大陷阱,提供`Connection: Close`、`Proxy-Tunnel`头、`DisableKeepAlives`及`CloseIdleConnections()`等生产级解决方案,助你精准控制出口IP切换。

229 2
|
1月前
|
监控 安全 Unix
|

智慧港口:NTP时钟服务器赋能铸造网络高墙

智慧港口依托NTP时钟服务器构建高精度时间同步网络,为视频监控、智能闸口、广播等弱电系统提供毫秒级统一授时。系统融合GPS/北斗双模授时、多网口隔离输出、子钟自动校对、远程监测告警及灵活扩展能力,筑牢港口数字化运营的时间基石。(239字)

195 1
|
1月前
|
存储 人工智能 JSON
|

AI 成为主流负载后,数据基础设施将如何演进?|Apache Doris 2026 Roadmap

Scale Intelligence, Accelerate Insight,不仅是年度主题,也定义了 Doris 在 AI 时代的演进方向。

232 0
|
1月前
|
测试技术 芯片
|

CN3302 8.4V1A电路板热成像温度分析

CN3302 8.4V/1A的电路板,5V升压8.4V给电池充电

173 0
|
1月前
|
人工智能 移动开发 安全
|

3. OpenClaw本地AI建站教程:部署、生成、调试、上线,全程清晰可落地

本教程教你用本地离线AI工具OpenClaw,零代码快速搭建企业静态网站:从一键部署、文字描述需求、AI生成HTML/CSS/JS源码,到本地调试、自由修改及上线部署,全程实操清晰,30分钟即可完成,安全可控、高度定制。(239字)

390 1
|
1月前
|
缓存 API 开发者
|

阿里巴巴国际站商品详情接口深度解析与实战指南

阿里巴巴国际站开放平台提供alibaba.product.get等API,支持获取商品全维度数据(标题、价格、SKU、多媒体、交易、供应链及SEO信息),仅限企业账号接入,需OAuth2.0认证与签名,适用于选品、比价、ERP集成等场景。(239字)

284 3
|
1月前
|
机器学习/深度学习 文字识别 自动驾驶
|

不会深度学习也能玩转视觉?用 OpenCV + Python,带你从0做出目标检测!

不会深度学习也能玩转视觉?用 OpenCV + Python,带你从0做出目标检测!

203 2
|
1月前
|
数据采集 SQL 数据管理
|

数据治理不是“做报表”:从混乱到可控,我是怎么把一家公司数据救活的?

数据治理不是“做报表”:从混乱到可控,我是怎么把一家公司数据救活的?

180 0
|
1月前
|
JavaScript 测试技术 芯片
|

CN3302设计复杂困难”,简单级芯片价格高,区别有哪些的测试

(1) PW4253 全面领先:效率高达 94%,实际充电电流最大(1.112A),温升最低(表面仅34℃),且全场景兼容。 (2)CN3302 效率(88%),且在 5V/1A 输入下异常(可能是输入欠压或启动问题),热成像温度达到60℃。 (3)PW4584A 效率与 CN3302 接近,但温度更高(热成像64℃),不过5V1A输入正常,兼容性完好。

306 1
|
1月前
|
存储 安全 Java
|

Java 基础数据类型完全指南

本文详解Java 8种基本数据类型(byte/short/int/long/float/double/char/boolean)的取值范围、默认值、使用场景及注意事项,涵盖字面量规范、自动/强制类型转换、包装类与装箱拆箱机制,并强调金额计算须用BigDecimal、内存优化等最佳实践。

288 1
|
1月前
|
SQL 存储 Oracle
|

银保监现场检查倒计时:如何 1 天内生成全量口径文档?

面对银保监“可追溯、可验证”严苛要求,传统人工或表级血缘工具效率低、准确差。本文介绍基于算子级血缘与主动元数据的自动化方案,实现监管指标口径“一键溯源”“自动盘点”。

108 4
|
1月前
|
监控 Java BI
|

如何通过 NoETL 指标平台根治跨业务口径混乱

本文剖析企业跨部门指标口径混乱顽疾,提出基于NoETL语义编织技术的Aloudata CAN指标平台,构建动态“唯一指标注册中心”,实现定义即开发、治理与服务。

138 5
|
1月前
|
安全 Java 索引
|

java工具:《对Collections.sort排序后我想制定查询几条,比如list有10条,我只想获取前4条》

java工具:《对Collections.sort排序后我想制定查询几条,比如list有10条,我只想获取前4条》

115 12
|
1月前
|
人工智能 架构师 Apache
|

相约深圳,全球征集|Flink Forward Asia 2026 演讲议题征集正式启动

Flink Forward Asia 2026将于6月26–27日首次落地深圳,聚焦实时计算与AI深度融合。面向全球征集议题(截止5月29日),涵盖实时AI、AI Agent、湖流一体等前沿方向。免费报名开启,共探下一代实时计算范式!

384 4
来自: 实时计算 Flink  版块
|
1月前
|
人工智能 安全 IDE
|

2026年 最值得关注的 6个 开源 AI 工具

2026年,开源AI已迈入“Agent+Toolchain”时代。本文精选6个真正落地的开源工具:LingtiStudio(AI视频全自动生产)、OpenClaw(系统级自动化Agent)、Ollama(本地LLM基石)、Dify(AI应用开发平台)、Cline(编程Agent)和Gemini CLI(终端AI入口),聚焦自主执行、本地优先、多模型兼容与开发者深度集成四大趋势。(239字)

1372 3
|
1月前
|
数据采集 网络协议 中间件
|

Scrapy爬虫大面积报错Timeout/403?彻底解决代理IP失效导致的“丢数据”痛点

爬虫开发常遇代理失效、重试漏判、403/429不重试等痛点,导致数据大量丢失。本文深度剖析Scrapy默认机制缺陷,手写高鲁棒性代理重试中间件:统一捕获Twisted底层异常、扩展重试状态码(含403/429)、自动轮换隧道IP,真正实现“丢包不丢数”。

114 1
|
1月前
|
存储 人工智能 API
|

基于Flutter3.41+Dart3.11+DeepSeek生成式AI对话应用App助手

Flutter3.41+Dart3+Dio+Getx+Markdown聚合DeepSeek-chat实战AI流式打字智能会话模板。新增深度思考模式、latex公式、mermaid图表,代码高亮/复制代码、图片预览、链接、表格等功能。

147 4
|
1月前
|
存储 分布式计算 运维
|

迅雷基于阿里云 EMR Serverless Spark 实现数仓资源效率与业务提升

迅雷基于阿里云 EMR Serverless Spark 实现数仓资源效率与业务提升,在迁移到 EMR Serverless Spark 之后,TCO 明显下降,平台按作业生命周期弹性拉起与回收,只为实际消耗付费;同时,托管化带来了稳定性与调度效率提升;更关键的是交付确定性提升,大作业整体可提速约 1 小时,报表链路从长尾波动变成更可控的出数节奏。

205 4
|
1月前
|
SQL 分布式计算 Serverless
|

鹰角网络:EMR Serverless Spark 在《明日方舟》游戏业务的应用

鹰角网络为应对游戏业务高频活动带来的数据潮汐、资源弹性及稳定性需求,采用阿里云 EMR Serverless Spark 构建云原生大数据架构,迁移后实现计算加速50%,核心链路产出时间提前1.5h,研发效率和稳定性显著提升!

518 2
|
1月前
|
存储 算法 定位技术
|

一套底座支撑多场景:高德地图基于 Paimon + StarRocks 轨迹服务实践

面对轨迹数据“高实时、高并发、长周期存储”的典型特征,高德团队以访问跨度为依据完成热/温/冷分层,并以 Apache Paimon + StarRocks 构建统一的数据底座,支撑轨迹数据的近实时写入与高性能查询。

344 4
|
1月前
|
数据采集 Rust 网络协议
|

学术文献抓取 OOM 崩溃与 403 风暴

学术文献抓取进程因内存泄漏和代理IP切换问题导致效率下降。通过使用Rust和Reqwest重写核心模块,隔离Cookie Jar,修复后内存稳定,抓取率提高至92%,延迟降低。

126 4
|
1月前
|
数据采集 人工智能 自然语言处理
|

快速接入京东商品评论API,商品口碑监测与舆情风控

依托京东官方评价API,融合AI/NLP技术,构建“采集—分析—预警—决策”全链路口碑风控体系:实时监测情感倾向与负面问题,智能分级预警,支持归因分析与工单处置,助力品牌从被动响应转向主动运营。(239字)

202 7
|
1月前
|
SQL 运维 监控
|

【生产避坑】Flink CDC + SQL Server 无增量?5分钟定位,直接抄解决方案

【生产避坑】Flink CDC同步SQL Server时增量失效?80%问题源于SQL Server Agent未启动!本文5分钟定位根因:先查CDC开关→再验CT表数据→最终确认Agent状态。附完整排查流程、3种启动方案及监控建议,直击要害,照抄即用,快速恢复实时同步!

202 6
|
1月前
|
Java
|

java工具:《Java 8 引入的 Optional 类型,它可以用来处理可能为空的值》

java工具:《Java 8 引入的 Optional 类型,它可以用来处理可能为空的值》

135 6
|
1月前
|
SQL 机器学习/深度学习 自然语言处理
|

企业数据智能成熟度评估:你的公司处在哪一级?

本文剖析企业“智能问数”落地困局:POC惊艳但上线即崩,根源在于技术路径与组织能力错配。对比四类主流方案(预制SQL、Text2SQL+宽表、预定义指标、本体语义),指出前三者“以人力换智能”,而本体路线(如UINO)通过结构化业务语义实现“又泛又准”。揭示三大陷阱:误将单表准确率当可用性、忽视业务知识隐性成本、低估组织协同难度,并给出分阶段落地五原则。强调选型关键不在模型多强,而在是否构建“机器可理解的语义”与“人机协同机制”。

140 2
|
1月前
|
存储 算法 BI
|

【图像加密】基于matlab混沌算法图像加密解密

本文提出一种基于逐段线性混沌映射(PWLCM)的图像加密算法。利用混沌系统对初值和参数的极端敏感性、遍历性及伪随机性,生成高安全性密钥流,与图像数据异或加密;通过动态切换控制参数增强抗攻击能力。仿真表明该算法加密效果好、解密准确、密钥空间大、抗初值微扰能力强。(239字)

144 2
|
1月前
|
数据采集 Rust NoSQL
|

架构视角下的千万级分布式爬虫:Rust + Reqwest 与代理网关的全局设计

本文探讨如何用Rust重构分布式爬虫Worker节点,解决高并发下的内存泄漏、CPU瓶颈与代理调度难题;结合Tokio、Reqwest与企业级隧道代理,实现千万级实时抓取的稳定、安全与高效。

174 2
|
1月前
|
JSON 监控 5G
|

某宝店铺商品全量接口-item_search_shop

淘宝item_search_shop_pro接口支持按店铺ID全量获取在售商品,含分页、字段筛选与类目过滤;提供完整参数说明、返回字段详解、Python调用示例及风控规范,开箱即用,适用于竞品监控、ERP同步与选品分析。(239字)

359 2
|
1月前
|
存储 搜索推荐 PyTorch
|

为什么使用 TorchRec 训练和推理更快

本文结合TorchEasyRec实践,从四大维度解析推荐系统加速:1)KeyedJaggedTensor统一变长特征,实现Embedding批量融合查找;2)自动分布式分片突破单卡显存瓶颈;3)TrainPipelineSparseDist流水线并行,重叠通信与计算;4)fbgemm-gpu融合优化器,减少显存访问。端到端提升训练效率与扩展性。

318 9
来自: 智能搜索推荐  版块
|
1月前
|
搜索推荐 调度 C++
|

TorchEasyRec的dbmtl 模型 config 详解

DBMTL(Deep Bayesian Multi-Target Learning)是阿里开源的多任务学习模型,显式建模任务因果依赖(如CTR→CVR)。基于TorchEasyRec实现,采用共享Bottom MLP+双Tower结构,CVR Tower融合CTR中间表征,体现贝叶斯条件关系。

172 5
来自: 人工智能平台PAI  版块
|
1月前
|
存储 搜索推荐 Python
|

TorchRec大量使用Jagged Tensor

Jagged Tensor(锯齿张量)是专为变长序列设计的紧凑存储格式,用values+lengths/offsets替代padding,显著节省内存与计算。广泛应用于推荐系统中用户行为、多值标签等不等长特征处理,如HSTU模型中的拼接、拆分与矩阵乘法操作。

258 8
来自: 人工智能平台PAI  版块
|
1月前
|
API 开发工具 C++
|

TorchEasyRec为什么推荐用 OdpsDataset 而不是 OdpsDatasetV1来读数据?

OdpsDataset(默认)是阿里TorchEasyRec推荐的数据集实现,相比旧版OdpsDatasetV1,其性能更优(批量Arrow读取+LZ4压缩)、支持断点续训、分布式协调精准分片、兼容30+复杂类型;V1仅作旧PAI环境兼容保留。

135 6
来自: 人工智能平台PAI  版块
|
1月前
|
API C++ Python
|

EasyRec和TorchEasyRec中FG NORMAL 和 FG DAG 的区别

TorchEasyRec提供两种特征生成模式:FG_NORMAL(Python逐特征处理,适合调试)与FG_DAG(C++ DAG引擎批量处理,性能更优、支持依赖、stub_type及自动侧识别)。推荐生产环境优先使用FG_DAG。

140 5
来自: 人工智能平台PAI  版块
|
1月前
|
机器学习/深度学习 搜索推荐 iOS开发
|

TorchEasyRec中INPUT_TILE 环境变量的三个模式

`NPUT_TILE` 是 tzrec 推荐系统在模型导出与在线推理阶段的优化策略,针对“1 用户 → N 商品”场景,避免用户特征重复计算。支持三种模式:`INPUT_TILE=1`(无优化)、`=2`(Embedding前tile)、`=3`(Embedding后tile,计算最优但需拆分Embedding表、依赖FG模式及torchrec,不支持macOS)。

181 6
来自: 智能搜索推荐  版块
|
1月前
|
并行计算 算法框架/工具 iOS开发
|

TorchRec在macos ARM芯片(Apple Silicon)上无法安装

JaggedTensor等在macOS ARM芯片上无法运行,主因是ARM64与x86_64架构不兼容,且TorchRec深度依赖CUDA——而Apple Silicon仅支持Metal。fbgemm-gpu缺失、Rosetta 2不支持CUDA指令,导致关键操作失败。建议改用MLX框架或标准PyTorch张量替代。

277 4
来自: 智能搜索推荐  版块
|
1月前
|
Python
|

心脏病预测的F1 Score计算

本项目基于阿里云PAI Designer,对心脏病数据开展二分类预测评估。通过遍历0–1间1000个阈值,计算各阈值下的F1 Score等指标,最终确定最佳阈值0.955,对应F1得分为0.8132,准确率82.47%。

127 2
来自: 人工智能平台PAI  版块
|
1月前
|
分布式计算 MaxCompute iOS开发
|

TorchEasyRec 在 macOS 上的功能限制总结

本文总结tzrec在macOS上的功能限制:核心依赖(如torchrec、fbgemm-gpu、graphlearn等)无法安装;分布式训练、原生数据管线、Embedding模块、Triton/CUDA算子、TDM树模型等功能完全不可用;优化器与模型导出部分失效;单元测试大多因强依赖而失败。

185 15
来自: 智能搜索推荐  版块
|
1月前
|
机器学习/深度学习 自然语言处理 iOS开发
|

Feature Generator(FG)特征算子配置指南

本文档全面介绍Feature Generator(FG)的各类特征算子配置方法,涵盖基础(ID/原始特征)、计算(表达式)、交叉(组合)、查找(Lookup/Match)、文本(重叠/BM25)、序列、预处理(分词/归一化)及字符串处理(正则替换/切片)等9大类算子,附详细配置示例与说明。

336 9
来自: 智能搜索推荐  版块
|
1月前
|
机器学习/深度学习 JSON 自然语言处理
|

PAI-Rec 特征工程全解析:统计特征、实时特征、序列特征与 FG 特征算子

PAI-Rec是阿里云智能推荐的特征工程解决方案,支持离线统计、实时及序列特征自动衍生,并通过Feature Generator(17种内置算子)保障离线/在线特征一致性,大幅降低开发与维护成本。

452 9
来自: 智能搜索推荐  版块
|
1月前
|
机器学习/深度学习 搜索推荐 数据处理
|

PAI-Rec推荐开发平台:企业级智能推荐解决方案,驱动业务全域增长

PAI-Rec是阿里云一站式推荐系统平台,集成多路召回、多目标精排(如DBMTL)、GPU加速推理与灵活迭代能力,已助力电商、直播、音视频等多行业提升点击率、转化率与ROI,实现高效、低成本、可自主演进的智能推荐。

344 16
来自: 智能搜索推荐  版块
|
1月前
|
算法 调度 数据库
|

演化计算与抽样方法构造新算法流程:从 AlphaEvolve 看 LLM × EA 融合范式

本文系统解析AlphaEvolve——Google DeepMind提出的LLM×EA融合新范式:以语义引导的抽样机制、双模型协同进化(Gemini Flash+Pro)、自动评估闭环,实现算法的自主发现与优化,已突破矩阵乘法纪录并提升训练效率。(239字)

259 15
|
1月前
|
机器学习/深度学习 分布式计算 搜索推荐
|

PAI-Rec 召回引擎:构建高性能推荐系统的核心引擎

PAI-Rec是阿里云智能推荐平台的核心召回引擎,经阿里大规模场景验证。支持多路召回融合(U2I/I2I/向量/随机)、召回即过滤、毫秒级实时更新与分布式弹性架构,开箱即用,助力企业构建毫秒级、高精度、强实时的推荐系统。

292 9
来自: 智能搜索推荐  版块
|
1月前
|
SQL 人工智能 分布式计算
|

EMR Serverless Spark 携手 PAI/百炼,开启“SQL 即 AI”的新篇章

EMR Serverless Spark 深度集成 AI Function 能力,并无缝对接 阿里云百炼与 阿里云人工智能平台 PAI 模型在线服务 PAI-EAS,定义了“SQL 即 AI”的新解决思路,数据分析师只需一行 SQL,即可直接调用世界顶尖的大模型。

243 4
|
1月前
|
人工智能
|

飞书OpenClaw配置教程,有吗?

253 3
来自:人工智能平台PAI 版块
已解决
|
1月前
|
JSON 数据安全/隐私保护 计算机视觉
|

告别付费套路!PhotoLab:开源免费的全功能桌面图片工作站,解锁所有核心能力

PhotoLab Pro是一款开源免费的桌面图片工作站,集成图像编辑、拼图排版、JPEG批量压缩、高级批量处理、图片转PDF五大模块,无广告、无VIP、无功能阉割,支持宏录制与跨模块协同,开箱即用。

288 2
|
1月前
|
关系型数据库 MySQL Apache
|

Flink CDC 3.6.0:支持 Flink 1.20/2.2, MySQL/PostgreSQL入湖入流支持Schema Evolution

Apache Flink CDC 3.6.0 正式发布!支持 Flink 1.20.x/2.2.x 与 JDK 11,增强端到端 Schema Evolution(MySQL/PostgreSQL 入湖入流),新增 Oracle Source 与 Hudi Sink 连接器,全面覆盖主流数据湖生态,并优化 Transform 框架、YAML 路由及多连接器能力。(239字)

699 2
来自: 实时计算 Flink  版块

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69520
内容
128
活动
439952
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务