|
8月前
|
Linux 虚拟化 Docker
|

win11怎么安装docker的必要设置自学软硬件工程师778天

win11怎么安装docker的必要设置自学软硬件工程师778天

632 4
|
8月前
|
人工智能 物联网 Apache
|

Flink Forward Asia 2025 新加坡站议题征集开启|The future of AI is Real-Time

Flink Forward Asia 2025 将于7月3日在新加坡盛大召开!作为Apache Flink社区顶级会议,大会聚焦实时AI、实时湖仓、实时分析等前沿方向,汇聚全球顶尖技术实践。即日起开放议题征集,诚邀开发者与数据专家分享创新经验。席位有限,立即行动!扫码或访问官网报名参与这场年度技术盛宴,共话实时计算未来。

585 17
来自: 实时计算 Flink  版块
|
8月前
|
Web App开发 编解码 算法
|

怎么实现实时无延迟的体育电竞动画直播

实时无延迟动画直播需关注技术方案、实现步骤与专业解决方案。技术上可选WebRTC(低至100-500ms延迟,互动性强)、低延迟HLS/CMAF(1-3秒延迟,兼容性好)和RTMP(传统协议,2-5秒延迟)。实现步骤包括采集端设置(高性能编码、稳定网络)、传输优化(CDN节点选择、抗丢包协议)及播放端优化(低延迟模式、自适应码率)。专业方案有云服务(AWS、Azure、阿里云)和专用平台(Millicast、Wowza)。注意完全无延迟不可行,需权衡画质与稳定性,并考虑终端兼容性和成本。代码示例展示了比赛数据处理逻辑,涉及匹配ID、状态、计划与关注等功能。

440 11
|
9月前
|
存储 人工智能 自然语言处理
|

方案介绍|基于百炼生成向量数据并使用阿里云Milvus存储和检索

阿⾥云Milvus是⼀款云上全托管服务,提供⼤规模向量数据的相似性检索服务。100%兼容开源Milvus,在开源版本的基础上增强了可扩展性,具备易⽤性、可⽤性、安全性、低成本与⽣态优势。阿⾥云Milvus可以⽀持⼏乎所有涉及到向量搜索的场景。例如检索增强⽣成RAG,以及经典的搜索推荐、多模态检索等。阿里云Milvus可存储百炼产生的向量数据,并进行大规模向量数据的检索。本文将重点介绍这一过程的方案。

716 2
|
9月前
|
机器学习/深度学习 人工智能 算法
|

SWEET-RL:基于训练时信息的多轮LLM代理强化学习框架

SWEET-RL是一种基于训练时信息的逐步评估算法,显著提升了多轮大型语言模型(LLM)代理在强化学习中的成功率。相比现有方法,SWEET-RL将成功率提高6%,使小型开源模型如Llama-3.1-8B达到甚至超越GPT-4O等大型专有模型性能。通过非对称Actor-Critic结构、创新优势函数参数化及两阶段训练流程,SWEET-RL优化了信用分配机制与泛化能力,降低了计算成本。ColBench基准测试显示,SWEET-RL在后端编程和前端设计任务中表现卓越,为AI代理训练技术带来突破性进展。

355 2
|
9月前
|
Web App开发 数据采集 前端开发
|

Python + Chrome 爬虫:如何抓取 AJAX 动态加载数据?

Python + Chrome 爬虫:如何抓取 AJAX 动态加载数据?

398 2
|
9月前
|
SQL 分布式计算 数据挖掘
|

《智能数据建设与治理 Dataphin》的最佳实践

本文介绍了使用Dataphin进行离线数仓搭建的实操教程,涵盖从创建数据板块到数据分析的完整流程。内容包括登录控制台、配置计算源、创建离线管道、生成SQL语句、运行任务及验证数据等步骤。通过详细的操作指南和截图,帮助用户快速上手Dataphin,体验其强大的数据治理能力。总结中提到教程存在部分陈旧问题,建议加深对产品逻辑的理解以更好地掌握工具使用。

487 1
|
9月前
|
机器学习/深度学习 运维 自然语言处理
|

当深度学习遇上故障根因分析:运维人的绝佳拍档

当深度学习遇上故障根因分析:运维人的绝佳拍档

415 17
|
9月前
|
供应链 算法 量子技术
|

量子跃迁:量子计算在物流优化中的革命性应用

量子跃迁:量子计算在物流优化中的革命性应用

627 22
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
|

云上一键部署通义千问 QwQ-32B 模型,阿里云 PAI 最佳实践

3月6日阿里云发布并开源了全新推理模型通义千问 QwQ-32B,在一系列权威基准测试中,千问QwQ-32B模型表现异常出色,几乎完全超越了OpenAI-o1-mini,性能比肩Deepseek-R1,且部署成本大幅降低。并集成了与智能体 Agent 相关的能力,够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。阿里云人工智能平台 PAI-Model Gallery 现已经支持一键部署 QwQ-32B,本实践带您部署体验专属 QwQ-32B模型服务。

1883 17
来自: 人工智能平台PAI  版块
|
9月前
|
人工智能 自然语言处理 API
|

Hologres × PAI × DeepSeek 搭建 RAG 检索增强对话系统

本文介绍如何使用PAI-EAS部署基于DeepSeek大模型的RAG(检索增强生成)服务,并关联Hologres引擎实例。Hologres与阿里云自研高性能向量计算软件库Proxima深度整合,支持高性能、低延时的向量计算能力。通过PAI-EAS,用户可以一键部署集成了大语言模型和RAG技术的对话系统服务,显著缩短部署时间,并提高问答质量。部署步骤包括准备Hologres向量检索库、部署基于DeepSeek的RAG服务、通过WebUI进行模型推理验证,以及通过API调用进行模型推理验证。Hologres还提供了特色功能支持,如高性能向量计算等。

467 1
来自: 实时数仓 Hologres  版块
|
9月前
|
自然语言处理 安全 API
|

1688 跨境属性 API 接口(1688API 系列)

1688跨境属性API助力跨境电商发展,提供商品目标市场适配、跨境物流、国际认证及语言文化属性等数据,支持HTTP GET/POST请求。开发者可通过商品ID、目标市场代码和语言参数精准获取信息,提升业务效率与精准度。示例代码展示了如何使用Python进行GET请求,获取商品跨境属性,确保数据准确可靠。

370 0
|
10月前
|
消息中间件 关系型数据库 MySQL
|

基于 Flink CDC YAML 的 MySQL 到 Kafka 流式数据集成

本教程展示如何使用Flink CDC YAML快速构建从MySQL到Kafka的流式数据集成作业,涵盖整库同步和表结构变更同步。无需编写Java/Scala代码或安装IDE,所有操作在Flink CDC CLI中完成。首先准备Flink Standalone集群和Docker环境(包括MySQL、Kafka和Zookeeper),然后通过配置YAML文件提交任务,实现数据同步。教程还介绍了路由变更、写入多个分区、输出格式设置及上游表名到下游Topic的映射等功能,并提供详细的命令和示例。最后,包含环境清理步骤以确保资源释放。

790 2
来自: 实时计算 Flink  版块
|
10月前
|
存储 分布式数据库 Apache
|

小米基于 Apache Paimon 的流式湖仓实践

本文整理自Flink Forward Asia 2024流式湖仓专场分享,由计算平台软件研发工程师钟宇江主讲。内容涵盖三部分:1)背景介绍,分析当前实时湖仓架构(如Flink + Talos + Iceberg)的痛点,包括高成本、复杂性和存储冗余;2)基于Paimon构建近实时数据湖仓,介绍其LSM存储结构及应用场景,如Partial-Update和Streaming Upsert,显著降低计算和存储成本,简化架构;3)未来展望,探讨Paimon在流计算中的进一步应用及自动化维护服务的建设。

599 0
来自: 实时计算 Flink  版块
|
10月前
|
SQL 数据可视化 atlas
|

低空经济新基建!DataV Atlas 如何用大模型玩转空间数据?

阿里云DataV Atlas推出搭载通义千问最新2.5 Max大模型「时空SQL智能小助手」,通过自然语言生成专业SQL,简化空间数据分析流程,助力智慧农田、城市低空交通及应急调度等领域,推动精准决策和智能化管理。零门槛体验空间智能分析革命,开启“会思考的天空网络”新时代。

728 5
来自: 数据可视化DataV  版块
|
10月前
|
JSON API 开发者
|

小红书商品详情API接口(小红书API系列)

小红书商品详情API接口帮助开发者获取平台上特定商品的详细信息,包括标题、价格、图片、描述、评价数量等。支持HTTP GET/POST请求,返回JSON格式数据。通过传递商品ID及其他可选参数,开发者可以将小红书的商品信息整合到自己的应用中,提供更丰富的购物体验。Python示例代码展示了如何使用requests库发送GET请求并处理响应数据。实际使用需替换为真实接口地址和商品ID,并遵循平台认证要求。

564 6
|
10月前
|
机器学习/深度学习 数据采集 人工智能
|

量子计算与人工智能的结合:引领科技革命的前沿

量子计算与人工智能的结合:引领科技革命的前沿

695 13
|
10月前
|
存储 机器学习/深度学习 数据挖掘
|

数据湖与数据仓库:初学者的指南

数据湖与数据仓库:初学者的指南

781 4
|
10月前
|
存储 前端开发 区块链
|

基于区块链的慈善捐赠平台:透明与信任的未来

基于区块链的慈善捐赠平台:透明与信任的未来

508 24
|
10月前
|
JavaScript 前端开发
|

Node.js 中实现多任务下载的并发控制策略

Node.js 中实现多任务下载的并发控制策略

345 15
|
10月前
|
人工智能 自然语言处理 搜索推荐
|

高性价比| OpenSearch 智能问答版开箱即用 DeepSeek-R1

OpenSearch LLM智能问答版基于DeepSeek-R1一分钟搭建RAG系统。

1691 11
来自: 智能搜索推荐  版块
|
10月前
|
应用服务中间件 Linux nginx
|

部署使用 CHAT-NEXT-WEB 基于 Deepseek

本文介绍如何在阿里云轻量服务器上部署基于 `Deepseek` 的 `CHAT-NEXT-WEB` 项目。首先,准备一台 Linux 服务器并安装 Docker,确保防火墙允许特定端口访问。接着,通过阿里云容器镜像服务解决国内网络限制问题,将镜像推送到私有仓库并拉取到本地。配置并启动 `chat-next` 项目,使用 Deepseek API 进行优化。最后,安装 Nginx 和 Certbot 配置 HTTPS 访问,确保安全性和自动续签。整个过程需严格遵循官方文档,以避免因网络问题导致的安装失败。

1786 9
来自: 智能搜索推荐  版块
|
11月前
|
存储 缓存 Java
|

Python高性能编程:五种核心优化技术的原理与Python代码

Python在高性能应用场景中常因执行速度不及C、C++等编译型语言而受质疑,但通过合理利用标准库的优化特性,如`__slots__`机制、列表推导式、`@lru_cache`装饰器和生成器等,可以显著提升代码效率。本文详细介绍了这些实用的性能优化技术,帮助开发者在不牺牲代码质量的前提下提高程序性能。实验数据表明,这些优化方法能在内存使用和计算效率方面带来显著改进,适用于大规模数据处理、递归计算等场景。

332 5
|
11月前
|
机器学习/深度学习 数据采集 算法
|

机器学习在生物信息学中的创新应用:解锁生物数据的奥秘

机器学习在生物信息学中的创新应用:解锁生物数据的奥秘

881 36
|
11月前
|

分布匹配蒸馏:扩散模型的单步生成优化方法研究

扩散模型在生成高质量图像方面表现出色,但其迭代去噪过程计算开销大。分布匹配蒸馏(DMD)通过将多步扩散简化为单步生成器,结合分布匹配损失和对抗生成网络损失,实现高效映射噪声图像到真实图像,显著提升生成速度。DMD利用预训练模型作为教师网络,提供高精度中间表征,通过蒸馏机制优化单步生成器的输出,从而实现快速、高质量的图像生成。该方法为图像生成应用提供了新的技术路径。

496 2
|
12月前
|
人工智能 分布式计算 数据处理
|

MaxCompute Data + AI:构建 Data + AI 的一体化数智融合

本次分享将分为四个部分讲解:第一部分探讨AI时代数据开发范式的演变,特别是MaxCompute自研大数据平台在客户工作负载和任务类型变化下的影响。第二部分介绍MaxCompute在资源大数据平台上构建的Data + AI核心能力,提供一站式开发体验和流程。第三部分展示MaxCompute Data + AI的一站式开发体验,涵盖多模态数据管理、交互式开发环境及模型训练与部署。第四部分分享成功落地的客户案例及其收益,包括互联网公司和大模型训练客户的实践,展示了MaxFrame带来的显著性能提升和开发效率改进。

768 7
来自: 大数据计算 MaxCompute  版块
|
12月前
|
存储 人工智能 算法
|

深度解读面向大模型开发和应用的数据处理套件

本文深入解读了大数据与AI联合场景下的技术,重点探讨了大语言模型、多模态模型训练及应用数据处理。文章首先分析了算法、算力和数据在大模型训练中的重要性,强调数据采集、标注和质量控制的关键作用。接着介绍了PAI平台上的端到端数据处理套件,涵盖预训练、有监督微调和偏好对齐的数据处理流程,以及数据合成和蒸馏技术的应用。最后展望了未来在多模态处理、性能优化和行业解决方案方面的扩展方向。

727 3
来自: 人工智能平台PAI  版块
|
12月前
|
存储 SQL 缓存
|

Flink 2.0 存算分离状态存储 — ForSt DB 

本文整理自阿里云技术专家兰兆千在Flink Forward Asia 2024上的分享,主要介绍Flink 2.0的存算分离架构、全新状态存储内核ForSt DB及工作进展与未来展望。Flink 2.0通过存算分离解决了本地磁盘瓶颈、检查点资源尖峰和作业恢复速度慢等问题,提升了云原生部署能力。ForSt DB作为嵌入式Key-value存储内核,支持远端读写、批量并发优化和快速检查点等功能。性能测试表明,ForSt在异步访问和本地缓存支持下表现卓越。未来,Flink将继续完善SQL Operator的异步优化,并引入更多流特性支持。

1205 88
来自: 实时计算 Flink  版块
|
14天前
|
分布式计算 资源调度 运维
|

Spark 批处理调优这点事:资源怎么要、Shuffle 怎么省、序列化怎么选?我用这些年踩过的坑告诉你

Spark 批处理调优这点事:资源怎么要、Shuffle 怎么省、序列化怎么选?我用这些年踩过的坑告诉你

103 8
|
15天前
|
人工智能 自然语言处理 安全
|

金融对话AI:伦敦证券交易所集团携手OpenAI重塑市场数据分析

2025年12月,LSEG与OpenAI达成战略合作,将金融数据接入ChatGPT,通过自然语言实现行情查询、估值分析等功能,推动金融分析民主化。借助MCP技术,用户可直观获取专业研报与实时数据,降低使用门槛。此举标志金融服务向智能化、直觉化转型,但也面临安全与合规挑战。#金融科技 #AI变革

100 1
|
1月前
|
人工智能 安全 数据可视化
|

教育行业如何用AI搜索优化实现低成本获客?数聚酷实战指南

一、教育行业的“流量焦虑”与AI搜索的破局机会 “用户越来越难被触达了!”这是深圳某K12机构负责人的真实感叹。传统广告投放成本飙升,社交媒体流量见顶,用户决策路径从“主动搜索”转向“向AI提问”——数据显示,2025年教育类AI搜索咨询量同比激增350%,但能被AI优先推荐的机构不足5%。 数聚酷的观察:AI搜索(G…

132 3
来自: 智能搜索推荐  版块
|
1月前
|
存储 传感器 边缘计算
|

边缘计算:当智能走向设备端,我们能做什么?

边缘计算:当智能走向设备端,我们能做什么?

367 6
|
1月前
|
SQL JSON 分布式计算
|

【跨国数仓迁移最佳实践6】MaxCompute SQL语法及函数功能增强,10万条SQL转写顺利迁移

本系列文章将围绕东南亚头部科技集团的真实迁移历程展开,逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第六篇,MaxCompute SQL语法及函数功能增强。 注:客户背景为东南亚头部科技集团,文中用 GoTerra 表示。

252 20
来自: 大数据计算 MaxCompute  版块
|
1月前
|
数据可视化 Java 大数据
|

基于大数据的天气分析与应用系统

本研究基于Spark大数据技术,针对西南复杂地形与多变气候,构建气象数据分析模型,结合Java、Vue、Spring Boot与MySQL技术实现降水可视化预测系统,提升气象预报精度与防灾能力。

135 4
|
1月前
|
人工智能 架构师 开发者
|

破局2025:定义AI数字艺术新生态的十大关键人物

当AI艺术迈入生态竞争时代,十位创作者正重塑未来。他们超越技术炫技,以生态构建、商业创新与跨界影响力开辟新疆域。从乾元AIGC的多维赋能,到林响的数字乡建,再到织梦人的互动叙事,他们定义规则,连接技术与人文,成为AI艺术时代的建筑师与引路人。

201 12
|
1月前
|
人工智能 分布式计算 大数据
|

阿里云大数据AI产品月刊-2025年10月

大数据& AI 产品技术月刊【2025年 10 月】,涵盖 10 月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。

233 1
|
1月前
|
数据可视化 搜索推荐 大数据
|

2026版基于python大数据的旅游可视化及推荐系统

本研究聚焦基于Python大数据的旅游可视化与推荐系统,利用Python在数据处理、分析和可视化方面的优势,结合Django框架与MySQL数据库,构建高效、个性化的旅游推荐平台。通过爬取多源旅游数据,运用机器学习算法挖掘用户偏好,实现精准推荐;借助Matplotlib、Seaborn等工具进行数据可视化,直观展示景点分布、客流趋势等信息。系统不仅提升游客决策效率与体验,也助力旅游企业优化产品设计与营销策略,推动行业数字化转型与智能化发展。

208 11
|
2月前
|
Kubernetes API 开发工具
|

Kubeflow-Pipelines-架构学习指南

本指南带你深入 Kubeflow Pipelines 架构,从零掌握 ML 工作流编排。涵盖核心组件、代码结构、开发调试及贡献流程,结合实战练习与学习路径,助你由使用者进阶为贡献者。

451 139
|
2月前
|
存储 程序员 C语言
|

c语言文件操作

本文介绍了C语言中文件操作的核心概念,包括文件缓冲区、数据与程序文件的区别、流的概念及标准输入输出流。重点讲解了文件的打开与关闭、读写操作(如fgetc、fputs、fscanf、fwrite等),以及随机读写函数fseek、ftell和rewind的使用方法。同时说明了文本文件与二进制文件的读取结束判定方式,并通过代码示例展示了实际应用。

173 2
|
2月前
|
监控 算法 NoSQL
|

Go 微服务限流与熔断最佳实践:滑动窗口、令牌桶与自适应阈值

🌟蒋星熠Jaxonic:Go微服务限流熔断实践者。分享基于滑动窗口、令牌桶与自适应阈值的智能防护体系,助力高并发系统稳定运行。

369 1
|
3月前
|
Java 数据库 Android开发
|

基于Android的电子记账本系统

本项目研究开发一款基于Java与Android平台的开源电子记账系统,采用SQLite数据库和Gradle工具,实现高效、安全、便捷的个人财务管理,顺应数字化转型趋势。

290 1
|
4月前
|
机器学习/深度学习 存储 人工智能
|

RAG系统文本检索优化:Cross-Encoder与Bi-Encoder架构技术对比与选择指南

本文将深入分析这两种编码架构的技术原理、数学基础、实现流程以及各自的优势与局限性,并探讨混合架构的应用策略。

327 10
|
4月前
|
SQL 人工智能 JSON
|

Flink 2.1 SQL:解锁实时数据与AI集成,实现可扩展流处理

简介:本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享,介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展,包括AI函数集成、Join优化及未来发展方向,助力构建高效实时AI管道。

846 43
来自: 实时计算 Flink  版块
|
4月前
|
机器学习/深度学习 算法 测试技术
|

NSA稀疏注意力深度解析:DeepSeek如何将Transformer复杂度从O(N²)降至线性,实现9倍训练加速

本文将深入分析NSA的架构设计,通过详细的示例、可视化展示和数学推导,构建对其工作机制的全面理解,从高层策略到底层硬件实现均有涉及。

412 0
|
5月前
|
存储 机器学习/深度学习 缓存
|

Google DeepMind发布MoR架构:50%参数超越传统Transformer,推理速度提升2倍

递归混合架构(MoR)通过自适应令牌级计算机制,在降低参数与计算开销的同时超越传统Transformer性能,显著提升推理效率与内存管理,为大模型发展提供新方向。

363 0
|
5月前
|
人工智能 缓存 测试技术
|

从零搭建智能搜索代理:LangGraph + 实时搜索 + PDF导出完整项目实战

本系统的核心特性包括:基于智能判断机制的自动网络搜索触发、跨多轮对话的上下文状态管理、多策略搜索机制与智能回退、透明的信息源追溯体系,以及专业级PDF文档生成功能。

261 0
|
5月前
|
人工智能 缓存 资源调度
|

云上AI推理平台全掌握 (4):大模型分发加速

为应对大模型服务突发流量场景,阿里云人工智能平台 PAI 推理服务 PAI-EAS 提供本地目录内存缓存(Memory Cache)的大模型分发加速功能,有效解决大量请求接入情况下的推理延迟。PAI-EAS 大模型分发加速功能,零代码即可轻松完成配置。

529 0
来自: 人工智能平台PAI  版块
|
5月前
|
Java 关系型数据库 MySQL
|

springboot项目集成dolphinscheduler调度器 实现datax数据同步任务

springboot项目集成dolphinscheduler调度器 实现datax数据同步任务

627 2
|
5月前
|
人工智能 供应链 数据挖掘
|

瓴羊入选中国信通院《AI Agent智能体产业图谱》

2025数据智能大会在京召开,中国信通院发布《AI Agent智能体产业图谱1.0》,瓴羊Quick BI凭借智能数据分析能力入选。该图谱系统梳理AI Agent产业生态,涵盖基础底座、平台、通用与行业智能体四大领域。Quick BI通过融合大模型技术,重构企业数据分析方式,实现从“被动响应”到“主动服务”的升级,广泛应用于供应链、零售、财务等多个场景。此次入选标志着瓴羊在数据分析智能体领域的创新成果获高度认可。作为阿里巴巴旗下数智服务品牌,瓴羊将持续推动企业智能化转型,释放数据价值,助力“人工智能+”深度发展。

504 0
|
5月前
|
数据采集 算法 数据可视化
|

量化交易隐藏模式识别方法:用潜在高斯混合模型识别交易机会

本文将从技术实现角度阐述LGMM相对于传统方法的优势,通过图表对比分析展示其效果,并详细说明量化分析师和技术分析师如何应用此方法优化投资决策。

299 3

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

1
今日
67714
内容
128
活动
439501
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务