|
11月前
|
SQL 安全 大数据
|

大数据时代的安全挑战——数据泄露如何悄然发生?

大数据时代的安全挑战——数据泄露如何悄然发生?

452 18
|
11月前
|
消息中间件 监控 5G
|

5G+智能家居:让生活更智慧、更畅快

5G+智能家居:让生活更智慧、更畅快

456 7
|
11月前
|
PyTorch 调度 算法框架/工具
|

阿里云PAI-DLC任务Pytorch launch_agent Socket Timeout问题源码分析

DLC任务Pytorch launch_agent Socket Timeout问题源码分析与解决方案

539 18
来自: 人工智能平台PAI  版块
|
12月前
|
人工智能 边缘计算 搜索推荐
|

5G+教育=未来课堂?一文讲透5G如何颠覆教学现场

5G+教育=未来课堂?一文讲透5G如何颠覆教学现场

322 5
|
12月前
|
数据采集 XML 存储
|

Headers池技术在Python爬虫反反爬中的应用

Headers池技术在Python爬虫反反爬中的应用

484 0
|
12月前
|
人工智能 运维 API
|

PAI-Model Gallery云上一键部署阶跃星辰新模型Step1X-Edit

4月27日,阶跃星辰正式发布并开源图像编辑大模型 Step1X-Edit,性能达到开源 SOTA。Step1X-Edit模型总参数量为19B,实现 MLLM 与 DiT 的深度融合,在编辑精度与图像保真度上实现大幅提升,具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持文字替换、风格迁移等11 类高频图像编辑任务类型。在最新发布的图像编辑基准 GEdit-Bench 中,Step1X-Edit 在语义一致性、图像质量与综合得分三项指标上全面领先现有开源模型,比肩 GPT-4o 与 Gemin。PAI-ModelGallery 支持Step1X-Edit一键部署方案。

327 2
来自: 人工智能平台PAI  版块
|
12月前
|
存储 SQL 运维
|

中国联通网络资源湖仓一体应用实践

本文分享了中国联通技术专家李晓昱在Flink Forward Asia 2024上的演讲,介绍如何借助Flink+Paimon湖仓一体架构解决传统数仓处理百亿级数据的瓶颈。内容涵盖网络资源中心概况、现有挑战、新架构设计及实施效果。新方案实现了数据一致性100%,同步延迟从3小时降至3分钟,存储成本降低50%,为通信行业提供了高效的数据管理范例。未来将深化流式数仓与智能运维融合,推动数字化升级。

587 0
来自: 实时计算 Flink  版块
|
12月前
|
搜索推荐 API 开发者
|

京东商品列表 API 接口全解析:从入门到精通

京东商品列表API是京东开放平台为开发者提供的核心数据接口,支持批量获取商品基础信息、价格、库存状态等多维度数据。它具备数据丰富性、灵活筛选与分页查询、稳定高效等特点,可满足市场分析、选品优化、比价工具及推荐系统开发等需求,为电商业务创新提供坚实支撑。通过标准化通道,助力第三方高效、合法地利用京东海量商品数据。

435 3
|
12月前
|
JSON API 数据格式
|

深入研究:Shopee 商品详情 API 接口详解

Shopee 商品详情 API 是针对东南亚及中国台湾地区电商开发者的强大工具,可获取商品的详细信息(如价格、库存、描述等),支持竞品分析与市场调研。通过 HTTP GET/POST 请求,传入商品 ID 等参数,返回 JSON 格式的商品数据,包括基本信息、销售数据、商家信息等。以下是 Python 示例代码,展示如何使用 requests 库调用该接口并处理响应数据。注意实际应用需遵循 Shopee 认证要求。

542 1
|
12月前
|
机器学习/深度学习 存储 数据可视化
|

KG4MM:融合知识图谱与多模态数据预测药物相互作用

本文探讨了用于多模态学习的知识图谱(KG4MM)在药物相互作用(DDI)预测中的应用。知识图谱通过整合药物的分子图像和文本描述,提供结构化先验知识,指导模型关注关键信息。具体实现中,利用图神经网络(GNN)连接知识图谱与多模态数据,通过注意力机制提取最具区分性的特征。以 Goserelin 和 Desmopressin 为例,模型结合直接边关系和共享节点路径,生成透明可解释的预测结果。实验表明,KG4MM 方法显著提升了预测准确性与可解释性,为生物医学领域提供了新思路。

479 0
|
12月前
|
安全 JavaScript 前端开发
|

引流器即服务(Drainer-as-a-Service)的兴起 | 了解引流器即服务(DaaS)

近期,X(原推特)平台遭遇一波账号接管攻击,多个知名账户被入侵以传播窃取加密货币的恶意内容。这些攻击主要依赖“加密货币引流器”及“引流器即服务”(DaaS)平台实施。DaaS提供现成脚本、智能合约等工具,帮助攻击者从受害者钱包中转移资产。2021年起,此类威胁逐渐兴起,但未引起足够关注。文章深入分析了DaaS运作模式及其影响,并以CLINKSINK恶意软件为例剖析具体攻击手法。为防范此类威胁,建议启用多因素认证(MFA),警惕社会工程学手段,使用硬件钱包提升安全性。DaaS因低门槛、高回报特点,可能吸引更多恶意参与者,需持续关注其演变趋势。

214 0
|
12月前
|
数据采集 存储 开发者
|

如何动态调整Python爬虫的Request请求延迟

如何动态调整Python爬虫的Request请求延迟

455 13
|
12月前
|
数据采集 机器学习/深度学习 人工智能
|

数据驱动智能,智能优化数据——大数据与人工智能的双向赋能

数据驱动智能,智能优化数据——大数据与人工智能的双向赋能

715 4
|
12月前
|
传感器 人工智能 边缘计算
|

5G+智慧城市:让城市自己“思考”的时代来了!

5G+智慧城市:让城市自己“思考”的时代来了!

387 12
|
12月前
|
自动驾驶 安全 物联网
|

5G加持自动驾驶:从“聪明”到“智慧”的进化

5G加持自动驾驶:从“聪明”到“智慧”的进化

387 8
|
12月前
|
人工智能 物联网 5G
|

5G如何重塑远程医疗——低延迟、高速连接背后的技术革命

5G如何重塑远程医疗——低延迟、高速连接背后的技术革命

404 12
|
12月前
|
API 开发者 Python
|

深入研究:1688商品跨境属性API接口详解

本文介绍了如何通过 1688 商品跨境属性 API 获取商品的跨境相关数据,助力企业开展电商业务。文章分为三部分:引言阐述了接口的重要性及应用场景;接口概述详细说明了调用步骤,包括参数准备、签名生成、请求发送和响应处理;Python 请求示例提供了一个完整的代码实现,帮助开发者快速上手。示例代码涵盖了请求参数配置、签名生成逻辑以及使用 requests 库发送请求的过程,为实际应用提供了参考。

2902 13
|
12月前
|
SQL 分布式计算 运维
|

dataphin评测报告

本文是一篇关于Dataphin的使用总结与测评报告。作为一位开发工程师,作者在使用Dataphin过程中发现其具备数据规范化构建、全链路数据治理、数据资产化及跨平台兼容的优势,能有效降低开发门槛并提升效率。文章详细介绍了从进入工作台到数据规划、引入数据、数据处理、功能周期任务补数据、数据验证以及数据分析的全流程操作步骤,并通过截图辅助说明,帮助用户快速上手Dataphin,实现高效的数据开发与治理,在测评使用过程中整体感觉dataphin这个产品功能非常强大,能够为开发人员提高工作效率,界面也是比较清晰的感觉,容易初学者上手学习。

282 3
|
12月前
|
人工智能 JavaScript 前端开发
|

TVM虚拟机

TVM引擎是一款超微型、多功能的编程工具,支持多种语法(如Lisp、JavaScript等),拥有几百个实用函数。其核心优势包括快速加载执行、跨平台运行(Windows、Linux等)、源代码链接生成独立文件及嵌入宿主系统作为开发语言平台。此外,它具备动态脚本特性、符号单元运算、面向对象原型继承、函数式编程特点,以及C语言底层操作能力。TVM还支持弱类型数据处理、多态函数、内存垃圾自动回收、正则表达式文本处理和网络编程接口,广泛应用于分布计算、科学统计及人工智能等领域。

921 6
|
12月前
|
XML JSON 监控
|

深入研究:1688 商品列表 API 详解

1688商品列表API为电商数据分析、竞品调研等场景提供程序化数据获取方式。通过关键词、价格区间、销量范围及类目等条件筛选商品,返回商品标题、价格、销量等基本信息。支持HTTP GET/POST请求,响应格式为JSON或XML,助力业务分析与决策。

250 4
|
12月前
|
XML JSON API
|

深入研究:1688 商品详情 API 详解

1688商品详情API助力电商数据分析与决策!通过该接口,开发者可基于商品ID快速获取1688平台上商品的标题、价格、规格、图片等多维信息。企业能优化商品策略,提升竞争力。使用前需注册开发者账号、创建应用并申请权限,调用时传入必要参数(如app_key和商品ID),返回JSON/XML格式数据,涵盖商品基本信息、描述、图片及商家资料等内容。

336 0
|
12月前
|
消息中间件 存储 监控
|

Lalamove基于Flink实时湖仓演进之路

本文由货拉拉国际化技术部资深数据仓库工程师林海亮撰写,围绕Flink在实时数仓中的应用展开。文章首先介绍了Lalamove业务背景,随后分析了Flink在实时看板、数据服务API、数据监控及数据分析中的应用与挑战,如多数据中心、时区差异、上游改造频繁及高成本问题。接着阐述了实时数仓架构从无分层到引入Paimon湖仓的演进过程,解决了数据延迟、兼容性及资源消耗等问题。最后展望未来,提出基于Fluss+Paimon优化架构的方向,进一步提升性能与降低成本。

421 11
来自: 实时计算 Flink  版块
|
12月前
|
数据采集 存储 JSON
|

用Python爬虫抓取数据并保存为JSON的完整指南

用Python爬虫抓取数据并保存为JSON的完整指南

749 3
|
12月前
|
人工智能 数据可视化 前端开发
|

自学软硬件工程师776天精简版github项目同步推送步骤

注意 这篇文章不是水内容的,虽然我之前也写过 github推送同步的内容。

281 0
|
12月前
|
搜索推荐 数据挖掘 数据安全/隐私保护
|

频率派与贝叶斯统计在营销组合建模中的应用比较:隐私优先时代的方法选择

营销组合建模(MMM)是量化营销渠道贡献的核心工具,在数字营销进入隐私优先时代后焕发新生。文章探讨了频率派与贝叶斯统计学在MMM中的应用,前者实现简单、结果直观,适合数据充足场景;后者能整合先验知识、量化不确定性,适应复杂和数据稀缺情况。两者各有优劣,选择需结合业务需求与数据条件。贝叶斯方法在隐私保护趋势下尤为重要,为未来营销分析提供新思路。

321 47
|
12月前
|
机器学习/深度学习 并行计算 PyTorch
|

【pytorch】【202504】关于torch.nn.Linear

小白从开始这段代码展示了`nn.Linear`的使用及其背后的原理。 此外,小白还深入研究了PyTorch的核心类`torch.nn.Module`以及其子类`torch.nn.Linear`的源码。`grad_fn`作为张量的一个属性,用于指导反向传播 进一步地,小白探讨了`requires_grad`与叶子节点(leaf tensor)的关系。叶子节点是指在计算图中没有前驱操作的张量,只有设置了`requires_grad=True`的叶子节点才会在反向传播时保存梯度。 最后,小白学习了PyTorch中的三种梯度模式 通过以上学习小白对PyTorch的自动求导机制有了更深刻的理解。

478 6
|
28天前
|
Java
|

java工具:《Java获取昨日零点时间工具方法》

java工具:《Java获取昨日零点时间工具方法》

119 9
|
2月前
|
机器学习/深度学习 人工智能 物联网
|

从微调到 PPO:祝福 AI 的下一步进化

本文探讨祝福AI从“写得不错”到“越写越懂你”的演进路径:SFT微调已解决群体风格对齐,而PPO强化学习则让模型基于用户反馈(点赞、修改、发送等)动态适配个体偏好,学会为表达后果负责——不是教它“怎么说”,而是教它“何时这样说才对”。

129 1
|
2月前
|
存储 安全
|

基于DLF构建实时数据湖

DLF

165 2
|
2月前
|
数据采集 安全 C++
|

当 Prompt 和 RAG 都开始别扭时,你该认真考虑微调了

本文以春节祝福生成为例,揭示微调本质:它不是技术升级的“最后一招”,而是对任务性质的判断结果——当问题核心是“模型会做但不像你要的”(如风格不一致、分寸难拿捏),且Prompt/RAG已显乏力时,微调反而是最克制高效的选择。提供可落地的三维度决策框架。

329 148
|
2月前
|
数据采集 人工智能 安全
|

别再用ChatGPT群发祝福了!手把手教你“喂”出一个懂人情的AI,连马术梗都能接住

本文揭秘春节祝福AI背后的数据构建逻辑:不靠大模型堆参数,而用“关系感知”六维框架(称呼/关系/细节/场合/风格/篇幅)定义人情分寸;通过人工精写种子数据、模型辅助繁殖(400→3107条)、结构化提示词模板,让AI写出有记忆点的专属祝福。技术是导盲犬,帮人打捞真心。

236 3
|
2月前
|
人工智能 安全 UED
|

多任务微调:拜年、感谢、道歉,为什么不是三个简单任务

本文探讨祝福类AI扩展多任务(拜年/感谢/道歉)时的关键工程抉择:表面相似的情绪表达,实则在风险等级、语气分寸与用户期待上差异巨大。多任务微调易致任务“污染”,尤其低风险任务会拉偏高风险任务的表达倾向。核心结论:技术难点不在模型能力,而在厘清人情世故的边界——何时共享,何时拆模,才是成熟落地的关键。

336 149
|
2月前
|
人工智能 自然语言处理 小程序
|

你的祝福AI真的好吗?三个维度量化“走心”的秘密

春节将至,AI祝福工具泛滥,但真“走心”吗?本文揭秘评估关键:**事实准确性**(细节不编造)、**风格契合度**(对父母/老板用不同语气)、**表达自然度**(像人话,不堆成语)。告别BLEU等传统指标,用三维标准科学打分,避开“智商税”。

142 4
|
2月前
|
缓存 人工智能 弹性计算
|

祝福发送也疯狂:秒级响应的速度奥秘

春节祝福需秒级响应!本文详解高并发下AI祝福生成的提效方案:优选7B小模型、INT4量化提速5倍、批处理提升吞吐、vLLM推理优化、弹性云部署+CDN缓存,多管齐下实现高质量与飞速响应兼得。

104 1
|
2月前
|
安全 算法 测试技术
|

PPO / DPO 对安全边界的影响:压制还是迁移风险

本文揭示对齐训练(PPO/DPO)的深层误区:它不降低风险总量,而是迁移风险形态——压制显性违规,却强化灰区输出的稳定性与隐蔽性。风险未被消除,只是从“直白越界”变为“委婉越界”,更难检测、评估与拦截。安全不能只靠对齐,需模型、系统、策略三层协同。

117 4
|
2月前
|
安全 数据挖掘 C++
|

基于语义切分 vs 基于结构切分的实际差异

RAG系统中,切分方式并非简单预处理,而是决定系统“如何犯错”的关键设计:语义切分将理解责任前置给embedding,易致“看错”;结构切分保留原文约束,暴露“没看到”,更可控。选型应基于错误成本,而非召回指标。

104 12
|
2月前
|
数据采集 边缘计算 运维
|

算力不是越近越好:从边缘到中心,一场正在发生的再分配

算力不是越近越好:从边缘到中心,一场正在发生的再分配

119 4
|
2月前
|
SQL 机器学习/深度学习 消息中间件
|

模型服务化这件事:从 Batch 到 Stream,不只是改个部署方式那么简单

模型服务化这件事:从 Batch 到 Stream,不只是改个部署方式那么简单

105 6
|
2月前
|
人工智能 安全 C++
|

一个项目能长期活下去,靠的从来不是模型

AI项目成败关键不在模型强弱,而在于系统性生存能力:厘清责任边界、接纳不确定性、严控复杂度、建立止损机制、允许模型“不万能”、并在模型成功时保持克制。真正活久的项目,清醒、务实、敬畏现实。

214 12
|
2月前
|
存储 SQL 运维
|

数据工程实践:指标平台如何通过三级物化与智能路由破解性能与成本难题?

实现从“成本中心”到“效率引擎”的转变。

101 2
|
3月前
|
搜索推荐 C++ 索引
|

RAG 的失败,大多在“切文档”那一刻就已经注定

RAG项目常败在文档切分:切得过小导致语义断裂,固定长度破坏表格/列表/步骤等关键结构。真正决定效果的,不是模型或向量库,而是chunk是否具备“语义完整性”——能否独立支撑答案。切分应以“生成可用性”为第一标准,而非检索便利性。

130 4
|
3月前
|
机器学习/深度学习 存储 人工智能
|

量子机器学习:AI 的下一个维度,真不是玄学

量子机器学习:AI 的下一个维度,真不是玄学

183 9
|
3月前
|
SQL 机器学习/深度学习 运维
|

MLflow / Feast 实战手记:MLOps 不是装工具,是治内伤

MLflow / Feast 实战手记:MLOps 不是装工具,是治内伤

179 13
|
3月前
|
安全 物联网
|

为什么你调的不是参数,而是风险

大模型微调不是调参,而是风险管理:学习率决定偏离幅度,batch size影响偏差放大,epoch迫使模型“选边”,LoRA rank拓展失控空间。参数非“强度 knob”,实为“风险杠杆”——每次调整都在重分配行为分布。成熟微调,重在理解并可控承担风险。

141 1
|
3月前
|
人工智能 自然语言处理 机器人
|

别错过商机!智能体降临,携手智创未来商业传奇

AI智能体正推动商业范式革命:“一人公司”崛起、主动获客成常态、垂直场景成蓝海。它不止优化流程,更重构生意逻辑,降低创业门槛,释放“超级个体”潜能。(239字)

121 0
|
3月前
|
人工智能 搜索推荐 智能硬件
|

赶快体验!智能体来了,一起智创未来温馨生活

科技不止算力与参数,更该有温度。AI智能体正悄然融入生活:感知情绪、预判习惯、代管琐事,把人从重复决策中解放,腾出时间陪伴家人。它不是冰冷工具,而是懂你的“数字家人”。(239字)

102 2
|
3月前
|
安全 物联网 C++
|

什么时候不该微调:比“怎么微调”更重要的一件事

本文揭示大模型微调失败的深层原因:问题常不在“调不好”,而在“不该调”。微调仅适用于优化已有能力下的行为偏好(如表达风格、响应边界),而非弥补知识缺失、推理短板或Prompt缺陷。RAG、Prompt工程、严谨评估与风险管控,往往比盲目微调更高效、更安全。

108 4

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69318
内容
128
活动
439805
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务