|
人工智能 自然语言处理 小程序
|

让小程序拥有“视觉之眼“:DeepSeek图像识别实战指南

本文介绍如何通过DeepSeek计算机视觉技术,赋予小程序“看懂世界”的能力。从构建视觉感知系统、训练专属视觉词典到创造会思考的界面,详细讲解了实现智能相册、植物识别器和老旧照片修复等功能的步骤。最后探讨性能优化与安全合规要点,展望未来视觉智能应用的无限可能。

2262 2
|
小程序 测试技术 数据安全/隐私保护
|

微信公众号接口测试实战指南

微信公众号接口测试是确保系统稳定性和功能完整性的重要环节。本文详细介绍了测试全流程,包括准备、工具选择(如Postman、JMeter)、用例设计与执行,以及常见问题的解决方法。通过全面测试,可以提前发现潜在问题,优化用户体验,确保公众号上线后稳定运行。内容涵盖基础接口、高级接口、微信支付和数据统计接口的测试,强调了功能验证、性能优化、安全保护及用户体验的重要性。未来,随着微信生态的发展,接口测试将面临更多挑战和机遇,如小程序融合、AI应用和国际化拓展。

1356 0
|
存储 机器学习/深度学习 PyTorch
|

PyTorch Profiler 性能优化示例:定位 TorchMetrics 收集瓶颈,提高 GPU 利用率

本文探讨了机器学习项目中指标收集对训练性能的影响,特别是如何通过简单实现引入不必要的CPU-GPU同步事件,导致训练时间增加约10%。使用TorchMetrics库和PyTorch Profiler工具,文章详细分析了性能瓶颈的根源,并提出了多项优化措施

686 1
|
分布式计算 大数据 数据挖掘
|

大数据的第一步:初学者指南

大数据的第一步:初学者指南

413 70
|
监控 数据挖掘 API
|

京东商品历史价格 API 接口系列(京东 API)

本文介绍了如何使用京东开放平台API获取商品价格信息。首先,需注册账号并创建应用以获取App Key和App Secret,进而获取Access Token。准备好开发工具后,通过调用`jd.item_search`和`jd.item_get`接口,可以分别按关键字搜索商品和获取指定商品的详细信息及价格。示例代码展示了如何使用Python的requests库进行API请求。应用场景包括价格监控、商家定价策略、电商平台数据分析及商业智能决策支持。

1154 10
|
JSON 数据挖掘 API
|

京东店铺所有商品 API 接口系列(京东 API)

京东店铺所有商品API接口用于获取指定店铺的全面商品信息,包括基本属性、价格、库存、销售数据等。前期需仔细研读接口文档,掌握请求地址、参数格式及频率限制。接口支持分页和筛选参数,返回JSON格式数据。Python示例中使用`requests`库发送HTTP请求并处理返回数据。该API适用于竞品分析、商品管理工具开发、市场调研及价格监测等场景,助力电商从业者优化运营策略。

596 4
|
前端开发 JavaScript 开发者
|

HMR 插件的优点和缺点

【10月更文挑战第23天】HMR 插件的优点远远超过其缺点。它为前端开发带来了巨大的便利和效率提升,使开发者能够更加专注于代码的编写和优化。然而,在使用过程中也需要注意可能出现的问题,并根据实际情况进行适当的调整和优化。

427 7
|
机器学习/深度学习 自然语言处理 数据建模
|

三种Transformer模型中的注意力机制介绍及Pytorch实现:从自注意力到因果自注意力

本文深入探讨了Transformer模型中的三种关键注意力机制:自注意力、交叉注意力和因果自注意力,这些机制是GPT-4、Llama等大型语言模型的核心。文章不仅讲解了理论概念,还通过Python和PyTorch从零开始实现这些机制,帮助读者深入理解其内部工作原理。自注意力机制通过整合上下文信息增强了输入嵌入,多头注意力则通过多个并行的注意力头捕捉不同类型的依赖关系。交叉注意力则允许模型在两个不同输入序列间传递信息,适用于机器翻译和图像描述等任务。因果自注意力确保模型在生成文本时仅考虑先前的上下文,适用于解码器风格的模型。通过本文的详细解析和代码实现,读者可以全面掌握这些机制的应用潜力。

1258 3
|
数据采集 存储 JavaScript
|

Puppeteer的高级用法:如何在Node.js中实现复杂的Web Scraping

在现代Web开发中,数据采集尤为重要,尤其在财经领域。本文以“东财股吧”为例,介绍如何使用Puppeteer结合代理IP技术进行高效的数据抓取。Puppeteer是一个强大的Node.js库,支持无头浏览器操作,适用于复杂的数据采集任务。通过设置代理IP、User-Agent及Cookies,可显著提升抓取成功率与效率,并以示例代码展示具体实现过程,为数据分析提供有力支持。

650 2
|
机器学习/深度学习 算法 大数据
|

【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析

2024“华为杯”数学建模竞赛,对ABCDEF每个题进行详细的分析,涵盖风电场功率优化、WLAN网络吞吐量、磁性元件损耗建模、地理环境问题、高速公路应急车道启用和X射线脉冲星建模等多领域问题,解析了问题类型、专业和技能的需要。

5468 22
|
存储 缓存 PyTorch
|

使用PyTorch从零构建Llama 3

本文将详细指导如何从零开始构建完整的Llama 3模型架构,并在自定义数据集上执行训练和推理。

565 1
|
机器学习/深度学习 存储 人工智能
|

压缩大型语言模型(LLMs):缩小10倍、性能保持不变

尽管大规模语言模型(LLMs)在多种应用场景中表现出色,但其庞大的规模也带来了实际部署难题。本文探讨了通过模型压缩技术解决这些问题的方法,介绍了量化、剪枝和知识蒸馏三种主要压缩技术,并通过具体Python代码示例展示了如何将一个100M参数的文本分类模型压缩至52.8M参数,再通过4位量化进一步减小至原来的1/7,同时保持甚至提升性能。示例代码展示了从数据预处理、模型训练到评估的完整流程,证明了压缩技术的有效性。

966 6
|
XML 存储 API
|

RAG效果优化:高质量文档解析详解

本文介绍了如何通过高质量的文档解析提升RAG系统整体的效果。

17157 15
来自: 智能搜索推荐  版块
|
编解码 数据可视化 定位技术
|

60行代码就可以训练/微调 Segment Anything 2 (SAM 2)

本文演示了如何在仅60行代码内(不包括标注和导入)对SAM2进行微调。

1513 1
|
并行计算 算法 Python
|

Dantzig-Wolfe分解算法解释与Python代码示例

Dantzig-Wolfe分解算法解释与Python代码示例

1369 2
来自: 人工智能平台PAI  版块
|
数据采集 机器学习/深度学习 算法
|

Python实现LightGBM分类模型(LGBMClassifier算法)项目实战

Python实现LightGBM分类模型(LGBMClassifier算法)项目实战

1399 1
来自: 人工智能平台PAI  版块
|
人工智能 安全 物联网
|

2024年6月后2周重要的大语言模型论文总结:LLM进展、微调、推理和对齐

本文总结了2024年6月后两周发表的一些最重要的大语言模型论文。这些论文涵盖了塑造下一代语言模型的各种主题,从模型优化和缩放到推理、基准测试和增强性能。

739 0
|
存储 运维 关系型数据库
|

探索 Apache Paimon 在阿里智能引擎的应用场景

本文整理自Apache Yarn && Flink Contributor,阿里巴巴智能引擎事业部技术专家王伟骏(鸿历)老师在 5月16日 Streaming Lakehouse Meetup · Online 上的分享。

26411 34
来自: 实时计算 Flink  版块
|
人工智能 弹性计算 运维
|

操作系统智能助手OS Copilot 产品体验评测

**OS Copilot 体验摘要** - AI爱好者评价其部署简单,一键快捷,无使用障碍,适合作为智能助手。 - 初次使用者表示聊天功能最吸引人,但无法立即评出对工作帮助的程度。 - 愿意推荐给他人,且有参与开源开发及模型训练的兴趣。 **功能反馈** - 用户尝试了全部功能,特别喜欢聊天交互。 - 与通义千问等多款产品对比,OS Copilot的速度较快。 - 希望增加功能:集成云端Notebook,自动代码生成和错误修正,支持所有操作系统。 - 潜在应用:与阿里云服务如魔搭、ECS结合,打造智能开发和工作流程。

378 1
|
文字识别 异构计算 Python
|

关于云端Jupyter Notebook的使用过程与感想

在自学Python时,由于家庭电脑使用冲突和设备老旧,转向云端平台。体验了多个服务:1. 魔搭modelscope(最喜欢,赠送资源丰富,社区活跃),2. Colaboratory(免费GPU,但有时重启,建议用阿里云),3. Deepnote(免费环境有限,但GPT-4代码生成功能强大),4. 飞桨aistudio(适合PaddlePaddle用户),5. ModelArts(曾有免费实例,现难找)。综合来看,阿里云的稳定性与服务更优,尤其是魔搭的自动代码修正功能。对于AIGC,推荐魔搭和付费版PAI-DSW。欢迎分享更多云端Jupyter平台体验。

993 1
|
算法 物联网 数据库
|

阿里云 OpenSearch RAG 应用实践

本文介绍了阿里云OpenSearch在过去一年中在RAG方面的应用和探索。

28928 4
来自: 智能搜索推荐  版块
|
机器学习/深度学习 自然语言处理 搜索推荐
|

探索文本向量化的新高峰:合合信息acge_text_embedding 模型原创

文本向量化方法包括词袋模型、TF-IDF、词嵌入和预训练模型(如BERT、GPT)。词嵌入如Word2Vec、GloVe和FastText捕捉单词语义,预训练模型则保留上下文信息。C-MTEB是中文文本嵌入评估平台,测试模型在检索、相似性、分类等任务的性能。合合信息的acge_text_embedding模型在C-MTEB中表现优秀,适用于情感分析、文本生成等任务,具有高分类聚类准确性、资源效率和场景适应性。技术突破涉及数据集优化、模型训练策略和持续学习,提供Demo展示如何使用acge模型计算句子相似度。acge_text_embedding是提升文本处理效率和智能化的有力工具。

1905 2
|
分布式计算 DataWorks 关系型数据库
|

DataWorks操作报错合集之在 DataWorks 中使用了归并节点,并且归并节点的逻辑不成立,如何解决

DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。

302 2
|
Go
|

Golang深入浅出之-Go语言函数基础:定义、调用与多返回值

【4月更文挑战第21天】Go语言函数是代码组织的基本单元,用于封装可重用逻辑。本文介绍了函数定义(包括基本形式、命名、参数列表和多返回值)、调用以及匿名函数与闭包。在函数定义时,注意参数命名和注释,避免参数顺序混淆。在调用时,要检查并处理多返回值中的错误。理解闭包原理,小心处理外部变量引用,以提升代码质量和可维护性。通过实践和示例,能更好地掌握Go语言函数。

526 1
|
存储 分布式计算 Hadoop
|

ClickHouse(01)什么是ClickHouse,ClickHouse适用于什么场景

ClickHouse是一款高性能的列式存储OLAP数据库,由俄罗斯的Yandex公司开发,用于在线分析处理(OLAP)。它提供秒级大数据查询,适用于商业智能、广告流量等领域。ClickHouse速度快的原因包括列式存储、数据压缩、向量化执行和多线程分布式处理。然而,它不支持事务,不适合OLTP操作。相比Hadoop生态中的查询引擎,ClickHouse在大量数据查询上表现出色。一系列的文章详细介绍了ClickHouse的各个方面,包括安装、表引擎和使用场景。

2705 2
|
数据处理 数据库 流计算
|

FlinkCDC的性能如何

FlinkCDC的性能如何

481 1
|
SQL JSON 分布式计算
|

DataWorks产品使用合集之DataWorks一键maxcompute数据同步的操作步骤是什么

DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。

857 1
|
SQL Oracle 关系型数据库
|

SQL 的 with as 临时中间表

SQL 的 with as 临时中间表

596 1
|
存储 前端开发 机器人
|

通过4个任务比较LangChain和LlamaIndex

我们在本地使用大模型的时候,尤其是构建RAG应用的时候,一般会有2个成熟的框架可以使用

3318 2
|
Linux 网络虚拟化
|

Debian系统安装OpenVPN

Debian系统安装OpenVPN

2398 0
|
缓存 算法 NoSQL
|

【分布式详解】一致性算法、全局唯一ID、分布式锁、分布式事务、 分布式缓存、分布式任务、分布式会话

分布式系统通过副本控制协议,使得从系统外部读取系统内部各个副本的数据在一定的约束条件下相同,称之为副本一致性(consistency)。副本一致性是针对分布式系统而言的,不是针对某一个副本而言。强一致性(strong consistency):任何时刻任何用户或节点都可以读到最近一次成功更新的副本数据。强一致性是程度最高的一致性要求,也是实践中最难以实现的一致性。单调一致性(monotonic consistency):任何时刻,任何用户一旦读到某个数据在某次更新后的值,这个用户不会再读到比这个值更旧的值。

1701 0
|
机器学习/深度学习 算法 数据挖掘
|

【MATLAB 】RBF径向基神经网络回归预测

【MATLAB 】RBF径向基神经网络回归预测

755 0
|
Web App开发 Linux 开发工具
|

Centos7 yum 安装chrome

Centos7 yum 安装chrome配置yum源vim /etc/yum.repos.d/google-chrome.repo写入以下内容[google-chrome]name=google-chromebaseurl=http://dl.google.com/linux/chrome/rpm/stable/$basearchenabled=1gpgcheck=1gpgkey=http...

1267 0
|
XML JSON 编解码
|

Thrift 介绍

Thrift 介绍

599 0
|
机器学习/深度学习 人工智能 自然语言处理
|

人工智能生成内容(AIGC):一种新兴的内容创造方式

在数字经济的挑战面前,人工智能生成内容(Artificial Intelligence Generated Content,AIGC)应运而生。AIGC是一种新型的内容创造方式,通过使用人工智能(AI)技术,根据用户输入的关键词或需求生成内容。大型模型算法的发展极大地增强了AIGC的能力,使AIGC产品成为一种有前景的生成工具,并为我们的生活带来了便利。作为上游技术,AIGC具有无限的潜力来支持不同的下游应用。分析AIGC的当前能力和短板,理解如何在未来的应用中最好地利用它,这是非常重要的

841 0
|
安全 5G 定位技术
|

IM开发者的零基础通信技术入门(十二):上网卡顿?网络掉线?一文即懂!

本文将详细介绍生活中遇到的常见网络问题,及可能的解决方法,虽说是一篇技术文章,但内容将一如既往地通俗易懂,简单实用。

561 0
|
存储 SQL 缓存
|

使用实践:Hologres对接MaxCompute常见问题排查

本文总结了Hologres对接MaxCompute时的常见问题与处理方法。

4146 3
来自: 实时数仓 Hologres  版块
|
SQL 运维 DataWorks
|

DataWorks数据服务介绍及最佳实践 | 《一站式大数据开发治理DataWorks使用宝典》

DataWorks作为一站式大数据开发治理平台,构建了从数据集成、数据开发、数据服务到应用开发的全链路解决方案。在整个大数据链路中,数据服务将数仓、数据库和数据应用进行串联,形成了一座数据与应用之间的桥梁。数据服务通过将数据封装成数据API的方式,可以为个人、团队及企业提供全面的数据开放及共享能力。借助这个平台,用户能够统一管理面向内外部的API服务。数据服务提供了向下对接数据源、向上支撑业务应用的有效连接。

4209 1
|
存储 SQL 关系型数据库
|

实时数仓入门训练营:Hologres性能调优实践

《实时数仓入门训练营》由阿里云研究员王峰、阿里云高级产品专家刘一鸣等实时计算Flink版和 Hologres 的多名技术/产品一线专家齐上阵,合力搭建此次训练营的课程体系,精心打磨课程内容,直击当下同学们所遇到的痛点问题。由浅入深全方位解析实时数仓的架构、场景、以及实操应用,7 门精品课程帮助你 5 天时间从小白成长为大牛!

2975 0
来自: 实时计算 Flink  版块
|
存储 SQL 缓存
|

Hologres揭秘:深度解析高效率分布式查询引擎

从阿里集团诞生到云上商业化,随着业务的发展和技术的演进,Hologres也在持续不断优化核心技术竞争力,为了让大家更加了解Hologres,我们计划持续推出Hologers底层技术原理揭秘系列,从高性能存储引擎到高效率查询引擎,高吞吐写入到高QPS查询等,全方位解读Hologers,请大家持续关注!

13362 4
来自: 实时数仓 Hologres  版块
|
人工智能 自然语言处理 算法
|

电商行业智能搜索技术原理全解析

对于电商平台来说,智能搜索功能是至关重要的。本文剖析电商行业的搜索专属特点和业务需求,并介绍开放搜索提供的【电商行业模板】智能搜索能力,希望带给企业更多提升业务转化的思路和解决方案~

6351 1
来自: 智能搜索推荐  版块
|
SQL 机器学习/深度学习 消息中间件
|

十大行业经典案例!Apache Flink 的 40 个最佳实践

如今,Apache Flink 行业应用几何?在降本增效的需求驱动下,企业如何实现数据与算力价值最大化?本文整理了 Flink 社区近一年的社区案例,并按照行业进行分类,供大家参考!

18321 1
来自: 实时计算 Flink  版块
|
存储 SQL 缓存
|

详解 Flink 实时应用的确定性

最近几年随着 Google The Dataflow Model 的提出,实时计算和离线计算的关系逐渐清晰,在实时计算中提供与离线计算一致的确定性成为可能。本文将基于流行实时计算引擎 Apache Flink,梳理构建一个确定性的实时应用要满足什么条件。

1661 0
来自: 实时计算 Flink  版块
|
SQL 分布式计算 数据管理
|

Delta Lake 平台化实践(离线篇)

本文是在 Delta Lake 0.4 与 Spark 2.4 集成、平台化过程中的一些实践与思考

1858 0
|
18天前
|
监控 算法 数据可视化
|

别再瞎调学习率了:一套用 Python 搞定“自动调参 + 训练监控”的实战方案

别再瞎调学习率了:一套用 Python 搞定“自动调参 + 训练监控”的实战方案

150 4
|
18天前
|
Java 容器 JavaScript
|

从"代码跑不通"到"答辩演示丝滑流畅":毕设部署避坑完全指南

毕设答辩“最后一公里”常因部署失败翻车!本文提供本地一键、云服务器、Docker三种部署方案,重点推荐智码方舟AI生成器——10分钟获取配置完备的部署文档+脚本,规避90%环境问题,助你稳过答辩。

133 2
|
21天前
|
人工智能 缓存 安全
|

OpenClaw:当 AI 开始 “做事”,我们该如何选择

OpenClaw是开源、本地优先的AI任务执行引擎,可听懂指令并自动完成文件处理、API调用等实操任务。支持本地/云端/混合部署,适配多类模型与交互入口(WebUI/CLI/IM),严守隐私与安全底线,兼顾可控性、成本与效率。(239字)

212 2
|
23天前
|
人工智能 安全 程序员
|

50%的人给了差评:龙虾为何在技术论坛翻车了?

OpenClaw(龙虾)AI工具因“自动赚钱”“代约主播”等夸张宣传走红,但吾爱破解论坛投票显示:50%技术用户未下载且不认可其能力。技术圈冷静源于见惯“神器”泡沫——AI擅写代码(搬砖),却难懂需求、统筹系统。它不是神药,而是待磨的砍柴刀。

204 3
|
1月前
|
消息中间件 监控 算法
|

别只盯着离线指标了:用大数据把模型“在线状态”盯死

别只盯着离线指标了:用大数据把模型“在线状态”盯死

143 2
|
2月前
|
安全 网络协议 网络安全
|

Socks5代理隐私保护攻略:高效、安全,一步到位

在数字时代,Socks5代理成隐私防护利器:作为会话层中介,隐藏真实IP、兼容TCP/UDP、不篡改数据,并支持认证。高效使用需选优质节点、合理配置协议、搭配加密工具防DNS泄漏,合规使用方能构筑“隐形防护盾”。

279 1

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69319
内容
128
活动
439805
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务