|
6月前
|
消息中间件 SQL Java
|

阿里云Flink-自定义kafka sink partitioner实践及相关踩坑记录

阿里云Flink-自定义kafka sink partitioner实践及相关踩坑记录

1071 1
来自: 实时计算 Flink  版块
|
6月前
|
Linux Docker 容器
|

CentOS7离线安装Docker

CentOS7离线安装Docker

1308 0
|
6月前
|
存储 测试技术 Apache
|

阿里云实时计算企业级状态存储引擎 Gemini 技术解读

本文整理自阿里云 Flink 存储引擎团队李晋忠,兰兆千,梅源关于阿里云实时计算企业级状态存储引擎 Gemini 的研究。

125943 4
来自: 实时计算 Flink  版块
|
6月前
|
Cloud Native Apache 流计算
|

福利「Flink Forward Asia 2023 」PPT 阅读合集!

福利「Flink Forward Asia 2023 」PPT 阅读合集!

3075 1
来自: 实时计算 Flink  版块
|
11月前
|
存储 安全 算法
|

【回顾】蚂蚁链自研TEE技术全项通过国家金融科技认证中心认证

2022年3月,蚂蚁集团自研TEE技术(HyperEnclave)通过了北京国家金融科技认证中心认证

314 0
|
11月前
|
自然语言处理 测试技术 异构计算
|

使用Accelerate库在多GPU上进行LLM推理

大型语言模型(llm)已经彻底改变了自然语言处理领域。随着这些模型在规模和复杂性上的增长,推理的计算需求也显著增加。为了应对这一挑战利用多个gpu变得至关重要。

1565 0
|
11月前
|
SQL 人工智能 自然语言处理
|

【2023云栖】田奇铣:大模型驱动DataWorks数据开发治理平台智能化升级

随着大模型掀起AI技术革新浪潮,大数据也进入了与AI深度结合的创新时期。2023年云栖大会上,阿里云DataWorks产品负责人田奇铣发布了DataWorks Copilot、DataWorks AI增强分析、DataWorks湖仓融合数据管理等众多新产品能力,让DataWorks这款已经发展了14年的大数据开发治理平台产品,从一站式向智能化不断升级演进。

59263 8
|
传感器 机器人 C++
|

机器人操作系统ROS 编程开发--详细总结

最近工作涉及到自动驾驶的,需要学习ROS,学习中总结了一些知识点,分享给大家。 机器人操作系统ROS,是一种分布式处理框架(又名Nodes),ROS常用C++和python编程语言开发;(这里项目开发采用C++ 11版本)。ROS的点对点设计以及服务和节点管理器等机制,可以分散由计算机视觉和语音识别等功能带来的实时计算压力,能够适应多机器人遇到的挑战。ROS免费并且开源。

1352 0
|
数据采集 供应链 监控
|

RPA助力企业管理,十大高频场景

rpa在财务、人力资源、客服、供应链管理、市场推广、质量管理、项目管理、数据分析、合规管理和业务流程优化等场景中的应用

694 0
|
存储 人工智能 分布式计算
|

【云栖2023】张治国:MaxCompute架构升级及开放性解读

本文根据2023云栖大会演讲实录整理而成,演讲信息如下 演讲人:张治国|阿里云智能计算平台研究员、阿里云MaxCompute负责人 演讲主题:MaxCompute架构升级及开放性解读 活动:2023云栖大会

60891 16
来自: 大数据计算 MaxCompute  版块
|
机器学习/深度学习 数据采集 人工智能
|

人工智能与机器学习的前景和挑战

人工智能和机器学习的前景是令人振奋的,它们在许多领域带来了创新和变革。然而,随着前景的广阔,也伴随着一些挑战,如数据质量、隐私和伦理问题。通过持续的研究和努力,我们有望克服这些挑战,实现人工智能和机器学习的更大潜力。从自动驾驶汽车到医疗诊断,从自然语言处理到工业自动化,人工智能和机器学习将继续塑造我们的世界。

516 1
|
SQL 分布式计算 运维
|

面向未来的开源 OLAP 技术架构探讨以及选型实践

本文详细介绍了开源大数据OLAP的演化过程和最佳实践。

9566 1
|
SQL 存储 关系型数据库
|

【最佳实践】使用 Elasticsearch SQL 实现数据查询

如何使用 Elasticsearch SQL 来对我们的数据进行查询。

5504 0
|
SQL 流计算 消息中间件
|

Flink 1.9 实战:使用 SQL 读取 Kafka 并写入 MySQL

《Flink SQL 1.9.0 技术内幕和最佳实践》,许多小伙伴对演示环节的 Demo 代码非常感兴趣,迫不及待地想尝试下,所以写了这篇文章分享下这份代码。

12931 0
来自: 实时计算 Flink  版块
|
4天前
|
机器学习/深度学习 数据采集 TensorFlow
|

使用Python实现智能食品安全监测的深度学习模型

使用Python实现智能食品安全监测的深度学习模型

18 0
|
7天前
|
机器学习/深度学习 PyTorch TensorFlow
|

使用Python实现智能食品质量检测的深度学习模型

使用Python实现智能食品质量检测的深度学习模型

40 1
|
8天前
|
存储 监控 安全
|

服务器死机,数据丢失怎么办?

【10月更文挑战第27天】当服务器死机且数据丢失时,应先尝试重启服务器并检查硬件问题。随后,利用备份数据、数据恢复软件或专业服务恢复数据。为预防未来数据丢失,需定期备份数据,使用热备份和RAID技术,定期维护服务器,强化安全性,并建立监控和日志记录机制。

37 8
|
10天前
|
机器学习/深度学习 数据采集 数据可视化
|

使用Python实现深度学习模型:智能植物生长监测与优化

使用Python实现深度学习模型:智能植物生长监测与优化

42 0
|
12天前
|
存储 物联网 PyTorch
|

基于PyTorch的大语言模型微调指南:Torchtune完整教程与代码示例

**Torchtune**是由PyTorch团队开发的一个专门用于LLM微调的库。它旨在简化LLM的微调流程,提供了一系列高级API和预置的最佳实践

121 59
|
12天前
|
数据采集 Web App开发 JavaScript
|

python-selenium模块详解!!!

Selenium 是一个强大的自动化测试工具,支持 Python 调用浏览器进行网页抓取。本文介绍了 Selenium 的安装、基本使用、元素定位、高级操作等内容。主要内容包括:发送请求、加载网页、元素定位、处理 Cookie、无头浏览器设置、页面等待、窗口和 iframe 切换等。通过示例代码帮助读者快速掌握 Selenium 的核心功能。

54 5
|
21天前
|
机器学习/深度学习 自然语言处理 算法
|

RAPTOR:多模型融合+层次结构 = 检索性能提升20%,结果还更稳健

本文探讨了通过多模型集成技术提升信息检索系统性能的方法,重点介绍了RAPTOR框架。RAPTOR通过构建层次化的信息组织结构和递归摘要技术,显著提高了检索系统的性能和适应性。研究建立在RAG Fusion技术基础上,旨在提供更全面的信息检索解决方案。

66 2
|
22天前
|
人工智能 机器人
|

多模态大模型活动 | 使用 PAI×LLaMA Factory 搭建文旅问答机器人

LLaMA Factory 是一款开源低代码大模型微调框架,集成了业界最广泛使用的微调技术,支持通过 Web UI 界面零代码微调大模型,目前已经成为开源社区内最受欢迎的微调框架,GitHub 星标超过3万。本次活动通过 PAI×LLaMA Factory 微调 Qwen2-VL 模型,快速搭建文旅领域知识问答机器人,期待看到您与 AI 导游的创意对话!

62 1
来自: 人工智能平台PAI  版块
|
25天前
|
机器学习/深度学习 存储 分布式计算
|

未来趋势:探索GraphRAG在大规模异构网络环境下的挑战与机遇

【10月更文挑战第11天】随着互联网和物联网技术的快速发展,数据不仅数量庞大,而且类型多样,形成了复杂的大规模异构网络。这些网络中包含了不同类型的节点(如文本、图像、视频等)以及它们之间的多种关系。如何有效地处理这种大规模异构网络,以便进行内容理解与生成,是当前研究的一个热点问题。Graph Retrieval-Augmented Generation (GraphRAG) 框架作为一种新兴的方法,在这一领域展现出了巨大的潜力。本文将深入探讨GraphRAG的基础理论、构建方法,并分析其在未来大规模异构网络环境下的挑战与机遇。

80 3
ly~
|
28天前
|
消息中间件 存储 监控
|

如何查看 RocketMQ 消息的重试次数和时间间隔?

RocketMQ消息重试次数和时间间隔可通过查看消费者和Broker日志、使用管理控制台的监控页面和消息查询功能,或通过分析消费者代码和RocketMQ客户端库代码等方式获取。日志中常有消费失败重试的明确记录,控制台可监控消费情况推断重试状态,代码分析则适合技术用户深入了解。

115 3
|
1月前
|
监控 安全 Apache
|

构建安全的URL重定向策略:确保从Web到App平滑过渡的最佳实践

【10月更文挑战第2天】URL重定向是Web开发中常见的操作,它允许服务器根据请求的URL将用户重定向到另一个URL。然而,如果重定向过程没有得到妥善处理,可能会导致安全漏洞,如开放重定向攻击。因此,确保重定向过程的安全性至关重要。

59 0
|
1月前
|
数据采集 机器人 测试技术
|

SeleniumBase在无头模式下绕过验证码的完整指南

本文详细介绍了如何在SeleniumBase的无头模式下绕过验证码,通过使用代理IP(以爬虫代理为例)、设置User-Agent和Cookie等手段提升爬虫效率。文章首先分析了无头模式下面临的验证码挑战,然后提供了具体的策略和代码示例,包括浏览器设置、代理IP配置及模拟用户行为的方法。最后,通过一个访问大众点评网站并绕过验证码的完整代码示例,展示了如何在实际场景中应用这些技术,应对现代网站的反爬虫机制。此外,还提供了一些提高爬虫效率的实用技巧,如代理池轮换、设置合适延迟和分布式爬虫等。

122 1
|
2月前
|
机器学习/深度学习 运维 分布式计算
|

大数据技术专业就业前景

大数据技术专业就业前景广阔,广泛应用于互联网、金融、医疗等众多行业,助力企业数字化转型。岗位涵盖大数据开发、分析、运维及管理,如大数据工程师、分析师和系统运维工程师等。这些岗位因专业性和稀缺性而享有优厚薪资,尤其在一线城市可达20万至50万年薪。随着技术进步和经验积累,从业者可晋升为高级职位或投身数据咨询、创业等领域,发展空间巨大。

67 5
|
2月前
|
运维 监控 安全
|

交换机运维监控:保障网络稳定的基石

作为网络连接的核心设备之一,交换机承担着数据转发、流量控制、VLAN划分等重要任务,其稳定运行直接关系到整个网络的性能和可靠性

112 0
|
2月前
|
搜索推荐 API
|

淘宝商品数据洞察:解锁精准营销新策略

在快速变化的商业环境中,高效的营销策略对企业至关重要。通过API获取淘宝APP的商品细节数据,企业可以精准分析产品特性、强化卖点,并制定灵活的价格策略。利用用户画像实现个性化营销,选择最佳渠道并优化内容,从而提升品牌影响力。这一方法不仅帮助企业抓住目标消费者,还能增强市场竞争力,促进长期发展。

197 0
|
2月前
|
存储 人工智能 分布式计算
|

云栖实录 | 阿里云 OpenLake 解决方案重磅发布:多模态数据统一纳管、引擎平权联合计算、数据共享统一读写

阿里云 OpenLake 解决方案重磅发布,构建大数据、搜索、AI 一体化的能力体系,实现多模态数据统一纳管、多种计算引擎平权计算、大数据 AI 一体化开发,助力企业基于数据资产构筑竞争力。

251 10
|
2月前
|
人工智能 算法 NoSQL
|

GraphRAG 与 RAG 的比较分析

Graph RAG 技术通过引入图结构化的知识表示和处理方法,显著增强了传统 RAG 系统的能力。它不仅提高了信息检索的准确性和完整性,还为复杂查询和多步推理提供了更强大的支持。

233 10
|
2月前
|
机器学习/深度学习 数据采集 算法
|

利用未标记数据的半监督学习在模型训练中的效果评估

本文将介绍三种适用于不同类型数据和任务的半监督学习方法。我们还将在一个实际数据集上评估这些方法的性能,并与仅使用标记数据的基准进行比较。

187 8
|
2月前
|
机器学习/深度学习 数据采集 TensorFlow
|

使用Python实现深度学习模型:智能心理健康评估

使用Python实现深度学习模型:智能心理健康评估

156 2
|
2月前
|
机器学习/深度学习 数据采集 算法
|

时间序列结构变化分析:Python实现时间序列变化点检测

在时间序列分析和预测中,准确检测结构变化至关重要。新出现的分布模式往往会导致历史数据失去代表性,进而影响基于这些数据训练的模型的有效性。

157 1
|
2月前
|
SQL 存储 NoSQL
|

阿里云 EMR StarRocks 在七猫的应用和实践

本文整理自七猫资深大数据架构师蒋乾老师在 《阿里云 x StarRocks:极速湖仓第二季—上海站》的分享。

237 2
|
2月前
|
JSON 监控 Java
|

Elasticsearch 入门:搭建高性能搜索集群

【9月更文第2天】Elasticsearch 是一个分布式的、RESTful 风格的搜索和分析引擎,基于 Apache Lucene 构建。它能够处理大量的数据,提供快速的搜索响应。本教程将指导你如何从零开始搭建一个基本的 Elasticsearch 集群,并演示如何进行简单的索引和查询操作。

193 3
|
3月前
|
分布式计算 DataWorks 关系型数据库
|

MaxCompute 生态系统中的数据集成工具

【8月更文第31天】在大数据时代,数据集成对于构建高效的数据处理流水线至关重要。阿里云的 MaxCompute 是一个用于处理大规模数据集的服务平台,它提供了强大的计算能力和丰富的生态系统工具来帮助用户管理和处理数据。本文将详细介绍如何使用 DataWorks 这样的工具将 MaxCompute 整合到整个数据处理流程中,以便更有效地管理数据生命周期。

116 0
|
3月前
|
存储 分布式计算 Hadoop
|

ChunkServer 原理与架构详解

【8月更文第30天】在分布式文件系统中,ChunkServer 是一个重要的组件,负责存储文件系统中的数据块(chunks)。ChunkServer 的设计和实现对于确保数据的高可用性、一致性和持久性至关重要。本文将深入探讨 ChunkServer 的核心原理和内部架构设计,并通过代码示例来说明其实现细节。

107 1
|
3月前
|
安全 Ubuntu 应用服务中间件
|

Web服务器安全最佳实践

【8月更文第28天】随着互联网的发展,Web服务器成为了企业和组织的重要组成部分。然而,这也使得它们成为黑客和恶意软件的目标。为了确保数据的安全性和系统的稳定性,采取适当的安全措施至关重要。本文将探讨一系列保护Web服务器的最佳策略和技术,并提供一些实用的代码示例。

256 1
|
3月前
|
机器学习/深度学习 数据采集 数据可视化
|

使用Python实现深度学习模型:智能垃圾分类与回收系统

【8月更文挑战第20天】 使用Python实现深度学习模型:智能垃圾分类与回收系统

104 1
|
3月前
|
自然语言处理 监控 机器人
|

自然语言处理中的语义理解和生成技术

【8月更文第18天】自然语言处理(NLP)是计算机科学的一个重要分支,其目标是使计算机能够理解、解析和生成人类语言。近年来,基于Transformer架构的预训练模型(如BERT、GPT系列)已经极大地推动了NLP的发展。本文将探讨这些模型在对话系统、文本生成、情感分析等领域的应用,并讨论相关技术挑战。

144 1
|
3月前
|
机器学习/深度学习 传感器 自动驾驶
|

使用Python实现深度学习模型:智能车联网与自动驾驶

【8月更文挑战第14天】 使用Python实现深度学习模型:智能车联网与自动驾驶

238 10
|
3月前
|
机器学习/深度学习 数据采集 人工智能
|

数据工作中的自动化与AI融合实践

【8月更文第13天】随着大数据和人工智能(AI)技术的发展,数据处理和分析变得越来越重要。本文将探讨如何通过自动化工具和AI技术来优化数据处理流程,包括数据清洗、特征工程、模型训练以及结果可视化等步骤。我们将使用Python编程语言及其相关库(如Pandas、Scikit-learn和TensorFlow)作为实现手段。

242 0
|
3月前
|
存储 机器学习/深度学习 自然语言处理
|

LangChain与向量数据库:高效的信息检索方案

【8月更文第4天】随着自然语言处理技术的发展,特别是深度学习的进步,我们能够更加高效地处理大量的文本数据。LangChain 作为一种强大的工具链,旨在简化和加速构建复杂的自然语言处理应用程序。结合向量数据库,LangChain 可以实现高效且精准的信息检索功能。本文将探讨这一组合的工作原理,并通过一个具体的实现案例来展示其在实际应用中的效果。

426 2
|
4月前
|
监控 安全 算法
|

云上智能风控:构建金融安全的智能防线

云上智能风控系统具有良好的灵活性和可扩展性。随着金融市场的不断变化和技术的不断发展,系统能够灵活调整风控策略和算法模型以适应新的风险类型和场景。同时,系统还能够根据业务需求进行功能扩展和升级以满足不同金融机构的个性化需求。

265 7
|
4月前
|
监控 供应链 定位技术
|

ERP系统中的销售订单处理与订单跟踪

【7月更文挑战第25天】 ERP系统中的销售订单处理与订单跟踪

257 0
|
4月前
|
监控 数据挖掘 数据安全/隐私保护
|

ERP系统中的固定资产管理

【7月更文挑战第25天】 ERP系统中的固定资产管理

229 3
|
4月前
|
供应链 监控 算法
|

ERP系统中的库存优化与成本控制解析

【7月更文挑战第25天】 ERP系统中的库存优化与成本控制解析

297 2
|
4月前
|
搜索推荐
|

想要刻录蓝光光盘吗? 快来了解最好的蓝光刻录软件!

在数字娱乐蓬勃发展的今天,追求高清震撼的视听体验已成为趋势。面对众多高清视频制作工具的选择难题,DVDFab Blu-ray Creator脱颖而出,被誉为最佳蓝光刻录软件。它不仅支持多种视频格式输入(如MP4, MKV)及高清1080p输出,还能制作个性化菜单,兼容不同输出介质(BD-R, BD-RE等)。只需几步即可完成从视频导入到成品输出的全过程,无论是家庭回忆还是专业项目都能完美呈现。

337 0
|
4月前
|
监控 算法 自动驾驶
|

目标检测算法:从理论到实践的深度探索

【7月更文第18天】目标检测,作为计算机视觉领域的核心任务之一,旨在识别图像或视频中特定对象的位置及其类别。这一技术在自动驾驶、视频监控、医疗影像分析等多个领域发挥着至关重要的作用。本文将深入浅出地介绍目标检测的基本概念、主流算法,并通过一个实际的代码示例,带您领略YOLOv5这一高效目标检测模型的魅力。

552 11

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
64618
内容
110
活动
438177
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务