数据处理的搜索结果_热门_第3页-阿里云开发者社区

xuzhengjun

|

博文

SAP HANA以大规模并行内存计算范式为基础，极大地提高了信息处理速度。SAP HANA架构利用单一列式内存数据存储数据中的的单份数据，执行联机事务处理(OLTP)和联机分析处理 (OLAP)。简言之，SAP HANA能够消除数据冗余，磁盘延迟，以及应用与分析工昊之间的数据移动。

# 数据集成 Data Integration # 存储 # 算法 # 大数据 # 数据处理 # 数据库

闲鱼技术

|

博文

UI2CODE系列文章|如何批量制造高质量样本

作者：闲鱼技术-楚丰在 UI2CODE 项目中，我们大量使用了深度学习方法来做一些物体检测。而深度学习模型的训练，避免不了需要大量的样本，因此如何制造大量样本，来满足模型训练需要是我们必须要解决的一个问题。

# 移动开发 # 前端开发 # weex # 数据处理 # iOS开发 # JavaScript # Web App开发 # 数据采集 # 机器学习/深度学习 # Android开发

傲海

|

博文

|

来自：大数据与机器学习

【玩转数据系列七】有娃的注意了，机器学习教您如何提高孩子学习成绩

母亲是老师反而会对孩子的学习成绩造成不利影响？能上网的家庭，孩子通常能取得较好的成绩？影响孩子成绩的最大因素居然是母亲的学历？本文通过机器挖掘算法和中学真实的学生数据为您揭秘影响中学生学业的关键因素有哪些。

# 人工智能平台 PAI # 机器学习/深度学习 # 数据采集 # 算法 # API # 搜索推荐 # 数据处理 # 测试技术 # SQL

闲鱼技术

|

博文

Pick！闲鱼亿级商品库中的秒级实时选品

作者：闲鱼技术-剑辛一、业务背景在电商运营工作中，营销活动是非常重要的部分，对用户增长和GMV都有很大帮助。对电商运营来说，如何从庞大的商品库中筛选出卖家优质商品并推送给有需要的买家购买是每时每刻都要思索的问题，而且这个过程需要尽可能快和实时。

# 云原生数据库 PolarDB # 实时计算 Flink版 # 云解析DNS # SQL # Java # 数据处理 # 流计算 # 关系型数据库 # PostgreSQL # 数据中心 # 算法 # druid # 监控

亦征

|

博文

|

来自：云存储

基于云上分布式NoSQL的海量气象数据存储和查询方案

气象数据是一类典型的大数据，具有数据量大、时效性高、数据种类丰富等特点，每天产生的数据量常在几十TB到上百TB的规模，且在爆发性增长。如何存储和高效的查询这些气象数据越来越成为一个难题，本文针对气象领域中海量模式数据的存储和查询问题，分别介绍了传统方案和采用表格存储(TableStore)的方案，并对方案优缺点进行了一些总结。

# 表格存储 # 云原生大数据计算服务 MaxCompute # 存储 # NoSQL # 大数据 # 关系型数据库 # 云计算 # 数据处理 # 传感器 # 数据库

阿里云实时计算Flink

|

博文

|

来自：大数据与机器学习

Flink Checkpoint 问题排查实用指南

本文会统一聊一聊 Flink 中 Checkpoint 异常的情况（包括失败和慢），以及可能的原因和排查思路。

# 实时计算 Flink版 # 日志服务 # 流计算 # Apache # 存储 # 调度 # 容器 # Java # 机器学习/深度学习 # 数据处理 # 大数据

【云行】

|

博文

图解故障服务器下线：关于阿里云MongoDB高可用的探秘

服务器容灾一直是云服务运维过程中无法避开的问题。MongoDB采用的是什么方法，得以做到在有机器故障的情况下依旧能保证用户业务的高可用？最近举行的“MongoDB Sharding杭州用户交流会”中，针对这一问题，阿里云资深研发工程师果实分享了关于MongoDB 故障服务器如何下线方面的详尽的技术解密。

# 云数据库 MongoDB 版 # 资源管理 # 运维 # 监控 # NoSQL # 容灾 # 数据处理

【方向】

|

博文

Python数据预处理：使用Dask和Numba并行化加速

本文是针对Python设计一种并行处理数据的解决方案——使用Dask和Numba并行化加速运算速度。案例对比分析了几种不同方法的运算速度，非常直观，可供参考。

# 数据采集 # 大数据 # Python # 数据处理 # 程序员 # 机器学习/深度学习 # 分布式计算 # Spark # 网络协议 # C++

技术小能手

|

博文

知识图谱数据构建的“硬骨头”，阿里工程师如何拿下？

背景简介为了不断提升搜索体验，神马搜索的知识图谱与应用团队，一直在不断探索和完善图谱的构建技术。其中，开放信息抽取（Open Information Extraction），或称通用信息抽取，旨在从大规模无结构的自然语言文本中抽取结构化信息。

# 自然语言处理 # 机器学习/深度学习 # 自然语言处理 # 算法 # 数据处理 # 知识图谱

金竹

|

博文

Apache Flink 漫谈系列(02) - 概述

Apache Flink 的命脉 "命脉" 即生命与血脉，常喻极为重要的事物。系列的首篇，首篇的首段不聊Apache Flink的历史，不聊Apache Flink的架构，不聊Apache Flink的功能特性，我们用一句话聊聊什么是 Apache Flink 的命脉？我的答案是：Apache Flink 是以"批是流的特例"的认知进行系统设计的。

# 实时计算 Flink版 # 云消息队列 Kafka 版 # SQL # 数据处理 # API # Apache # 流计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

数据处理