赵慧@ApacheFlink中文社区_个人页

个人头像照片 赵慧@ApacheFlink中文社区
个人头像照片
16
350
0

个人介绍

暂无个人介绍

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

阿里云技能认证

详细说明
  • 提交了问题 2018-10-30

    请问flink 能像spark那样直接对hive表进行查询和计算吗?

  • 提交了问题 2018-10-30

    flink 有可以和mongodb集成的相关插件吗

  • 提交了问题 2018-10-24

    这种报错有人知道怎么回事么

  • 提交了问题 2018-10-24

    请教个问题 为什么flink1.5 可以通过readCsvFile读取hdfs数据 却用result.writeAsCsv写hdfs不成功呢 谢谢!

  • 提交了问题 2018-10-24

    请问下各位大佬,在Flink里面频繁出现Checkpoint expired before completing的错误,状态本身并不大,看了一下Checkpoint确认的进度56/64 (88%),还有几个不知道什么原因迟迟收不到Acknowledge。请问下出现这种现象是什么原因?

  • 提交了问题 2018-10-24

    请问下各位大佬,在flink官网上讲解join的一章里,有这样一张图,在这张图中不太理解的是,为什么0,1 和1,0 也会作为join的结果输出呢?

  • 提交了问题 2018-10-24

    请问大家遇到过这个错误吗:Checkpoint expired before completing

  • 提交了问题 2018-10-18

    对于Tracking URL转到Flink Web UI我设置了以下3个参数: yarn.application-master.port yarn.appmaster.rpc.address yarn.appmaster.rpc.port yarn session启动后,还是转不到Flink Web UI?这是什么原因?还是有其它的参数呢

  • 提交了问题 2018-10-18

    大家好,业务场景是这样的,从kafka拉来的数据需要对原始日志进行备份,使用 BucketingSink bk=new BucketingSink("hdfs-path");写入HDFS,不同的文件写入不同的目录,有性能问题吗,每个新到的文件就新new一个BucketingSink,

  • 提交了问题 2018-10-18

    请问Flink程序中使用redis,有朋友用过吗?现在我们使用的是原始的Jedis,感觉性能不是特别好,请问有没有更好的解决方案?

  • 提交了问题 2018-10-18

    如果我使用run直接提交任务到yarn的方式,HA的效果还有用吗?

  • 提交了问题 2018-10-18

    求助:sink to mysql应该怎么写? 继承了RichSinkFunction ,数据库连接信息放在open,还是invoke

  • 提交了问题 2018-10-18

    flink配置文件有更改存储方式的地方么

  • 提交了问题 2018-10-18

    github现有的源码,能以hadoop3. 0编译吗?还是需要把hadoop3.0集成进去?

  • 提交了问题 2018-10-18

    各路大神们,有没有玩过好用sql解析java工具类或封装类,能把复杂的SQL语句逻辑中的所要操作的表的表名给解析出来放到set集合中???

  • 提交了问题 2018-10-18

    flink1.4.2 使用kafka08jsontablesource,我们测试,kafka里没有数据的情况下,程序运行一段时间就会报这个exception

  • 提交了问题 2018-10-18

    如果在exactly-once 的checkpoint模式下,处理数据出现异常该怎么处理因为重启会一直在那个点重跑 岂不是一直fail

  • 提交了问题 2018-10-18

    如果在exactly-once 的checkpoint模式下,处理数据出现异常该怎么处理

  • 提交了问题 2018-10-18

    请教个问题,tableEnvironment.registerDataStream(table)为什么和tableEnvironment.registerTable(table)一样也能接受一个table参数?

  • 提交了问题 2018-10-18

    flink sink 如何做到数据准确性?

  • 提交了问题 2018-10-18

    我可以把retraction流 (例如SELECT DISTINCT ...的结果),用regiterDataStream()注册为表吗?我试了报以上错误。

  • 提交了问题 2018-10-18

    请教下,Flink里面把流注册为表: tableEnv.registerDataStream("mytable", mystream ....) 这里的流 mystream 貌似必须是append only流,不能是retraction流。这是为什么?如果是retraction流,报错Table is not an append-only table. Use the toRetractStream() in order to handle add and retract messages.

  • 提交了问题 2018-10-18

    各位前辈,晚辈有个问题,为什么流式处理框架都是 java 写成的,JVM 是不是在流和批存在着特殊优势。还有分布式资源调度,感觉Mesos 的成长速度跟不上 Yarn。这是为什么?

  • 提交了问题 2018-10-18

    请问一下给大侠,我这里怎样配置能外网访问的静态IP?

  • 提交了问题 2018-10-18

    对比flink和spark 代码提交记录,spark 算是非常频繁?

  • 提交了问题 2018-10-18

    大神,请教一下阿里的Blink平台业务方使用是强制要求只能写sql和udf么?

  • 提交了问题 2018-10-18

    第一季flink meetup视频出来了吗?有的话链接发一个

  • 提交了问题 2018-10-18

    hi 我遇到一个奇怪的问题 有一个10个分区的kafka topic 我的并发度设置成9 有8个分区的数据不消费 并发度设置成8有6个分区数据没法消费 并发度设置成10时 所有分区数据都消费不到,但是从日志上来看 每个task 都分配到了一个partition. 并发度设置成2或者5时 数据消费正常

  • 提交了问题 2018-10-18

    请问大家我想用flink消费卡夫卡数据,可是kafka怎么创建消费组呢?

  • 提交了问题 2018-10-18

    flink on yarn大家实际生产上,是用yarn session方式还是single yarn job?这两个方式如何选择

  • 提交了问题 2018-10-18

    想问一下 flink 有写orc hdfs 的BucketingSink吗? 或者还需StreamingFileSink 来写吗?貌似1.6没有orc writer哦

  • 提交了问题 2018-10-18

    请教下,阿里云上的流计算平台是基于blink的,集群资源管理是用的yarn吗

  • 提交了问题 2018-10-18

    请问一下,有人用过flink monitor 的rest api吗?我cancel job每次都返回404 not found。flink 文档里写的是DELETE

  • 提交了问题 2018-10-18

    如果不在第三方存储结果,服务重启,历史数据就丢了,要重新再全部计算一次?

  • 提交了问题 2018-10-18

    阿里流计算平台支持自己定义 udf 函数吗

  • 提交了问题 2018-10-18

    flink datastream 现在支持图计算和ML吗

  • 提交了问题 2018-10-18

    之前玩storm如果有blot做这种耗时较长的操作,会导致整个链路崩。flink没问题吗

  • 提交了问题 2018-10-18

    你们flink 计算过程会去查外部数据吗 譬如数据库

  • 提交了问题 2018-10-18

    大家一般都什么业务场景下用sql啊?

  • 提交了问题 2018-10-18

    系统参数 ulimit -n 给到65536

  • 提交了问题 2018-10-18

    flink提倡用Java编程吗

  • 提交了问题 2018-10-18

    Flink 的 watermark 时区处理那部分很有问题

  • 提交了问题 2018-10-18

    各位大神,有没有用cep的 我这边做cep匹配,同样的代码,processing time 有输出,event time没有。人为造的数据,是满足对应的窗口时间的

  • 提交了问题 2018-10-18

    你好,我想问一下,如果上报的时间格式是string(yyyy-mm-dd HH:mm:ss格式),这个字段作为eventtime,使用watermark时候blink能够直接处理吗

  • 提交了问题 2018-10-18

    经常遇到 major GC 花了半分钟才完成,但一两秒以后又启动了,如此往复。这种情况下 Flink 很不稳定,随时可能挂掉,checkpoint 也完不成了,Flink 还在默默地往身上扛数据

  • 提交了问题 2018-10-18

    blink上支持 datahub从特定offset上开始消费这个特性很赞,对于补数据重跑的场景很合适。

  • 提交了问题 2018-10-18

    是不是需要加强一些python api 呢在flink ml 上

  • 提交了问题 2018-10-18

    想问下 Flink 和 Tensorflow 结合这点有成熟些的方案么?有些团队有这个需求,但目前各种方案感觉都或多或少有问题、

  • 提交了问题 2018-10-18

    流式SQL目前有规范吗?一直在用KSQL,没觉得Flink目前在这块比KSQL有什么优势。

  • 提交了问题 2018-10-18

    看源码有个小问题,RocksDBStateBackend 的 writeOptions 都把 disableWAL 设为 true, 是为了加速么?那如果地址放在内存盘里,是不是这里就不能这样了? 另外现在 Flink 状态管理很粗放,HeapKeyedStateBackend & DefaultOperatorStateBackend 都是直接放入堆内存且各种 copy,经常导致 OOM,这点 dataArtisans 的同学说暂时没太多改进计划...

暂无更多信息
  • 发表了文章 2019-01-05

    Apache Flink,流计算?不仅仅是流计算!

  • 发表了文章 2018-11-30

    Apache Flink 干货合集打包好了,速来下载

  • 发表了文章 2018-11-06

    取之开源,用之开源-深度剖析阿里巴巴对Flink的优化与改进

  • 发表了文章 2018-10-16

    阿里巴巴为什么选择Apache Flink?

  • 发表了文章 2018-10-15

    Flink在唯品会的实践

  • 发表了文章 2018-10-15

    Flink在美团的实践与应用

  • 发表了文章 2018-10-15

    Flink 靠什么征服饿了么工程师?(Flink在饿了么实时计算平台的应用)

  • 发表了文章 2018-10-15

    携程基于Flink的实时特征平台

  • 发表了文章 2018-10-15

    下:比拼生态和未来,Spark和Flink哪家强?

  • 发表了文章 2018-10-15

    Flink状态管理和容错机制介绍

  • 发表了文章 2018-10-15

    Jstorm到Flink 在今日头条的迁移实践

  • 发表了文章 2018-10-15

    Flink在美团的实践与应用

  • 发表了文章 2018-10-15

    上:Spark VS Flink – 下一代大数据计算引擎之争,谁主沉浮?

  • 发表了文章 2018-10-15

    携程基于Flink的实时特征平台

  • 发表了文章 2018-10-15

    Flink在唯品会的实践

  • 发表了文章 2018-10-15

    Flink 的新方向在哪里?这场顶级盛会给出了答案

正在加载, 请稍后...
滑动查看更多
  • 提交了问题 2019-02-21

    有没有flink实时计算的demo,集群方式的

  • 提交了问题 2019-02-21

    各位大牛下午好,请问在编译Blink时,发生如下异常: 我的maven版本:3.2.5,请问该如何解决 Failed to execute goal net.alchim31.maven:scala-maven-plugin:3.2.2:compile (scala-compile-first) on project flink-table_2.11: wrap: org.apache.commons.exec.ExecuteException: Process exited with an error

  • 提交了问题 2019-02-21

    大神们,你们一般hadoop设置几个副本啊?

  • 提交了问题 2019-02-21

    编译完Blink源码,启动集群时报这个警告。哪位大佬知道在哪里设置?

  • 提交了问题 2019-02-21

    Flink on Yarn 有两种模式 分离模式 和 客户端模式 ,我现在在做调研,没有大规模的使用,我想知道的是,这两种模式具体适用的场景是什么,对于我现在来说,两种模式我感觉区别不是很大,有人说 客户端模式的隔离性更好,但是我想知道这个这个在实际应用起来,所谓的隔离性影响大吗?或者说这两者有什么其他的较大的区别,有朋友了解吗?

  • 提交了问题 2019-02-21

    flink + rocketmq从指定Offsets启动有人做过吗

  • 提交了问题 2019-02-21

    Job倒了如何自动重新启动呢?

  • 提交了问题 2019-02-21

    请教大牛,我自己写了一个SinkFunction,继承了RichSinkFunction,初始化这个SinkFunction时,我传进去了一个数据库连接池对象,在SinkFunction的invoke里,调用数据库连接池对象来写数据库。我的问题是,当SinkFunction被partition到多个机器的vm执行时,这个数据库连接池对象是在程序入口的JobClient(程序提交所在的机器VM),还是这个对象也被复制了好多份,有多少个SinkFunction在运行就有多少个数据库连接池对象?

  • 提交了问题 2019-02-21

    flink可以通过代码自动重启job程序嘛?

  • 提交了问题 2019-02-21

    设置了flink source的 parallelism 为4,会直接造成flink启动4个taskmanager吗?

  • 提交了问题 2019-02-21

    blink有开发文档么

  • 提交了问题 2019-02-21

    State Backend中backend是什么意思,是存储的意思吗

  • 提交了问题 2019-02-21

    请问flink on yarn模式, 怎么使用REST API接口对作业进行监控? 我想集成到自己的后台里 而不是在原本的web UI上查看

  • 提交了问题 2019-02-21

    flink on yarn任务失败了之后,错误日志从哪看有人知道吗?

  • 提交了问题 2019-02-21

    blink中是否已经实现了HBase表的维表JOIN功能?有的话,具体体现在哪个包里?

  • 提交了问题 2019-02-21

    请问Flink on Yarn的模式是否需要部署Flink 集群?个人理解下来,Flink on Yarn会从启动session的节点上传jar和配置文件,但是每次想到spark on yarn部署了集群心里总是不安。还请在生产中使用Flink的前辈确认一下,谢谢!

  • 提交了问题 2019-02-21

    谁有flink的学习资料

  • 提交了问题 2019-02-21

    现在blink能用在生产环境吗

  • 提交了问题 2019-02-21

    flink每分钟滚动和滑动窗口能不能join在一起啊?

  • 提交了问题 2019-02-21

    blink是不是支持hadoop3?

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息