在大数据计算MaxCompute中,请教2个语法有没有在maxframe支持?:
bucket_list = ["12", "9", "6", "3", "4"]
data = data[data.bucket_id.isin(["12", "9", "6", "3", "4"]))] # 这个语法可以
尝试使用 data.query('bucket_id @in bucket_list") 这个语法不行,但是pandas支持,本意是想将filter条件都在query里面拼起来。单机例子:import pandas as pddata = pd.DataFrame({"bucket": [1,2,3,4,5], "value": [12, 34, 56, 78, 90]})data.head()bucket_list = [1, 2, 3]data.query("bucket in @bucket_list")YH@8月19日 10:36maxframe:import maxframe.dataframe as mdfrom maxframe import new_sessionfrom maxframe.config import optionsoptions.sql.enable_mcqa = Falsetable = o.create_table("test_source_table", "key string, v bigint", if_not_exists=True)with table.open_writer() as writer: writer.write([ ["a", 0], ["b", 1], ["c", 1] ])# 创建MaxFrame sessionsession = new_session(o)df = md.read_odps_table("test_source_table")key_list = ["a", "b"]res = df.query("key in @key_list")# 打印dataframe数据print(res.execute().fetch())# MaxFrame DataFrame数据写入MaxCompute表# md.to_odps_table(df, "test_prefix_source_table").execute()# 销毁 maxframe sessionsession.destroy()
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。