更新时间:2025-09-18 GMT+08:00

快速开始

以下代码使用ibis库连接DataArtsFabric数据湖并执行数据查询,将结果转换为DataFrame格式的基本语法。

示例仅供参考,请您根据实际情况进行修改。

关于Ibis更详细的用法,请参见Ibis官方文档

import ibis  # 导入ibis依赖

con = ibis.fabric.connect(  # 调用Fabric后端连接,创建连接
    endpoint=FABRIC_ENDPOINT,  # 指定服务的区域,区域查询请参见地区和终端节点
    endpoint_id=FABRIC_ENDPOINT_ID,  # 查询endpoint_id
    domain=FABRIC_DOMAIN,  # 租户名
    user=FABRIC_USER,  # IAM用户名
    password=FABRIC_PASS,  # IAM密码
    access_key=ACCESS_KEY,  # 获取AK/SK
    secret_key=SECRET_KEY,
    security_token=SECURITY_TOKEN,  # 获取临时AK/SK
    project_id=FABRIC_PROJECT_ID,  # 如何获取project_id
    catalog_name=IBIS_TEST_FABRIC_CATELOG,  # 连接指定的Catalog
    workspace_id=FABRIC_WORKSPACE_ID,  # 获取workspace_id
    lakeformation_instance_id=IBIS_TEST_FABRIC_LAKEFORMATION_INSTANCE_ID,  # LakeFormation服务的实例ID,详情请参见与LakeFormation数据类型映射关系
    obs_directory_base=OBS_DIRECTORY_BASE,  # obs中udf的存储路径
    obs_bucket_name=OBS_BUCKET_NAME,  # obs的桶名字
    obs_server=OBS_SERVER,  # obs访问地址,详情请参见终端节点(Endpoint)和访问域名
    verify=VERIFY,  # bool类型,是否校验服务端SSL证书
)
t = con.table("table_name", database="db")  # 通过连接到后端获取table表信息,建立表对象
t.select("cola")  # 查询表字段
df = t.execute()  # 将DataFrame转为SQL,传输到后端执行,并且返回Pandas DataFrame格式的结果