反馈已提交

网络繁忙

文件输入-读取CSV文件

  • 文档创建者:Wendy123456
  • 历史版本:4
  • 最近更新:Wendy123456 于 2026-07-02
  • 1. 概述

    1.1 版本

    FineDataLink 版本功能变动
    4.0.14-
    4.2.10.3原「读取起始行」配置项修改为「读取行范围」,并新增「读取列范围」
    点击展开更多
    FineDataLink 版本
    功能变动
    4.0.24

    FineDataLink 服务器本地和 FTP/SFTP 服务器中:

    • 支持批量读取同格式的 CSV 文件

    • 支持 CSV 文件自定义输出字段类型

    • 支持 CSV 文件跳过前 N 行取数

    • 支持忽略后缀名大小写读取

    4.1.4

    文件类型选择 CSV 时,支持读取类 csv 文件类型,例如tsv、log、dt(csv 和 xml 混合格式)等

    4.2.6.1
    • 支持添加内置字段「fileName(文件名)」、「filePath(文件路径)」、「lastModifiedTime(文件修改时间)」,在配置中可添加三个内置字段作为输出字段

    • 文件读取后缀取消必填校验

    4.2.10.1输出字段配置中选择「手动获取」,新增支持搜索字段

    1.2 功能简介

    本文介绍如何使用「文件输入」算子,读取 CSV 文件。

    1.3 注意事项

    1)「文件输入」算子前端日志显示的读取量,不包含表头这行数据。

    比如 Excel 数据有 100 w行,包括 1 行表头+999999行数据,「文件输入」算子读取后,前端日志会显示读取 999999 行数据。

    2)「文件输入」算子中,文件地址、文件夹地址、文件筛选、sheet筛选设置项中支持使用参数,参数使用方法请参见:如何配置并使用参数

    1.4 支持的数据源类型

    支持读取服务器本地目录、FTP/SFTP、Amazon S3、Server Message Block中的文件数据。详情请参见:前提条件

    2. 功能说明

    若文件类型选择「CSV」文件,需配置以下内容:

    注:此处为广义的 CSV ,指的是包括所有使用逗号、制表符、分号、竖线等任何符号作为分隔符的纯文本表格文件。

    1782982628394906.png

    文件来源、读取方式、首行为字段名、读取行范围、读取列范围、输出字段介绍请参见 文件输入-读取Excel文件 文档,其余设置项说明见下表:

    设置项
    说明
    文件类型

    文件类型选择 CSV 时,支持读取 csv 文件类型。

    例如:支持的文件后缀名:csv、CSV、txt、TXT、tsv、log、dt(csv 和 xml 混合格式)等。

    读取文件后缀

    当用户选择「文件读取」方式时,新增该选项。说明如下:

    • 不区分大小写;

    • 根据用户输入的「文件后缀」读取文件地址中的该类型文件,跳过路径下非该格式文件;

    • 支持写多种格式,以逗号为分隔符;支持读取类 CSV 文件,例如:txt/tsv/log

    • /dt(csv和xml混合格式)

    4.2.6.1 及之后版本,取消必填校验

    列分隔符

    根据指定的分隔符,分隔数据为多列。配置的分隔符需要与文件中实际的分隔符保持一致才可正常解析。

    4.png

    分隔符可选择:英文逗号,制表符\t英文分号;管道符|空格ASCII字符自定义

    • 可以手动输入自定义分隔符,可以输入多个字符作为分隔符,可以是中文字符;

    • 可以手动输入十进制的 ASCII 编码,指定 ASCII 字符作为特殊的列分隔符,支持的十进制ASCII编码为0~32;

    • 文本限定符、列分隔符、行分隔符彼此不可重复

     行分隔符

    支持指定 CSV 中的行分隔符:

    5.png

    • CR+LF:在 Windows 系统中使用;

    • LF:在 Unix、Linux 等系统中使用;

    • CR:在早期的 Mac OS 系统中使用;

    • 文本限定符、列分隔符、行分隔符彼此不可重复

    文本限定符

    用于标识数据值的开始和结束,以避免数据中包含的特殊字符干扰 CSV 文件的解析。

    6.png

    可选择:双引号、单引号、ASCII 字符(支持的十进制ASCII编码为0~32);

    文本限定符、列分隔符、行分隔符彼此不可重复

    编码

    指定 CSV 文件编码

    编码支持选择 GBK、BIG5、ISO-8859-1、UTF-8、UTF-16、EUC_JP、EUC_KR、CP850、GB2312

    7.png

    注:该设置项应该选择正确的文件编码格式,否则,将会导致读取数据乱码

    读取行范围

    读取列范围

    4.2.10.3 及之前版本,该功能为「读取起始行」,详情请参见:历史版本

    4.2.10.3 及之后版本,原「读取起始行」配置项修改为「读取行范围」并新增「读取列范围」,详情请参见本文 3.1 节




    附件列表


    主题: 数据开发-定时任务
    • 有帮助
    • 没帮助
    • 只是浏览
    中文(简体)

    鼠标选中内容,快速反馈问题

    鼠标选中存在疑惑的内容,即可快速反馈问题,我们将会跟进处理。

    不再提示

    10s后关闭



    AI

    联系我们
    在线支持
    获取专业技术支持,快速帮助您解决问题
    工作日9:00-12:00,13:30-17:30在线
    页面反馈
    针对当前网页的建议、问题反馈
    售前咨询
    采购需求/获取报价/预约演示
    或拨打: 400-811-8890 转1
    qr
    热线电话
    咨询/故障救援热线:400-811-8890转2
    总裁办24H投诉:17312781526
    提交页面反馈
    仅适用于当前网页的意见收集,帆软产品问题请在 问答板块提问前往服务平台 获取技术支持