循环多次读取Linux环境文件同步数据 FineReport帮助文档|报表开发|报表使用|学习教程

历史版本3 :循环多次读取Linux环境文件同步数据返回文档

编辑时间:04-14 17:05 历史版本: 最新历史版本上一篇历史版本下一篇历史版本 内容长度:7686 图片数:18目录数:3 修改原因:调整页面

1. 概述
2. 操作步骤
3. 结果展示

1. 概述编辑

1.1 应用场景

1.2 实现思路

1.3 任务展示

2. 操作步骤编辑

2.1 场景模拟

服务器所在目录/data/demo_FR/webroot/WEB-INF/local_files/df_files/csv文件夹中，会定时上传未知数目的 csv 表数据。这些表数据最终定时手工汇总到数据库中的某张表中，存在效率低下和容易出错的问题。

现希望提高汇总数据的速度与准确性。

本文示例 csv 文件夹中存在两张表。如下图所示：

示例表数据：csv.zip

2.2 方案说明

2.3 准备工作

本文使用「Shell 脚本」节点，扫描指定文件夹下的 csv 文件，所以需要做以下准备。

1）由于需要在目标服务器执行指定 Shell 脚本，因此需要首先通过 SSH 远程连接至目标服务器。

因此新建 SSH 协议数据连接，参考：前提条件

2）本文使用「Shell 脚本」节点，扫描指定文件夹下的 csv 文件，所以需要准备 .sh 文件。

新建 file_search.sh 文件。代码如下所示：

本文示例 file_search.sh 文件：file_search.zip

#!/bin/bash
# 获取输⼊参数
path=$1 # 指定要扫描的文件夹路径
output=$2 # 指定输出文件的路径
# 输出表头
echo "文件名,绝对路径,修改时间" > $output
# 遍历文件夹
for file in $(ls $path)
do
# 获取文件名、绝对路径和修改时间
filename=$(basename $file)
abspath=$(realpath $path/$file)
modtime=$(stat -c %y $path/$file | awk '{print $1,$2}')
# 将文件名、绝对路径和修改时间输出到csv文件
echo "$filename,$abspath,$modtime" >> $output
done
# 输出完成信息
echo "扫描完成！输出文件路径为：$output"

3）将 file_search.sh 文件上传到 csv 文件夹所在的目录中。如下图所示：

4）新建一个服务器本地目录数据连接，服务器本地目录选择存放 csv 文件夹的路径。

2.4 设置 Shell 脚本节点

本节目的：扫描指定文件夹下的 csv 文件，结果输出到 file_list.csv 表中。file_list.csv 表中包含 csv 文件夹下表信息的：文件名、绝对路径、修改时间。

1）新建定时任务，添加「Shell脚本」节点。

2）在「参数设置」中新增两个文本类型的参数。如下表所示：

参数	说明	值
source_folder	指定要扫描的文件夹路径，本文是 csv 文件夹	/data/demo_FR/webroot/WEB-INF/local_files/df_files/csv
target_csv	指定输出文件的路径，file_list1.csv名称可自定义，为自动生成的文件包含 csv 文件夹下表信息的：文件名、绝对路径、修改时间	/data/demo_FR/webroot/WEB-INF/local_files/df_files/file_list.csv

参数

说明

值

source_folder

指定要扫描的文件夹路径，本文是 csv 文件夹

/data/demo_FR/webroot/WEB-INF/local_files/df_files/csv

target_csv

指定输出文件的路径，file_list1.csv名称可自定义，为自动生成的文件

包含 csv 文件夹下表信息的：文件名、绝对路径、修改时间