Apachi Nifi问题，仅读取并保存选定列到文件。_程序开发

Apachi Nifi问题，仅读取并保存选定列到文件。

创始人

2024-09-06 20:00:31

0次

要仅读取和保存选定列到文件，您可以使用Apache Nifi的ExecuteScript处理器与Groovy脚本来实现。以下是一个示例代码片段：

import org.apache.commons.io.IOUtils
import org.apache.nifi.processor.io.OutputStreamCallback

// 获取输入流中的数据
def flowFile = session.get()
if (!flowFile) return

session.read(flowFile, { inputStream ->
    def inputText = IOUtils.toString(inputStream, 'UTF-8')

    // 选择您要提取的列
    def selectedColumns = [0, 2, 4] // 示例选择第1、第3和第5列

    // 提取选定列的数据
    def outputText = inputText.split('\n').collect { line ->
        def columns = line.split(',')
        selectedColumns.collect { columns[it] }.join(',')
    }.join('\n')

    // 将提取的数据写入输出流
    flowFile = session.write(flowFile, { outputStream ->
        outputStream.write(outputText.getBytes('UTF-8'))
    } as OutputStreamCallback)
})

session.transfer(flowFile, REL_SUCCESS)

将此代码片段放入ExecuteScript处理器的Script Body中，并将Script Language设置为Groovy。然后，您可以配置适当的输入和输出关系，以及其他处理器以及其他处理器来处理数据流。

此脚本将从输入流中读取数据，提取选定的列，并将提取的数据写入输出流，以便保存到文件中。您可以通过修改selectedColumns数组来选择不同的列。请记住，数组是从零开始的索引。

请注意，此示例假设输入数据是以逗号分隔的文本格式，并且每行都具有相同的列数。如果您的数据格式不同，请根据您的情况进行修改。

上一篇：Apache：用户成功认证后出现500错误？

下一篇：ApachIgniteClientCache::putIfAbsent不会实际更新缓存？

Apachi Nifi问题，仅读取并保存选定列到文件。

相关内容

热门资讯