监控文件变化
Flume 监控文件变化
需求分析
采集需求:比如业务系统使用 log4j 生成的日志,日志内容不断增加,需要把追加到日志文件中的数据实时采集到 hdfs
根据需求,首先定义以下 3 大要素
- 采集源,即 source—— 监控文件内容更新 :
exec 'tail -F file'
- 下沉目标,即 sink——HDFS 文件系统 :
hdfs sink
- Source 和 sink 之间的传递通道 ——channel,可用
file channel
也可以用 内存channel
定义 flume 的配置文件
node03 开发配置文件
cd /export/servers/apache-flume-1.6.0-cdh5.14.0-bin/conf |
agent1.sources = source1 |
启动 flume
cd /export/servers/apache-flume-1.6.0-cdh5.14.0-bin |