
PiFlow是一个扩展性强,性能优越,简单易用的大数据流水线系统,提供了100+的数据处理组件,包括Hadoop 、Spark、MLlib、Hive、Solr、Redis、MemCache、ElasticSearch、JDBC、MongoDB、HTTP、FTP、XML、CSV、JSON等,欢迎下载使用!
软件特色
可视化配置流水线
监控流水线
查看流水线日志
检查点功能
支持自定义开发数据处理组件
基于分布式计算引擎Spark开发
集成了微生物领域的相关算法
使用方法
解压piflow-server-v0.9.tar.gz:
tar -zxvf piflow-server-v0.9.tar.gz
编辑配置文件config.properties
运行、停止、重启PiFlow Server
start.sh、stop.sh、 restart.sh、 status.sh
测试 PiFlow Server
设置环境变量 PIFLOW_HOME
vim /etc/profile
export PIFLOW_HOME=/yourPiflowPath/bin
export PATH=PATH:PIFLOW_HOME/bin
运行如下命令
piflow flow start example/mockDataFlow.json
piflow flow stop appID
piflow flow info appID
piflow flow log appID
piflow flowGroup start example/mockDataGroup.json
piflow flowGroup stop groupId
piflow flowGroup info groupId
如何配置
config.properties
#spark and yarn config
spark.master=yarn
spark.deploy.mode=cluster
#hdfs default file system
fs.defaultFS=hdfs://10.0.86.191:9000
#yarn resourcemanager.hostname
yarn.resourcemanager.hostname=10.0.86.191
#if you want to use hive, set hive metastore uris
#hive.metastore.uris=thrift://10.0.88.71:9083
#show data in log, set 0 if you do not want to show data in logs
data.show=10
#server port
server.port=8002
#h2db port
h2.port=50002
以上就是万能驱动网小编今日为大家带来的PiFlow(大数据流水线系统),更多软件下载尽在万能驱动网。

版权声明:PiFlow(大数据流水线系统)所展示的资源内容均来自于第三方用户上传分享,您所下载的资源内容仅供个人学习交流使用,严禁用于商业用途,软件的著作权归原作者所有,如果有侵犯您的权利,请来信告知,我们将及时撤销。
软件下载信息清单:
| 软件名称 | 发布日期 | 文件大小 | 下载文件名 |
|---|---|---|---|
| PiFlow(大数据流水线系统)安装包 | 2026年4月5日 | 308.66MB | piflow-server-v0.9.zip |
软件评论