Apache Samza 0.12.0 发布,Samza 是一个分布式流处理框架,专用于实时数据的处理,目前已经在几个大公司(包括 LinkedIn、Netflix、Uber)实际生产中使用。
0.12.0 版本中添加了几个功能,以提高稳定性,性能和易用性。
支持“End of Stream”:Samza 现在将有一个“end-of-stream”概念,以支持从有限的输入源(例如磁盘文件)中消耗。这使得 Samza 能够在完成耗用所有数据后正常关闭。
HDFS Consumer:Samza 现在为从 HDFS 文件消费的数据提供一流的支持。这使开发人员能够定义其处理逻辑一次,并在批处理和流式处理环境中运行它们。此功能还允许使用 Samza 快速实验 ETL 的 HDFS 数据,而无需编写单独的 Hadoop 任务。
Samza 现在可以在执行检查点时通知 SystemConsumer。
支持 Yarn 节点标签。
此版本还包括几个关键的错误修复和操作稳定性的改进。
软件详情:https://blogs.apache.org/samza/entry/announcing-the-release-of-apache
下载地址:http://www.apache.org/dyn/closer.lua/samza/0.12.0
来自:开源中国社区


gwg591405154 于 2017-02-26 14:01:14发表:
顶