Gobblin是批量和流式系统的分布式大数据集成框架(提取,复制,合规性,保留)。 Gobblin与Apache Hadoop,Apache Kafka,Salesforce,S3,MySQL,Google等集成。