相关介绍
Apache Tajo™:Hadoop上的大数据仓库系统
Apache Tajo是Apache Hadoop的强大大数据关系和分布式数据仓库系统。Tajo 专为存储在 HDFS(Hadoop 分布式文件系统)和其他数据源上的大数据集上的低延迟和可扩展的即席查询、在线聚合和 ETL(提取-转换-加载过程)而设计。通过支持 SQL 标准并利用高级数据库技术,Tajo 允许跨各种查询评估策略和优化机会直接控制分布式执行和数据流。
特征
- 快速高效
- 完全分布式的 SQL 查询处理引擎
- 高级查询优化,例如基于成本的查询优化和渐进式查询优化
- 对合理数据集的交互式分析
- 可 伸缩
- 长时间运行的查询的容错和动态调度
- 用于大于主内存的数据集的核外算法
- 相容
- ANSI/ISO SQL 标准合规性
- Hive 元存储访问支持
- JDBC 驱动程序支持
- 支持各种文件格式,如CSV,JSON,RCFile,SequenceFile,ORC和Parquet
- 容易
- 用户定义的函数
- 交互式外壳
- 方便的备份/还原实用程序
- 异步/同步 Java API
关键词:Tajo,Apache Tajo
网址预览
预览图片
数据评估
关于Apache Tajo特别声明
本站萌导航网提供的Apache Tajo都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由萌导航网实际控制,在2023年1月2日 下午3:24收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,萌导航网不承担任何责任。
相关导航
暂无评论...