首页 > 消费 > > 正文
2022-02-15 17:51:20

Cloudera为数据团队发布新的机器学习产品

导读 软件公司Cloudera今天在Strata Data伦敦大会上宣布了一系列机器学习产品更新:Cloudera数据科学工作台1 4、微软Azure上的Cloudera Al

软件公司Cloudera今天在Strata Data伦敦大会上宣布了一系列机器学习产品更新:Cloudera数据科学工作台1.4、微软Azure上的Cloudera Altus数据工程和Cloudera Enterprise 6.0。首席执行官汤姆莱利表示,这三家公司都专注于促进数据团队之间的合作。

Cloudera宣布为数据团队提供新的机器学习产品

“我们相信数据可以让明天不可能实现的目标成为可能。通过增强的机器学习、分析和云功能,我们宣布的新软件产品和云服务将使我们的客户能够更快地在数据经济中获得竞争优势,”赖利在一份声明中表示。“这些增强功能证明了Cloudera对市场领先创新的承诺,这些创新使企业能够安全地将复杂的数据转化为清晰可行的见解,从而推动其数字化转型。

Azure上的Cloudera Altus数据工程昨天上线,支持Apache Spark、Apache Hive、Spark上的Hive和MapReduce 2。云企业6.0和Altus Analytic DB现已启动测试阶段,数据科学工作台1.4预计将于今年夏天推出。

数据科学工作台允许数据科学团队在单个平台上构建、运行、训练、比较和实现机器学习模型。1.4版本有一个改进的用于运行和跟踪实验的工具包和一个一键式工具,允许用户将该模型部署为网络应用程序的代表性状态转移(rest) API。

Cloudera Atlus更以云为中心;Cloudera声称它是第一个投入使用的“多云多功能”平台。其产品包括Azure的数据工程,它授予处理作业对微软Azure数据湖存储(ADLS)的读写访问权限,以及Altus Analytic DB,这是一种“数据仓库”服务,可以通过Altus SDX提供SQL、Python和r .等格式的数据库分析。这是对Cloudera Altus软件开发工具包(SDK)的补充,该工具包允许对Java进行编程访问,并提供一个自动工作负载性能监视器来标记潜在的问题。

最后但同样重要的是,Cloudera Enterprise,一个机器学习和分析应用程序的平台。与之前的版本相比,最新的迭代(6.0版)引入了GPU支持和Apache Hive数据仓库优化,“显著加速了机器学习和数据工程的应用”。它还提供了Apache Solr 7.0(支持嵌套数据类型和JSON方面)、Kafka 1.0和Spark 2.2作为完全原生的组件。Cloudera声称,即使单个Cloudera Manager 6.0接口集群中有多达2500个节点,平台上的机器学习速度也可能提高10倍。Apache Hive 2.0的分析工作量可以将性能提高80%%。

Cloudera机器学习总经理希拉里梅森(Hilary Mason)在一份声明中表示:“我们非常高兴在Cloudera Data Science Workbench中引入新功能,可以加速数据科学家的日常工作流程,包括实验管理和模型部署,并保持数据安全和治理的无缝体验。