咨询邮箱 咨询邮箱:service@yitianxinda.com 咨询热线 咨询热线:400-668-3065 微博 微信
北京软件开发公司Apache Spark 2.0技术预览版_北京软件开发公司
发表日期:2016-06-08 10:12:36    文章编辑:yitianxinda    浏览次数:

  北京软件开发公司Apache Spark 2.0技术预览版,Apache Spark第一版发布时隔两年后,Databricks公布了基于上游分支2.0.0-preview的Apache Spark 2.0技术预览版。该预览版在稳定性和API方面均不适合用于生产环境,主要是为了在正式上市前收集来及社区的反馈。

  此次发布的新版主要针对社区反馈进一步完善了各种功能,根据Spark的开发计划,主要改进分为两方面。

  SQL是基于Apache Spark的应用程序较常用的接口之一。Spark 2.0可以支持全部的99个TPC-DS查询,这些查询大部分都基于SQL:2003规范。这些改进有助于在对应用程序堆栈进行较少量重写的情况下将现有数据负载移植至Spark后端。

  第二方面改进主要是编程API,同时在这个新版中也更重视机器学习。spark.mllib程序包已经被全新的spark.ml程序包所取代,后者更加侧重于基于管线的API,这项技术源自DataFrames。机器学习管线和模型现已能够持久保存,Spark所支持的所有语言均支持这一特性。同时R已经可以支持K-Means、Generalized Linear Models(GLM)、朴素贝叶斯和Survival Regression。

  借助新增的Datasets类,DataFrames和Datasets已实现了统一,可支持Scala和Java编程语言,同时也可充当结构流(Structured streaming)的抽象。不支持编译时类型安全(Compile time type safety)的语言暂时还无法做到这一点,此时只能使用DataFrames作为主要抽象。SQLContext和HiveContext已被统一的SparkSession所取代。新增的Accumulator API具有比基本类型更简单的类型层级,可支持对基本类型进行专门化(Specialization)。老的API已被弃用,但为了实现向后兼容性依然包含在新版中。

  新发布的结构化流API主要可用于在不增加复杂性的前提下管理流数据集,借此程序员和现有机器学习算法将可以处理批量加载的数据集。在第二代Tungsten引擎的帮助下,性能也有所增强,执行速度较高可提升10倍。

  该技术预览版已经发布至DataBricks。

相关文章推荐
通过与北京软件公司​合作,企业可以获得所需的熟练开发人员,以加速创新和发展。北京软件公司 可以通过提供成熟的开发人员和定制解决方案来帮助企业弥补开发人员短缺的差距并实现业务增长。...
企业级软件或应用程序已经发展到几乎所有组织和企业都依赖它来保持市场竞争力的程度。无论您是需要跟踪捐赠者的非营利组织还是寻求更好的库存管理的汽车经销商,都没关系。移动企业应用程序为公司提供了前所未有的灵活性和功能。...
优秀的软件开发技术设施和具有丰富开发知识的高水平专家似乎对于软件开发项目的成功至关重要。...
对于软件开发公司来说几乎每个新程序代码都有错误,在最坏的情况下,这些错误可能会危及安全性...
北京软件开发公司对软件错误检测的研究促使软件开发工程师开发了一种方法——它就像两个说自己语言的朋友一样——来加强对电子邮件和社交媒体消息等数字内容的保护。...
工业控制系统 (ICS) 解决方案需要新的架构,并且需要更适应不断变化的环境的理念。重点介绍了六种方法: 学习目标 工业 4.0 时代的工业控制解决方案需要新的架构和理念。 由于工业...
学会软件开导国际-,对待我国高速飞行器你看北京的气动弹性本能机能预测、特种考查技我不领略软件开导术发达以及...
物联网软件开发(IoT)连接日常对象中发现的智能技术,以实现数据流。物联网的机会扩展到许多垂直领域,包括工业市场。...
纪录只需轻触大屏幕在选好的脾气背景画轴上写意地泼墨挥洒展现本身的笔体神韵彰显脾气极端具有涌现和留存价值。 能够保证签到 活动利市稳妥地举办。北京软件开拓公司。 灵动笔...
政策优渥! 为进步中国新闻化管理程度不休勉力。 美萍行业管理软件,看着北京软件启发。勉力启发具有中国特色的宁静、管理软件,幼稚。争持适用为主的思绪,比拟一下界面。简...
企业级软件或应用程序已经发展到几乎所有组织和企业都依赖它来保持市场竞争力的程度。无论您是需要跟踪捐赠者的非营利组织还是寻求更好的库存管理的汽车经销商,都没关系。移动企业应用程序为公司提供了前所未有的灵活性和功能。...
对于软件开发公司来说几乎每个新程序代码都有错误,在最坏的情况下,这些错误可能会危及安全性...