微软开源大规模数据处理项目 Data Accelerator
2019-04-23 10:44:23爱云资讯1421
微软开源了一个原为内部使用的大规模数据处理项目 Data Accelerator。自 2017 年开发以来,该项目已经大规模应用在各种微软产品工作管道上。
据微软官方开源博客介绍,Data Accelerator 的一些方法可以更容易地在 Apache Spark 上构建流式传输管道:
- 即插即用:轻松设置输入源和输出接收器,以便在几分钟内建立管道。Data Accelerator 支持从 Eventhub 和 IoThub 取数据,并支持将数据下载到 Azure blob、CosmosDB、Eventhub 等。
- 无代码体验:无需编写任何代码即可设置警报和数据处理。通过规则设计器体验,您可以指定简单和聚合的数据处理,标记和警报。
- SQL 查询:在 SQL 中编写复杂的处理——无需在 Scala 中工作。内置的可扩展性模型还支持用户定义的函数并利用 Azure 功能,例如,用于 ML 中流。
- 实时查询:通过针对传入数据样本运行,在几秒钟内验证您的查询,从而节省设置和测试管道处理的工作时间。
Data Accelerator 不仅仅是 EventHub 和数据库之间的管道。它允许用户在继续流式传输的同时重塑传入的事件,然后将同一事件的不同部分路由到不同的数据存储,同时提供健康监控和整个管道状态的警报。
Data Accelerator 还提供配置 UI 和规则/查询设计器体验,使用户无需编写任何代码即可启动和运行。
此外,任何进行流数据处理的人通常都需要使用滑动窗口处理数据,或处理延迟到达数据,或者随时间累积数据。Data Accelerator 支持并简化了这些高级功能的使用。
最后,微软提到,Data Accelerator 支援 dev-test 循环的快速验证周期,其中查询针对本地采样的事件运行在部署之前就能迭代修正到可用,这可以节省大量测试工作管道处理的时间。
相关文章
- 微软张祺:微软迎来50周年,回望初心,砥砺前行!
- 微软即将正式推出Recall功能
- 微软50周年之际:Copilot迎来重大更新
- 微软2025年度Xbox游戏发布会将于6月举行
- 微软计划独立开发人工智能模型以减少对OpenAI的依赖
- 微软转身ToDesk亮剑:Windows用户终于等到远控的终极形态
- 微软推出具备深度推理能力的Copilot人工智能助手
- 微软将推出游戏版Copilot,充当人工智能游戏教练
- 亚马逊首款量子计算芯片Ocelot亮相,微软/谷歌/微美全息竞逐加速量子行业成熟
- 微软推出医疗人工智能助手Dragon Copilot,手写病历的时代结束
- 微软为Mac发布了原生Copilot应用程序
- 微软宣布通过Majorana 1芯片在量子计算领域取得重大突破
- Scale AI语音识别技术落地微软,AI语音领域再添里程碑
- 微软组建CoreAI组织,打造端到端的Copilot和AI堆栈,以构建和运行AI应用程序及智能体
- 微软发布2025年AI预测:AI Agents将彻底改变工作方式
- 微软推出新款人体工学键盘 拥有超灵敏的按键
人工智能技术
更多>>人工智能公司
更多>>人工智能硬件
更多>>- 行业首款 TÜV 南德「三防品质」认证手机 魅族 Note 16 系列 5 月 13 日发布
- 神眸开启AI智能摄像机无线时代:全定制芯片方法学+六神守护价值体系,坚守初心普惠千万家庭
- 时尚博主们爱不释手!宏碁非凡Go Air毕竟只有999克
- 未来智能将发布新一代讯飞AI会议耳机 重新定义办公生产力
- 技嘉科技横扫 2025 iF 与红点设计大奖,展现全产品线研发实力
- 玩家福音,RTX 5070加持6999元起,华硕天选6 Pro锐龙版高能来袭
- 【强势上新】HPM5E00:EtherCAT运动控制MCU,先楫半导体再拓工业总线产品新版图
- 荣耀MagicBook Pro 16 2025正式发布:轻薄静音性能旗舰,重塑游戏本体验