数据仓库作业SEARCH AGGREGATION

首页/精选主题/

数据仓库作业

Greenplum

数据仓库(UDW Greenplum)是大规模并行处理数据仓库产品,基于开源的Greenplum开发的大规模并发、完全托管的PB级数据仓库服务。UDW可以通过SQL让数据分析更简单、高效,为互联网、物联网、金融、电信等行业提供丰富的业务分析...

数据仓库作业问答精选

想买块机械硬盘当仓库用,存储孩子照片、视频,平时不上电,该不该买企业级机械硬盘?

回答:目前最可靠的仓库不是机械硬盘,不是ssd,不是u盘,是光盘,虽然,市面上已经很少见到光盘,但光盘目前还是最廉价最可靠的个人用存储介质,本人20年前刻录的dvd光盘,依然能读取数据,试问,还有多少人20年前的硬盘还健在?目前,容量最大的光盘是蓝光光盘,价格也很低廉,一片容量为23g的刻录光盘,最多3元钱,蓝光刻录光驱,也仅300元左右一台,仅仅是一块1t机械盘的价格,但它可存储的容量,就是它的刻录寿...

Neilyo | 1590人阅读

搭建私有云平台:Hadoop还是选择OpenStack?

回答:首先建议题主描述清楚应用场景,否则别人做的方案可能都不符合需求。就Hadoop和OpenStack的纠结而言,支撑数据分析用前者,做资源管理用后者。=================补充=============题主的需求,实质是搭建一个IoT实时大数据平台,而不是一般意义的私有云。IoTa大数据平台除了数据采集和结果反馈,其余部分和一般的大数据平台相差不多。OpenStack长于管理VM资源管理...

MonoLog | 865人阅读

MySQL数据库如何删除重复数据?

问题描述:现在数据库有几万条数据,如何删除重复数据只留下一条就行, 比如,有十条一样的数据,要删除掉其他九条记录,只留下一条就行

李涛 | 751人阅读

mysql数据库怎么导入数据

问题描述:关于mysql数据库怎么导入数据这个问题,大家能帮我解决一下吗?

魏明 | 543人阅读

数据库怎么创建数据库

问题描述:关于数据库怎么创建数据库这个问题,大家能帮我解决一下吗?

李义 | 591人阅读

如何向数据库中导入数据

问题描述:关于如何向数据库中导入数据这个问题,大家能帮我解决一下吗?

617035918 | 663人阅读

数据仓库作业精品文章

  • 自动化测试工具

    ...版个人作业作为对数器。自己写一个程序来自动生成测试数据,因为每个个人作业的要求不一样,自动化框架无法对每种程序都生成测试数据,目前只支持生成按规则生成随机的字符串测试集。要制定评分规则(自动化框架已经...

    tuniutech 评论0 收藏0
  • 数据仓库概述

    数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智能的企业,...

    马龙驹 评论0 收藏0
  • 在 OpenStack 上部署 Hadoop

    ...算、存储和网络资源池。本文主要关注 OpenStack 如何在大数据用例中扮演关键角色。OpenStack 上的大数据现在,数据随处生成,数据量呈指数增长。来自 Web 服务器、应用程序服务器、数据库服务器的数据以用户信息、日志文件和...

    luffyZh 评论0 收藏0
  • Hadoop中的三种调度算法

    ...调度Hadoop 是一个通用系统,可以对一组分散的节点上的数据进行高性能处理。这样的定义也说明,Hadoop 是一个多任务系统,它可以同时为多个用户、多个作业处理多个数据集。这种多处理的能力也意味着 Hadoop 能以更优的方式...

    int64 评论0 收藏0
  • 当当弹性化中间件及云化之路(据说读完可以少踩坑)

    ...服装等。与垂直电商不同,水平电商由于品类繁多,因此数据架构也会有很大区别。 7X24 互联网公司基本都是如此要求,尽量缩短宕机时间。 流量突增 如双11或书香节,其流量是平时的几倍到几十倍不等。 业务复杂 下...

    王陆宽 评论0 收藏0
  • 360度透视Hadoop,大数据技术、案例及相关应用

    来自Wikibon社区的大数据宣言为公司提供有效的业务分析工具和技术是首席信息官的首要任务。有效的业务分析(从基本报告到高级的数据挖掘和预测分析)使得数据分析人员和业务人员都可以从数据中获得见解,当这些见解转...

    rottengeek 评论0 收藏0
  • 阿里云大数据MaxCompute计算资源分布以及LogView分析优化

    摘要: MaxCompute(原ODPS)的概念 海量数据处理平台,服务于批量结构化数据的存储和计算,提供海量数据仓库的解决方案以及针对大数据的分析建模服务.(官方文档有这里就不多做介绍了)官方文档链接 优势 用户不必关心分布...

    617035918 评论0 收藏0
  • 阿里云大数据MaxCompute计算资源分布以及LogView分析优化

    摘要: MaxCompute(原ODPS)的概念 海量数据处理平台,服务于批量结构化数据的存储和计算,提供海量数据仓库的解决方案以及针对大数据的分析建模服务.(官方文档有这里就不多做介绍了)官方文档链接 优势 用户不必关心分布...

    raise_yang 评论0 收藏0
  • 阿里云大数据MaxCompute计算资源分布以及LogView分析优化

    摘要: MaxCompute(原ODPS)的概念 海量数据处理平台,服务于批量结构化数据的存储和计算,提供海量数据仓库的解决方案以及针对大数据的分析建模服务.(官方文档有这里就不多做介绍了)官方文档链接 优势 用户不必关心分布...

    zorro 评论0 收藏0
  • 不看不知道:六个超大规模Hadoop部署案例

    虽然Hadoop是眼下热闹非凡的大数据领域最热话题,但它肯定不是可以解决数据中心和数据管理方面所有难题的灵丹妙药。考虑到这一点,我们暂且不 想猜测这个平台未来会如何,也不想猜测各种数据密集型解决方案的开源技术...

    hidogs 评论0 收藏0
  • OPPO数据中台之基石:基于Flink SQL构建实数据仓库

    ...举行的 Flink Meetup 会议,分享嘉宾张俊,目前担任 OPPO 大数据平台研发负责人,也是 Apache Flink contributor。本文主要内容如下: OPPO 实时数仓的演进思路; 基于 Flink SQL 的扩展工作; 构建实时数仓的应用案例; 未来工作的思考和...

    jeffrey_up 评论0 收藏0
  • TOP100summit:【分享实录】链家网大数据平台体系构建历程

    本篇文章内容来自2016年TOP100summit 链家网大数据部资深研发架构师李小龙的案例分享。编辑:Cynthia 李小龙:链家网大数据部资深研发架构师,负责大数据工具平台化相关的工作。专注于数据仓库、任务流调度、元数据管理、...

    Yu_Huang 评论0 收藏0
  • 数据开发平台(Data Platform)在有赞的最佳实践

    前言 随着公司规模的增长,对大数据的离线应用开发的需求越来越多,这些需求包括但不限于离线数据同步(MySQL/Hive/Hbase/Elastic Search 等之间的离线同步)、离线计算(Hive/MapReduce/Spark 等)、定时调度、运行结果的查询以及失败场...

    HitenDev 评论0 收藏0
  • cdh组件有哪些

    ...于提供了一个统一的平台,可以让用户方便地使用各种大数据处理工具和技术,并且CDH还提供了许多管理和监控工具,方便用户管理和监控集群。

    白马啸西风 评论0 收藏0
  • Jstorm到Flink 在今日头条的迁移实践

    ...业务场景 首先,应用层有广告,也有AB测,也有推送和数据仓库的一些业务。然后在使用J storm的过程中,增加了一层模板主要应用于storm的计算模型,使用的语言是python。所以说中间相对抽象了一个schema,跑在最下面一层J storm...

    luckyyulin 评论0 收藏0

推荐文章

相关产品

<