数据仓库技术方案SEARCH AGGREGATION

首页/精选主题/

数据仓库技术方案

Greenplum

数据仓库(UDW Greenplum)是大规模并行处理数据仓库产品,基于开源的Greenplum开发的大规模并发、完全托管的PB级数据仓库服务。UDW可以通过SQL让数据分析更简单、高效,为互联网、物联网、金融、电信等行业提供丰富的业务分析...

数据仓库技术方案问答精选

mysql数据库中,数据量很大的表,有什么优化方案么?

回答:个人的观点,这种大表的优化,不一定上来就要分库分表,因为表一旦被拆分,开发、运维的复杂度会直线上升,而大多数公司是欠缺这种能力的。所以MySQL中几百万甚至小几千万的表,先考虑做单表的优化。单表优化单表优化可以从这几个角度出发:表分区:MySQL在5.1之后才有的,可以看做是水平拆分,分区表需要在建表的需要加上分区参数,用户需要在建表的时候加上分区参数;分区表底层由多个物理子表组成,但是对于代码来...

周国辉 | 1492人阅读

想买块机械硬盘当仓库用,存储孩子照片、视频,平时不上电,该不该买企业级机械硬盘?

回答:目前最可靠的仓库不是机械硬盘,不是ssd,不是u盘,是光盘,虽然,市面上已经很少见到光盘,但光盘目前还是最廉价最可靠的个人用存储介质,本人20年前刻录的dvd光盘,依然能读取数据,试问,还有多少人20年前的硬盘还健在?目前,容量最大的光盘是蓝光光盘,价格也很低廉,一片容量为23g的刻录光盘,最多3元钱,蓝光刻录光驱,也仅300元左右一台,仅仅是一块1t机械盘的价格,但它可存储的容量,就是它的刻录寿...

Neilyo | 1585人阅读

大数据究竟是什么?大数据有哪些技术呢?

回答:近几年,大数据的概念逐渐深入人心,大数据的趋势越来越火爆。但是,大数据到底是个啥?怎么样才能玩好大数据呢?大数据的基本含义就是海量数据,麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。数字经济的要素之一就是大数据资源,现在大家聊得最多的大数据是基于已经存在的...

khlbat | 513人阅读

大数据Spark技术是否可以替代Hadoop?

回答:1998年9月4日,Google公司在美国硅谷成立。正如大家所知,它是一家做搜索引擎起家的公司。无独有偶,一位名叫Doug Cutting的美国工程师,也迷上了搜索引擎。他做了一个用于文本搜索的函数库(姑且理解为软件的功能组件),命名为Lucene。左为Doug Cutting,右为Lucene的LOGOLucene是用JAVA写成的,目标是为各种中小型应用软件加入全文检索功能。因为好用而且开源(...

ctriptech | 625人阅读

数据分析需要用什么技术?java还python好一点?

回答:先说结论,问题1回答:数据分析技术简单来说可归类为统计分析技术和数据可视化两类。问题2回答:目前阶段做数据分析使用Python更高效,方便一点。希望我作为数据分析师的经验能对你有帮助1、数据分析的本质数据分析是指用适当的统计方法对收集的大量数据进行数据分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程,最后再通过得到的结论应用到行业中解决实际问题。简单概括来说数据分析就是-- 处理数...

ormsf | 1216人阅读

学习数据库编程技术要先学会c++或计算机基础之类的吗?

回答:计算机基础,高等数学,离散数学,数据结构,算法

张汉庆 | 912人阅读

数据仓库技术方案精品文章

  • 一出上云大戏,一曲数据仓库的悲歌?

    对于一家自身组织运行历史数十年的公司来说,数据仓库会是一种有效帮助其报告和理解相关操作的方式。在数据仓库出现之前,对来自不同系统的数据进行报告与收集是一项昂贵、耗时而且常常徒劳无功的尝试,而数据仓库保...

    TigerChain 评论0 收藏0
  • 阿里云MaxCompute被Forrester评为全球云端数据仓库领导者

    ...构佛瑞斯特研究公司(Forrester)发布《2018年一季度云端数据仓库》报告。报告对大数据服务商的主要功能、区域表现、细分市场和典型客户等进行了全面评估,最终AWS、阿里云、谷歌、微软四大巨头杀入全球一线阵营。 参考消...

    jerry 评论0 收藏0
  • 阿里云MaxCompute被Forrester评为全球云端数据仓库领导者

    ...构佛瑞斯特研究公司(Forrester)发布《2018年一季度云端数据仓库》报告。报告对大数据服务商的主要功能、区域表现、细分市场和典型客户等进行了全面评估,最终AWS、阿里云、谷歌、微软四大巨头杀入全球一线阵营。 参考消...

    Sunxb 评论0 收藏0
  • Sybase与美地森携手打造全球领先的云架构数据仓库平台

    大数据时代为数据存储带来压力,越来越多的组织需要在云计算的技术基础上搭建起能够存储大量结构化和非结构化数据的存储平台。云存储应云而生。   所谓云存储,是指通过集群应用、网格技术或分布式文件系统等...

    desdik 评论0 收藏0
  • 原创翻译 | Hadoop和企业信息管理:利用大数据的解决方案

    过去几年,大数据在全球商业环境中的重要性已得到坚定的确认。2017年看起来是 Apache Hadoopimplementation (在开源开发和更多的商业选择方面)在企业层面上,由于企业信息管理(EIM)仍然需要更多改进的大数据解决方案。 ...

    YacaToy 评论0 收藏0
  • 一篇文看懂Hadoop:风雨十年,未来何去何从

    ...态,其中包含在各大发行版中的组件就有25个以上,包括数据存储、执行引擎、编程和数据访问框架等。Hadoop在2.0将资源管理从MapReduce中独立出来变成通用框架后,就从1.0的三层结构演变为了现在的四层架构:底层——存储层,...

    Hanks10100 评论0 收藏0
  • 数据环境下该如何优雅地设计数据分层

    ...几次同样的对话场景:问:你是做什么的?答:最近在搞数据仓库。问:哦,你是传统行业的吧,我是搞大数据的。答:...... 发个牢骚,搞大数据的也得建设数据仓库吧。而且不管是传统行业还是现在的互联网公司,都需要对...

    CHENGKANG 评论0 收藏0
  • [译] 解密 Airbnb 的数据科学部门如何构建知识仓库

    顽疾 Airbnb的数据团队很重要的一个职责就是传播基于数据的决策方法。我们将数据的获取民主化,使得每一个Airbnb的成员都可以量化他们基于数据的决策影响力并且借此洞察用户偏好,提升数据产品的用户体验。最近,我们...

    Taonce 评论0 收藏0
  • Teradata:Hadoop虽大有裨益 但开源市场仍欠稳

    ...户确实将Hadoop提上了议事日程,但如果拥有数十年历史的数据仓库供应商都认为难度很大、客户们往往只会选择放弃。 更重要的是破除炒作带来的误解而非在现实层面作出妥协,Teradata Labs总裁Scott Gnau在最近的一次采访当...

    didikee 评论0 收藏0
  • 【Filecoin源码仓库全解析】第六章:如何单机部署多节点集群及矿池设计思路》

    ...更高的矿工节点。 雪球越滚越大... 越早参与,存储越久数据的矿工节将更有优势,当全网存储量达到一个很大的基数时,新矿工短时间内将难以获得较大的出块可能,将随比特币系统一样,节点矿工将形成马太效应。 5.4 Filecoi...

    BDEEFE 评论0 收藏0
  • TOP100summit:【分享实录】链家网大数据平台体系构建历程

    本篇文章内容来自2016年TOP100summit 链家网大数据部资深研发架构师李小龙的案例分享。编辑:Cynthia 李小龙:链家网大数据部资深研发架构师,负责大数据工具平台化相关的工作。专注于数据仓库、任务流调度、元数据管理、...

    Yu_Huang 评论0 收藏0
  • 青云QingCloud 镜像仓库上线|最强 IaaS 驱动下的完整容器平台

    ...,比如说,容器管理、编排、应用打包、容器间的网络、数据快照等; 其次,当企业想构建一套网络方案,需要精通 Linux 提供的各种高级网络功能,这个技术门槛太高了。特别是对专注于业务开发的 Docker 用户而言,这类操作...

    AlienZHOU 评论0 收藏0
  • Facebook的Hadoop应用与故障转移方案

    在《数据大爆炸 一分钟=60秒=海量数据》一文中,我们曾提到在短短的60秒内,Facebook的用户会分享684478条信息,Like按钮被点击34772次。庞大的业务量时刻考验着Facebook的数据处理能力。我们知道,Facebook使用Hadoop来进行大数据的...

    megatron 评论0 收藏0
  • 数据与Hadoop之间是什么关系

    大数据在近些年来越来越火热,人们在提到大数据遇到了很多相关概念上的问题,比如云计算、 Hadoop等等。那么,大数据是什么、Hadoop是什么,Hadoop和大数据有什么关系呢?大数据概念早在1980年,著名未来学家阿尔文·托夫勒提出的...

    Michael_Lin 评论0 收藏0
  • 6步搭建企业的数据仓库

    ...迎访问网易云社区,了解更多网易技术产品运营经验。 数据仓库作为企业提供决策支持而构建的集成化数据环境,本身并不产生或者消费数据,基本架构包含的是数据流入流出的过程,首先放上一张数据仓库的架构图。数据仓...

    Gemini 评论0 收藏0

推荐文章

相关产品

<