-
​用 PySpark ML打造机器学习模型
所属栏目:[大数据] 日期:2022-08-31 热度:189
Spark 是一种专门用于交互式查询、机器学习和实时工作负载的开源框架,而 PySpark 是 Python 使用 Spark 的库。 PySpark 是一种用于大规模执行探索性数据分析、构建机器学习管道以及为数据平台创建 ETL 的出色语言。如果你已经熟悉 Python 和 Pandas 等库,[详细]
-
AI在时尚行业的应用
所属栏目:[大数据] 日期:2022-08-31 热度:156
面对人工智能的冲击,就算是注重手工技艺和创意概念的时尚行业也没能幸免,作为人类最后防线的创意领域已经被打破,而时尚行业的未来也必将和整个社会的进程息息相关。当人工智能踏足时尚圈,自下而上的用户需求数据成为设计和搭配的出发点,时尚潮流的方向[详细]
-
终于有人把Hadoop大数据系统架构讲清楚了
所属栏目:[大数据] 日期:2022-08-25 热度:105
传统的系统已无法处理结构多变的大数据,而高性能硬件和专用服务器价格昂贵且不灵活,Hadoop因此应运而生。Hadoop使用互连的廉价商业硬件,通过数百甚至数千个低成本服务器协同工作,可有效存储和处理大量数据。 1.Hadoop生态体系 Google通过三篇重量级论[详细]
-
交通领域的物联网如何使大数据之于企业产生价值
所属栏目:[大数据] 日期:2022-08-25 热度:63
全球物流市场不断增长,科技正成为发展的主要触发器。 企业正在寻找用于运输的物联网解决方案,以帮助他们提高供应链的可见性、改善物流各个阶段的运营并节省资源。 这可以通过使用物联网设备收集有关物流过程的数据并将其转换为有价值的业务信息来实现。[详细]
-
怎样用好数据科学
所属栏目:[大数据] 日期:2022-08-25 热度:179
很长一段时间以来,数据科学一直被视为科技和商业领域的下一次重大革命。最近几年增加了不少使用数据科学应用的企业。根据Statista的数据,截至2021年,近60%的公司在其团队中拥有至少50名数据科学家。 然而,如果客观地看待,数据科学提供的结果与它的期[详细]
-
浅析大数据的数据灾备建设
所属栏目:[大数据] 日期:2022-08-25 热度:87
大数据时代,数据呈爆炸趋势增长,很多企业都从大数据中获得了利益,推动各自的业务上升了一个台阶。通过大数据技术的完善尤其是大数据和云容器技术相结合,各个企业已经把自己的重要业务迁移到了大数据平台。与此同时企业对数据可靠性和业务连续性保证的[详细]
-
未来已来 Cloudera拥抱混合数据年代
所属栏目:[大数据] 日期:2022-08-25 热度:88
我们生活在一个混合数据的世界中。在过去十年间,世界创建、捕获、复制和使用的结构化数据量已从2011年的不到 1ZB 增长到 2020 年的近 14ZB,这已经很惊人了,但还有另外更巨大的 50ZB数据非结构化数据、云数据和机器数据。 对于Cloudera来说,这是一个回[详细]
-
如何策划数据可视化平台
所属栏目:[大数据] 日期:2022-08-25 热度:191
最近在项目上常常听到这样的话:我想要一个酷炫的数据大屏,设计一定要有科技感,这个可视化设计没有重点每当听到这些需求,作为设计师一般都是欲哭无泪的。到底什么叫酷炫有科技感?客户理解的数据大屏什么样?是数据还是可视化出了问题?? 这篇文章将会[详细]
-
Python实行数据可视化 你会用什么库来做呢
所属栏目:[大数据] 日期:2022-08-25 热度:160
用Python进行数据可视化你会用什么库来做呢? 今天就来和大家分享Python数据可视化库中的一员猛将Altair! 借助Altair,我们可以将更多的精力和时间放在理解数据本身及数据意义上,从复杂的数据可视化过程中解脱出来。 简单来说,Altair是一种可视化语法,[详细]
-
一文看清楚 数据指标体系的几大类别
所属栏目:[大数据] 日期:2022-08-25 热度:69
很多同学问:有没有普遍的、一般的指标体系梳理方法?网上常见的指标体系分享,大多是互联网的AARRR一类,现实中情况却很复杂。普遍的方法当然有,就是基于业务逻辑,梳理指标体系。从本质上看,数据指标体系有4大类型,针对四个不同的业务逻辑。今天来系[详细]
-
两种主流大数据系统架构的差异 终于有人讲明白了
所属栏目:[大数据] 日期:2022-08-25 热度:58
同样都可以处理大规模数据的MPP数据库架构与Hadoop体系架构属于不同的技术体系,二者没有直接的相关性,却常常被放在一起进行比较。特别是在企业数据仓库建设中,MPP架构与Hadoop架构代表两类典型的技术路线选型,事实上,在2015年左右甚至有人认为基于Had[详细]
-
从0到1创建智能灰度数据体系 以vivo游戏中心为例
所属栏目:[大数据] 日期:2022-08-25 热度:73
本文介绍了vivo游戏中心在灰度数据分析体系上的实践经验,从实验思想-数学方法-数据模型-产品方案四个层面提供了一套较为完整的智能灰度数据解决方案,以保障版本评估的科学性、项目进度以及灰度验证环节的快速闭环。该方案的亮点在于,指标异动根因分析方[详细]
-
几个好使常见的大数据分析模型
所属栏目:[大数据] 日期:2022-08-24 热度:194
互联网打工人来说,数据分析是一项必备技能!花了这么多钱,营销效果到底达到没有?什么样的功能才能真正戳中用户的痛点? 1. 事件分析 干啥的:研究某行为事件的发生对企业组织价值的影响以及影响程度。 怎么用:追踪或记录的用户行为或业务过程,如用户[详细]
-
大数据项目可能出错的几种方案
所属栏目:[大数据] 日期:2022-08-24 热度:86
大数据项目的低成功率是过去10年中一个持续存在的问题,与之类似的是:人工智能项目中也出现了相同类型的问题。虽然100%的成功率不是一个可以实现的目标,但用户可以进行一些调整以从数据投资中获得更多收益。 一个重要原因是缺乏数据集中化,这抑制了公司[详细]
-
MPP与Hadoop 两种主流大数据系统架构有什么差别
所属栏目:[大数据] 日期:2022-08-24 热度:56
同样都可以处理大规模数据的MPP数据库架构与Hadoop体系架构属于不同的技术体系,二者没有直接的相关性,却常常被放在一起进行比较。 1. 设计思路对比 两类系统运行的硬件架构是相同的,都是普通服务器组成的集群,但从资源管理角度来说,它们并行化软件实[详细]
-
为什么大热的数据可视化行业 我不提议轻易入行
所属栏目:[大数据] 日期:2022-08-24 热度:85
这两年互联网行业在 C 端市场上的增长已经不足以吸引大众和投资者的视线,B 端作为一个新的热点开始被追捧。 各种让人眼花缭乱的图例和技术应用解说,很容易让我们产生未来已经加速向我们走来的 幻觉,此时不抓紧时代的机遇投身数字化界面的设计,更待何时[详细]
-
数据指标 VS 标签体系 到底有啥区别 总算讲清楚了
所属栏目:[大数据] 日期:2022-08-24 热度:179
实际上,标签和指标一样,是数据分析的左膀右臂,两者同样重要。实际上,很多人分析不深入,就是因为缺少对标签的应用。今天系统的讲解下。 那如果做得好的话,标签能发挥啥作用呢? 一:查询信息。这是最普遍的场景了。大量的一线工作人员会有需求,比如[详细]
-
为什么完善数据供应链是一种责任
所属栏目:[大数据] 日期:2022-08-24 热度:77
如今,企业拥有比以往任何时候都要多的数据,数据架构师、分析师和数据科学家在所有业务职能部门中变得越来越普遍。然而,随着企业招募经验丰富的分析师以利用数据做出更好的决策,他们往往无法改善数据供应链和由此产生的数据质量。如果没有可靠的数据供[详细]
-
2022大数据十大关键词 重磅公布
所属栏目:[大数据] 日期:2022-08-24 热度:75
大数据几大关键词是基于我们长期对于产业的研究观察,以及与一线专家的研讨交流完成。如图所示,本年度十大关键词涉及数据从计算机语言到成为生产要素的全生命周期,包括 【数据资源化】,即数据从计算机语言到成为可被人类识别的信息 【数据治理】,即将[详细]
-
数据解析如何赋能销售
所属栏目:[大数据] 日期:2022-08-24 热度:107
数据助力业务大号口喊了很多年,可一提到数据分析,人们习惯性的依然讲的是:excel,python,sql,依然是数据清洗、数据计算、可视化。到底业务部门需要啥样的数据分析,很少有人认真讨论。今天我们就拿销售举个例子,具体看看到底啥样的数据分析有用。 1.[详细]
-
总做描述性统计 深入的数据分析到底咋办
所属栏目:[大数据] 日期:2022-08-24 热度:92
经常有同学抱怨:感觉平时做的都是描述性统计,同比、环比,深入的数据分析到底怎么做?今天系统地讲解一下。 举个简单的例子,让分析:为啥业绩下降了。很多同学的做法,就是拿本月和上月做对比,然后分产品、地区、分公司等维度做交叉。最后发现:A产品[详细]
-
怎样改善数据供应链的成果
所属栏目:[大数据] 日期:2022-08-24 热度:124
如今,企业拥有比以往任何时候都要多的数据,数据架构师、分析师和数据科学家在所有业务职能部门中变得越来越普遍。然而,随着企业招募经验丰富的分析师以利用数据做出更好的决策,他们往往无法改善数据供应链和由此产生的数据质量。如果没有可靠的数据供[详细]
-
五个时间序列预测的深度学习模型对比概括
所属栏目:[大数据] 日期:2022-07-30 热度:127
Makridakis M-Competitions系列(分别称为M4和M5)分别在2018年和2020年举办(M6也在今年举办了)。对于那些不了解的人来说,m系列得比赛可以被认为是时间序列生态系统的一种现有状态的总结,为当前得预测的理论和实践提供了经验和客观的证据。 2018年M4的结[详细]
-
数智时代的绩效管理:现实和前景
所属栏目:[大数据] 日期:2022-07-30 热度:189
数智化的绩效管理变革 数智目标设定 绩效计划连接公司繁荣战略与运营,作为绩效管理的第一个环节,它是绩效管理成功实施的关键因素。组织通过数智技术收集的大量数据可用于设定员工的目标,数智目标设定包括两个方面:算法任务分配和绩效目标设定。 算法任务[详细]
-
人工智能对太阳能和风能的好处存在吗?
所属栏目:[大数据] 日期:2022-07-30 热度:86
太阳能和风力发电正在蓬勃发展,但世界向可再生电力的过渡仍然太慢,无法快速实现气候目标。由于许多原因,在全球范围内利用风能和太阳能说起来容易做起来难。一是风力涡轮机和太阳能电池板是复杂、挑剔的工程系统,很容易发生故障。频繁的故障会降低电力输[详细]