• 真的缺数据科学家吗? 如今到底有多少数据科学家?
    真的缺数据科学家吗? 如今到底有多少数据科学家?   2011年,麦肯锡发布的《大数据》报告称,“仅美国就面临着14万至19万名具有分析专长的人才短缺,以及150万名具备理解并基于大数据分析做出决策能力的管理人员和分析师... 10-23    
  • 从面试官的角度谈谈大数据面试
    从面试官的角度谈谈大数据面试 关于传授面试经验的文章太多了,眼花缭乱,我这里就不谈了,点进来想获取几吨面试学习资料的同学,抱歉让你失望了。(我是真的找不到那么多资料...)。所以,今天我们只聊面试官。... 10-23    
  • 为数据而生:大数据创新实践八步骤
    为数据而生:大数据创新实践八步骤 成为大数据企业   什么样的企业可以称得上是大数据企业呢?恐怕没有人能够给出一个完美的答案。但是,直观地,我们可能觉得Google更像是一个大数据的企业,阿里巴巴也像是... 10-22    
  • 没有完美的数据插补法,只有最适合的
    没有完美的数据插补法,只有最适合的   数据缺失是数据科学家在处理数据时经常遇到的问题,本文作者基于不同的情境提供了相应的数据插补解决办法。没有完美的数据插补法,但总有一款更适合当下情况。   我... 10-22    
  • 5个原因告诉你:为什么在成为数据科学家之前,“逻辑回归”是第一个需要学习的
    5个原因告诉你:为什么在成为数据科学家之前,“逻辑回归”是第一个需要学习的 在几年之前,我踏进了数据科学的大门。之前还是软件工程师的时候,我是最先开始在网上自学的(在开始我的硕士学位之前)。我记得当我搜集网上资源的时候,我看见的只有玲琅满目的算... 10-22    
  • 大数据的阴暗面
    大数据的阴暗面 数据无疑是企业创新的关键,为企业做出明智商业决策提供了巨大的机会。但是,当企业采用大数据时,他们也应该考虑大数据的阴暗面。   大数据具有巨大力量来改变企业及其经营... 10-19    
  • 大数据和人工智能的未来可以归结为一件事
    大数据和人工智能的未来可以归结为一件事   就大数据、分析和人工智能而言,价值不是来自收集数据(甚至也不是来自于从中获取的一些洞察),价值来只有一个来源:行动。   我在90年代中期开办了第一家公司,那时我做了... 10-19    
  • 大数据时代如何保护隐私
    大数据时代如何保护隐私   在这个互联网技术迅猛发展的年代,你会发现个人隐私随时会被“侵犯”。前不久还爆出一个APP如果你一不小心下载了,你的家庭生活就有可能随时被它的平台“... 10-19    
  • 掌握这25条小贴士,快速提升数据可视化能力!
    掌握这25条小贴士,快速提升数据可视化能力! 可视化不是单纯的数据展示,其真正价值是设计出可以被读者轻松理解的数据展示。设计过程中的每一个选择,最终都应落地于读者的体验,而非设计者个人。   本文提到了一些常... 10-18    
  • 张峰:大数据进入加速期,工信部将四方面推进国家大数据战略
    张峰:大数据进入加速期,工信部将四方面推进国家大数据战略 在10月18日召开的"2018第五届中国国际大数据大会"上,工业和信息化部党组成员、总工程师张峰表示,我国大数据进入加速期,未来将通过四方面工作,扎实推进国家大数据战略,全面提升我... 10-18    
  • Hadoop,Zookeeper这些名字都是怎么来的呢?
    Hadoop,Zookeeper这些名字都是怎么来的呢? 首先我们要明白,Apache 是一个 http 服务器,而我们熟悉的另一种说法Apache Hadoop中的 Apache 则指的是 Apache 软件基金会。Apache是 Apache 软件基金会中的一个项目。  ... 10-18    
  • 5个系统管理员常用的警报和可视化工具
    5个系统管理员常用的警报和可视化工具 这些开源工具帮助用户了解系统行为和输出,并为潜在问题提供警报。   你可能使用警报和可视化工具,为什么我要将它们作为可观察性工具进行讨论,特别是某些系统将可视化作为... 10-17    
  • 分享 : 数据可视化专家的七个秘密
    分享 : 数据可视化专家的七个秘密   数据可视化的道路上充满了不可见的陷阱和迷宫,最近ClearStory Data的两位数据可视化开发人员分享了他们总结出来的数据可视化开发的7个不宣之秘,普通开发者了解这些方法... 10-17    
  • 比拼生态和未来,Spark和Flink哪家强?
    比拼生态和未来,Spark和Flink哪家强? 概 况   Spark 是最活跃的 Apache 项目之一。从 2014 年左右开始得到广泛关注。Spark 的开源社区一度达到上千的活跃贡献者。最主要推动者是 Databricks,由最初的 Spark... 10-17    
  • 如何将传统关系数据库的数据导入Hadoop?
    如何将传统关系数据库的数据导入Hadoop?   大多数企业的关键数据存在于OLTP数据库中,存储在这些数据库中的数据包含有关用户,产品和其他有用信息。如果要分析此数据,传统方法是定期将该数据复制到OLAP数据仓库中。... 10-16    
  • Kafka集群内复制功能深入剖析
    Kafka集群内复制功能深入剖析 Kafka是一个分布式发布订阅消息系统。由LinkedIn开发并已经在2011年7月成为apache顶级项目。kafka在LinkedIn, Twitte等许多公司都得到广泛使用,主要用于:日志聚合,消息队列,实... 10-16    
  • 谁“杀死了”大数据创业者
    谁“杀死了”大数据创业者   又一个大洗牌的行业。   “这两年在大数据领域,纯粹讲概念没有技术的公司都死完了。融资过很多的钱的企业虽然还存活着,但大多过的也很难受。”一位大数... 10-16    
  • 各地机构改革方案出台 大数据局、新“大部制”部门亮相
    各地机构改革方案出台 大数据局、新“大部制”部门亮相 近期多地机构编制方案已经通过,各地除了根据中央部委机构改革成立新的机构外,还根据自己的实际情况,成立了大量新的机构,如大数据局、金融监管局等。   随着中央部委机构改... 10-16    
  • 大数据干货 | 论Spark高手是怎样炼成的
    大数据干货 | 论Spark高手是怎样炼成的 大数据的处理怎么能变快一点,答案是请用spark,因为它是基于内存的,可以有效减少数据的落地次数。Spark性能超过Hadoop百倍,从多迭代批量处理出发,兼收并蓄数据仓库、流处理和图计... 10-15    
  • 实践 | 从美国警务管理大数据实践看国内下一个政务大数据风口
    实践 | 从美国警务管理大数据实践看国内下一个政务大数据风口   最近几年,在美国,警务管理的模式随着大数据的出现正在发生革命性的变化。警务部门一方面面对着不断上升的犯罪种类和规模,另一方面又面对着由于宏观经济的下行带来的预算... 10-15