炼数成金 大数据运维
订阅

运维

NoOps:IT完全自动化运营之路
NoOps:IT完全自动化运营之路
自动化领域的IT领导者正在关注和探索无人值守运营环境的可能性。但是DevOps的这种演变实现起来绝非易事。自动化已经成为一种在简化IT运营中广泛使用的工具,Mindtree就是这样一个组织,它从基础设施中移除手动流程, ...
携程框架团队对于应用监控系统的探索与思考
携程框架团队对于应用监控系统的探索与思考
随着市场环境的变化以及国际化的进程,企业的各种对内、对外需求也日益增长。服务化的架构以及容器化的应用加速了各种功能、产品的迭代与更新。随之而来,我们也面临着一个不断膨胀,日渐复杂的系统。复杂度的成倍增 ...
备战618,京东如何保障系统稳定性?
备战618,京东如何保障系统稳定性?
每年 618 的大促都是一场技术团队大练兵的时候。作为技术研发人员,在这场战斗中,加深了对线上系统的敬畏之心,通过系统的备战,在技术上也得到了提升。大战在即,如何保障系统稳定,我们的备战思路是什么?首先确 ...
运维十年回顾:当前很多新技术的本质都是在解决运维问题
运维十年回顾:当前很多新技术的本质都是在解决运维问题
第一个阶段,人工作坊阶段,也就是我们遇到的所有运维问题,基本靠人工操作完成。这种情况下,系统规模不大,遇到的问题相对简单,大多集中在硬件、网络和系统层面,所以有一定操作系统或网络维护经验的人就可以搞定 ...
一文梳理 RedHat 和 CentOS 运维中的网络知识
一文梳理 RedHat 和 CentOS 运维中的网络知识
在很多公司,岗位职责都是很明确的,专职转岗,每人或者每组负责一块业务。系统运维岗基本上在IT架构上相对偏后一些,该岗位和网络管理岗基本上是平行的。因为今天咱们说的是系统运维方面网络方面的事情,或多或少都 ...
数据库智能运维探索与实践
数据库智能运维探索与实践
近些年,传统的数据库运维方式已经越来越难于满足业务方对数据库的稳定性、可用性、灵活性的要求。随着数据库规模急速扩大,各种NewSQL系统上线使用,运维逐渐跟不上业务发展,各种矛盾暴露的更加明显。在业务的驱动 ...
留给传统 DBA 的时间不多了?看饿了么如何构建数据库平台自动化
留给传统 DBA 的时间不多了?看饿了么如何构建数据库平台自动化
从时间轴上看我们每年会有一个比较大的前进,我们从人肉->工具化->平台化->自助化只用了两年半时间完成全部迭代,其中平台化&自助化+数据库多活改造我们一口气用了8个月的时间完成全部开发及改造工作。在完 ...
监控系统的前世今生
监控系统的前世今生
随着互联网的发展,监控系统也得到了发展。从最早期的网络监控、系统监控,发展到现在的业务监控、日志监控、性能监控、代码监控、全链路监控等,并在监控数据的基础上,逐步发展出了APM(应用性能管理)、AIOps(智 ...
阿里云故障「惊魂」1小时:难道我们是那0.1%?
阿里云故障「惊魂」1小时:难道我们是那0.1%?
6月27日晚,北京国贸写字楼2座灯火通明。林晓宇疾步往返于运维部与研发部的走廊上,表情有些凝重。  一场因阿里云故障引发的突发事件,导致他所在的互联网金融公司几近瘫痪。在运维部工作近一年,林晓宇首次受到公 ...
惊爆!一行正则表达式引发的 CPU 惨案
惊爆!一行正则表达式引发的 CPU 惨案
正则表达式是程序员经常使用的工具之一。本文作者通过一个正则表达式的陷阱,先深入剖析了出现问题的原因,后给出怎么处理这类问题的方法。最后还给出了一些检测常见正则表达式问题的工具,十分值得深入研究。前几天 ...
运维定位服务故障时,前5分钟都在忙啥?
运维定位服务故障时,前5分钟都在忙啥?
遇到服务器故障,问题出现的原因很少可以一下就想到。我们基本上都会从以下步骤入手,这些也是绝大多数运维工程师在定位故障时前几分钟的主要排查点:一、尽可能搞清楚问题的前因后果,不要一下子就扎到服务器前面, ...
AIOps在携程的践行
AIOps在携程的践行
随着人工智能时代的到来,携程生产环境运维进入了新的运维时代——AIOps。通过两年多时间的技术投入与实践,AIOps在效率提升、可用性保障、成本优化等运维场景取得了显著的成果。通常人工智能技术分为“弱人工智能” ...
一些小团队的自动化运维实践经验
一些小团队的自动化运维实践经验
应用系统的编译打包基本在程序员自己的电脑上。分支管理也清一色的 dev 分支开发,测试通过后,再合并到 master 分支。生产环境的应用配置要登录上具体的机器看才知道,更不用说配置中心及配置版本化了。对了,连基 ...
实践解析:大众点评账号业务高可用进阶之路
实践解析:大众点评账号业务高可用进阶之路
在任何一家互联网公司,不管其主营业务是什么,都会有一套自己的账号体系。账号既是公司所有业务发展留下的最宝贵资产,它可以用来衡量业务指标,例如日活、月活、留存等,同时也给不同业务线提供了大量潜在用户,业 ...
解密百度智能运维工程的架构建设
解密百度智能运维工程的架构建设
百度云智能运维团队在运维工具和平台研发方向历史悠久,支撑了全百度数十万规模服务器上的运维服务,所提供的服务包括服务管理、资源定位、监控、部署、分布式任务调度等等。最近几年,团队着力于发展智能化运维能力 ...
12下一页

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2019-8-23 04:12 , Processed in 0.092416 second(s), 16 queries .