阿里监控平台架构师(职位编号:GP010988)
淘宝(中国)软件有限公司
- 公司规模:5000-10000人
- 公司行业:互联网/电子商务
职位信息
- 发布日期:2014-07-17
- 工作地点:杭州
- 招聘人数:若干
- 工作经验:三年以上
- 学历要求:本科
- 职位月薪:面议
- 职位类别:网站架构设计师
职位描述
挑战
1 高并发,淘宝、天猫双11的高并发众所周知,作为应用系统监控分析的后端工具来讲,要处理的并发大于淘宝+天猫+支付宝的总和。即使一个简单的PV/UV计算,要实时地做数据采集、汇总计算、基于网络部署的数据层聚、数据存储、数据披露等等,每一项都是巨大的挑战。要支撑复杂的业务监控,更是要涉及到复杂的数据计算及分析、规则执行等等。
2 大数据,要支撑数十万计主机及应用实例的数据采集、计算、存储、分析,全网用户的访问记录只是其中一部分而已。要处理这么大的信息量,对存储的选型、数据模型的设计、计算任务的拆解调度等等有苛刻要求,任何一项技术决策会影响整个系统的可扩展性和响应速度。
3 高效稳定,我们的核心能力是要保证线上应用稳定高效的运行,监控作为其中一个重要的工具,自身的稳定及性能优化的挑战比任何一个具体应用都要大。针对业务数据的实时监控,任何一个小的闪失都影响数据的实时性和精确性,可能会给一个金融性质的企业造成巨大的资金损失。在使用的技术或者框架本身有缺陷影响我们的支撑能力时,要首当其冲地做这些技术或者框架的改进。
4 专业知识,做一个监控工具本身可能并不难,熟悉整个系统的运作原理,了解哪些指标对运维是至关重要的,知道每个单元的可监控能力,明确各个监控指标之间的关联关系等等,这些知识才是监控的核心。需要知晓网络架构,协议标准、硬件特性、Linux操作系统、JVM等知识,有些系统需要从源码级别知晓其能力,搜集有价值的监控项,帮助在问题发生时快速定位,或者根据知识做应用部署前的自动化风险识别及运行期的风险预测。要提供有价值的工具,首先要让我们成为使用工具的专家。
1.对技术充满激情,良好的学习能力;
2.JAVA基础扎实,熟悉io、多线程、分布式、缓存、消息等机制;
3.熟悉几个常用的开源软件,对其原理及源码实现有深入理解;
4.对linux操作系统、TCP协议栈、SQL/noSQL技术有深入理解;
5.有大规模高可用性系统设计开发经验;
6.良好的沟通技能,团队协同及推动能力;
7.关注新技术,能够胜任团队的技术辅导、技术方向及选型等角色;
1 高并发,淘宝、天猫双11的高并发众所周知,作为应用系统监控分析的后端工具来讲,要处理的并发大于淘宝+天猫+支付宝的总和。即使一个简单的PV/UV计算,要实时地做数据采集、汇总计算、基于网络部署的数据层聚、数据存储、数据披露等等,每一项都是巨大的挑战。要支撑复杂的业务监控,更是要涉及到复杂的数据计算及分析、规则执行等等。
2 大数据,要支撑数十万计主机及应用实例的数据采集、计算、存储、分析,全网用户的访问记录只是其中一部分而已。要处理这么大的信息量,对存储的选型、数据模型的设计、计算任务的拆解调度等等有苛刻要求,任何一项技术决策会影响整个系统的可扩展性和响应速度。
3 高效稳定,我们的核心能力是要保证线上应用稳定高效的运行,监控作为其中一个重要的工具,自身的稳定及性能优化的挑战比任何一个具体应用都要大。针对业务数据的实时监控,任何一个小的闪失都影响数据的实时性和精确性,可能会给一个金融性质的企业造成巨大的资金损失。在使用的技术或者框架本身有缺陷影响我们的支撑能力时,要首当其冲地做这些技术或者框架的改进。
4 专业知识,做一个监控工具本身可能并不难,熟悉整个系统的运作原理,了解哪些指标对运维是至关重要的,知道每个单元的可监控能力,明确各个监控指标之间的关联关系等等,这些知识才是监控的核心。需要知晓网络架构,协议标准、硬件特性、Linux操作系统、JVM等知识,有些系统需要从源码级别知晓其能力,搜集有价值的监控项,帮助在问题发生时快速定位,或者根据知识做应用部署前的自动化风险识别及运行期的风险预测。要提供有价值的工具,首先要让我们成为使用工具的专家。
1.对技术充满激情,良好的学习能力;
2.JAVA基础扎实,熟悉io、多线程、分布式、缓存、消息等机制;
3.熟悉几个常用的开源软件,对其原理及源码实现有深入理解;
4.对linux操作系统、TCP协议栈、SQL/noSQL技术有深入理解;
5.有大规模高可用性系统设计开发经验;
6.良好的沟通技能,团队协同及推动能力;
7.关注新技术,能够胜任团队的技术辅导、技术方向及选型等角色;
公司介绍
该公司尚未添加公司介绍
联系方式
- 公司地址:地址:span文一西路969号
- 电话:18612531658