上海蒙帕智能科技股份有限公司 - 保障智能巡检机器人中数据监控
公司简介
上海蒙帕智能科技股份有限公司(以下简称:蒙帕)成立于2015年6月,总部设于上海,注册资本5940万元,目前在全国设立多个分支机构,包括北京、西安、深圳、沈阳、重庆、武汉、成都、合肥、大连等。蒙帕是一家从事IT系统集成及智能运维服务的高新技术企业,拥有专业的自主研发团队,公司软件开发能力已获得国际CMMI3级评估标准。
公司拥有员工170余人,业务范围覆盖全国,主要客户为中国中铁、中国日报社、中国上海工程局、三星集团、太平洋保险集团、比亚迪股份等大型国企外企公司。2020年公司为中国中铁、中国日报社等主要用户成功搭建蒙帕智能运维综合管控平台,投入蒙帕智能运维机器人,实现了无人化运维,客户数据智能化分析,提高了IT支撑的质量,保障用户业务运行稳定。同时,蒙帕投身于信创产业建设,成为信创委员会会员单位、中国科技产业促进委员会会员单位,致力于以创新的意识,探索未知领域,勇做行业先锋,向更高的目标挑战,是运维行业中的标杆企业。公司愿景:采用日新月异的新技术,特别是人工智能技术,专心为客户提供服务。
项目背景
随着信息化的发展,IT信息化系统从原来的信息网络系统、单一业务系统,发展为拥有基础平台、应用平台、应用软件组成的以业务为中心的综合业务信息系统,成为企业业务发展的核心组成部分。
目前云计算、大数据、软件定义存储等技术已经趋于成熟,尤其云计算的发展,促使大量的企业业务上云;技术的快速发展以及结合成本考虑,小型机加传统存储的IT基础设施架构已经不适合现在的新型业务。当前企业IT架构的一个主要特点就是异构性,一个业务系统有多个厂商产品并存已是常态,并且近几年企业数字化的推广,数据量呈爆发时增长,企业运维的体系结构已发生巨大转变,促进运维人员的技能转型需要具备更为复合性的能力,同时需要更完善、更智能、更多元化的运维平台做支撑。
在IT基础设施架构转型的趋势下,为支撑业务敏捷、稳定、创新发展,IT运维的重要性已日益凸显。伴随着IT运维管理目标、管理范围、管理深度的转变,IT运维平台建设呈现管理一体化、操作自动化、分析智能化、业务可视化的关键趋势转变。
智能运维AIOps(Algorithmic IT Operations)是建立在运维基础上,利用大数据分析、机器学习等人工智能技术来自动化管理运维技术,以更快、更准确、更高效地完成运维工作的技术体系。
智能运维面临数据分析挑战
随着企业业务数据的爆发式增长,大多数企业目前的运维体系结构处于转变的过程中,随之而来的是各种问题的爆发。当前IT运维主要有以下特点:
1、发生的数据量大
机房设计的设备种类,配件监控节点数量庞大,往往需要监控参数量也是十分庞大,均是上万;因此包含了大量的图像,温湿度数据的精准记录。
2、大量的无效告警,无法快速故障定位,查找根因困难
目前IT 运维需要管理大量的告警,极大地分散了企业的注意力,消耗运维人员大量的时间和创新力。对于包括多个实体对象(机器、数据库、中间件等),以及多个业务系统关联的环境发生异常时,仅找到异常点就需要很长时间。当设备故障时,很难快速查找根因,甚至无法查找到根因。
3、信息传递滞后
业务运行缓慢,完全依赖人工巡检,运维工程师人数有限,昼夜需要值班,需要保证高可用的数据敏感度,巡检希望能通过机器人的智能巡检及各个敏感元件,能够自动获取机房内部的运行环境,监管对象包括中铁云系统、机房空调、UPS等设备,获取的数据能够及时的通过,机器人技术图像识别等技术,辅助运维人员完成机房设备日常巡视、红外测温、操作前后设备运行状态的检测诊断,因此信息能够传递的更加及时。而人工巡检依赖个人经验过多,因此容易造成数据遗漏、导致处理延误。
4、运维平台多,但无法有效的联动
随着企业的发展,IT部门陆陆续续增加了多个运维平台,但是各运维平台的数据是不能互通的,各平台的运维数据形成了孤岛。甚至各厂家开发产品的角度和目的不同,使得产品具有多样性和复杂性,给运维人员增加了工作复杂度。
5、无法做到实时数据预警
无法做到提前预警,无法提早发现故障隐患,报警、报事响应不够及时,业务环节流转不流畅。及早的将机器人各设备采集来的信息,进行分析处理,对异常数据以及时的,可触达的方式进行数据预警,且预警的形式多样,除了常见的数据可视化预警外,也需要主动触发预警,并通知相关联系人。
6、数据整合分析困难
无法基于历史数据,决策缺乏精确的数据支撑,机器人巡检会产生大量的巡检信息,包含不同的设备、节点、参数、图片等信息,而这些信息因为数据量大,因此需要基于历史数据分析后,产生对未来有利的决策,是十分困难的。
7、无法快速的产出报告
无法建立完善的日常巡检机制,并出具详细的巡检报告用于日常的信息存档,以及历史数据的管理。
运维行业智能化解决方案
系统需求
机器人各元件收集的环境信息,设备运转信息等存储到实体数据库中,希望能够基于原始的数据分析,及时产出数据报告存档或预告,并在报告中形成数据可视化预警,构造实时的数据监控大屏。
因为每个终端客户,有自己的运维标准,因此产出的巡检报告和数据分析都是有各家自定义的标准要求的。因此客户期望在报告制作上、数据仪表板中能够获得成熟的交互体验,界面清晰简洁、易于上手。同时,客户要求本系统在数据加载、统计计算、制表制图等功能保证数据精确及高性能,使得巡检信息存档并呈现时,保证系统实施运行稳定。同时,该系统需要支持数据快速录入、数据仓库的统一存储,数据的抽取、融合,数据的二次加工利用,形成智能分析报表生成、报告,综合监控管理平台仪表板等。
项目技术框架
蒙帕智能运维综合管控平台主要分为“机器人巡检、IT信息状态监控、IT运维流程管理、运维故障处理、统一大屏展示”五大部分。整个平台共分为9个模块。
机器人巡检结合多种先进传感器、多种智能识别算法,对机房动力环境、设备运行状态、线路进行全方位精细化感知、巡检;包括:机器人远程操作、状态指示灯识别、二维码资产识别、动环数据识别、有害气体识别、声纹识别、人脸识别、异物识别等;
信息状态监控底层基础平台主要通过综合监控模块、日志大数据模块中的信息采部分实现对底层数据的采集、存储、分析等工作,为上层监控及流程系统提供基础数据;IT运行监控主要完成对基础设施故障、性能、配置等方面的全面监控管理,实现主动式的IT管理;
CMDB配置管理系统做作为运维系统平台的基础组件,通过模型的自由组合,实现信息资产架构的灵活配置和存储管理,为监控、服务管理、自动化提供一致的配置管理服务。
IT运维流程服务主要根据IT服务管理的国际标准ISO2000,并结合ITIL最佳实践,梳理出了事件管理、问题管理、变更管理等运维流程,实现对日常运维工作的流程化、规范化管理,提升IT服务的质量。
数据分析模块支持多种数据采集,使用syslog、SNMP、agent、script等工具,可采集服务器、网络设备、操作系统、应用系统等设备的文本输出、二进制日志等数据;提供多种标准深度学习算法,并支持在界面交互平台上探索深度学习算法的数据运用。按照数值预测、分类预测、离群检测、聚类分析、时序预测五个场景分类,提供不同的模型测试效果评价和可视化。
大屏展示和报表模块对机器人各种状态、业务监控信息进行汇总、分析展示以及预测。
项目成果
整个项目的数据呈现和分析,采用Wyn商业智能来解决,让更多的开发资源主要集中到核心业务的开发,如图像识别,巡检路线规划算法研究等,因此数据呈现的分析,交给成熟的商业智能软件来对接。
Wyn 商业智能能够无缝对接机器人传递的数据信息,并通过可视化的在线设计器进行数据报告拖拽设计,文档管理等。
- 通过BI工具提供的在线报表设计平台,可基于不同客户的需求,快速设计实现数据报告,巡检报告,统计报告,及时实现各项运维指标的汇总分析统计
(告警报表)
(资产统计报表)
(工单统计报表)
- 本项目中的数据可视化平台度交互与自由数据探索的管理看板为基础,辅助决策的制定通过本项目的可视化大屏,对客户企业信息进行展示
- 智能运维
智能运维的数据分析能力增强的项目价值
- 隐患及时处理分析,第一时间通知运维管理人员
- 移动端、PC端实时跟踪,巡检全过程可视化
- 数据分析报表整理,自动生成巡检报告
Wyn 为智慧运维带来的价值
蒙帕智能巡检机器人通过高度智能的机器人技术和图像识别等技术,辅助运维人员完成机房设备日常巡视、红外测温、操作前后设备运行状态的检测诊断,实现设备区域全覆盖巡视,具有安防巡检、环境监测、烟雾感应等多种功能,提高设备巡检的工作效率和质量,缓解运维值班人员力量薄弱的问题,提升工作效率。“使用Wyn商业智能软件能够解决我们需要的数据分析和可视化展示的主要需求,让我们将主要的研发资源集中在核心的功能开发中,实现全方面的运维管理,对我们推出智能巡检机器人解决了很重要的一个基础但又核心的功能。我们也将更深入的引用到我们项目中”。上海蒙帕技术经理赵宁介绍到。