我并不是“一个人在战斗”:这是工业大数据开拓者们的故事

  • 时间:
  • 浏览:0
  • 来源:湖北快3平台-吉林快3网投平台_极速快3投注平台

2019年7月22-23日,由工业和信息化部指导,中国信息通信研究院主办的第三届“中国工业大数据创新竞赛”(以下简称为“竞赛”)决赛现场答辩及颁奖仪式在北京辽宁大厦落下帷幕。作为首个由政府主管部门指导的工业

2019年7月22-23日,由工业和信息化部指导,中国信息通信研究院主办的第三届“中国工业大数据创新竞赛”(以下简称为“竞赛”)决赛现场答辩及颁奖仪式在北京辽宁大厦落下帷幕。作为首个由政府主管部门指导的工业大数据领域的权威性全国赛事,竞赛已累计吸引产学研各界超过40000人参赛,开发出或多或少聚焦行业细分领域的算法模型,外理诸多传统工业领域中的“老大难”问题报告 报告 。此次,InfoQ 专访第三届工业大数据竞赛冠军团队胡翔,以及来自首尔大学的国际团队 tea ,深入解读在工业大数据与智能制造领域中这群开拓者的故事。

我并还会 “有有一自己在战斗”

作为决赛中唯一的自己参赛者,当提起“以一敌百”取得冠军的荣耀时刻时,胡翔调侃道,“实际上我并还会 ‘有有一自己在战斗’。”

面对着竞赛数十只支多人队伍同场竞技,胡翔表示单人参赛既有优势又有劣势。其中,优势在于自己对比赛工作的安排更加自由灵活,并肩也会更加专注,对于每有有另另一个想法都能亲自尝试与验证,这使得自己对问题报告 报告 的理解能更加的透彻、深入。

或多或少,“人多力量大”这句老话也确有道理,单人参赛相比于多人团队,时要去做更多的分析工作,也更加有压力。毕竟自己的理解能力比较单一,缺陷不同思路的碰撞,思路会更容易陷入壁垒。“但很幸运的是在因联科技,我身边的同事给了我可是我帮助,你们 对这一问题报告 报告 的理解和思路给了我可是我启发,实际上我并还会 ‘有有一自己在战斗’,在这里向你们 表示感谢。”

2018 年,胡翔硕士毕业于西安交通大学机械工程学院,入职于西安因联信息科技,正式成为了一名工业算法工程师。持续关注工业大数据相关信息的他,在看后第三届工业大数据竞赛报名的信息后,毅然决定“单枪匹马大练兵”。

对于“练兵”的含义,胡翔笑着说:“练兵有两层含义,一是为了锻炼自己外理工业预测性维护问题报告 报告 的能力。二是在工业预测性维护领域工作一年多后,以比赛这一形式去外理实际问题报告 报告 ,对于自我业务能力的提升,是有有另另一个非常好的或多或少。毕竟比赛的水平是非常高的,还能认识非常多优秀的同行。”

第三届工业大数据创新竞赛冠军 胡 翔

大概的解题思路是外理问题报告 报告 的“灵魂”所在

工业大数据创新竞赛自 2017 年首届举办以来,每一届竞赛都为参赛者提供着基于真实工业场景的数据资源,并为工业大数据领域的相关研究人员和创业者们提供了成果转移转化的交流平台。

“实际上本次竞赛的数据,均来源于沈鼓大型高速旋转机组实际运行中的真实数据,故障案例非常宝贵,”胡翔对记者说道。据了解,胡翔的工作主要集中在振动淬硬层 和加淬硬层 数据的分析上,事先从未获取过那末絮状的大机组振动位移数据进行分析,当记者询问胡翔拿到赛题与数据后的第一反映,胡翔表示“十分惊喜”。

早在 2019 大数据产业峰会,中国通信研究院就发布了首道主赛区赛题——由沈阳鼓风机集团测控技术有限公司提供的《大型旋转机组转子部件脱落故障预测》。但看后赛题后的胡翔,并未着急着手“解题”,可是我我先选用了有有另另一个大概的解题思路后,再进行攻克。

“我自己认为解题思路实际是外理问题报告 报告 的“灵魂”所在。不论是在这次的比赛中还是日常工作中,所有问题报告 报告 的外理还会 依赖于正确的解题思路。”胡翔总结道,那末在深入理解赛题目标和数据的基础上,才能选用有有另另一个大概的解题思路,大概的解题思路会对数据分析和底部形态提取提供非常好的方向。

比如对于工业领域的数据挖掘比赛,可是我选手一开始英语 就确立的是纯数据的分析和挖掘,很少结合机理分析,仅仅是提取了数据各个统计底部形态,或多或少使用了多个模型对结果进行融合。人太好这也许能得到非常好的结果,但这一模型并那末“洞察力”,首先底部形态对于模型结果的解释力无须强,其次这一模型那末与人建立信任,最终人太好训练出有有另另一个准确率为 99% 的模型,但却难以成功在工业实际场景中落地实践。

打破专家定论——新措施外理老问题报告 报告

本次竞赛赛题《大型旋转机组转子部件脱落故障预测》属于工业领域典型的异常检测和故障诊断问题报告 报告 。旋转类机械设备的故障诊断问题报告 报告 在实际的工业场景中非常常见,转子部件脱落更是有有另另一个老问题报告 报告 。

据了解,比赛数据提供方沈鼓负责人曾在阿尔斯通的事先就遇到过这一问题报告 报告 ,并就该问题报告 报告 与欧美专家进行讨论,当时的结论是不或多或少通过传感器的信号预测出故障。但让我惊喜的是,在比赛中非常多优秀的选手和外理方案,用不同的措施实现转子部件脱落的故障预测,打破了当时专家的定论。其中最让在场专家评审印象深刻的要属冠军团队胡翔的外理方案。

要说胡翔的外理方案,重中之重可是我我在拿到赛题数据后,对原始工业数据进行了包括数据的整合和数据的可视化的预外理。或多或少工业数据的繁复性,数据集处在数据测点名称与测点数据不一致的问题报告 报告 ,可是我第一步他先对数据进行了标准化整理,将测点名称标准化;第二步是对振动位移数据进行可视化分析,考虑到大机组的振动采样底部形态,以及典型的位移振动分析措施特点,通过总采样点与转子旋转周数相除,得到了采样频率为每转 32 点(等淬硬层 采样)。

在获取采样频率后,利用 FFT 变换获取位移振动阶次谱,并观察故障样本和正常样本阶次谱的区别差异,为底部形态提取提供方向。竞赛中,胡翔在阶次谱中提取了 1 倍转频,2 倍转频,3 倍转频等底部形态,并观察那些底部形态在有故障机组和无故障机组中历史趋势,进而选用有效底部形态。并肩根据转子 X 向和 Y 向位移,合成轴心轨迹,发现无故障机组的轴心轨迹在各个时段变几乎那末较大变化(如图 1),而转子部件脱落故障的机组的轴心轨迹在各个时段经历较大变化(如图 2)。

图 1 无故障机组各时段典型轴心轨迹

图 2 故障机组各时段典型轴心轨迹

此后,胡翔别出心裁地把赛题拆解为“转子部件有无脱落”与“脱落故障征兆淬硬层 识别”有有另另一个累积,并通过外理二分类问题报告 报告 与分类概率大小排序问题报告 报告 ,分别外理赛题的两大难点。

其中,外理二分类问题报告 报告 所面临的挑战在于数据集的划分,如保选用训练数据集,对结果的影响非常之大。或多或少理论上转子部件脱落故障征兆在最接近故障处在时刻表现最强,最接近故障时间的数据与实际故障数据也是最之类的,可是我胡翔在解题中选用了最接近故障时间的数据作为二分类的正例数据进行训练。

在分类概率大小排序问题报告 报告 中,最大的挑战莫过于如保筛选底部形态,或多或少底部形态选用关系到模型的性能结果和泛化能力。考虑到赛题目标是区分故障征兆淬硬层 ,对于机械部件故障来说,越接近故障处在时刻,征兆的表现也就越强,或多或少底部形态若是与故障时间呈现较强的单调性,它能区分故障的能力也就越强,也越能区分故障处在哪个阶段。综合上述分析,选用故障数据中单调性更强的底部形态进行建模和预测为最佳外理方案。最终都取得了比较好的结果,胡翔的那些思路和方案在答辩中也得到了多位评委的认可和赞许。

但胡翔也表示他的算法模型还有或多或少缺陷时要改进与完善,算法模型的精度上还时要提升,以满足工业应用的更高要求。算法模型也时要考虑除“转子部件脱落故障”之外的其余故障对算法模型的影响,那末外理了这一关键问题报告 报告 ,算法模型才有或多或少在工业实际中得到应用。

全球参赛选手同台竞技,各领风骚

第三届工业大数据创新竞赛已顺利落下帷幕。但值得注意的是,本届竞赛可谓是一场真正意义上的全球竞技,中国信息通信研究院作为全球工业大数据领域顶尖活动—— PHM 亚太学术论坛(www.phmap.cn)主办方之一,赛题还会 全球参赛选手和国内参赛者同台 PK,而来自首尔大学的参赛团队“ tea ”更是取得了第三名的好成绩。

tea 小组是由来自首尔国立大学机械工程系的研究生 Yongjin Shin、Jongmin Park 与 Myungyon Kim 并肩组成。在接受记者采访时,tea 小组的成员们谈起这段参赛经历时,感叹道:”Since we are students in the lab, we often use experimental data or refined data. However, it was a good experience to analyze and build the model by directly using the data measured in the industrial field without any filtering. (或多或少你们 是实验室的学生,使用到的通常为实验数据或外理后的数据。直接使用工业领域中测量的未经外理的数据来分析和建模是一段很好的经历。)”

第三届工业大数据创新竞赛韩国参赛团队 tea 小组

据了解,这也是 tea 小组第一次来中国参加此虚实结合 赛。对于你们 来说,本次竞赛的最大挑战在于,给定的数据集是在转子部件脱落故障事先整理的。或多或少,在分析数据的过程中,那末检测到故障处在的底部形态,并选用未故障到接近故障的顺序。而为了更清晰的判断,tea 小组在解题初期也想过使用机器学习或或多或少模型(实际上或多或少成员的主要研究方向是 PHM 领域的淬硬层 学习),但或多或少标签信息或多或少会或多或少上诉问题报告 报告 变得不清晰,tea 小组设定了自己的标准,以选用有无故障及故障的顺序。

同样,为了实现在实际工业场景中的应用,tea 小组表示,你们 还需对给定目标系统(的特定故障)设置更大概的故障标准或阈值,算法模型也要从目标系统中并肩获取正常和故障的数据,并设置明确标准以区分是正常还是故障,实现模型的进一步优化与改进。

近年来,在工业 4.0 的发展趋势下,韩国和联 国一样,随着高附加值技术重要性的增强,过程自动化以及相关的自动故障诊断和预测系统也将变得十分重要。

写在最后

智能制造和工业互联网是密不可分的关系。正如胡翔所说,预测性维护是工业互联网应用的“皇冠上的明珠”。当然远远不止那末,大数据和智能制造给传统工业带来了巨大冲击,强大的工业数据分析服务将成为制造企业数字化战略的重要组成累积,工业互联网将显现出更大的战略价值。可不还后能 预见,工业大数据应用将带来工业企业创新和变革的新时代。

(本内容属于网络转载,文中涉及图片等内容如有侵权,请联系编辑删除)