HCR强化学习智能应用之赋能工业(上)
近些年科技进步的速度有点快:
从2012年开始深度学习取得飞跃式发展,在人脸识别、语音识别、机器翻译等领域开始大量应用。
从2016年开始强化学习又火了一把,阿尔法狗先后战胜世界顶级围棋棋手李世乭和柯洁,OpenAI-Five打Dota2(一种竞技游戏)也战胜了人类选手。
作为一家数据智能公司,HCR持续关注最前沿的人工智能技术,并不断应用到实际的业务场景。
HCR已经将深度学习和强化学习应用到了大量领域:
应用领域 |
应用点 |
相关技术 |
环保 |
区域污染物智能溯源 |
深度学习 |
区域空气质量智能预测 |
深度学习 |
|
教育 |
试题知识点智能识别 |
深度学习 |
试题智能推荐 |
深度学习 |
|
学生成绩智能预测 |
深度学习 |
|
新零售 |
人脸识别 |
深度学习 |
人物属性识别 |
深度学习 |
|
消费者智能画像 |
深度学习 |
|
交通 |
智能助手 |
深度学习 |
智能用户画像 |
深度学习 |
|
车型识别 |
深度学习 |
|
工业 |
优化燃煤工业锅炉控制 |
强化学习+深度学习 |
优化机房制冷 |
强化学习+深度学习 |
那深度学习和强化学习有什么关系呢?通过公司近些年深度学习和强化学习的应用,我们总结如下:
相比之下,强化学习有哪些突出的特点呢?
强化学习通过智能体(如阿尔法狗)不断实践、探索来学习,每次探索包括以下几个步骤:
智能体能够感知环境(即下图中地球,可以理解为要解决的具体场景),观察当前状态(observation)
智能体根据策略,采取某种行动(action)
智能体采取行动后,环境对智能体的行动会有一个反馈(reward)
智能体获取反馈,根据反馈调整策略
强化学习与人类学习的方式更加相似,为什么HCR在实际业务中应用更多的却是深度学习?
目前深度学习在各领域应用四处开花,为什么强化学习仍主要应用于游戏,其他领域应用极少?
HCR已经将强化学习应用于工业大数据领域,包括燃煤工业锅炉控制优化、IDC机房制冷设备自动调控等,通过实践积累了大量的宝贵经验。
下篇我们会详细介绍强化学习在工业领域的应用,并回答为什么强化学习目前仍主要应用于游戏领域的问题,敬请期待下周的推送。