AutoML 被认为是降低机器学习工作门槛,让 AI 真正推动行业变革的重要一环。探智立方即将推出的产品,可以让各领域的专家们仅需专业知识和数据,就能完成机器学习复杂算法的开发。
在 2017 年底成立的时候,探智立方的愿景还只是做好模型自动化生成这一件事。创始人们希望能够通过 AutoML 技术降低人类的重复性劳动,甚至在未来 3-5 年时间里实现超越人类的水平。
今年,这家公司面向各行业推出了数据处理、推断能力和 AI可解释性等大量新工具。在最近的一次活动中,探智立方公布了自己的,产品图谱,这家公司的产品,距离开箱即用的目标更近了一步:
随着新产品即将上线,探智立方已经构建起三大产品线:
全新的 DarwinML Data Fustion数据融合工具,帮助缩短数据抽取的时间及降低宽表生成的复杂度;
作为核心的自动建模平台 DarwinML Studio,加入了大量扩展工具;
以及推理平台 DarwinML Inference platform,面向高并发低延时需求的推理任务。
针对金融保险等行业的商业落地,在即将推出的新版 DarwinML 中,还会包含一些专用插件。
探智立方的新产品面向机器学习模型和深度学习模型,在已有工具的基础上进行了大幅度改进。在数据自动分析工具 DarwinML Data Fusion 中,人们可以通过图形化界面,拖拉拽的形式控制系统自动整理数据。经过整理的数据不光在探智立方的平台上,在任何其他机器学习平台中都是可用的。
在核心产品 DarwinML Studio 中,探智立方新增了大量特征工程扩展,带来更为丰富的自动化能力,让「设计大脑」变得聪明,其中还包括数据增强和自动标注技术。此外,探智立方还对模型的结构生成进行了进一步优化,使其效率更高。
基于进化算法的 AutoML 路线
在 AI 自动建模上,AutoML 的实现路径其实包括四大方向:强化学习、进化算法,迁移学习方法及元学习(Meta Learning 是未来有潜力的方向之一),各家公司的实现路径不同,不过大多数采用的是迁移学习。与众不同的是,探智立方一直坚持探索进化算法方向。
不过后者也有缺点:需要背靠足够大的数据科学家团队,以及特定领域中丰富的模型种类。我们可以看到今天 AutoML 产品在图像领域里效果,,这是因为图像领域中可以获取的资源是最多的(不仅是模型,甚至模型权重都有开源)。
但在大量其他领域,如果希望对时序、结构化数据进行处理和分析,没有一定之规,也没有现成权重,迁移的方法或许就无法适用了。