旷视联合创始人杨沐:开源生态培养需长期主义
如今,开源已成为推动全球AI技术创新的重要驱动力,无论是硬件、软件、操作系统还是算法,都在积极拥抱开源。
作为新一轮产业变革的核心驱动力量,人工智能技术的开源及生态发展备受产业关注。9月24日,以“开源共享·融金服产”为主题的2021中关村论坛开源创新发展论坛在北京中关村举办。
旷视联合创始人兼资深副总裁杨沐在论坛上表示,回顾过去十年AI技术的发展,我们基本在回答3个问题,AI有没有用,AI在哪里用,以及AI易不易用。现阶段,想让AI发挥更大的价值,更需要让AI好用、易用。AI基础设施的建设能够有效降低AI算法生产门槛,让AI变得越来越易用,走向更多实业。
中关村论坛期间,杨沐接受了新京报贝壳财经记者的采访,他表示,在过去十年中,人工智能技术取得了很大的发展,如今已经开始融入到各行各业中,助力传统行业实现数字化转型和智能化升级。
AI的应用场景将从学术研究为主向应用落地为主转变
“现阶段,AI算法逐渐成熟,AI的应用场景将从学术研究为主向应用落地为主进行转变,想让AI发挥更大的价值,我们需要让AI好用、易用。”杨沐在论坛采访中表示,落地应用的过程中,我们发现AI算法的供给是远远不足的,当前大量算法生产过程还是非标准化的,因为非标准化所以算法生产过程充满不确定性,而生产落地实用算法的过程只有先标准化,才能自动化,才能更进一步实现规模化的普惠易用。
同时,AI基础设施建设最重要的莫过于深度学习框架。杨沐在论坛采访中表示,深度学习框架上承应用、下接芯片,不夸张地说,它对于人工智能的意义,就像Windows之于PC,安卓之于智能手机。此前IDC的调研显示,目前86.2%的企业和开发者选择使用开源深度学习框架。近年,中国科技创新的背景下,中国AI企业纷纷开源自主研发的AI框架,构筑中国AI产业的核心竞争力。
国内外框架演进将百花齐放,中国也成为全球开源体系的重要力量
“每个AI开源框架都各有所长,一个框架很难满足所有企业和开发者的全部需求。即便国外最早启动的几家大企业,他们的框架已经有了很好的生态起步优势也无法做到面面俱到。”杨沐直言,国内外框架演进在接下来一段时间内依然会呈现百花齐放的趋势,并且开源的深度学习框架变多,大家也可以相互学习对方的长处。
他还提到,过去几年,国内的开源环境取得了很大的发展,中国已经成为全球开源体系的重要力量。据不完全统计,我国开发者开发贡献代码的数量在全球的比重已占40%左右。
值得注意的是,对于国内的开源框架企业而言,既需要补充生态上的硬实力,也需要找到差异化的技术竞争点,充分结合我国国情和国产硬件,发挥好自身的技术优势和更好的生态洞察力。
工业和信息化部人才交流中心发布的《人工智能产业人才发展报告(2019~2020年版)》显示,预计我国人工智能产业内有效人才缺口达30万,研发人员稀缺,杨沐认为,企业应通过一系列产学研合作,为社会培养和输送符合市场需求的AI人才。“我们通过开源竞赛、培训、高校课程合作等方式,不断完善我们的开发者支持体系,助力开发者实现深度学习、简单开发,同时我们在框架上通过差异化的技术来降低AI实际生产的门槛,让更多现有的产业内开发者可以顺利转型为AI开发者”。
以下为部分采访实录:
新京报贝壳财经:随着国内AI行业和自研AI技术的发展,国内的AI公司纷纷开源自主研发的AI框架,助力我国AI基础设施的建设,你认为我国目前AI基础设施的建设处在何种发展阶段?如何加强我国AI基础设施的建设?
杨沐:回顾过去十年AI技术的发展过程,基本在回答3个问题,AI有没有用,AI在哪里用以及AI易不易用。在2011年、2012年的时候,深度学习刚刚崭露头角。这个时候大家要回答的问题是以机器学习为代表的AI到底是不是比以前好很多,到底能不能带来很大的价值,是不是有用。
从2015年起,我们看到了逐渐成熟的AI技术走出实验室,切实帮助人们解决现实问题。而现在,AI也已经开始融入到各行各业中,助力传统行业实现数字化转型和智能化升级。
新京报贝壳财经:那么,现阶段应该如何加强我国AI基础设施的建设?
杨沐:现阶段,AI算法逐渐成熟,AI的应用场景将从学术研究为主向应用落地为主转变,想让AI发挥更大的价值,我们需要让AI好用、易用。而人工智能基础设施的建设能够有效降低AI算法生产门槛,让AI变得越来越易用。在AI落地应用的过程中,我们发现AI算法的供给是远远不足的,当前大量算法生产过程还是非标准化的,所以算法生产过程充满不确定性,而生产落地实用算法的过程只有先标准化,才能自动化,才能更进一步实现规模化的普惠易用。
新京报贝壳财经:当下AI开源框架已是群雄混战的局面,包括谷歌、Facebook、微软、亚马逊、百度、华为等都动作频频,科技创新企业该如何突出重围?
杨沐:每个AI开源框架都各有所长,一个框架很难满足所有企业和开发者的全部需求。即便国外最早启动的几家大企业,它们的框架已经有了很好的生态起步优势也无法做到面面俱到。国内外框架演进在接下来一段时间内依然会呈现百花齐放的趋势,并且开源的深度学习框架变多,大家也可以相互学习对方的长处。
对于国内的开源框架企业而言,既需要补充生态上的硬实力,也需要找到差异化的技术竞争点,充分结合我国国情和国产硬件,发挥好自身的技术优势和更好的生态洞察力。比如2021年上半年,结合我国AI科研环境以及显卡短缺情况,旷视天元成为在市场上首个支持自动动态图显存优化的开源框架,开发者只需要增加2行代码,即可在相同显存情况下,训练3倍大的模型并有效提升AI模型性能,从而帮助硬件资源有限的企业开发者和科研人员节省成本,用有限的硬件资源训练出更大的模型。
新京报贝壳财经:工业和信息化部人才交流中心发布的《人工智能产业人才发展报告(2019~2020年版)》显示,预计我国人工智能产业内有效人才缺口达30万,研发人员稀缺,这对于开源生态建设是很大的挑战,该如何改变这一现状?
杨沐:一方面应通过一系列产学研合作,为社会培养和输送符合市场需求的AI人才。例如旷视通过开源竞赛、培训、高校课程合作等方式,不断完善我们的开发者支持体系,助力开发者实现深度学习、简单开发。另一方面旷视也在框架上通过差异化的技术来降低AI实际生产的门槛,让更多现有的产业内开发者可以顺利转型为AI开发者。
例如近期我们开源了MegFlow流式计算框架,提供了可快速完成AI应用部署的视觉解析服务方案。常规的AI算法交付流程一般分为模型训练、SDK封装、业务集成和交付验收四个步骤,冗长繁杂。MegFlow总结了旷视内部多年的AI应用工程落地经验,将资源、消息、任务等概念进行了清晰一致的抽象化,将冗长的算法交付流程简化为模型训练、业务集成及交付验收三步。AI应用开发者可以基于MegFlow提供的图像和视频解析服务,最快15分钟即可完成客制化所需功能,例如发票扫描、明火检测、电瓶车进电梯检测等。
新京报贝壳财经:目前国内的开源项目还没有在全球范围内铺开,深度学习基石地位仍然绕不开国外巨头的牵制,国产厂商该如何破局?
杨沐:过去几年,国内的开源环境取得了很大的发展。中国已经成为全球开源体系的重要力量。据不完全统计,我国开发者贡献代码的数量在全球的比重已在40%左右。但必须承认的是,我们的开源生态仍待完善,仍然有很长的路要走,开源生态培养需要坚持长期主义。