行业动态

米乐M6官网·人工智能核心技术产业:资本降温白热化竞争来临

发布时间:2024-11-17 05:38:05 来源:米乐m6米乐平台 作者:M6米乐最新下载地址

  在过去一年中,人工智能的新算法不断涌现,深度学习仍是这一时期发展主线,尝试解决更为复杂的应用任务。人工智能的产业格局与生态体系更为明晰,开源开发框架格局逐步确立,以科技巨头引领的生态系统垂直整合速度不断加快;同时,产业发展重心开始转变,企业比拼重点从单项技术的“理论”准确率转向应用场景白热化的“跑马圈地”。

  人工智能的技术应用开始全面覆盖日常生活、 科学研究、社会治理、商业创新和等经济社会的关键领域, 以空前的广度和深度推动社会发展。然而,由于人工智能技术成熟周期相对较长,产业发展速度不及资本市场预期, 资本热度开始减退。人工智能产业似乎显现出“陷入困境”与“高速发展”的矛盾现象。

  本期的智能内参,我们推荐中国信通院的报告《人工智能核心技术产业》, 探讨以深度学习技术为主要驱动力的人工智能发展状况、 技术创新重点与产业发展趋势,总结十三五期间我国发展情况, 提出十四五期间的发展方向与机遇。如果想收藏本文的报告,可以在智东西(公众号:zhidxcom)回复关键词“nc537”获取。

  人工智能技术体系与产业体系错位发展,深度学习理论突破速度逐步放缓,产业开始步入高速发展阶段。目前,本轮深度学习理论突破速度开始放缓,技术红利的持续释放驱动图像分类、机器翻译等多类感知任务准确率大幅增长,步入升级优化期。人工智能本轮爆发初期主要在探讨算法理论的可能性,聚焦探索强化学习、迁移学习等新的学习方式以及 AlexNet、 VGG、 GoogLeNet 等结构多样的算法模型;算法理论的不确定性和技术的不成熟耗费产业界大量精力和时间,阻碍人工智能大规模应用进程。

  目前, 产业开始步入高速发展时期, 2020年技术标志性生产工具 TensorFlow 框架下载量爆发式增长, 仅一个月1超 1000 万次,占发布四年半下载总量( 1 个亿+) 的十分之一;同时,技术成本快速下降,同等算法水平所需计算量每八个月降低一倍,成本降低百倍, 业内涌现出研发平台、技术服务平台等多样化的平台形态, 工程技术正在引领产业快速发展。

  资本寒冬已经出现。其中,预期过高是主要原因。人工智能企业增速明显放缓, 2019、 2020 年全球每年新增人工智能企业数量已不足 100 家, 且投融资的轮次后移趋势不断扩大。2020 年 B 轮及以上融资笔数占总笔数的 62.3%,较上一年增长 40%以上。同时,曾获大笔融资的知名创新企业由于预期过高、虚假宣传等原因退出产业舞台。曾对标英特尔的芯片企业 Wave Computing,是人工智能计算领域最受关注的独角兽之一, 2020 年 4 月由于数据流处理器性能不达预期而宣告破产;智能会计工具 ScaleFactor 宣称利用人工智能技术自动化生成财务报表, 但实际却部分采用人工外包方式处理, 在融资1 亿美元后于 2020 年 3 月宣告倒闭。

  此外, 资本早期对人工智能产业回报周期过于乐观是资本寒冬的另一原因。移动互联网在偏向工程属性的前提下,资本预期取得成效的时间为二到四年;与之相较,人工智能与传统行业核心业务深度融合,需更高的技术准确率和更深刻的行业理解力。因此,人工智能产业孕育时间更长,资本市场的期望和现实出现较大偏差。

  从技术基础理论突破到工程化落地应用,既有技术红利已为产业发展奠定坚实基础。当前,虽然资本市场的泡沫逐步破裂,但优质企业的估值仍在持续增长,独角兽企业不断出现, 产业呈现良性发展态势。深度学习技术局限性似乎导致人工智能产业发展将遇天花板,然而事实并非如此。

  虽然,可解释性、理解推理等局限性确已显现,但这是下一时期理论技术突破重点, 不能因此否定图像识别、语音合成、机器翻译等感知类任务上的应用技术成就和产业应用前景。目前,基 于深度学习理论的优化技术层出不穷, RegNet、 GPT-3 等模型不断提升视觉处理、阅读理解等基础智能任务水平,虚拟助手、多语种翻译等智能应用已开始进入规模化应用阶段,大量的行业应用场景加速深度融合,技术能力和优化速度可见 5 到 8 年的红利。

  业各环节逐步明晰,规模化应用突破已现曙光。人工智能技术在消费互联网领域发展速度较快,智能推荐、视觉识别、语音助手等智能技术能力已深度应用至电商、社交、资讯等消费互联网平台以及手机、无人机等消费终端中,并加速与核心业务进行整合。当前,智能技术正在向更多的行业领域渗透,融合渗透仍需时日孕育。相较于消费互联网领域,传统行业的知识获取和积累需要较长时间,应用场景碎片化的特点导致低成本、易用、泛化能力较强的能力平台构建需较长周期。

  总体来看,人工智能产业正处于 S 曲线中快速发展的临界位置(如下图),现阶段智能技术落地成本较为昂贵,导致智能产品绝对量增加时,其单位成本并未明显下降。目前,人工智能头部企业加速布局, 不断完善技术生产工具(开源开发框架、数据处理、验证分析、部署监测等完备研发工具链), 加速建立全栈智能计算技术体系(形成基础计算理论、 芯片、 软硬协同、 系统协同全栈技术支撑能力), 探索孕育基础和垂直行业技术平台;产业规模化发展的进程正在不断加速,规模经济有望形成。

  工智能已全面覆盖社会运行的基本要素,内生化提升全局运转效率。从社会运行角度,人工智能加速影响日常生活、科学研究、商业创新和等社会运行的基本要素。

  一是人工智能与科学研究的结合已开始改变基于传统学术经验的科学研究方式,实现从大量已知论文、实验数据中挖掘未知理论,加速提升化学、材料、物理、药物研发等领域文献获取速度与实验发现效率, 成为下一时期科技竞争的重要动力。

  二是人工智能成为商业创新与竞争的下一个主战场, 传统行业巨头加速布局智能供应链、质量检测、商业决策等细分应用,有望显著提升生产流程、质量控制、商业营运等环节效率,改善工作条件;

  三是娱乐、消费电子、医疗等生活领域的智能应用不断贴近、细化场景需求, 室内安防无人机、人性化虚拟助手等智能消费产品不断涌现,问诊机器人及智能影像逐步推广使用,医疗资源紧缺、分布不均等一些行业痛点开始缓解;

  四是疫情加速教育培训向在线智能化发展,试题 OCR 识别、辅助批改等应用已从试点向规模化发展,推动教学管理向精准管理转变,助力个性化学习体系的建立;

  五是全球领先国家已充分意识到人工智能技术与国防安全融合的重要程度, 投入针对性资金推动预测维护、自动驾驶、情报分析、智能飞控等国防智能应用的发展。

  人工智能渗透率的提升有望显著加快全产业链结构的优化速度,牵引产业向高附加值的产品与服务转变。

  一方面, 人工智能作为众多技术产品创新核心,是下一时期最为关键的高附加值产业。据预测,到 2030 年约 70%的行业企业将使用人工智能技术,预计为全球增加13 万亿美元的附加值。

  另一方面, 人工智能加速提升传统行业高附加值产品的比重, 进一步优化产业结构。人工智能技术与核心业务、专家经验深度融合,行业主营产品和运行方式的智能化程度正在不断提升,衍生新产品与新服务。《麻省理工科技评论》全球 50 家聪明企业( TR50)榜单中已显现传统行业企业的身影,如布局医药研发赋能平台的传统药物研发厂商药明康德,利用智能技术提升物流收派效率的顺丰科技等。

  深度学习仍然是人工智能技术发展的主导路线。当前,基于大量标注数据进行训练是深度学习技术实际应用的主要路线 余万幅图片的ImageNet数据集至2020年脸书和卡内基梅隆大学构建的超过 130 万种化合物分子间作用数据集 Open Catalyst,模型训练所需标注数据普遍达十万以上。然而,这种路线在取得良好成效的同时,面临着严重依赖标注数据的问题,带来在更多细分场景中应用落地的局限性。

  业内不断拓展深度学习解决问题的边界, 推动人工智能进入感知增强时代。人工智能纯粹使用有监督学习方式训练深度学习模型的时代基本结束,受限于对大量标注数据依赖与理解能力缺乏,这种路径难以解决更多应用问题。

  当前, 感知增强时代拉开序幕,这一时期的新算法聚焦提升数据的质量和规模, 通过迁移其他领域训练成果、自主生成或增强数据、依托知识图谱常识关系、利用多源数据等方式侧面弥补深度学习的局限性。深度强化学习、多模态学习等多元化的学习方式受到产业热捧,深度学习技术与知识工程、传统机器学习等分支的结合成为学界探索的热点新方向。

  深度学习加速探索与多元学习方式、多种技术分支的结合, 少量数据训练、弱化人为干预以及多模态学习成为下一时期的发展关键。

  一是减少数据量依赖的少样本学习。少样本学习通过复用其他领域知识结构,使用少量数据对新领域进行训练, 已进入初步应用阶段,如英伟达提出基于少样本学习的视频转化( Few-shot vid2vid)框架,仅借助少量目标示例图像即可合成未出现过的目标或场景视频。

  二是弱化人为干预的自监督学习、强化学习。业内主流的有监督学习方式数据标注成本高昂,以机器翻译任务为例,市场人工翻译每单词平均价格约 7.5 美分, 假设单个句子平均长度为 30 个单词, 1000 万个句子人工翻译标注的成本约为 2200 万美元;若需支持上百种语言的互译,人工标注训练集的成本将达上千亿美元。这种高昂的数据成本促使学产两界加速对深度强化学习、自监督学习等范式的探索。

  图灵奖获得者杨立昆( Yann LeCun)加速自监督学习的研究进程,通过从未标记的数据集中学习监督信息, 提升数据无标注下的学习能力;DeepMind、 OpenAI 等机构不断演进深度强化学习算法,试图显著提升智能体的自主决策和多智协同能力。

  三是提高应用场景复杂度的多模态学习。应用场景正从单一视觉、语音的感知向多模态理解侧重,复杂度不断提升, 从多模态信息源中学习模态间关系成为焦点,如菜肴制作视频与菜谱文本步骤对齐、唇动视觉描述与语音信号融合预测单词等。深度学习技术正在不断挑战更为复杂的任务,扩展能够解决问题的边界。

  直面推理理解问题的算法路径尚无定论,距离认知时代到来仍需数年。从理论体系角度来看,深度学习的领军专家开始探索深度学习理论体系的新形态,反向传播、经典神经网络模型等已有基础理论受到质疑。目前,杰弗里·辛顿( Geoffrey Hinton)提出替代深度神经网络( DNN)架构的胶囊网络,试图解决小样本问题。然而,胶囊网络虽连续三年推陈出新,但研究进程并非叠加式的演进,而是完全不同路径的替代。

  从学习方式角度来看, 近一年来,强化学习实现通用智能的技术路径不再是业内共识,不依赖大量人工标注数据的自监督学习成为学习方式的新焦点,并在 2020 年 ICML、 ICLR 等全球人工智能学术会议上高频出现,已成为众多专家所关注的关键路径。然而,无论是深度学习体系的颠覆式创新,还是多种学习方式的不断尝试,具备理解能力的算法模型目前未有显现迹象, 真正的认知时代到来仍未可知。

  有监督学习建立在严苛条件之上,已不能完全满足模型学习需求,面对更为复杂的任务场景,业内加速探索强化学习、自监督学习等多元学习方式,试图缩小与通用智能的距离。

  深度强化学习不断演进,加速提升自主决策能力。深度强化学习加速拓展任务边界, 突破性解决多人棋牌、即时战略游戏等多智能体非完全信息博弈任务。目前, OpenAI、谷歌、微软等企业相继攻克即时战略、 德州扑克、麻将等复杂游戏, 并加速向无人机群体飞行等更为实际的应用场景拓展。

  另一方面, 深度强化学习不断提升处理复杂任务的能力, 逐步拓展芯片设计、音乐编曲等对知识技能要求更高的专业领。


米乐M6官网
亮照