对话海信视像王烨东、朱春波:家电领域的“DeepSeek时刻”并非我们最终追求的目标

牵着乌龟去散步 万象 3

( *** 来源: *** )

出品|搜狐财经

作者|李保铭

近日,家电领域卷起了一阵“接入DeepSeek”的热潮,国内头部家电企业纷纷接入DeepSeek,引发外界关注。

除了DeepSeek外,近年来,家电AI化进程也在国内家电头部企业中有条不紊推进中。

比如,海信电视在近期发布E8Q旗舰系列电视新品。据介绍,其依托星海大模型的仿生推演,以AI光色同控、超清晰解构、人眼景深追焦、智慧视觉四大技术的矩阵式协作。

家电企业搭载大模型如何做出差异化?接入DeepSeek有哪些未来想象空间?针对大模型幻觉问题,又有哪些不同解决思路?

近日,搜狐财经独家对话海信视像科技研发中心副总经理、显示研发部总经理王烨东和海信视像科技研发中心副总经理朱春波,他们聊了很多一线从业者的思考。

展开全文

谈DeepSeek和星海大模型

搜狐财经:最近 Vidda 投影系列接入了 DeepSeek,具体是怎么应用的?接入是基于什么考虑?将怎么赋能?

朱春波:在DeepSeek发布前我们就关注到了他们,Deepseek发布后,海信电视2月11日宣布正式接入DeepSeek。对于海信来说,DeepSeek给了我们一些启示,如何把它“揉碎吸收”,这一过程对我们来说是更为重要的发展方向和思路。

DeepSeek的深度思维链推理能力、规划能力,都可以被海信智能体吸收使用,可以减少幻觉、提升用户意图的识别率和触达率。

DeepSeek的后训练过程以及模型蒸馏和压缩,对于海信自研的星海大模型训练部署、终端侧的应用(也有帮助)。我们将这些关键技术融合进自己模型的相关技术,用来提升星海大模型的能力和海信电视智能体应用的用户使用体验。

搜狐财经:现在很多家电企业推出自己的 AI 大模型,海信也发布了“星海”大模型,和友商的区别在哪里?

朱春波:海信的星海大模型目前已经形成了矩阵化能力,包含了从几十亿参数到几百亿参数的模型矩阵。形成矩阵化的能力不仅赋能于产品AI 创新和体验提升,还赋能了海信内部运营效率的提升。

从星海大模型的矩阵分类来看,包括语言大模型、多模态理解大模型、视觉生成大模型这三类,分别负责语言、不同模态的互相融合以及生产视觉内容。

搜狐财经:电视AI化已经提了很多年,但之前用户对它的感知不是特别强烈的原因是什么?

王烨东:其实2023年之前,我们一直在同步研究深度学习和预训练语言模型,Transformer也不是一个特别新的架构。之所以用户感触不深,主要还是用户体验上不去的原因。

这就需要从两方面入手提升用户认知:一是AI要足够聪明,在理解用户场景、上下文、副语言信息等的基础上具备深度思考和完成任务的能力;二是AI要足够快,在端云混合的架构模式下更大程度提升AI的响应速度,并尽可能将实时 *** 任务部署在终端。

为此,我们正在将DeepSeek等行业更先进模型的后训练、蒸馏、加速等技术与星海系列大模型进行融合,未来将产生化学反应。

搜狐财经:当电视“足够聪明、足够快”之后,如何加深用户对电视智能化的体验?

朱春波:这意味着电视需要“又快又好”。

“好”意味着用户无论如何自然表达,比如口音、语速、不同人群语言习惯,电视都可以去理解,并且能够结合对话本身、对话之外的用户信息推断用户的真正意图。此时最需要提升的就是模型本身的推理思考能力,这也是基础模型能力提升里最关键的瓶颈之一。

想要实现这点,DeepSeek给了我们很好的借鉴,它的一系列训练技术,比如混合任务强化学习技术,能够大幅提升长思维链推理能力。

“快”意味着能够在保证准确的情况下及时响应用户。DeepSeek在这方面给了我们更多的借鉴,比如针对小模型的蒸馏技术,能够让我们部署更小、更快的模型同时保证 *** 能不下降;专家混合模型(MoE)架构设计、高效通信、混合精度训练等技术能够大幅提升训练和推理效率,从而更快解决问题。

此外,在 *** 作 *** 软件、用户界面设计上也可以带给用户更友好的交互方式,提升用户体验。这些也都是用户能看到的、在交互方面的提升路径。

而在一些用户不易察觉的地方,比如音质、画质方面,AI也会有一些驱动力,从更高维度增强了音画处理能力,最终体现在产品上时,对用户来说不像交互那样简单直接。

谈未来:多模态交互是人机交互的未来

搜狐财经:“足够聪明、足够快”之后,您觉得在应用场景方面会有什么样的体现?

朱春波:在场景应用上,我们判断,生成式AI正在重塑整个行业。

以大模型为 *** 的生成式AI,会成为智能电视的原生能力,也会让视听交互、服务体验全面升级。这也意味着电视当中的服务会由被动式服务向主动式服务转变,也就是此前提到的“结合上下文和各种模态信息推断用户表达显 *** 或隐 *** 意图”。

多模态入口,包括语音图像等各种入口的场景化服务,将引领电视服务范式变革。

电视会作为智慧家居里客厅的中心为用户提供服务,主要围绕的之一个场景是视听,比如音画质,能够通过理解和感知,让不同内容在不同家庭环境中,针对不同用户以更佳方式呈现,而通过大模型训练专家模型是调控音画质呈现的有效手段。

第二个场景是交互。以前用户必须要发出明确清晰的语音指令,电视才能去执行 *** 作。从短期来看,电视将具备语音和图像感知能力,并且理解和感知用户表达上下文,比如AI *** 像人眼一样识别电视任意画面、用户按AI键后可以实现与内容相关的自然对话。

从长远未来看,电视将具备全面感知和推断能力,提供主动的、具备情感的、个 *** 化交互。比如,在教育场景下,电视可以感知、记忆、识别 *** 的学习习惯和薄弱点,通过数字化 *** 一对一进行拟人化口语对话练习,实时评测和指导。

第三类场景是创新服务。一方面,电视在现有核心场景上优化体验,另一方面基于新AI能力,拓展电视使用场景,让电视成为生活娱乐的超级中心。比如短期内凭借大模型识别能力、深度剖析能力,游戏玩家在遇到难题时可实时获取指引和辅助。

在长远的未来,电视会具备多模态感知能力,可以全面感知用户和环境信息,提供主动的、情感化内容服务。比如为每个家庭成员量身定制专属时尚搭配,通过感知用户的喜好、肤色、体型等信息提供专家建议。

我们认为,电视会再次成为家庭客厅的中心,不仅仅是信息展示,更是一个大脑和一系列服务的提供者。

搜狐财经:电视未来有可能成为全屋智能互联的中枢吗?

朱春波:是的,电视肯定会成为中枢。电视其实具有公共属 *** ,也可以做到始终在线,不仅是“高能陪伴者”,还是“实时守护者”,所以电视作为中心实际上是非常合适的。

搜狐财经:不过现在智能互联还存在一些痛点,比如协议纷杂等等,会产生很多障碍。

朱春波:虽然国内外现在存在一些协议的割裂,但其实各自都在向打通生态、建立多设备同控,控制数据传输和服务流转等方向发展。在这一方面,以前我们是终端生产商,未来是家居场景化的服务提供商,在这一过程中也会带动产业链和相关友商在这一方向努力。

搜狐财经:如果仅靠行业自律,会不会还是比较难推动?

朱春波:行业里面无论是先行者还是后进者,大家都意识到 *** 的重要 *** 。我想,未来趋势一定是向着更 *** 、更融合发展。虽然当前存在一些困难,但我认为未来国内、国外都会形成比较 *** 的生态。

搜狐财经:语音交互是电视交互的未来吗?

王烨东:语音作为单一模态的交互方式存在天然的短板,比如会丢失副语言信息、视觉信息等。人类最自然的交互方式一定是发生在多模态信息融合互补的环境中,因此我们认为多模态交互才是未来。

模态是信息的表达方式,语音是一种模态,图像是一种模态,指向和动作也是一种模态。当然,还有更多的模态信息都可以用来更好地理解用户、与人交流。

搜狐财经:电视或者家电领域是否会出现某个“DeepSeek时刻”?

朱春波:之所以称之为“DeepSeek时刻”,其意味着难以预判,这并不是技术研发所追求的。我们进行技术突破,其实是为了消除技术在演进过程当中大量的不确定 *** ,然后让技术有预期的提升能力和扩展边界。

所以,我们所期待的并不是这种爆发,而是进化。当然,进化到一个“点”上可能会出现现象级爆发,那一定是用户体验得到很大改善,这可以是我们追求的效果,但我们自己追求的目标一定是可以预期的进化。

谈大模型幻觉的海信解法

搜狐财经:接入DeepSeek之后,幻觉问题也不能完全避免?

朱春波:所谓幻觉,就是说得不对、不符合实际情况,或者似是而非导致用户无法判断。如果把AI当成一个人,也不能保证人说的每句话都对。

所以幻觉其实是无法避免的,除非是模型足够大,已经达到一个极限,把所有的知识都吸收融合进来,并且能无限次进行多跳推理,具备这种无限能力,可能就没有幻觉了。这是一个不可达到的理想状态。所以,所有工作都在为减少幻觉以及幻觉产生后减经幻觉所带来有害效果去努力。

在减少幻觉方面,主要就是训练数据和训练策略的精心设计,以及本身架构设计的策略。比如DS,会把深度推理思考过程展现出来,就 *** 了它的模型架构更倾向于进行准确推理,而非流畅向用户表达的架构设计策略。

此外就是减轻幻觉带来的有害效果。在软件交互设计、后向验证等方面可以继续下功夫,并且海信拥有安全 *** 平台,对于产生的幻觉是否符合伦理价值观、社会公序良俗,在大模型相应服务上线之前,都会通过大量测试和语料训练,避免恶劣影响。

从根本上来说,减少幻觉需要在技术方面进行突破。未来还有一些新的技术方向,比如可解释 *** AI,知识嵌入的模型架构;在运营方面,安全 *** 和用户交互处理,也都需要加强。

对话海信视像王烨东、朱春波:家电领域的“DeepSeek时刻”并非我们最终追求的目标-第1张图片-

搜狐财经:此前市场一些观点认为,基础大模型没有未来,应该加快在应用层面部署,开源大模型也没有未来,您认可吗?

王烨东:这个说法我不认同。基础大模型是AI能力的基石,其参数量、训练数据量决定着模型的能力上限。应用层的创新依赖于基础模型的通用能力,尤其是复杂任务的表现与基础模型的规模成正比。

开源大模型通过开源权重降低技术门槛,符合技术 *** 化这一科学伦理。而且,开源模型更有利于生态建设,并提供了更多的商业化路径。

我们要清楚,正是因为大模型的开源才造就了当前生成式AI百花齐放、百家争鸣的繁荣局面。未来的竞争将聚焦如 *** 衡 *** 与商业化,而非非此即彼的选择。

搜狐财经:此前很多家电厂商会更多选择和文心一言、讯飞的AI大模型合作。现在是不是有一个趋势,接入DeepSeek之后,会更多替代掉这些模型?

朱春波:技术总是进步的,模型之间更迭的关系,其实是和应用是有关系的。最终应用肯定会落在各个不同的专业赛道上,基础模型在通识方面会努力达到能力上限,但除了通用知识,还需要足够强的学习能力,有了这些能力之后,垂直行业会把它拿来训练成自己的专家模型。

王烨东:我们认为,一个模型不可能解决所有问题,DeepSeek通过开源的方式给所有做基础模型、垂类模型或AI应用的人提供了一个平台,在这个平台上,有人可以直接拿来用;有人可以用它产生物理作用,替换自己模型的基座或体系的一部分;也有人可以用它产生化学作用,吸收其先进部分,融合进自己的模型和业务。以上这些方式一定是并存的,与各自的技术战略和业务特 *** 相关。

搜狐财经:从内部来看,海信的AI部门会如何去赋能其他部门?

王烨东:从2024年到2025年,海信在AI方面确实做了一些调整,不仅发布了海信集团的AI *** ,还统一了AI的资源和组织架构。

现在,海信的AI部门对于集团的每个业务部门都在对接。比如某个产品对于大模型的需求是什么、如何赋能,我们都会做专项讨论,然后回归到公共平台上面做聚合和提升。除了产品的赋能外,公司内部的 *** 管理效率、先进制造方面的能力,都是由这个部门做统一布局和推进。

此外,在内部管理效率提升方面和生产制造的数字化转型方面,AI大模型的赋能也在同步展开。

谈出海:数字化与专利大战

搜狐财经:制造板块“机器换人”相关的表达,在海信的财报中近几年也都会提及。

王烨东:在出海成本已经很高的情况下,如果能很好实现数字化,对整个生产制程效率、质量管控等都会有非常大的帮助。

因此,越高的数字化,对于公司整个供应链的保障、效率、产品质量的保障越有意义。

搜狐财经:目前一些友商的 AI 产品路径是基于第三方开源做产品微调,你们在思路上有相似 *** 吗?

王烨东:不同厂商的策略会有所不同,因为每一家企业都有自己的战略。比如,我们主打画质、音质、智能体交互等,也有一些企业主打语言交互等等,大家需要在不同领域做深。

海信认为,算力、芯片、算法一定是配套的,而且这些配套之后,还需要掌握自主知识产权。因为对于中国企业来讲,在出海过程中会面临大量专利风险。

这也是为什么我们要投芯片、投算法,要有自己的专利,要在自己的专业模型去部署更多专利,去支撑出海,在全球竞争中实现领先。

朱春波:海信不仅仅是微调,虽然从0开始构建模型时也是基于开源模型构建自己的基座,除了在基座上微调,更多是根据业务进行再次预训练。

有些企业做微调可能足够了,但对于海信这种在视听领域做得比较深、比较专业的公司,肯定需要再次预训练,把它训练成专家。

搜狐财经:全部都部署,消耗的资金也会更多,背后除了战略外,其实也是综合实力的考量。

王烨东:投芯片有助于企业提升技术研发深度拓展创新空间进而实现技术引领,建立技术壁垒。比如海信今年发布的RGB三维控色液晶显示技术,从RGB光色同控画质芯片,到RGB-Mini LED 背光芯片,所有芯片都是海信自研、自主规划、自主开发的。

这方面,我们很有信心能说在行业里有3-6个月的领先,其他企业追赶需要时间和一定难度。长时期投入下来后,我们有了一定积累,也看到了一定成果,未来会形成滚动的领先优势。

另外,当我们能定义这个过程的时候,我们会对整个 *** 形成一个统筹和规划, *** 效率会更高,产品的计算速度和 *** 能也会更好。而其他企业如果不是自研,而是去采购不同厂商的芯片,不同的芯片之间可能会有一些边界。

标签: 春波 王烨 海信 视像 DeepSeek

抱歉,评论功能暂时关闭!