科技日报记者 罗云鹏
记者4月2日获悉,在第十一届中国网络视听大会上,腾讯云副总裁、腾讯混元大模型负责人刘煜宏表示,多模态大模型正在加速到来,并将重构整个内容产业,而基于多模态的应用也会呈现出百花齐放之势。
自2023年9月首次亮相以来,腾讯混元大模型技术架构已升级为混合专家模型 (MoE) 架构,参数规模达万亿,尤以处理复杂场景和多任务场景见长。目前腾讯混元所提供的不同尺寸模型,可适应更多低成本和高推理性能的应用场景。
刘煜宏介绍, 腾讯混元正积极发展多模态模型,以进一步加强文生图、文生3D以及文/图生视频能力。
据悉,基于基础能力积累,腾讯混元大模型正推进相关应用落地,让大模型创造更多价值。
数据显示,目前腾讯内部超过400个业务及场景已接入测试,文生图的能力已经被用于广告素材生成、QQ频道内用户生成内容(UGC)等领域。
刘煜宏表示,面对内容制作行业多样化需求,腾讯混元也在探索基于大模型全面升级的数智人、语音对话虚拟人、具身智能机器人等应用,将更多的前沿技术和应用引入内容生成领域,提升生产效率和交互体验。
暂无评论...