腾讯,大动作

2024-12-04 16:23来源: 中国经济网

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  12月3日下午,腾讯混元大模型正式上线视频生成能力,这是继文生文、文生图、3D生成之后,混元大模型又一进展。同时,腾讯宣布开源该视频生成大模型,参数量130亿。

  开放申请测试

  “用户只需要输入一段描述,即可生成视频。”腾讯混元相关负责人透露,目前生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度。该模型已上线腾讯元宝APP,用户可在AI应用中的“AI视频”板块申请试用。企业客户通过腾讯云提供服务接入,目前API同步开放内测申请。

  在现场演示环节,演示视频中出现的冲浪、跳舞等大幅度运动画面,运动镜头及人物未发生形变。

  腾讯混元相关负责人介绍,腾讯混元生成视频大模型可实现超写实画质、生成高度符合提示词的视频画面,画面流畅不易变形。光影反射基本符合物理规律,在镜面或者照镜子场景中,可以做到镜面内外动作一致。同时,模型还可以实现在画面主角保持不变的情况下自动切镜头。

  全面开源

  据了解,腾讯混元生成视频大模型基于DiT架构,并在架构设计上进行多处升级。混元视频生成模型适配了新一代文本编码器提升语义遵循,其具备语义跟随能力,更好地应对多个主体描绘,实现更加细致的指令和画面呈现。同时,采用统一的全注意力机制,使得每帧视频的衔接更为流畅,并能实现主体一致的多视角镜头切换;通过先进的图像视频混合VAE(3D 变分编码器),让模型在细节表现有明显提升,特别是小人脸、高速镜头等场景。

  目前,腾讯宣布开源该视频生成大模型已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。基于腾讯混元的开源模型,开发者及企业无需从头训练,即可直接用于推理,并可基于腾讯混元系列打造专属应用及服务,能够节约大量人力及算力,加速行业创新步伐。

  从年初以来,腾讯混元系列模型的开源速度不断加快。此前,腾讯混元已经开源了旗下文生文、文生图和3D生成大模型。至此,腾讯混元系列大模型已实现全面开源。

  转自:中国证券报微信

[责任编辑: ]
阅读剩余全文(
为你推荐
”  3月17日,从伊朗撤离的中国公民等待进入土库曼斯坦萨拉赫斯口岸的边检大厅办理手续。新华社记者 李任滋 摄  3月17日,在土库曼斯坦萨拉赫斯口岸,从伊朗撤离的中国公民马玉秀接受新华社记者采访。
19
3月17日,在湖南湘江新区雷锋小学,老师在数学课上使用动态演示工具将抽象的数学原理具像化展示,帮助学生理解。近年来,湖南湘江新区雷锋小学将智慧教育场景与基础学科、艺体学科、特色教学领域等深度融合,让人工智能化身教学助手、学习伙伴。
19
这是3月18日在北京明城墙遗址公园拍摄的夕阳风景。
19
新华社记者晋美多吉 摄  春耕仪式是西藏农区重要的民俗活动,一般根据藏族天文历法推算,确定仪式开展的确切日子。新华社记者晋美多吉 摄  山南是西藏重要的农业生产地区和主要粮食产地,平均海拔3700米,气候适宜、土地肥沃,种植青稞历史久远。
18
3月17日,在中国雄安集团数字城市科技有限公司具身智能训练场,工作人员对机器人进行具身智能训练。
18
春风和煦,花红柳绿,人们踏青赏花,享受美好春光。春风和煦,花红柳绿,人们踏青赏花,享受美好春光。春风和煦,花红柳绿,人们踏青赏花,享受美好春光。春风和煦,花红柳绿,人们踏青赏花,享受美好春光。
18
这是3月16日在北京航天飞行控制中心屏幕上拍摄的神舟二十一号乘组航天员工作的画面。3月16日19时35分,经过7小时的出舱活动,神舟二十一号乘组航天员张陆、武飞、张洪章密切协同,在空间站机械臂和地面科研人员的配合支持下,圆满完成空间碎片防护装置安装等任务。
17
3月16日,在北京地铁六里桥站附近,一名乘客走下从雄安新区驶抵北京的京雄定制快巴。3月16日,在北京六里桥地铁站附近,一辆从雄安新区抵达北京的京雄定制快巴在乘客下车后驶离。
17
春回大地,暖风轻拂,北京街头各种花卉次第开放,人们走出家门,赏花观景,乐享和煦春光。春回大地,暖风轻拂,北京街头各种花卉次第开放,人们走出家门,赏花观景,乐享和煦春光。
17
3月15日21时22分,我国在太原卫星发射中心使用长征六号改运载火箭,成功将遥感五十号02星发射升空,卫星顺利进入预定轨道,发射任务取得圆满成功。新华社发(尚宇航 摄)
16
载入更多资讯
返回
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮